Boksplot løser et klassisk problem i statistik: du har mange tal, og du vil vide, hvad de egentlig fortæller. De individuelle observationer ser kaotiske ud, men kondenér dem til fem nøgletal, og overblikket dukker straks frem. Forestil dig en klasse, der har undersøgt, hvor mange minutter eleverne bruger på lektier om dagen. Du har 30 tal fra 10 til 90 minutter. Et boksplot viser i ét greb den midterste halvdel, minimum, maksimum og en streg for medianen.
Boksplot er obligatorisk stof i folkeskolens afgangsprøver (FP9 og FP10) og et centralt element i matematikundervisningen på gymnasiet. Ifølge UVMs læreplan for matematik B, stx (2025) skal du både kunne tegne og aflæse boksplot ved den skriftlige prøves delprøve 1. Det er også et diagram, der dukker op når man arbejder med normalfordelingen og andre statistiske fordelinger. Den gode nyhed: når du forstår de fem nøgletal bag figuren, er boksplot et af de nemmeste statistik-emner.
Hvad er et boksplot?
Nøglebegreb
Boksplot (kassediagram)
Et boksplot er et statistisk diagram, der sammenfatter et datasæt i fem nøgletal: minimum, nedre kvartil (Q1), median, øvre kvartil (Q3) og maksimum. Disse fem tal tegnes på en vandret tallinje som en boks med to 'haler' eller 'antenner' i hver ende.
Eksempel: Et boksplot med min=10, Q1=25, median=40, Q3=60, max=85 viser, at den midterste halvdel af dataene ligger mellem 25 og 60, og at medianen er 40.
Den midterste boks viser, hvor de 50 procent af observationerne, der ligger i midten, befinder sig. Venstre halvdel af boksen dækker den næste fjerdedel (25 – 50 %), og højre halvdel de 25 procent over medianen. De to haler viser resten: den laveste fjerdedel til venstre og den højeste fjerdedel til højre. Boksplottet er særligt nyttigt, når du vil sammenligne to datasæt side om side, fordi det er let at læse af på et sekund. Det er også robust over for ekstreme værdier: en enkelt sky høj observation påvirker ikke boksen, kun halen.
De fem tal i det udvidede kvartilsæt
Kan du sortere dine observationer fra mindst til størst? Så er du halvvejs. Nu skal du finde fem specifikke punkter i den sorterede række. De fem punkter kaldes tilsammen det udvidede kvartilsæt, og de er alt, hvad du behøver for at tegne et boksplot.
| Betegnelse | Symbol | Hvad det viser |
|---|---|---|
| Mindste observation | min | Den laveste værdi i datasættet |
| Nedre kvartil | Q₁ | 25 % af observationerne er under denne værdi |
| Median | Q₂ (eller m) | Den midterste værdi; 50 % er under, 50 % er over |
| Øvre kvartil | Q₃ | 75 % af observationerne er under denne værdi |
| Største observation | max | Den højeste værdi i datasættet |
Afstanden mellem Q1 og Q3 kalder man kvartilbredden. Det er et nyttigt mål, fordi det fortæller, hvor spredt den midterste halvdel af datasættet er, uden at ekstreme værdier påvirker billedet. Jo bredere boksen er, jo mere spredt er dataene i midten. Selve boksen repræsenterer altid 50 procent af dine observationer, uanset hvor mange tal du har i alt.
Boksplot for datasættet: 3, 7, 8, 12, 15, 19, 21, 25
Sådan beregner du kvartilerne trin for trin
Tag datasættet: 8, 3, 21, 7, 25, 15, 12, 19. Det er otte tal i vilkårlig rækkefølge. Tænk på dem som antallet af bøger, otte elever har læst i løbet af et skoleår. Start med at sortere dem, og du er godt i gang.
- 1
Trin 1: Sortér observationerne
Placer alle tal i stigende rækkefølge fra mindst til størst. Vores datasæt bliver: 3, 7, 8, 12, 15, 19, 21, 25.
- 2
Trin 2: Find medianen (Q2)
Medianen er den midterste værdi. Med 8 tal (lige antal) er der ikke et enkelt midtertal. Tag de to midterste tal: det 4. tal (12) og det 5. tal (15). Medianen er gennemsnittet af de to: (12 + 15) divideret med 2 = 13,5.
- 3
Trin 3: Find den nedre kvartil (Q1)
Q1 er medianen af den nedre halvdel af tallene, dvs. tallene til venstre for medianen: 3, 7, 8, 12. Der er 4 tal, så Q1 er gennemsnittet af det 2. og 3. tal: (7 + 8) / 2 = 7,5.
- 4
Trin 4: Find den øvre kvartil (Q3)
Q3 er medianen af den øvre halvdel: tallene til højre for medianen: 15, 19, 21, 25. Der er 4 tal, så Q3 = (19 + 21) / 2 = 20.
Eksempelopgave
Datasæt: 3, 7, 8, 12, 15, 19, 21, 25. Bestem det udvidede kvartilsæt og kvartilbredden.
Vis løsningSkjul løsning
- 1
Sortér og identificer yderpunkter
Tallene er sorterede: 3, 7, 8, 12, 15, 19, 21, 25. Minimum er 3, maksimum er 25.
\[\min = 3, \quad \max = 25\] - 2
Find medianen
n = 8, så medianen er gennemsnittet af det 4. og 5. tal (12 og 15).
\[\text{median} = \frac{12 + 15}{2} = 13{,}5\] - 3
Find Q1
Nedre halv: 3, 7, 8, 12. Medianen af fire tal er gennemsnittet af det 2. og 3. tal.
\[Q_1 = \frac{7 + 8}{2} = 7{,}5\] - 4
Find Q3
Øvre halv: 15, 19, 21, 25. Medianen er gennemsnittet af det 2. og 3. tal.
\[Q_3 = \frac{19 + 21}{2} = 20\] - 5
Beregn kvartilbredden
Kvartilbredden er afstanden fra Q1 til Q3. Det viser spredningen i den midterste halvdel.
\[\text{kvartilbredde} = Q_3 - Q_1 = 20 - 7{,}5 = 12{,}5\]
Formel
Kvartilbredde
Variable
| Symbol | Navn |
|---|---|
| \(Q_1\) | Nedre kvartil |
| \(Q_3\) | Øvre kvartil |
| \(Q_3 - Q_1\) | Kvartilbredde |
Aflæs et boksplot
At tegne et boksplot er én ting. At aflæse et, som du får udleveret i en prøveopgave, er noget lidt andet. Her er, hvad de fire dele af figuren faktisk fortæller dig.
Husk
Y-aksen på et boksplot har ingen matematisk betydning. Det er kun positionen langs x-aksen (tallinja) der tæller. Du kan tegne boksplottet højt eller lavt på siden, og det ændrer ingenting i diagrammet.
Brug for lektiehjælp?
Få hjælp i øjenhøjde af en tutor. Start med en gratis prøvetime uden binding.
Boksen spanner fra Q1 til Q3 og viser, hvor den midterste halvdel af dine data ligger. En bred boks betyder stor spredning i midten; en smal boks betyder, at de fleste observationer er tæt på hinanden. Medianen (stregen inde i boksen) viser centrum. Sidder den tæt på midten af boksen, er fordelingen nogenlunde symmetrisk. Halerne viser, hvor langt de yderste fjerdedele strækker sig: en lang venstre hale signalerer, at der er et lille antal meget lave værdier; en lang højre hale det modsatte.
Sammenlign to boksplot
To klasser har fået karakter i den samme matematiksprøve. Du har boksplottene for begge. Opgaveteksten lyder: 'Sammenlign de to klasser.' Mange elever skriver blot 'Klasse B klarer sig bedre.' Det er ikke tilstrækkeligt. Du skal kommentere både niveauet (medianer) og spredningen (kvartilbredder og variationsbredder) for at få en velargumenteret sammenligning.
Eksempelopgave
Klasse A: min=44, Q1=56, median=67, Q3=77, max=92. Klasse B: min=50, Q1=63, median=73, Q3=83, max=96. Sammenlign de to klasser.
Vis løsningSkjul løsning
- 1
Sammenlign medianer (niveau)
Klasse B har en højere median (73) end klasse A (67). Det betyder, at mindst halvdelen af eleverne i B fik over 73, mens mindst halvdelen i A fik over 67. Klasse B klarer sig gennemgående bedre.
\[\text{Median}_B - \text{Median}_A = 73 - 67 = 6 \text{ karakterpoint}\] - 2
Sammenlign kvartilbredder (spredning i midten)
Kvartilbredde A = 77 - 56 = 21. Kvartilbredde B = 83 - 63 = 20. De to klasser har næsten samme spredning i den midterste halvdel, så niveauforskellen er reel og ikke blot udtryk for større spredning i B.
\[\text{KB}_A = 77 - 56 = 21, \quad \text{KB}_B = 83 - 63 = 20\] - 3
Sammenlign variationsbredder (samlet spredning)
Variationsbredde A = 92 - 44 = 48. Variationsbredde B = 96 - 50 = 46. Klasse A har en anelse bredere samlet spredning. Begge klasser har en svag elev, der trækker minimum ned.
\[\text{VB}_A = 92 - 44 = 48, \quad \text{VB}_B = 96 - 50 = 46\]
Outliers i et boksplot
Nøglebegreb
Outlier (ekstrem observation)
En outlier er en observation, der afviger meget fra de øvrige data i datasættet. En observation er en outlier, hvis den ligger mere end halvanden kvartilbredde under Q1 eller mere end halvanden kvartilbredde over Q3.
Eksempel: Hvis Q1 = 10 og Q3 = 18, er kvartilbredden 8. Nedre grænse = 10 - 1,5 · 8 = -2. Øvre grænse = 18 + 1,5 · 8 = 30. En observation på 38 er derfor en outlier, da 38 > 30.
Outliers optræder typisk i to situationer: enten er der sket en målefejl i dataindsamlingen, eller der er en reel ekstremsituation i din stikprøve. En elev der brugte 300 minutter på lektier en enkelt dag, mens alle andre brugte 30-60 minutter, kan være reel eller en fejlindtastning. I et boksplot med outliers tegner du antennerne kun hen til den yderste observation, der IKKE er en outlier. Outlieren markeres som et separat punkt eller kryds uden for antennerne.
Formel
Outlier-grænser
Variable
| Symbol | Navn |
|---|---|
| \(Q_1\) | Nedre kvartil |
| \(Q_3\) | Øvre kvartil |
| \(Q_3 - Q_1\) | Kvartilbredde |
Eksempelopgave
Datasæt: 5, 8, 10, 12, 14, 15, 16, 18, 20, 38. Er værdien 38 en outlier?
Vis løsningSkjul løsning
- 1
Find Q1 og Q3
Sorteret datasæt: 5, 8, 10, 12, 14, 15, 16, 18, 20, 38. n=10. Nedre halv: 5, 8, 10, 12, 14. Q1 = det midterste tal = 10. Øvre halv: 15, 16, 18, 20, 38. Q3 = det midterste tal = 18.
\[Q_1 = 10, \quad Q_3 = 18\] - 2
Beregn kvartilbredden
Kvartilbredden fortæller, hvor bred midterhalvdelen af datasættet er.
\[Q_3 - Q_1 = 18 - 10 = 8\] - 3
Beregn øvre grænse
En observation er en outlier, hvis den er større end øvre grænse.
\[Q_3 + 1{,}5 \cdot 8 = 18 + 12 = 30\] - 4
Konkluder
Da 38 > 30, er 38 en outlier. I boksplottet støpper den højre antenne ved 20 (den største ikke-outlier), og 38 tegnes som et separat punkt til højre.
Skævhed og boksplot
Hvad sker der, når medianen ikke sidder midt i boksen? Så er fordelingen skæv, og boksplottet viser det tydeligt. Skævhed er en af de ting, en sensor gerne vil høre dig kommentere, når du sammenligner boksplot.
Sidder medianen tæt på Q1 (til venstre i boksen) og den højre hale er lang, er fordelingen højreskæv. Det betyder, at de fleste værdier er lave, men en lille gruppe høje værdier trækker til højre. Indkomstfordelinger er et klassisk eksempel: de fleste tjener et beløb i midten, men en lille gruppe meget rige individer trækker højre hale langt ud. Sidder medianen tæt på Q3 og venstre hale er lang, er fordelingen venstreskæv. En symmetrisk fordeling har medianen omtrent midt i boksen og to nogenlunde lige lange haler. Dette er det mønster, du typisk ser ved binomialfordelingen og andre symmetriske fordelinger.
Boksplot i GeoGebra
Du behøver ikke beregne de fem nøgletal i hånden, når du har GeoGebra. Programmet laver boksplottet for dig på sekunder og markerer automatisk eventuelle outliers. Det er særligt nyttigt, når du arbejder med store datasæt eller skal sammenligne to klasser.
- 1
Åbn GeoGebra
Gå til geogebra.org eller åbn GeoGebra-appen. Vælg 'Regneark' (Spreadsheet) fra startmenuen.
- 2
Skriv dine data
Skriv alle dine observationer i én kolonne, f.eks. A1:A10. én observation per celle. Har du to datasæt til sammenligning, skriv dem i to kolonner side om side.
- 3
Markér dataene
Klik på den første celle, hold Shift nede, og klik på den sidste. Alle observationer er nu markerede.
- 4
Vælg Enkeltvariabelanalyse
Klik på knappen 'Enkeltvariabelanalyse' (ét datasæt) eller 'Flervariabelanalyse' (to datasæt). Et nyt analysevindue åbnes.
- 5
Vælg Boksplot
I analysevinduet ser du en menu med diagramtyper. Vælg 'Boksplot'. GeoGebra beregner automatisk Q1, median, Q3 og markerer eventuelle outliers som separate punkter.
Quiz
Test din forståelse af boksplot
1. Hvad er kvartilbredden for et datasæt med Q1 = 10 og Q3 = 25?
2. Hvad er medianen i datasættet: 2, 5, 7, 10, 13?
3. En observation er en outlier, hvis den er større end...
4. Hvad viser en bred boks i et boksplot?
Ofte stillede spørgsmål om boksplot