Boksplot løser et klassisk problem i statistik: du har mange tal, og du vil vide, hvad de egentlig fortæller. De individuelle observationer ser kaotiske ud, men kondenér dem til fem nøgletal, og overblikket dukker straks frem. Forestil dig en klasse, der har undersøgt, hvor mange minutter eleverne bruger på lektier om dagen. Du har 30 tal fra 10 til 90 minutter. Et boksplot viser i ét greb den midterste halvdel, minimum, maksimum og en streg for medianen.

Boksplot er obligatorisk stof i folkeskolens afgangsprøver (FP9 og FP10) og et centralt element i matematikundervisningen på gymnasiet. Ifølge UVMs læreplan for matematik B, stx (2025) skal du både kunne tegne og aflæse boksplot ved den skriftlige prøves delprøve 1. Det er også et diagram, der dukker op når man arbejder med normalfordelingen og andre statistiske fordelinger. Den gode nyhed: når du forstår de fem nøgletal bag figuren, er boksplot et af de nemmeste statistik-emner.

Hvad er et boksplot?

Nøglebegreb

Boksplot (kassediagram)

Et boksplot er et statistisk diagram, der sammenfatter et datasæt i fem nøgletal: minimum, nedre kvartil (Q1), median, øvre kvartil (Q3) og maksimum. Disse fem tal tegnes på en vandret tallinje som en boks med to 'haler' eller 'antenner' i hver ende.

Eksempel: Et boksplot med min=10, Q1=25, median=40, Q3=60, max=85 viser, at den midterste halvdel af dataene ligger mellem 25 og 60, og at medianen er 40.

Den midterste boks viser, hvor de 50 procent af observationerne, der ligger i midten, befinder sig. Venstre halvdel af boksen dækker den næste fjerdedel (25 – 50 %), og højre halvdel de 25 procent over medianen. De to haler viser resten: den laveste fjerdedel til venstre og den højeste fjerdedel til højre. Boksplottet er særligt nyttigt, når du vil sammenligne to datasæt side om side, fordi det er let at læse af på et sekund. Det er også robust over for ekstreme værdier: en enkelt sky høj observation påvirker ikke boksen, kun halen.

De fem tal i det udvidede kvartilsæt

Kan du sortere dine observationer fra mindst til størst? Så er du halvvejs. Nu skal du finde fem specifikke punkter i den sorterede række. De fem punkter kaldes tilsammen det udvidede kvartilsæt, og de er alt, hvad du behøver for at tegne et boksplot.

BetegnelseSymbolHvad det viser
Mindste observationminDen laveste værdi i datasættet
Nedre kvartilQ₁25 % af observationerne er under denne værdi
MedianQ₂ (eller m)Den midterste værdi; 50 % er under, 50 % er over
Øvre kvartilQ₃75 % af observationerne er under denne værdi
Største observationmaxDen højeste værdi i datasættet

Afstanden mellem Q1 og Q3 kalder man kvartilbredden. Det er et nyttigt mål, fordi det fortæller, hvor spredt den midterste halvdel af datasættet er, uden at ekstreme værdier påvirker billedet. Jo bredere boksen er, jo mere spredt er dataene i midten. Selve boksen repræsenterer altid 50 procent af dine observationer, uanset hvor mange tal du har i alt.

Boksplot for datasættet: 3, 7, 8, 12, 15, 19, 21, 25

Sådan beregner du kvartilerne trin for trin

Tag datasættet: 8, 3, 21, 7, 25, 15, 12, 19. Det er otte tal i vilkårlig rækkefølge. Tænk på dem som antallet af bøger, otte elever har læst i løbet af et skoleår. Start med at sortere dem, og du er godt i gang.

  1. 1

    Trin 1: Sortér observationerne

    Placer alle tal i stigende rækkefølge fra mindst til størst. Vores datasæt bliver: 3, 7, 8, 12, 15, 19, 21, 25.

  2. 2

    Trin 2: Find medianen (Q2)

    Medianen er den midterste værdi. Med 8 tal (lige antal) er der ikke et enkelt midtertal. Tag de to midterste tal: det 4. tal (12) og det 5. tal (15). Medianen er gennemsnittet af de to: (12 + 15) divideret med 2 = 13,5.

  3. 3

    Trin 3: Find den nedre kvartil (Q1)

    Q1 er medianen af den nedre halvdel af tallene, dvs. tallene til venstre for medianen: 3, 7, 8, 12. Der er 4 tal, så Q1 er gennemsnittet af det 2. og 3. tal: (7 + 8) / 2 = 7,5.

  4. 4

    Trin 4: Find den øvre kvartil (Q3)

    Q3 er medianen af den øvre halvdel: tallene til højre for medianen: 15, 19, 21, 25. Der er 4 tal, så Q3 = (19 + 21) / 2 = 20.

Eksempelopgave

Datasæt: 3, 7, 8, 12, 15, 19, 21, 25. Bestem det udvidede kvartilsæt og kvartilbredden.

Vis løsning
  1. 1

    Sortér og identificer yderpunkter

    Tallene er sorterede: 3, 7, 8, 12, 15, 19, 21, 25. Minimum er 3, maksimum er 25.

    \[\min = 3, \quad \max = 25\]
  2. 2

    Find medianen

    n = 8, så medianen er gennemsnittet af det 4. og 5. tal (12 og 15).

    \[\text{median} = \frac{12 + 15}{2} = 13{,}5\]
  3. 3

    Find Q1

    Nedre halv: 3, 7, 8, 12. Medianen af fire tal er gennemsnittet af det 2. og 3. tal.

    \[Q_1 = \frac{7 + 8}{2} = 7{,}5\]
  4. 4

    Find Q3

    Øvre halv: 15, 19, 21, 25. Medianen er gennemsnittet af det 2. og 3. tal.

    \[Q_3 = \frac{19 + 21}{2} = 20\]
  5. 5

    Beregn kvartilbredden

    Kvartilbredden er afstanden fra Q1 til Q3. Det viser spredningen i den midterste halvdel.

    \[\text{kvartilbredde} = Q_3 - Q_1 = 20 - 7{,}5 = 12{,}5\]

Formel

Kvartilbredde

\[\text{kvartilbredde} = Q_3 - Q_1\]

Variable

SymbolNavn
\(Q_1\)Nedre kvartil
\(Q_3\)Øvre kvartil
\(Q_3 - Q_1\)Kvartilbredde
Hvornår: Brug kvartilbredden som mål for spredningen i den midterste halvdel af datasættet. En stor kvartilbredde betyder stor variation; en lille kvartilbredde betyder, at dataene i midten er tæt samlet.

Aflæs et boksplot

At tegne et boksplot er én ting. At aflæse et, som du får udleveret i en prøveopgave, er noget lidt andet. Her er, hvad de fire dele af figuren faktisk fortæller dig.

Husk

Y-aksen på et boksplot har ingen matematisk betydning. Det er kun positionen langs x-aksen (tallinja) der tæller. Du kan tegne boksplottet højt eller lavt på siden, og det ændrer ingenting i diagrammet.

Brug for lektiehjælp?

Få hjælp i øjenhøjde af en tutor. Start med en gratis prøvetime uden binding.

Få en gratis prøvetime

Boksen spanner fra Q1 til Q3 og viser, hvor den midterste halvdel af dine data ligger. En bred boks betyder stor spredning i midten; en smal boks betyder, at de fleste observationer er tæt på hinanden. Medianen (stregen inde i boksen) viser centrum. Sidder den tæt på midten af boksen, er fordelingen nogenlunde symmetrisk. Halerne viser, hvor langt de yderste fjerdedele strækker sig: en lang venstre hale signalerer, at der er et lille antal meget lave værdier; en lang højre hale det modsatte.

Sammenlign to boksplot

To klasser har fået karakter i den samme matematiksprøve. Du har boksplottene for begge. Opgaveteksten lyder: 'Sammenlign de to klasser.' Mange elever skriver blot 'Klasse B klarer sig bedre.' Det er ikke tilstrækkeligt. Du skal kommentere både niveauet (medianer) og spredningen (kvartilbredder og variationsbredder) for at få en velargumenteret sammenligning.

Eksempelopgave

Klasse A: min=44, Q1=56, median=67, Q3=77, max=92. Klasse B: min=50, Q1=63, median=73, Q3=83, max=96. Sammenlign de to klasser.

Vis løsning
  1. 1

    Sammenlign medianer (niveau)

    Klasse B har en højere median (73) end klasse A (67). Det betyder, at mindst halvdelen af eleverne i B fik over 73, mens mindst halvdelen i A fik over 67. Klasse B klarer sig gennemgående bedre.

    \[\text{Median}_B - \text{Median}_A = 73 - 67 = 6 \text{ karakterpoint}\]
  2. 2

    Sammenlign kvartilbredder (spredning i midten)

    Kvartilbredde A = 77 - 56 = 21. Kvartilbredde B = 83 - 63 = 20. De to klasser har næsten samme spredning i den midterste halvdel, så niveauforskellen er reel og ikke blot udtryk for større spredning i B.

    \[\text{KB}_A = 77 - 56 = 21, \quad \text{KB}_B = 83 - 63 = 20\]
  3. 3

    Sammenlign variationsbredder (samlet spredning)

    Variationsbredde A = 92 - 44 = 48. Variationsbredde B = 96 - 50 = 46. Klasse A har en anelse bredere samlet spredning. Begge klasser har en svag elev, der trækker minimum ned.

    \[\text{VB}_A = 92 - 44 = 48, \quad \text{VB}_B = 96 - 50 = 46\]

Outliers i et boksplot

Nøglebegreb

Outlier (ekstrem observation)

En outlier er en observation, der afviger meget fra de øvrige data i datasættet. En observation er en outlier, hvis den ligger mere end halvanden kvartilbredde under Q1 eller mere end halvanden kvartilbredde over Q3.

Eksempel: Hvis Q1 = 10 og Q3 = 18, er kvartilbredden 8. Nedre grænse = 10 - 1,5 · 8 = -2. Øvre grænse = 18 + 1,5 · 8 = 30. En observation på 38 er derfor en outlier, da 38 > 30.

Outliers optræder typisk i to situationer: enten er der sket en målefejl i dataindsamlingen, eller der er en reel ekstremsituation i din stikprøve. En elev der brugte 300 minutter på lektier en enkelt dag, mens alle andre brugte 30-60 minutter, kan være reel eller en fejlindtastning. I et boksplot med outliers tegner du antennerne kun hen til den yderste observation, der IKKE er en outlier. Outlieren markeres som et separat punkt eller kryds uden for antennerne.

Formel

Outlier-grænser

\[x < Q_1 - 1{,}5 \cdot (Q_3 - Q_1) \quad \text{eller} \quad x > Q_3 + 1{,}5 \cdot (Q_3 - Q_1)\]

Variable

SymbolNavn
\(Q_1\)Nedre kvartil
\(Q_3\)Øvre kvartil
\(Q_3 - Q_1\)Kvartilbredde
Hvornår: Brug grænserne til at afgøre, om en observation i dit datasæt skal betragtes som en outlier og markeres separat i boksplottet.
\[\text{Nedre grænse} = Q_1 - 1{,}5 \cdot (Q_3 - Q_1)\]
\[\text{Øvre grænse} = Q_3 + 1{,}5 \cdot (Q_3 - Q_1)\]

Eksempelopgave

Datasæt: 5, 8, 10, 12, 14, 15, 16, 18, 20, 38. Er værdien 38 en outlier?

Vis løsning
  1. 1

    Find Q1 og Q3

    Sorteret datasæt: 5, 8, 10, 12, 14, 15, 16, 18, 20, 38. n=10. Nedre halv: 5, 8, 10, 12, 14. Q1 = det midterste tal = 10. Øvre halv: 15, 16, 18, 20, 38. Q3 = det midterste tal = 18.

    \[Q_1 = 10, \quad Q_3 = 18\]
  2. 2

    Beregn kvartilbredden

    Kvartilbredden fortæller, hvor bred midterhalvdelen af datasættet er.

    \[Q_3 - Q_1 = 18 - 10 = 8\]
  3. 3

    Beregn øvre grænse

    En observation er en outlier, hvis den er større end øvre grænse.

    \[Q_3 + 1{,}5 \cdot 8 = 18 + 12 = 30\]
  4. 4

    Konkluder

    Da 38 > 30, er 38 en outlier. I boksplottet støpper den højre antenne ved 20 (den største ikke-outlier), og 38 tegnes som et separat punkt til højre.

Skævhed og boksplot

Hvad sker der, når medianen ikke sidder midt i boksen? Så er fordelingen skæv, og boksplottet viser det tydeligt. Skævhed er en af de ting, en sensor gerne vil høre dig kommentere, når du sammenligner boksplot.

Sidder medianen tæt på Q1 (til venstre i boksen) og den højre hale er lang, er fordelingen højreskæv. Det betyder, at de fleste værdier er lave, men en lille gruppe høje værdier trækker til højre. Indkomstfordelinger er et klassisk eksempel: de fleste tjener et beløb i midten, men en lille gruppe meget rige individer trækker højre hale langt ud. Sidder medianen tæt på Q3 og venstre hale er lang, er fordelingen venstreskæv. En symmetrisk fordeling har medianen omtrent midt i boksen og to nogenlunde lige lange haler. Dette er det mønster, du typisk ser ved binomialfordelingen og andre symmetriske fordelinger.

Boksplot i GeoGebra

Du behøver ikke beregne de fem nøgletal i hånden, når du har GeoGebra. Programmet laver boksplottet for dig på sekunder og markerer automatisk eventuelle outliers. Det er særligt nyttigt, når du arbejder med store datasæt eller skal sammenligne to klasser.

  1. 1

    Åbn GeoGebra

    Gå til geogebra.org eller åbn GeoGebra-appen. Vælg 'Regneark' (Spreadsheet) fra startmenuen.

  2. 2

    Skriv dine data

    Skriv alle dine observationer i én kolonne, f.eks. A1:A10. én observation per celle. Har du to datasæt til sammenligning, skriv dem i to kolonner side om side.

  3. 3

    Markér dataene

    Klik på den første celle, hold Shift nede, og klik på den sidste. Alle observationer er nu markerede.

  4. 4

    Vælg Enkeltvariabelanalyse

    Klik på knappen 'Enkeltvariabelanalyse' (ét datasæt) eller 'Flervariabelanalyse' (to datasæt). Et nyt analysevindue åbnes.

  5. 5

    Vælg Boksplot

    I analysevinduet ser du en menu med diagramtyper. Vælg 'Boksplot'. GeoGebra beregner automatisk Q1, median, Q3 og markerer eventuelle outliers som separate punkter.

Quiz

Test din forståelse af boksplot

0/4 besvaret

1. Hvad er kvartilbredden for et datasæt med Q1 = 10 og Q3 = 25?

2. Hvad er medianen i datasættet: 2, 5, 7, 10, 13?

3. En observation er en outlier, hvis den er større end...

4. Hvad viser en bred boks i et boksplot?

Ofte stillede spørgsmål om boksplot

Hvad er forskellen på et boksplot og et histogram?
Et histogram viser fordelingen som søjler, hvor søjlehøjden angiver antallet af observationer i hvert interval. Et boksplot kondenserer data til fem nøgletal og viser ikke enkeltværdier. Histogrammet er bedre til at se den præcise form (fx om der er to toppe i fordelingen), mens boksplottet er bedre til hurtigt at sammenligne to eller flere datasæt og vurdere niveau og spredning.
Hvad gør jeg, hvis der er en outlier i mit datasæt?
Beregn outlier-grænserne: nedre = Q1 - 1,5 · (Q3 - Q1) og øvre = Q3 + 1,5 · (Q3 - Q1). Outlierne tegnes som separate punkter, og antennerne stopper ved den yderste observation, der IKKE er en outlier. Vær altid opmærksom på, om outlierne er fejl i dataindsamlingen, eller om de afspejler en reel ekstremsituation.
Hvad er forskellen på median og gennemsnit?
Gennemsnittet beregnes ved at lægge alle tal sammen og dividere med antallet. Det påvirkes kraftigt af outliers. Medianen er den midterste værdi, når tallene er sorteret, og er robust over for ekstreme observationer. Boksplottet bruger medianen, fordi den giver et mere retvisende billede af centrum, når der er meget skæve fordelinger eller outliers.
Hvordan aflæser jeg skævhed i et boksplot?
Se på, om medianen sidder midt i boksen, og om de to haler er nogenlunde lige lange. Sidder medianen tæt på Q1 og den højre hale er lang, er fordelingen højreskæv. Sidder medianen tæt på Q3 og venstre hale er lang, er fordelingen venstreskæv. Er fordelingen symmetrisk, sidder medianen omtrent midt i boksen og de to haler er omtrent lige lange.
Hvad er det udvidede kvartilsæt?
Det udvidede kvartilsæt består af de fem nøgletal: minimum, Q1, median (Q2), Q3 og maksimum. Disse fem tal er alt, hvad du behøver for at tegne et boksplot. Kvartilsættet (uden 'udvidet') er blot de tre tal Q1, median og Q3.