Forestil dig, at du har spørgt alle 20 elever i din klasse, hvor mange søskende de har. Du sidder nu med en liste: 0, 1, 2, 0, 1, 2, 2, 1, 3, 2, 1, 3, 2, 1, 0, 2, 1, 2, 2, 1. Det er svært at se mønstret bare ved at kigge på tallene. En hyppighedstabel løser det problem med det samme: tabellen samler dine observationer og viser præcis, hvor mange gange hver værdi forekommer.
Hyppighedstabellen er grundstenen i deskriptiv statistik. Når du har opstillet den, kan du hurtigt beregne frekvens, kumuleret frekvens og statistiske deskriptorer som typetal, middeltal og median. Du møder den i folkeskolen fra 7. klasse og i gymnasiets matematik på C-, B- og A-niveau. Som Undervisningsministeriet lægger vægt på i Krav til matematik på folkeskolens områder, er statistik og sandsynlighed ét af fagets fire centrale kompetenceområder. Kender du tabellens logik, sidder resten af statistikken meget lettere.
Hvad er en hyppighedstabel?
Nøglebegreb
Hyppighedstabel
En hyppighedstabel er en tabel med to kolonner: én der viser de mulige observationer (x), og én der viser hyppigheden h(x), altså antallet af gange hver observation forekommer i datasættet. Summen af alle hyppigheder er altid lig med n, det samlede antal observationer.
Eksempel: Har du observationerne 0, 1, 2, 2, 1, 0, 2, giver tabellen: h(0) = 2, h(1) = 2, h(2) = 3. Summen: 2+2+3 = 7 = n.
Tabellen har altid mindst to kolonner. Den venstre viser de forskellige værdier i datasættet, ordnet fra mindste til største. Den højre viser, hvor mange gange hver enkelt værdi optræder. Summen af alle hyppighederne er altid lig med n. Tilføjer du en tredje kolonne med frekvenser og en fjerde med kumulerede frekvenser, taler man om en frekvenstabel.
Sådan opstiller du en hyppighedstabel trin for trin
Du kan lave en hyppighedstabel med blyant og papir på under fem minutter. Du behøver hverken Excel eller GeoGebra, men begge programmer kan også hjælpe dig, når datasættet er stort.
- 1
Identificér de unikke værdier
Kig på alle dine observationer og skriv de unikke værdier ned i stigende rækkefølge. For observationerne 0, 1, 2, 0, 1, 3 får du: 0, 1, 2, 3.
- 2
Tæl hyppigheden for hver observation
Gå observationerne igennem én for én og tæl, hvor mange gange hver værdi forekommer. Brug tællestreger (IIII) for at holde styr på det.
- 3
Udfyld tabellen
Skriv observationerne i venstre kolonne og de tilsvarende hyppigheder i højre kolonne. Tilføj en 'I alt'-række i bunden med summen af alle hyppigheder.
- 4
Tjek at summen stemmer
Læg alle hyppighederne i højre kolonne sammen. Resultatet skal præcis være lig med det antal observationer, du startede med. Passer det ikke, er der en tællefejl et sted.
Eksempelopgave
En klasse på 20 elever har oplyst, hvor mange søskende de har: 0, 1, 2, 0, 1, 2, 2, 1, 3, 2, 1, 3, 2, 1, 0, 2, 1, 2, 2, 1. Opstil en hyppighedstabel.
Vis løsningSkjul løsning
- 1
Find de unikke observationer
De mulige værdier er 0, 1, 2 og 3. Disse placeres i venstre kolonne.
- 2
Tæl hyppighederne
Gå alle 20 observationer igennem og tæl: 0'er = 3, 1'ere = 7, 2'ere = 8, 3'ere = 2.
\[h(0)=3,\quad h(1)=7,\quad h(2)=8,\quad h(3)=2\] - 3
Udfyld tabellen og tjek summen
Tabellen ser nu sådan ud: x: 0, h(x): 3 x: 1, h(x): 7 x: 2, h(x): 8 x: 3, h(x): 2 I alt: 20 Summen: 3+7+8+2 = 20 = n. Det passer.
\[\sum h(x) = 3 + 7 + 8 + 2 = 20 = n \checkmark\]
Fra hyppighed til frekvens
Hyppighed fortæller, hvor mange der har en bestemt observation. Frekvens fortæller, hvor stor en andel det svarer til. Forskellen er, at frekvensen giver et tal du kan sammenligne på tværs af klasser med forskellig størrelse: 8 ud af 20 er præcis 40%, uanset om klassen har 20 eller 200 elever.
Formel
Frekvens (relativ hyppighed)
Variable
| Symbol | Navn | Enhed |
|---|---|---|
| \(f(x)\) | Frekvens | Dimensionsløs (0 til 1) |
| \(h(x)\) | Hyppighed | Antal observationer |
| \(n\) | Observationssættets størrelse | Antal |
Frekvensen er et tal mellem 0 og 1. Ganger du med 100 får du en procent. Summen af alle frekvenser skal altid være 1,00 (eller 100%). Det er en praktisk kontrol: passer summen ikke, er der regnet forkert et sted.
Eksempelopgave
Beregn frekvenserne for søskendeekssemplet med n = 20, h(0) = 3, h(1) = 7, h(2) = 8 og h(3) = 2.
Vis løsningSkjul løsning
- 1
Beregn f(0)
Del hyppighed med n:
\[f(0) = \frac{3}{20} = 0{,}15 = 15\%\] - 2
Beregn f(1), f(2) og f(3)
Samme fremgangsmåde:
\[f(1) = \frac{7}{20} = 0{,}35, \quad f(2) = \frac{8}{20} = 0{,}40, \quad f(3) = \frac{2}{20} = 0{,}10\] - 3
Tjek summen
Summen af alle frekvenser skal være 1:
\[0{,}15 + 0{,}35 + 0{,}40 + 0{,}10 = 1{,}00 \checkmark\]
Frekvensen i procent fungerer på samme måde som almindelig procentregning. Vil du friske procentreglerne op, kan du læse vores guide til procentregning.
Kumuleret frekvens: svar på 'hvor mange har højst X?'
Spørg dig selv: hvor stor en del af eleverne har 1 søskende eller færre? Det kan du ikke aflæse direkte i hyppighedstabellen, men du kan beregne det via den kumulerede frekvens. Den kumulerede frekvens af x er summen af alle frekvenser for observationer mindre end eller lig med x.
Kumuleret frekvens kaldes også summeret frekvens. Du starter med den første frekvens og lægger den næste til, trin for trin. Den sidste kumulerede frekvens skal altid være 1,00. Det er igen en næn kontrol af dine beregninger.
Eksempelopgave
Beregn den kumulerede frekvens for søskendeeksemplet: f(0) = 0,15, f(1) = 0,35, f(2) = 0,40, f(3) = 0,10.
Vis løsningSkjul løsning
- 1
F(0): frekvens op til og med 0 søskende
Den kumulerede frekvens af 0 er blot frekvensen af 0:
\[F(0) = f(0) = 0{,}15\] - 2
F(1): op til og med 1 søskende
Læg frekvenserne for 0 og 1 sammen:
\[F(1) = f(0) + f(1) = 0{,}15 + 0{,}35 = 0{,}50\] - 3
F(2) og F(3)
Fortsæt ved at lægge den næste frekvens til:
\[F(2) = 0{,}50 + 0{,}40 = 0{,}90 \qquad F(3) = 0{,}90 + 0{,}10 = 1{,}00\] - 4
Aflæs resultatet
F(1) = 0,50 betyder, at 50% af eleverne har højst 1 søskende. F(2) = 0,90 betyder, at 90% har højst 2 søskende. Den kumulerede frekvens bruges bl.a. til at aflæse medianen og kvartiler fra tabellen og til at tegne et trappediagram.
Ugrupperede og grupperede observationer
Søskendeeksemplet fungerer, fordi der kun er fire mulige værdier. Forestil dig i stedet, at du måler 200 personers håndstørrelse i millimeter: så ville du måske få 150 forskellige observationer, og en tabel med 150 rækker hjælper dig ikke meget. Her er løsningen at gruppere observationerne i intervaller.
| Type | Hvornår? | Kolonnebetegnelse | Eksempel |
|---|---|---|---|
| Ugrupperede observationer | Få mulige værdier | Observation (x) og Hyppighed h(x) | Antal søskende: 0, 1, 2, 3 |
| Grupperede observationer | Mange eller kontinuerte værdier | Interval og Intervalhyppighed | Håndstørrelse: ]150;160], ]160;170] mm |
Ved grupperede observationer hedder kolonnen intervalhyppighed frem for hyppighed. Normén er, at et tal, der ligger præcis på grænsen mellem to intervaller, hører til det laveste interval. Det gør tabellen entydig. Vælg typisk 5 til 10 intervaller med samme bredde, og husk: jo bredere intervaller, jo bedre overblik, men jo mere information mister du.
Statistiske deskriptorer du kan aflæse fra tabellen
Tag søskendetabellen igen. Hvem har flest søskende? Hvad er gennemsnittet? De spørgsmål kan du besvare direkte fra tabellen, uden at gå tilbage til de originale rådata.
Eksempelopgave
Find typetal, variationsbredde, middeltal og median for søskendeeksemplet ud fra hyppighedstabellen: h(0)=3, h(1)=7, h(2)=8, h(3)=2, n=20.
Vis løsningSkjul løsning
- 1
Typetal
Typetallet er den observation med den største hyppighed. Her er h(2) = 8 størst, så typetal = 2.
\[\text{Typetal} = 2\] - 2
Variationsbredde
Variationsbredden er størsteværdien minus mindsteværdien:
\[V = 3 - 0 = 3\] - 3
Middeltal (gennemsnit)
Gang hver observation med sin hyppighed, læg det hele sammen og divider med n:
\[\bar{x} = \frac{3 \cdot 0 + 7 \cdot 1 + 8 \cdot 2 + 2 \cdot 3}{20} = \frac{0 + 7 + 16 + 6}{20} = \frac{29}{20} = 1{,}45\] - 4
Median
Med 20 observationer er medianen gennemsnittet af den 10. og 11. observation i sorteret rækkefølge. Fra tabellen: de første 3 er 0'er, de næste 7 er 1'ere (observation 4-10), herefter starter 2'erne (observation 11-18). Den 10. observation er 1, den 11. er 2:
\[\text{Median} = \frac{1 + 2}{2} = 1{,}5\]
Er du interesseret i mere avancerede statistiske fordelinger, kan du læse vores guide til normalfordelingen. Har du brug for hjælp med statistikopgaver, finder du erfarne tutorer hos Toptutors lektiehjælp i matematik.
Diagrammer fra din hyppighedstabel
En tabel viser tallene. Et diagram viser mønstret. Der er tre diagramtyper, du typisk bruger med ugrupperede observationer: pindediagrammet, søjlediagrammet og trappediagrammet.
Pindediagrammet viser hyppigheder som lodrette pinde over en vandret akse. Søjlediagrammet er identisk opbygning, men med bredere søjler. Begge visualiserer hyppighedsfordelingen. Trappediagrammet viser kumulerede frekvenser og stiger i trin. Nedenfor er pindediagrammet for søskendeeksemplet tegnet som en interaktiv graf.
Pindediagram: antal søskende (n = 20)
Søjlen ved 2 er klart højest, fordi h(2) = 8 er typetallet. Diagrammet bekræfter visuelt det, du allerede vidste fra tabellen. Vil du lave dit eget pindediagram, taster du dine observationer og hyppigheder direkte ind i GeoGebra eller Excel og vælger 'pinde-' eller 'søjlediagram'.
Sidder du fast med statistikopgaver?
Toptutors har over 1.000 certificerede tutorer i matematik, der kan hjælpe dig med hyppighedstabeller, frekvens og meget mere. Prøv en gratis time uden binding.
Quiz
Test din viden om hyppighedstabeller
1. Et datasæt har 30 observationer. Hvad er summen af alle hyppighederne i tabellen?
2. I en hyppighedstabel er h(5) = 4 og n = 20. Hvad er frekvensen f(5)?
3. Hvad fortæller typetallet?
4. Hvad er den kumulerede frekvens F(x)?
5. Hvornår er det en god idé at gruppere observationerne?
Ofte stillede spørgsmål om hyppighedstabeller