Normalfordeling er et af de vigtigste emner i gymnasiets statistik og er fast pensum på Matematik A på både STX og HHX. Fordelingen beskriver, hvordan mange målinger i virkeligheden fordeler sig: de fleste resultater klumper sig om middelværdien, mens ekstreme værdier er sjældne. Tænk på elevers testresultater, vægten af produkter fra en fabrik eller den menneskelige højde – alle disse fænomener følger typisk en normalfordeling.
I denne guide gennemgår vi alt om normalfordeling: normalfordeling formel, tæthedsfunktion, standardnormalfordeling, 68-95-99,7-reglen, fraktiler og konfidensinterval for middelværdi. Du får konkrete eksempler og trin-for-trin-vejledning. Har du brug for personlig hjælp, finder du lektiehjælp i matematik hos Toptutors med mere end 1.000 certificerede tutors – og du kan prøve en gratis time uden binding.
Hvad er normalfordeling?
Nøglebegreb
Normalfordeling
En normalfordeling er en kontinuert sandsynlighedsfordeling kendetegnet ved en symmetrisk, klokkeformet kurve (Gauss-kurven). Den beskrives fuldstændigt af to parametre: middelværdien μ og standardafvigelsen σ. Vi skriver X ~ N(μ, σ), når en stokastisk variabel X er normalfordelt med middelværdi μ og spredning σ. Arealet under kurven er altid lig med 1.
Eksempel: Menneskenes højde, karakterfordeling i en klasse, fyldningsmåling på en fabrik.
Normalfordeling er en af de vigtigste sandsynlighedsfordelinger i matematikken og bruges i et hav af praktiske situationer. Det karakteristiske ved fordelingen er, at kurven er symmetrisk om middelværdien: halvdelen af observationerne er under μ, og halvdelen er over. Toppunktet befinder sig præcis ved x = μ.
For at forstå hvad normalfordeling er, hjælper det at forestille sig 1.000 tilfældige personers højde. De fleste vil ligge tæt på gennemsnittet - lad os sige 174 cm - mens meget lave eller meget høje personer er sjældne. Tegner man disse målinger i en graf, fremstår den typiske klokkekurve. Historisk var Carl Friedrich Gauss en af de første til at beskrive fordelingen matematisk i 1809 i forbindelse med mindste kvadraters metode.
Standardnormalfordelingen N(0,1) – den klassiske klokkekurve
Middelværdi og standardafvigelse - normalfordelingens to parametre
En normalfordeling bestemmes fuldstændigt af to parametre: middelværdien μ (udtales "my") og standardafvigelsen σ (udtales "sigma"). Middelværdien μ angiver kurvens centrum – den x-værdi, hvor toppunktet befinder sig. Jo større μ, desto mere forskydes kurven mod højre. Standardafvigelsen σ styrer kurvens bredde: en stor σ giver en bred, flad klokke, og en lille σ giver en smal, høj klokke.
Variansen betegnes \( \sigma^2 \) og er kvadratet af standardafvigelsen. I gymnasiet arbejdes typisk med σ direkte. Notationen X ~ N(μ, σ) bruges til at angive normalfordeling: X ~ N(5, 2) er en normalfordeling med middelværdi 5 og spredning 2. Bemærk: visse bøger bruger variansen som parameter (N(μ, σ²)), men på gymnasiet i Danmark er det standardafvigelsen σ der bruges.
Formel
Notation for normalfordeling
Variable
| Symbol | Navn |
|---|---|
| \(\mu\) | Middelværdi |
| \(\sigma\) | Standardafvigelse (spredning) |
| Parameter | Symbol | Effekt på kurven |
|---|---|---|
| Middelværdi | μ (my) | Forskydes kurven til højre (stor μ) eller venstre (lille μ) |
| Standardafvigelse | σ (sigma) | Bred, lav klokke (stor σ) eller smal, høj klokke (lille σ) |
| Varians | σ² | Kvadratet af standardafvigelsen – bruges i avancerede beregninger |
Normalfordelt stokastisk variabel og fordelingstyper
En stokastisk variabel, der har normalfordelingen som sandsynlighedsfordeling, kaldes en normalfordelt stokastisk variabel. Middelværdien μ er nemlig et reelt tal, mens spredningen σ er et positivt reelt tal. I gymnasiet arbejder du med to slags fordelinger: diskrete (som binomialfordelingen, der kun tager heltallige værdier) og kontinuerte (som normalfordelingen, der kan antage alle reelle værdier). Normalfordelingen er kontinuert.
Sandsynligheder i en kontinuert fordeling beregnes som arealer under tæthedsfunktionens kurve. Det er her integralregning fra Matematik A kommer i spil – dog bruger du i praksis altid CAS-værktøjer til selve udregningen. Vil du repetere de grundlæggende statistikbegreber, finder du målrettet hjælp på Toptutors' matematikside, hvor mere end 70.000 undervisningstimer er gennemført med gymnasieelever.
Tæthedsfunktionen – normalfordelingens formel
Tæthedsfunktionen for normalfordelingen – også kaldet frekvensfunktionen – er den funktion, hvis graf danner den karakteristiske klokkekurve. For en normalfordeling med middelværdi μ og standardafvigelse σ er tæthedsfunktionen f(x) givet ved formlen nedenfor. Bemærk, at toppunktet altid befinder sig ved x = μ, og at kurven er symmetrisk om dette punkt. Arealet under kurven fra minus uendelig til plus uendelig er altid 1.
Formel
Normalfordelingens tæthedsfunktion
Variable
| Symbol | Navn |
|---|---|
| \(x\) | Observationsværdien |
| \(\mu\) | Middelværdien |
| \(\sigma\) | Standardafvigelsen |
| \(e\) | Eulers tal (≈ 2,718) |
| \(\pi\) | Pi (≈ 3,14159) |
Selve formlen kan virke skræmmende, men budskabet er enkelt: arealet under kurven er altid 1, og kurven er symmetrisk om μ. I gymnasiet skal du ikke kunne udlede eller integrere formlen – det kræver universitetsmatematik. Du skal dog forstå, hvad μ og σ gør, og kunne bruge GeoGebra eller TI-Nspire til at beregne sandsynligheder. Integralet afhænger af en fejlfunktion Erf(z), som kun kan beregnes numerisk.
Effekten af μ og σ: grøn = N(0,1), orange = N(0,2), rød = N(2,1)
Sandsynlighed og fordelingsfunktionen
I en normalfordeling er sandsynligheder altid arealer under tæthedsfunktionens kurve. Sandsynligheden for, at X antager en værdi i intervallet [a, b], er arealet fra a til b under kurven. Fordelingsfunktionen F(x) angiver arealet fra minus uendelig til x, dvs. F(x) = P(X ≤ x). Grafen for fordelingsfunktionen er S-formet og stiger fra 0 til 1.
Da normalfordelingskurven er symmetrisk om middelværdien μ, gælder altid at F(μ) = 1/2. For at beregne P(a ≤ X ≤ b) bruger du: P(a ≤ X ≤ b) = F(b) - F(a). I GeoGebra Calculator er kommandoen NormalFordeling(μ, σ, x) lig med F(x), og du beregner sandsynligheder ved at trække to værdier fra hinanden. I TI-Nspire bruges normalcdf(a, b, μ, σ) direkte.
- 1
Åbn GeoGebra Calculator
Gå til geogebra.org/calculator eller åbn GeoGebra på din computer.
- 2
Find sandsynlighedsregneren
Klik på menuen og vælg Sandsynlighedsregner (Probability Calculator).
- 3
Vælg normalfordeling
Vælg 'Normal' som fordeling og indtast μ (middelværdi) og σ (standardafvigelse).
- 4
Beregn en sandsynlighed
Angiv intervallet [a; b]. GeoGebra beregner og viser arealet P(a ≤ X ≤ b).
- 5
Find en fraktil
Vil du finde en x-værdi ud fra en sandsynlighed, brug NormalFordelingInvers(μ, σ, p) i CAS-feltet.
Eksempelopgave
X er normalfordelt med X ~ N(10, 2). Find sandsynligheden P(8 ≤ X ≤ 13).
Vis løsningSkjul løsning
- 1
Aflæs parametre
Middelværdi μ = 10, standardafvigelse σ = 2.
- 2
Opsæt udtryk
Vi bruger F(b) - F(a).
\[P(8 \leq X \leq 13) = F(13) - F(8)\] - 3
Beregn i GeoGebra
Skriv: NormalFordeling(10, 2, 13) - NormalFordeling(10, 2, 8)
- 4
Resultatet
P(8 ≤ X ≤ 13) ≈ 0,7745 = 77,45%.
\[P(8 \leq X \leq 13) \approx 0{,}7745\]
Standardnormalfordeling
Standardnormalfordelingen er normalfordelingen med middelværdi μ = 0 og standardafvigelse σ = 1. Den skrives Z ~ N(0, 1). Tæthedsfunktionen for standardnormalfordelingen kaldes φ (phi), og fordelingsfunktionen kaldes Φ (stor phi). Standardnormalfordelingen er særlig, fordi enhver normalfordeling kan omregnes til den ved standardisering.
Standardisering går ud på, at man trækker middelværdien fra en observation og dividerer med spredningen. Resultatet er en z-score, som angiver, hvor mange standardafvigelser en observation befinder sig fra middelværdien. En z-score på +2 betyder, at observationen er 2 standardafvigelser over gennemsnittet. Standardisering bruges bl.a. til at sammenligne observationer fra fordelinger med forskellig μ og σ.
Formel
Standardisering (z-score)
Variable
| Symbol | Navn |
|---|---|
| \(z\) | Z-score / antal standardafvigelser fra middelværdien |
| \(x\) | Observationsværdien |
| \(\mu\) | Middelværdien |
| \(\sigma\) | Standardafvigelsen |
68-95-99,7-reglen og normale udfald
En af de mest nyttige egenskaber ved normalfordelingen er 68-95-99,7-reglen. Den fortæller, at for en hvilken som helst normalfordeling X ~ N(μ, σ) gælder: ca. 68,27% af observationerne ligger i [μ − σ; μ + σ], ca. 95,45% i [μ − 2σ; μ + 2σ], og ca. 99,73% i [μ − 3σ; μ + 3σ]. Disse tre tal er essentielle at huske til eksamen.
Baseret på reglen definerer vi normale og exceptionelle udfald. Et udfald er normalt, hvis det befinder sig i intervallet [μ − 2σ; μ + 2σ] – dvs. inden for to standardafvigelser. Et udfald er exceptionelt, hvis det befinder sig uden for [μ − 3σ; μ + 3σ] – dvs. mere end 3 spredninger fra middelværdien. Sandsynligheden for et exceptionelt udfald er kun 0,27%.
| Interval | Sandsynlighed | Klassifikation |
|---|---|---|
| [μ − σ; μ + σ] | 68,27% | – |
| [μ − 2σ; μ + 2σ] | 95,45% | Normale udfald |
| [μ − 3σ; μ + 3σ] | 99,73% | Ikke-exceptionelle udfald |
| Uden for [μ − 3σ; μ + 3σ] | 0,27% | Exceptionelle udfald |
Eksempelopgave
X er normalfordelt med X ~ N(9, 2). Bestem intervallet for normale udfald, og afgør om 14 er et exceptionelt udfald.
Vis løsningSkjul løsning
- 1
Normale udfald
Normale udfald er de værdier, der er inden for 2σ fra μ.
\[[9 - 2 \cdot 2;\ 9 + 2 \cdot 2] = [5;\ 13]\] - 2
Exceptionelle grænser
Exceptionelle udfald er dem, der er mere end 3σ fra μ.
\[[9 - 3 \cdot 2;\ 9 + 3 \cdot 2] = [3;\ 15]\] - 3
Vurdering af 14
14 ligger inden for [3; 15], så det er ikke exceptionelt. Men 14 > 13, så det er heller ikke et normalt udfald – det er et udfald, der er usædvanligt men ikke exceptionelt.
Fraktiler i normalfordelingen
En p-fraktil er den x-værdi, for hvilken sandsynligheden P(X ≤ x) = p. Med andre ord: p-fraktilen deler fordelingen, så en p-andel af observationerne er under den. Fraktiler er nødvendige, når du kender sandsynligheden og vil finde den tilsvarende grænseværdi – for eksempel: "Hvilken højde svarer 90%-fraktilen til?" eller "Hvad skal en intelligenskvotient være for at komme i Mensa?". I GeoGebra bruges NormalFordelingInvers(μ, σ, p).
Eksempelopgave
X ~ N(170, 8). Find 0,90-fraktilen, dvs. den højde som præcis 90% af populationen er under.
Vis løsningSkjul løsning
- 1
Opsæt ligningen
Vi søger x₀ så P(X ≤ x₀) = 0,90.
\[F(x_0) = 0{,}90\] - 2
Løs i GeoGebra
Skriv: NormalFordelingInvers(170, 8, 0,90)
- 3
Resultatet
GeoGebra giver x₀ ≈ 180,3 cm. Det betyder, at 90% af populationen er under 180,3 cm.
\[x_0 \approx 180{,}3 \text{ cm}\]
Konfidensinterval for middelværdien
Konfidensintervaller bruges, når man estimerer en populations middelværdi μ ud fra en stikprøve. En stikprøve giver kun et punktestimat (x̄ for middelværdien), og vi har brug for et interval, der med en given sandsynlighed indeholder den sande μ. Et 95%-konfidensinterval betyder, at intervallet ville indeholde den sande μ i 95% af tilfældene, hvis vi gentog stikprøven mange gange. Et interval, vi er 95% sikre på indeholder fordelingens middelværdi.
Formlen for et (1 − α)-konfidensinterval for middelværdien, når standardafvigelsen σ er ukendt (det normale tilfælde), bruger t-fordelingen med n − 1 frihedsgrader. Konfidensniveauet 1 − α er typisk 95% (α = 0,05) eller 99% (α = 0,01).
Formel
Konfidensinterval for middelværdi (σ ukendt)
Variable
| Symbol | Navn |
|---|---|
| \(\bar{x}\) | Stikprøvemiddelværdien |
| \(s\) | Stikprøvens standardafvigelse (estimat for σ) |
| \(n\) | Stikprøvestørrelsen |
| \(t\) | (1−α/2)-fraktilen i t-fordeling med n−1 frihedsgrader |
Eksempelopgave
En stikprøve giver n = 25, x̄ = 174,5 cm og s = 9,0 cm. Bestem et 95%-konfidensinterval for middelværdien.
Vis løsningSkjul løsning
- 1
Aflæs parametre
n = 25, x̄ = 174,5, s = 9,0, konfidensniveau = 95%, α = 0,05.
- 2
Find t-fraktilen
Frihedsgrader = n − 1 = 24. Fra GeoGebra: t₀,₉₇₅(24) ≈ 2,064.
\[t_{0,975}(24) \approx 2{,}064\] - 3
Beregn grænser
Indsæt i formlen.
\[I = \left[174{,}5 - 2{,}064 \cdot \frac{9{,}0}{\sqrt{25}};\ 174{,}5 + 2{,}064 \cdot \frac{9{,}0}{\sqrt{25}}\right]\] - 4
Resultatet
Konfidensintervallet er [170,8; 178,2]. Vi er 95% sikre på, at den sande middelværdi μ ligger her.
\[I = [170{,}8;\ 178{,}2]\]
t-fordeling – hvornår bruges den?
T-fordelingen bruges i stedet for standardnormalfordelingen, når standardafvigelsen σ er ukendt og estimeres fra stikprøven – hvilket er det normale tilfælde i praksis. T-fordelingen ligner standardnormalfordelingen, men har tykkere haler, dvs. den giver en lidt større sandsynlighed for ekstreme værdier. Det afspejler, at vi er mere usikre, når vi estimerer σ fra data frem for at kende den på forhånd.
T-fordelingen har én parameter: antal frihedsgrader ν = n − 1, hvor n er stikprøvestørrelsen. Når n er stor (typisk over 30), nærmer t-fordelingen sig standardnormalfordelingen. Når stikprøvestørrelsen er meget stor, kan vi bruge formlen for kendt standardafvigelse selvom vi ikke kender standardafvigelsen." Til konfidensintervaller med konfidensniveau 1 − α skal du bruge (1 − α/2)-fraktilen i t-fordelingen med n − 1 frihedsgrader.
Er data normalfordelt? Tilnærmelsesvist normalfordelte observationer
Ikke alle datasæt er præcist normalfordelt, men mange er tilnærmelsesvist det. Takket være den centrale grænseværdisætning vil gennemsnittet af mange uafhængige observationer nærme sig en normalfordeling – uanset hvad den underliggende fordeling er. Wikipedia formulerer det som: "En størrelse, der fremkommer som resultatet af mange små tilfældige uafhængige bidrag, vil være tilnærmelsesvis normalfordelt." Det giver en teoretisk begrundelse for, hvorfor normalfordelingen ses så ofte.
Du kan tjekke, om data er tilnærmelsesvist normalfordelt, ved at tegne et histogram og se, om det har en klokkeform. En mere præcis metode er normalfordelingspapir eller et QQ-plot: observationerne plottes mod de forventede fraktiler i en normalfordeling, og hvis punkterne danner en ret linje, er data normalfordelt. Punkterne bøjer systematisk af for data, der ikke er normalfordelt.
Normalfordeling på eksamen – STX og HHX
Normalfordeling er fast pensum på Matematik A på STX og HHX. På eksamen vil du typisk møde opgaver, der beder dig om at beregne sandsynligheder, bestemme normale og exceptionelle udfald, finde fraktiler og opstille konfidensintervaller for middelværdien. Alle disse opgaver løses med CAS – du behøver ikke beregne noget i hånden, men du skal forstå og fortolke resultaterne i den givne kontekst.
På HHX er der typisk en stærkere vægtning af den praktiske anvendelse i erhvervsmæssige sammenhænge (fx kvalitetskontrol på en fabrik, markedsundersøgelser), mens STX lægger lidt mere vægt på den matematiske teori. Få personlig hjælp til gymnasiematematik hos Toptutors - prøv med en gratis prøvetime.
GeoGebra-tip
I GeoGebra Calculator: åbn Sandsynlighedsregner (Probability Calculator), vælg 'Normal', og indtast μ og σ. Du kan direkte aflæse sandsynligheder og fraktiler. Brug NormalFordelingInvers(μ, σ, p) til at finde fraktiler fra CAS-feltet.
Typiske fejl i normalfordelingsopgaver
Undgå disse fejl
Har du brug for hjælp til normalfordeling?
Vores certificerede tutors hjælper dig med alt fra tæthedsfunktionen til konfidensintervaller. Med over 70.000 undervisningstimer og 96% positive anmeldelser på Trustpilot er vi klar til at hjælpe dig. Prøv en gratis prøvetime uden binding fra 229 kr./time.
Quiz
Test din viden om normalfordeling
Svar på spørgsmålene herunder for at tjekke, om du har styr på de vigtigste begreber.
1. Hvilken af følgende beskriver bedst normalfordelingens tæthedsfunktion?
2. X er normalfordelt med X ~ N(8, 2). Hvad er intervallet for de normale udfald?
3. Standardnormalfordelingen har middelværdi 0 og standardafvigelse 1.
4. Hvilken andel af observationerne i en normalfordeling ligger inden for [μ − 2σ; μ + 2σ]?
5. Hvornår bruger du t-fordelingen i stedet for standardnormalfordelingen ved konfidensintervaller?
Ofte stillede spørgsmål om normalfordeling