Binomialfordeling er en af de mest centrale sandsynlighedsfordelinger i gymnasiets matematik. Møder du en opgave om gentagne forsøg med to mulige udfald, terningekast, stikprøvekontrol eller meningsmålinger, er binomialfordeling dit redskab. Kender du betingelserne og formlerne, kan du løse de fleste opgaver systematisk og sikkert.
Denne guide dækker alt, hvad du har brug for til eksamen på matematik på gymnasiet: binomialfordeling formel, middelværdi og spredning, normale og exceptionelle udfald, normalfordelingsapproksimation, estimering af andelen p, konfidensinterval og binomialtest. Du finder gennemregnede eksempler, GeoGebra-vejledning og et overblik over de typiske fejl, der koster point til eksamen.
Hvad er binomialfordeling?
Nøglebegreb
Binomialfordeling
En binomialfordeling b(n, p) beskriver sandsynligheden for at opnå et bestemt antal succeser i n uafhængige forsøg, hvor hvert forsøg har to mulige udfald (succes eller fiasko) og en fast successandsynlighed p. Den stokastiske variabel X angiver antallet af succeser og noteres X ~ b(n, p).
Forestil dig, at du kaster en terning ti gange og tæller, hvor mange gange den lander på seks. Hvert kast er uafhængigt af de øvrige, og sandsynligheden for sekser er altid \( \frac{1}{6} \). Det er præcis den situation, binomialfordelingen beskriver. Den stokastiske variabel X angiver antallet af succeser og kan kun antage heltallige værdier fra 0 til n. Vi skriver \( X \sim b(n, p) \), hvor n er antalsparameteren og p er sandsynlighedsparameteren.
Binomialfordelingen er en diskret sandsynlighedsfordeling: X kan kun antage heltallige værdier (0, 1, 2, ..., n). Det adskiller den fra normalfordelingen, der er kontinuert og kan antage alle reelle værdier. Iflølge [Wikipedia: Binomialfordelingen](https://da.wikipedia.org/wiki/Binomialfordelingen) er den en af de vigtigste diskrete sandsynlighedsfordelinger og danner grundlag for store dele af statistikken på gymnasiet. Fordelingen bruges i en lang række sammenhenge: kvalitetskontrol på fabrikker, meningsmålinger, biologiske eksperimenter og meget mere.
Betingelserne for en binomialfordeling
Inden du anvender binomialfordelingen, skal du kontrollere, at situationen opfylder fire betingelser. Disse betingelser sikrer, at modellen passer til virkeligheden, og at beregningerne er gyldige. Opfyldes blot én af dem ikke, er der ikke tale om en binomialfordeling, og du skal vælge en anden statistisk model.
| Betingelse | Forklaring |
|---|---|
| 1. To udfald | Hvert forsøg har præcis to mulige udfald: succes eller fiasko. |
| 2. Fast antal forsøg | Forsøget gentages et fast antal gange n (antalsparameteren). |
| 3. Fast sandsynlighed | Sandsynligheden p for succes er den samme i alle forsøg. |
| 4. Uafhængige forsøg | Udfaldet af ét forsøg påvirker ikke sandsynligheden i de øvrige. |
Et klassisk eksempel er møntkast: du kaster en mønt fem gange og tæller antal plat. Hvert kast har to udfald (plat eller krone), sandsynligheden for plat er konstant 0,5, og kastene er uafhængige. Vi skriver \( X \sim b(5;\, 0{,}5) \). Et andet eksempel er stikprøvekontrol: en fabrik producerer bolte, og 3% er defekte. Du udtager ti bolte, og \( X \sim b(10;\, 0{,}03) \) er en god model, forudsat at stikprøven er tilstrækkelig lille i forhold til populationens størrelse.
Binomialfordeling formel: beregn punktsandsynligheder
En punktsandsynlighed er sandsynligheden for, at X antager præcis værdien r. Binomialfordeling formlen kombinerer binomialkoefficienten med de respektive sandsynligheder for succeser og fiaskoer. Formlen giver den eksakte sandsynlighed og kan beregnes i hånden for små n-værdier, men det anbefales at bruge GeoGebra på eksamen.
Formel
Binomialsandsynlighed (punktsandsynlighed)
Variable
| Symbol | Navn |
|---|---|
| \(n\) | Antalsparameter (antal forsøg) |
| \(p\) | Sandsynlighedsparameter (successandsynlighed) |
| \(r\) | Det ønskede antal succeser (r = 0, 1, ..., n) |
| \(K(n,r)\) | Binomialkoefficienten: antal måder r succeser fordeles i n forsøg |
Binomialkoefficienten \( K(n, r) \) angiver, på hvor mange forskellige måder du kan fordele r succeser over n forsøg. I GeoGebra beregner du den med nCr(n, r) eller Kombiner(n, r). Som [Erik Vestergaards noter om binomialfordelingen](https://www.matematikfysik.dk/mat/noter_tillaeg/binomialfordelingen.pdf) viser, er kombinatorikken det centrale fundament for hele formlen: \( K(n, r) \) mulige rækkefølger ganges med sandsynligheden for en specifik rækkefølge med r succeser og (n-r) fiaskoer.
For den kumulerede sandsynlighed \( P(X \leq r) \) adderer du alle punktsandsynligheder fra 0 til r. I praksis bruger du GeoGebra, da det hurtigt bliver uoverskueligt for store n-værdier. \( P(X \geq r) \) beregnes som summen fra r til n, eller som \( 1 - P(X \leq r-1) \).
Eksempelopgave
En terning kastes 10 gange. X betegner antal seksere. Bestem sandsynligheden for præcis 2 seksere.
Vis løsningSkjul løsning
- 1
Trin 1: Identificer parametre
n = 10 (antal kast), p = 1/6 (sandsynlighed for sekser), r = 2. Vi skriver X ~ b(10; 1/6).
- 2
Trin 2: Beregn binomialkoefficienten
Beregn K(10, 2).
\[ K(10, 2) = \frac{10!}{2! \cdot 8!} = \frac{10 \cdot 9}{2} = 45 \] - 3
Trin 3: Indsæt i formlen
Sæt alle værdier ind i formlen.
\[ P(X = 2) = 45 \cdot \left(\frac{1}{6}\right)^2 \cdot \left(\frac{5}{6}\right)^8 \approx 0{,}291 \] - 4
Konklusion
Sandsynligheden for præcis 2 seksere i 10 kast er cirka 29,1%.
Sandsynlighedsfordeling X ~ b(6; 0,4)
Binomialfordeling middelværdi og spredning
Middelværdien \( \mu \) for en binomialfordeling angiver det forventede antal succeser, når du gentager forsøget n gange med successandsynlighed p. Det er den gennemsnitlige værdi, du ville observere, hvis du gentog hele eksperimentet uendeligt mange gange. Middelværdien behøver ikke at være et heltal, selvom X kun kan antage heltallige værdier.
Formel
Middelværdi for binomialfordeling
Variable
| Symbol | Navn |
|---|---|
| \(μ\) | Middelværdien: forventet antal succeser |
| \(n\) | Antalsparameter |
| \(p\) | Sandsynlighedsparameter |
Formel
Standardafvigelse (binomialfordeling spredning)
Variable
| Symbol | Navn |
|---|---|
| \(σ\) | Standardafvigelsen (spredning) |
| \(n\) | Antalsparameter |
| \(p\) | Successandsynlighed |
| \(1-p\) | Fiaskosandsynlighed |
Standardafvigelsen \( \sigma \) er kvadratroden af variansen og angiver den typiske afvigelse fra middelværdien. Jo større spredning, jo mere usikker er fordelingen. Variansen er størst, når p = 0,5, og mindst, når p er tæt på 0 eller 1. For store n giver større stikprøver som regel mere præcise estimater, alt andet lige.
Eksempelopgave
En fabrik producerer bolte, og 8% er defekte. Du udtager en stikprøve på 75 bolte. Bestem middelværdi og standardafvigelse for X = antal defekte bolte.
Vis løsningSkjul løsning
- 1
Trin 1: Identificer parametre
n = 75, p = 0,08. Vi skriver X ~ b(75; 0,08).
- 2
Trin 2: Middelværdi
Anvend middelværdiformlen.
\[ \mu = n \cdot p = 75 \cdot 0{,}08 = 6 \] - 3
Trin 3: Standardafvigelse
Anvend formlen for standardafvigelsen.
\[ \sigma = \sqrt{75 \cdot 0{,}08 \cdot 0{,}92} = \sqrt{5{,}52} \approx 2{,}35 \] - 4
Fortolkning
Vi forventer gennemsnitligt 6 defekte bolte pr. stikprøve på 75, med en typisk spredning på ca. 2,35.
Normale og exceptionelle udfald
Begrebet normale og exceptionelle udfald bruges til at afgøre, om et observeret antal succeser er usædvanligt. Udfald inden for intervallet \( [\mu - 2\sigma\,;\, \mu + 2\sigma] \) anses for normale, mens udfald uden for dette interval er exceptionelle. Sandsynligheden for et normalt udfald er mindst 95%, svarende til 95%-reglen fra normalfordelingen.
Formel
Interval for normale udfald
Variable
| Symbol | Navn |
|---|---|
| \(μ\) | Middelværdien: n gange p |
| \(σ\) | Standardafvigelsen: kvadratroden af n gange p gange (1-p) |
Eksempelopgave
Bolt-eksempel: X ~ b(75; 0,08), middelværdi = 6, standardafvigelse = 2,35. Bestem intervallet for normale udfald og afgør, om 13 defekte bolte er exceptionelt.
Vis løsningSkjul løsning
- 1
Beregn grænseværdierne
Indsæt i intervallet.
\[ \mu - 2\sigma = 6 - 2 \cdot 2{,}35 = 1{,}30 \qquad \mu + 2\sigma = 6 + 2 \cdot 2{,}35 = 10{,}70 \] - 2
Konklusion
Normale udfald er heltal i [1,30; 10,70]: X = 2, 3, ..., 10. Da 13 > 10,70 er det et exceptionelt udfald, der kan indikere, at andelen af defekte bolte er steget.
Exceptionelle udfald er ikke umulige, men de er usandsynlige nok til at give anledning til opmærksomhed. Observerer du et exceptionelt antal defekter i en produktionskontrol, kan det være et signal om, at produktionsprocessen har ændret sig. Her er binomialtesten et nyttigt redskab til at kvantificere, om afvigelsen er statistisk signifikant på et valgt signifikansniveau.
Stikprøve med og uden tilbagelægning
En afgørende betingelse for binomialfordelingen er, at successandsynligheden p er konstant fra forsøg til forsøg. Det er altid tilfældet ved stikprøve med tilbagelægning: du trækker et element, noterer udfaldet, lægger det tilbage, og p er den samme næste gang. Trækker du bolde fra en pose med tilbagelægning, kan du altid bruge binomialfordelingen.
Ved stikprøve uden tilbagelægning ændres p efter hvert træk, fordi populationens sammensætning forandres. Til praktiske formål på gymnasiet gælder reglen, at du kan bruge binomialfordelingen som approksimation, når stikprøvestørrelsen n er under 5% af populationens størrelse N. Herved er ændringen i p negligibel og fejlen minimal.
| Stikprøve | Gyldighed af binomialfordeling |
|---|---|
| Med tilbagelægning | p er konstant. Binomialfordelingen er altid gyldig. |
| Uden tilbagelægning | p ændres. Brug binomialfordeling som approksimation når n er under 5% af N. |
Normalfordelingsapproksimation
Når antalsparameteren n er tilstrækkelig stor, ligner binomialfordelingen mere og mere en normalfordeling med samme middelværdi og standardafvigelse. I disse tilfælde kan du bruge normalfordelingen til at beregne sandsynligheder, der ellers ville kræve summering af mange punktsandsynligheder. Dette er særligt nyttigt, når n er meget stor, for eksempel ved en stikprøve på 100.000 elementer, fordi GeoGebra kan blive langsom ved så store binomialfordelinger.
Betingelse
Betingelse for normalfordelingsapproksimation: n gange p gange (1-p) skal være større end 5. Er betingelsen opfyldt, approksimerer du b(n, p) med normalfordelingen N(mu, sigma), hvor mu = n gange p og sigma = kvadratroden af (n gange p gange (1-p)).
I GeoGebra kan du visuelt se, at søjlediagrammet for binomialfordelingen ligner normalfordelingskurven mere og mere, jo større n er og jo tættere p er på 0,5. En vigtig detalje er kontinuitetskorrektionen: fordi binomialfordelingen er diskret, skal du lægge 0,5 til eller trække 0,5 fra grænseværdien, når du oversætter. For eksempel beregnes \( P(X \leq r) \) i binomialfordelingen som \( P(X \leq r + 0{,}5) \) i normalfordelingsapproksimationen.
Normalfordelingsapproksimation: X ~ b(10; 0,5)
Eksempelopgave
X ~ b(100; 1/3). Bestem sandsynligheden P(X højst 30) vha. normalfordelingsapproksimationen.
Vis løsningSkjul løsning
- 1
Trin 1: Tjek betingelsen
n gange p gange (1-p) = 100 gange 1/3 gange 2/3 = 22,2, som er større end 5. Betingelsen er opfyldt.
- 2
Trin 2: Middelværdi og standardafvigelse
Indsæt i formlerne.
\[ \mu = 100 \cdot \tfrac{1}{3} \approx 33{,}33 \qquad \sigma = \sqrt{100 \cdot \tfrac{1}{3} \cdot \tfrac{2}{3}} \approx 4{,}71 \] - 3
Trin 3: Brug GeoGebra
Brug normalfordeling N(33,33; 4,71) i GeoGebra. Med kontinuitetskorrektionen beregnes P(X højst 30,5). Resultatet er cirka 0,242.
Estimering af andel (p) og konfidensinterval for andel
I mange situationer kendes andelen p ikke på forhånd, og du er nødt til at estimere den fra en stikprøve. Antag, at du har udvalgt n elementer og fundet x succeser. Estimatet for p noteres \( \hat{p} \) ("p-hat") og beregnes som andelen af succeser i stikprøven. Estimatet er dit bedste bud på den sande populationsandel, men det er forbundet med statistisk usikkerhed, fordi stikprøven er tilfældig.
Formel
Estimat for andelen p (p-hat)
Variable
| Symbol | Navn |
|---|---|
| \(p-hat\) | Estimeret andel af populationen |
| \(x\) | Antal observerede succeser i stikprøven |
| \(n\) | Stikprøvestørrelse |
Formel
95%-konfidensinterval for andelen p
Variable
| Symbol | Navn |
|---|---|
| \(p-hat\) | Estimeret andel |
| \(n\) | Stikprøvestørrelse |
| \(1,96\) | Konstantfaktor fra standardnormalfordelingen (95%-niveau) |
Et 95%-konfidensinterval for andelen p angiver et interval, som vi med 95% sikkerhed kan sige indeholder den sande populationsandel. Som [Aarhus Universitets interaktive statistikbog](https://data.math.au.dk/interactive/statpyt/pBog204.html) forklarer, bygger formlen på, at binomialfordelingen for store n tilnærmes af normalfordelingen, og at det standardiserede estimat følger en standardnormalfordeling. Betingelsen \( n \cdot \hat{p} \cdot (1 - \hat{p}) > 9 \) skal være opfyldt for, at formlen er gyldig.
I GeoGebra vælger du sandsynlighedslommeregneren, skifter til fanen Statistik og vælger Z interval for andel. Indtæst stikprøvestørrelsen n, antal succeser x og konfidensniveauet 0,95. GeoGebra beregner automatisk estimatet og konfidensintervallets grænser. Hvis den tidligere kendte andel ikke ligger inden for konfidensintervallet, er der statistisk evidens for, at andelen har ændret sig.
Eksempelopgave
I en meningsmåling af 100 adspurgte vælgere svarede 51, at de vil stemme på Parti A. Bestem et 95%-konfidensinterval for andelen p.
Vis løsningSkjul løsning
- 1
Beregn estimatet
Beregn estimatet.
\[ \hat{p} = \frac{51}{100} = 0{,}51 \] - 2
Tjek betingelsen
100 gange 0,51 gange 0,49 = 24,99, som er større end 9. Betingelsen er opfyldt.
- 3
Beregn konfidensintervallet
Indsæt i formlen.
\[ 0{,}51 \pm 1{,}96 \cdot \sqrt{\frac{0{,}51 \cdot 0{,}49}{100}} = 0{,}51 \pm 0{,}098 \] - 4
Konklusion
Konfidensintervallet er [0,412; 0,608]. Med 95% sikkerhed ligger Parti A's vælgertilslutning mellem 41,2% og 60,8%.
Binomialtest: udfør et statistisk hypotesetest
Et binomialtest er et statistisk hypotesetest, du bruger, når du har en formodning om andelen p i en population og vil undersøge, om en observeret stikprøveværdi understøtter eller modsiger denne formodning. Du opstiller en nulhypotese \( H_0: p = p_0 \) og beslutter derefter, om du forkaster den baseret på, hvor usandsynligt dit observerede antal succeser er under antagelse af \( H_0 \).
I binomialtesten sammenligner du p-værdien med signifikansniveauet \( \alpha \) (typisk 5%). P-værdien er sandsynligheden for at observere et udfald mindst lige så ekstremt som det observerede, under antagelse af at nulhypotesen er sand. Hvis p-værdien er lig med eller mindre end \( \alpha \), forkaster du \( H_0 \). Du kan aldrig bevise en nulhypotese: du kan kun afgøre, om der er tilstrækkelig statistisk evidens til at forkaste den.
- 1
Opstil nulhypotesen
Formuler H0: p = p0, hvor p0 er den formodede andel. For et tosidet test er alternativhypotesen H1: p forskellig fra p0.
- 2
Vælg signifikansniveau
Alfa er typisk 0,05 (5%). For strengere krav kan du vælge 0,01 (1%).
- 3
Beregn p-værdien i GeoGebra
Åbn sandsynlighedslommeregneren, vælg Statistik og Z test af en andel. Indtæst p0, n og observerede succeser. Vælg tosidet eller ensidet og aflæs p-værdien.
- 4
Træf en beslutning
Hvis p-værdien er lig med eller mindre end alfa, forkastes H0. Ellers beholdes H0.
- 5
Formuler konklusion i kontekst
Oversæt det statistiske resultat til en konkret konklusion om det reale problem.
Eksempelopgave
Historisk har 20% af elever dumpet matematik B. I en klasse på 30 elever dumper 10. Test på 5%-signifikansniveau, om dumpeprocenten er ændret.
Vis løsningSkjul løsning
- 1
Opstil hypoteser
H0: p = 0,20 og H1: p forskellig fra 0,20. Under H0: X ~ b(30; 0,20).
- 2
Middelværdi under H0
Middelværdien bruges som reference.
\[ \mu = 30 \cdot 0{,}20 = 6 \] - 3
Beregn p-værdien
Statistik, Z test af en andel i GeoGebra, p0 = 0,20, n = 30, x = 10, tosidet. P-værdien er ca. 0,057.
- 4
Konklusion
P-værdien 0,057 er større end 0,05. Vi forkaster ikke H0. Der er ikke statistisk evidens for, at dumpeprocenten er ændret på 5%-signifikansniveau.
Binomialfordeling i GeoGebra: trin for trin
GeoGebra er det primære CAS-værktøj til binomialfordeling på gymnasiet og er tilladt ved langt de fleste eksaminationer. Med sandsynlighedslommeregneren kan du beregne punktsandsynligheder og kumulerede sandsynligheder, visualisere fordelingen som søjlediagram, beregne konfidensintervaller og udføre binomialtests. Har du brug for personlig hjælp til at mestre værktøjet, kan du få lektiehjælp hos en af vores tutorer.
- 1
Åbn sandsynlighedslommeregneren
Gå til GeoGebra Calculator og vælg sandsynlighedslommeregneren (ikonet med klokkekurven øverst til højre).
- 2
Vælg Binomial og indtæst parametre
Under Fordeling vælger du Binomial. Indtæst antalsparameteren n og sandsynlighedsparameteren p.
- 3
Vælg sandsynlighedstype
Venstresidet giver P(X er højst a), højresidet giver P(X er mindst a), og interval giver P(a højst X højst b). Aflæs resultatet.
- 4
Konfidensinterval for andel
Skift til Statistik og vælg Z interval for andel. Indtæst n, antal succeser og konfidensniveauet 0,95. Aflæs de nedre og øvre grænser.
- 5
Binomialtest i GeoGebra
Under Statistik vælger du Z test af en andel. Indtæst p0, n og observerede succeser. Vælg tosidet eller ensidet og aflæs p-værdien.
En nyttig funktion er, at søjlediagrammet for binomialfordelingen vises direkte i sandsynlighedslommeregneren. Det giver dig et visuelt overblik over, om et observeret udfald er normalt eller exceptionelt. Eksperimentér med at ændre n og p og se, hvordan fordelingens form ændrer sig: for stor n og p tæt på 0,5 får du en tilnarmelsesvis symmetrisk klokkekurve, mens fordelingen er skæv for p tæt på 0 eller 1.
Typiske fejl med binomialfordeling
Undgå disse fejl med binomialfordeling
Quiz
Test din viden om binomialfordeling
1. En pose indeholder 4 røde og 6 blå bolde. Du trækker 5 bolde med tilbagelægning. Hvad er sandsynlighedsparameteren p for en rød bold?
2. X ~ b(20; 0,3). Hvad er middelværdien af X?
3. Normalfordelingsapproksimationen kan bruges til X ~ b(5; 0,5), da n gange p gange (1-p) = 1,25.
4. I et binomialtest får du p-værdien 0,03 ved signifikansniveau alfa = 0,05. Hvad konkluderer du?
Opgave 5
Standardafvigelsen for X ~ b(100; 0,25) er sigma = (to decimaler).
Spørgsmål om binomialfordeling
Hvad er forskellen på en diskret og en kontinuert sandsynlighedsfordeling?
Hvornår bruger jeg binomialtest frem for konfidensinterval?
Hvad er forskellen på et tosidet og et ensidet binomialtest?
Hvorfor er middelværdien for binomialfordelingen netop n gange p?
Kan jeg bruge Excel i stedet for GeoGebra til binomialfordeling?
Hvad er et Bernoulli-forsøg?
Har du brug for hjælp til binomialfordeling?
Vores tutorer er specialister i gymnasiets matematik og hjælper dig med at forstå binomialfordeling, sandsynlighedsregning og statistik. Prøv en gratis prøvetime uden binding. Vi har 1.000+ certificerede tutorer og 96% positive anmeldelser.