Mathematische statistiek.

Eerst gaan we na wat er in principe aan de orde is bij het toetsen van een hypothese, m.b.v. de regels uit de mathematische statistiek.
Daarna wordt er een probleem voorgelegd dat vervolgens wordt opgelost.

De hypothesetoets.

a) Bij een hypothesetoets hebben we te maken met een populatie waarover een hypothetische uitspraak wordt gedaan. (bijv. Slechts 30% van de Nederlandse bevolking is voorstander van het regeringsbeleid.)
b) Deze uitspraak (de nulhypothese H0) wordt in een kansgetal uitgedrukt. Bijv. H0: p=0,3.
c) Daarna wordt deze nulhypothese aangevochten. (bijv. Nee, meer dan 30% van de Nederlandse bevolking is voorstander van het regeringsbeleid.)
d) Dit geeft de alternatieve hypothese. H1: p>0,3.
e) Vervolgens worden er afspraken gemaakt om H0 te toetsen, rekening houdende met de kritiek die in H1 uitgesproken wordt over H0. We gaan als volgt te werk.

I. We nemen een steekproef uit de populatie. Hierbij wordt een steekproefgrootte N afgesproken. ( bijv. We gaan 100 Nederlanders vragen wat zij vinden van het regeringsbeleid.)
II. Waar wordt in de steekproef op gelet? We spreken een onderzoeksvariabele af. ( Hier letten we in dit geval op het aantal mensen in de steekproef dat voor het regeringsbeleid is.)
III. De onderzoeksvariabele geeft een binomiale kansverdeling. ( Immers het aantal mensen is een discrete variabele.)
IV. We gaan een beslissingcriterium vastleggen. Bij welke waarden van de onderzoeksvariabele wordt H0 verworpen, of aanvaard? Dit wordt vaak gedaan door een significantie niveau af te spreken. ( Bijv. We kunnen een significantie niveau afspreken van 10%.)
V. Er wordt ook vastgesteld of de toets die plaats moet vinden eenzijdig, of tweezijdig is. ( Hier is sprake van een rechtszijdige toets. Immers H1: p>0,3.)

f) Opmerking: Alle afspraken voor een correcte toets moeten voorafgaande aan de steekproef worden gemaakt. (Waarom?)
g) Nu kan de steekproef worden gedaan.
h) Als we de steekproef hebben gedaan, kijken we wat de waarde van de onderzoeksvariabele in deze steekproef is. (Het toetsresultaat is bijvoorbeeld 36 mensen (van de 100) zijn voor het regeringbeleid.)
i) Vraag is nu, is dit resultaat genoeg om de nulhypothese te verwerpen? Deze zegt immers dat de verwachtingswaarde van de onderzoeksvariabele in de steekproef E= 100x0,3=30 is.
j) Maar zo glad zit dit niet, we hebben immers een significantieniveau afgesproken.
k) Van de onderzoeksvariabele die als uitslag uit de steekproef kwam wordt nu eerst de zogenaamde overschrijdingskans berekend. P(overschrijding)=1-P(X<36)=1-0,88392=0,11608
l) Wanneer de overschrijdingskans kleiner is dan het significantieniveau (bij eenzijdig toetsen) of kleiner dan de helft van het significantieniveau bij tweezijdig toetsen, dan wordt de nulhypothese verworpen. (Hier is P(overschrijding)>significantieniveau, dus is er onvoldoende reden om H0 te verwerpen.)
m) Tenslotte wordt van het resultaat een antwoord geformuleerd in termen die aansluiten bij de oorspronkelijke vraag. (Uit de steekproef blijkt dat er niet getwijfeld hoeft te worden aan H0.)

Nu krijgen we een vraagstuk.

1) Lees de vraagstuktekst eerst aandachtig door en probeer daarna het volgende model vast te leggen.
2) Kies daarbij een nulhypothese H0.
3) Kies ook een alternatieve hypothese H1.
4) Wat is de steekproefgrootte?
5) Wat is de onderzoeksvariabele?
6) Wat is het significantieniveau?
7) Is de toets links-, rechts-, of tweezijdig?
8) Wat is de toetsuitslag?
9) Welke overschrijdingskans hoort hier bij?
10) Wordt de nulhypothese aanvaard of verworpen?
11) Formuleer een antwoord op de in het vraagstuk gestelde vraag.

De Plantenkweker.
Een kweker van kamerplanten zaait in zijn kas petunia’s. Hij zaait ze in bakken van waarin 10.000 plantjes kunnen worden gezaaid. Als de plantjes groot genoeg zijn moeten ze worden verplant naar andere kweekbakken om verder tot een goed verkoopbare plant op te kunnen groeien. Van alle 10.000 uitgezaaide planten komen er tussen de 7880 en de 8120 levensvatbare planten op. De kweker probeert dit aantal te verbeteren. Daartoe gaat hij naar een leverancier in voedingsstoffen voor planten, om zich voor te laten lichten over een verbetering van de bemesting. Deze leverancier biedt hem een middel aan waarvan hij beweert dat hij hiermee een resultaat kan behalen van meer dan 85% levensvatbare planten. Hij noemt dit percentage, omdat hij weet dat de kweker de extra kosten van het middel dan kan terugverdienen.

Het middel is echter nogal duur, daarom probeert de kweker het middel eerst uit met een testverpakking. Hiervoor zaait hij 100 petunia’s uit en gebruikt daarbij het nieuwe middel. Na afloop van de eerste groeiperiode blijkt het dat er 91 levensvatbare planten zijn opgekomen.

Is dit voor de kweker voldoende reden om het nieuwe middel aan te schaffen als hij bereid is een risico te nemen van 5%, dat hij ten onrechte de nulhypothese afwijst?

De uitwerking.
1) De nulhypothese H0: p=0,85.
2) De alternatieve hypothese H1: p>0,85.
3) De steekproefgrootte n=100.
4) De onderzoeksvariabele X is: ‘Het aantal levensvatbare planten in de steekproef’.
5) Het significantieniveau is 5%.
6) De toets is rechtszijdig, immers H1 zegt: p>0,85.
7) De toetsuitslag: X=91.
8) P(overschrijding)=P(X groter of gelijk aan 91|n=100; p=0,85)= 1 – P( X kleiner of gelijk aan 90)=1 – 0,9449= 0,0551.
9) De nulhypothese wordt aanvaard, omdat de overschrijdingskans groter is dan het significantieniveau.
10) We adviseren de kweker het middel niet te gaan gebruiken, omdat er onvoldoende argumenten zijn om aan te nemen dat er meer dan 85% levensvatbare planten op zullen komen.