p value

P value

De P value (ook wel overschrijdingskans genoemd) is de uitkomst van een toestand en kan op verschillende wijze geïnterpreteerd worden, waar N (aantal waarnemingen) van belang is. Hoe hoger N, des de betrouwbaarder P value, als de P value hoog is maar met een lagere N (aantal waarnemingen) dan is de betrouwbaarheid toch lager. Juist in de statistisch onderzoek wil je weten wat het betrouwbaarheids-percentage is bij onderzoek.

Wat is een P value nu eigenlijk? 

De P waarde evalueert hoe goed de sample-data nu is, zeg maar een soort “advocaat van de duivel” dat aangeeft of de Nul hypothese waar is. Het meet hoe verenigbaar de data is met de gestelde Null hypothese. De term nulhypothese werd bedacht door de Engelse geneticus en statisticus Fisher in 1934.

P value en aantallen (N=)

N = 64P value = 0.288De P value is meer betrouwbaar dan de P value met N = 27
N = 27P value = 0.864De P value is minder betrouwbaar dan de P value met N = 64

Dus hoe hoger N is, hoe betrouwbaarder de P-value is.

Een simpel voorbeeld om de p-waarde te verduidelijken.

Stel dat een farmaceutisch bedrijf een nieuwe stofje creëert in de vorm van een injectie en waar mensen gelukkiger van worden. Voor het injecteren meet je de geluksratio en nadien nogmaals, als de persoon in kwestie inderdaad dan gelukkig is geworden kan je wel zeggen dat het werkt, maar is het geen toeval? Neen, natuurlijk niet, want het effect kan toeval zijn, dat zal je moeten uitsluiten. Want als je dit niet doet dan kan de proefpersoon wel net op vakantie gaan, of je bent net vader of moeder geworden.

Maar, en dat is de hypothese, stel nu dat die persoon nu wel gelukkiger voelt nadat de injectie is toe gediend? En dat over langere periode? Dan is de kans op toeval minder geworden. Met andere woorden: stel N vast: Uit een steekproef van 100 mensen die de injectie hebben gekregen en ze voelen zich vrijwel allemaal gelukkiger dan ooit? Dan is de kans op toeval wel echt klein.

Daarmee is de Nul hypothese gesteld, H0 er verandert niets (of te weinig) of, en dit geval er verandert wel iets. De Nul hypothese is H1 er is significant iets gewijzigd.

Betrouwbaarheid percentage

De uitkomst van de P waarde geeft de betrouwbaarheid aan in een %. Deze waarde geeft je een richtlijn of een Nul hypothese verworpen kan worden of, dat er bijvoorbeeld een relatie is tussen Y en een of meerder x’en. Zie onderstaande waarde tabel;

  • P value = ≥ 0.05 is gelijk of groter dan 0.05: geeft dus aan dat H0 een betrouwbaarheid heeft van 5% of hoger. Dus H0 is waar.
  • P value = 1 is dus een betrouwbaarheid van 100%: H0 is dus waar.
  • P value = < 0.05 is minder dan 5%: dit geeft aan dat H0 verworpen kan worden.
  • P value = 0,0000 er is een relatie tussen de Y en de X (of X’en)
P value

Een Hypothese formuleren

Het formuleren van een hypothese kan soms wel lastig zijn, maar oefening baart kunst… Bij toetsend onderzoek formuleer je voorafgaand aan het onderzoek de hypothesen, welke je vervolgens gaat toetsen aan de hand van de data. Het toetsen van hypothesen is wel een wetenschappelijke aangelegenheid, niet inhoudende dat je het niet kan gebruiken. Een hypothese formuleer je dus om een stelling te toetsen.

Veel hypothesen zijn uitgedrukt in termen van twee of drie variabelen. Ook wel H0, H1 of H2 genoemd. Door middel van hypotheses onderzoek ga je na of deze juist of onjuist zijn. Je gaat dus verifiëren van een of meerdere aannames, de tegenhanger is dan we het ontkrachten van een aanname: falsifiëren. Bij voldoende bewijs van 95% of meer van de steekproef, spreken we van significantie.

Betrouwbaarheidsinterval = Nul hypothese analyse

De Engelse term ‘Confidence interval’ betekent ‘betrouwbaarheidsinterval’. Dit geeft bijvoorbeeld aan dat iets voor 95% betrouwbaar is. Oftewel 95% = x̄ ± 2 SE. Op basis van deze gegevens wordt Nul hypothese herleid.

Z Score Calculator of tabel

Er zijn er verschillende, hier een meest gebruikte Z score calculator. En een Z tabel is ook handig in gebruik om er bij te hebben.