Probability Plot

Probability Plot

Book OPEX pag.: 127
Minitab  : Graph > Probability Plot
File     : Distributions.mpj

Probability Plot ook wel in de statistiek een ‘kansplot’ genoemd, is een grafische weergave voor het vergelijken van twee gegevenssets, ofwel twee sets empirische waarnemingen, een empirische set tegen een theoretische set, of twee theoretische sets tegen elkaar.

Probability Plot in vergelijking met de Histogram


De histogram is de primaire methode om te bepalen of de data-sample een Normale verdeling heeft. De Probability Plot heeft een meer ‘beslissende aanpak’ in je onderzoek. 

Veel statistische technieken zijn gebaseerd op de veronderstelling dat de populatie bij benadering normaal verdeeld is. Daarom is het belangrijk eerst te bepalen of de steekproefgegevens uit een normaal verdeelde populatie komen, voordat je deze technieken kan toepassen. 

Een beoordeling aan de hand van een frequentieverdeling (histogram, dot plot) biedt niet altijd voldoende zekerheid. De Probability Plot (normaliteitsplot) heeft een zodanige schaalverdeling dat de grafiek van een theoretisch zuivere normale verdeling een rechte lijn wordt. Hoe beter data in een normaliteitsplot op een rechte lijn liggen des te beter de data een normale verdeling benaderen. Ter vergelijking kun je de ideale lijn laten tekenen. 

Probability Plot van klein naar groot


Bij een Probability Plot worden de waarnemingen in een gegevensverzameling van klein naar groot geordend en vervolgens in een grafiek uitgezet tegen de bijbehorende verwachte z-waarden als de waarnemingen uit een normale verdeling komen. Eigenlijk is een Probability Plot een spreidingsdiagram met de gesorteerde gegevenswaarden op de ene as, en de bijbehorende verwachte z-waarden van een standaardnormale verdeling op de andere as. Het berekenen van de verwachte standaardnormale z-scores is niet iets wat je handmatig doet, maar over kunt laten aan een statistisch programma, zoals Minitab. 

Probability Plot en de Z-waarde

Als de gegevens inderdaad uit een normale verdeling komen, zullen de gevonden punten op een rechte lijn liggen. Als de z-waarden niet bij benadering op een rechte lijn liggen, is dat een duidelijke aanwijzing dat er geen sprake is van een normale verdeling. In een van de voorbeelden (rechts) zijn op basis van een betrouwbaarheidsinterval van 95%, twee ‘limietlijnen’ getekend, waarbinnen het merendeel van de punten moet liggen om van een rechte lijn te kunnen spreken. 

probability plot
Voorbeeld kansplot Minitab 17
probability plot
Voorbeeld kansplot in Minitab 17