one way anova

One Way ANOVA

One Way ANOVA is een statistische test die vanuit 6 Sigma vaak gebruikt wordt, het is een test die de gemiddelde per groep test. Het zijn de gemiddelde van 2 of meer data-sets (samples) die vergeleken worden. De rekenkundige formule is anders maar de interpretatie is het hetzelfde dan elke ander test waar een P Value uitkomt. 

Wat is ANOVA?

ANOVA staat voor Analysis of Variance, oftewel variantie-analyse, en wordt gebruikt om gemiddelden van meer dan twee groepen met elkaar te vergelijken. Eigenlijk is het een uitbreiding van de t-toets om de gemiddelde van maximaal twee groepen met elkaar te vergelijken.

Example: Je wilt weten of er een verschil in lengte bestaat tussen voetballers, handballers, en basketballers. Je meet de lengte van alle personen binnen deze doelgroepen en test dit met een ANOVA test.

Soorten ANOVA

Er bestaan verschillende soorten ANOVA. Welke je gebruikt hangt af van je data en het conceptueel data model. One-way-ANOVA en two-way-ANOVA worden het meest gebruikt.

One-way-ANOVA

Je gebruikt een One Way ANOVA wanneer één groepsvariabele de groepen bepaalt en er dus maar één afhankelijke variabele is.

Example: Je vergelijkt de gemiddelde lengte van verschillende typen sporters, zoals voetballers, handballers, en basketballers. Het type sport dat iemand beoefent, is in dit geval de enige groepsvariabele en lengte is de enige afhankelijke variabele.

Two-way-ANOVA

Gebruikt two-way-ANOVA (ook wel factorial ANOVA genoemd) wanneer je twee of meer groepsvariabelen in je conceptueel model hebt.

Example: Je vergelijkt de gemiddelde lengte van verschillende typen zoals voetballers, handballers, en basketballers én of zijn man of vrouw zijn. Er wordt dan niet alleen getest of het gemiddelde dan verschilt voor voetballers, handballers, en basketballers, maar ook voor mannen en vrouwen elk met hun eigen sport.

Multivariatie ANOVA (MANOVA)

Gebruik multivariatie ANOVA (ook wel MANOVA) als je meerdere afhankelijke variabelen gebruikt. Je kunt deze ANOVA zowel gebruiken met een als meerdere groepsvariabelen.

Example: Je wilt niet alleen niet alleen de gemiddelde lengte, maar ook het gemiddelde gewicht van verschillende groepen sporters vergelijken.

Je zou eventueel meerdere individuele ANOVA’s kunnen uitvoeren maar dat kan weer een fout opleveren (type I fout: onterecht aannemen dat er wel verschillen tussen groepen bestaan) een stuk groter. Gebruik dus altijd de MANOVA als je meerdere afhankelijke variabelen hebt zoals eerder genoemd.

Voorwaarden voor ANOVA zijn:

  • De afhankelijke variabele wordt gemeten op ratio- of intervalniveau.
  • De data per groep zijn verkregen uit een aselecte en willekeurige steekproef.
  • De variaties voor elke groep zijn gelijk
  • Binnen iedere groep bestaat een normale verdeling.

One Way ANOVA case

Binnen een project wil men weten of de gemiddelde transacties van 3 Sales centers verschillen. Bij een voor onderzoek weet men dat vanuit de Boxplot er zichtbare verschillen zijn in de gemiddelde transacties, maar het is niet duidelijk of deze statistisch significant zijn. De One Way ANOVA analyse moet hierop beter antwoord geven. 

  • De stelling is dat Hypothese H0 ongewijzigd of nauwelijks verbeterd is.
  • De Hypothese H1 is wel verbeterd.
One way anova
One way anova
One way anova
Conclusie;
P value : 0,000, de Null Hypothese kan verworpen worden. 
T value :
Mean(s) : Er is een overzicht voor elke Sales center gegeven met een Confidence Interval van 95% van elke sub-groep. Deze kan nuttig zijn in het verder onderzoeken van de verschillende gemiddelden en ondersteunt de Interval Plot. De plot laat zien dat de Sales center 1 & 2 lager liggen dan de 3de Sales center. Verder onderzoek op de Sales center 1 en 2 kan wenselijk zijn.
CI = 95%: 
H Null  : 
X Bar   : 

Eindconclusie: Wij kunnen vaststellen dat Sales centers 1 & 2 in gemiddelde transacties afwijkt van de 3de Sales center.
Results for: Sales data for ANOVA-Stacked
 
One-way ANOVA: Sales (GBP) versus Subscripts 

Method

Null hypothesis         All means are equal
Alternative hypothesis  At least one mean is different
Significance level      α = 0,05

Equal variances were assumed for the analysis.


Factor Information

Factor      Levels  Values
Subscripts       3  Centre 1; Centre 2; Centre 3


Analysis of Variance

Source      DF  Adj SS  Adj MS  F-Value  P-Value
Subscripts   2   285,8  142,90    10,25    0,000
Error       57   794,8   13,94
Total       59  1080,6

Model Summary

      S    R-sq  R-sq(adj)  R-sq(pred)
3,73409  26,45%     23,87%      18,50%

Means

Subscripts   N    Mean  StDev       95% CI
Centre 1    20  18,775  2,870  (17,103; 20,447)
Centre 2    20  20,300  2,151  (18,628; 21,972)
Centre 3    20   23,98   5,38  ( 22,30;  25,65)

Pooled StDev = 3,73409
anova
OPEX pagina 169
Mini Tab: Stat > ANOVA > One-Way
Select button: None
Let op!