Scatter plot

Box plot

De Box plot is een grafische voorstelling waarmee je snel een overzicht van de verdeling van een verzameling gegevens kunt krijgen. Als je meerdere samples wilt vergelijken is de Box plot de eerste grafische tool die je kan gebruiken. Gebruik de Histogram in geval dat er maar 1 data-sample is, terwijl de Box plot juist geschikt voor 2 of meerdere data-samples.

Boxplot

Een goede weergave van een Box plot zie je hiernaast, de Boxplot is onder weergegeven in de totale spreiding van de data-set. Je ziet nu goed hoe de mediaan, de 1ste en 3de Quartiel geven duidelijk de spreiding aan en de Minimale en Maximale waarde zijn zichtbaar weergegeven.

Box plot en de werking

  • Hoe werkt een Box Plot?: Het berekent statistisch de data-samples en geeft dit weer in een Box met whiskers.
  • De Box zelf: 50% representeert de data beginnend in Quartiel 1 (Q1) en eindigt in Quartiel 3 (Q3)
  • De Whiskers: Representeert de ‘range’ van de data-sample
  • De Outliers: De lengte van de Outliers is gelimiteerd tot 1.5 de lengte van de box. Alle data punten die buiten de whisker vallen noemen we de Outliers (en dient onderzocht te worden)
  • Mediaan Tevens is de Mediaan als een lijn dwars door de box getrokken.
Box plot

Box plot voorbeeld

  • OPEX pag.: 140
  • Minitab  : Graph >
  • Boxplot File  : Courier Process.mpj


In geval van de sample (courier process) is in de grafiek (printscreens 1,2, & 3) de volgende punten zichtbaar; 

Box plot
  • De data-points voor boxplots moeten meer dan 25 zijn, reden is dat eventuele Whiskers significanter zichtbaarder worden
  • In de grafiek is bij de subgroup ‘Overnight’ zichtbaar dat n = 10. Dit geeft een niet betrouwbare calculatie of de kwartielen variëren en daardoor onbetrouwbaar.
  • In de grafiek gegeven subgroup ‘Express’ lijken de parcels lager te zijn vanwege dat de mediaan in gewicht lager is dan de ‘Normal’ subgroup
  • De variatie tussen ‘Express’ en ‘Normal’ lijken in gewicht ongeveer hetzelfde te zijn
Box plot

Minitab gegeven invoeren printscreen 5

  • In geval 2 of meer categorieën van de sample (courier process) is in de grafiek (printscreens 4 & 5) de volgende punten zichtbaar;
  • In Minitab kan de variabelen ingegeven worden, in dit geval ‘Location’ en ‘Business Type’, Minitab zal de sample stratificeren ((in welke orde je ze kiest is belangrijk)
  • Ook hier is de subgroup ‘Commercial – France’ de data-points n = 22 laag te noemen voor de Boxplot test, in dit geval zou een individuele Boxplot beter zijn
Box plot

Conclusie voor printscreen 5 

Parcels voor Residential geven een lagere Median (in gewicht) dan de Commercial klanten

Dit geldt zowel voor Frankrijk als wel U.K.

Box plot

De subgroepen lijken dezelfde niveaus in variaties te hebben

Mocht je deze Boxplot willen maken volg dan de link: Boxplot in Excel

Voor meer informatie is hier een link.