Excel

Boxplot in Excel

Een Boxplot, ook wel doosdiagram met 2 snorharen genoemd (Box and Whisker) is niets anders dan statistische weergave van een of meerdere reeksen. Je kan hiermee de spreiding van de waarde(n) zien en in hoeverre deze waarden dan onderling verschillen.

boxplot

De doos geef een lijn weer die het middelpunt van de verdeling aangeeft, de mediaan. De lengte aan de ene kant is het eerste kwartiel en aan de andere kant de derde kwartiel. Het tweede kwartiel is middelste en tevens de grootste kwartiel.

  • Q1 = 25%
  • Q2 = 50%
  • Q3 =25%

Binnen Q2 ligt 50% van alle waarden. De eventuele uitschieters worden apart gemarkeerd met rondjes (of kruisjes) buiten de doos.

Weergave en formules

Boxplot tabel

Een Boxplot kan zowel horizontaal als verticaal worden weergegeven, dit afhankelijk van de reeksen of persoonlijke voorkeuren. De volgende gegevens worden weergegeven in de grafische voorstelling van Box and Whisker;

  • grootste getal (max.)
  • derde kwartiel (Q3
  • mediaan (Q2)
  • gemiddelde
  • eerste kwartiel (Q1)
  • kleinste getal (min.)

Boxplox in Excel voorbeeld

Hier een voorbeeld van de Boxplot in Excel, je kan deze downloaden zodat je de formules en de opbouw in Excel kan zien. De opbouw is dat vanuit het tabel aan gegevens, de dataset een grafiek kan maken. Voor een betere interpretatie is het verstandig om enkele formules extra bij te zetten, denk aan het lijstje hiervoor genoemd. Je ziet dan dus cijfermatig en de grafiek tezamen in een oog opslag in de Excel sheet terug komen.

Het betreft hier om een Boxplot waar 3 verschillende regio’s de verkopen laten zien in tabel met de verschillende berekeningen. Tevens laat het in een grafiek zien hoe de onderlinge regio’s tegen over elkaar presteren.

Boxplot in Excel
Boxplot grafiek

Uitschieters in de Boxplot

Binnen deze grafiek is ook duidelijk 2 uitschieters te zien in de regio Amsterdam en Amersfoort, respectievelijk op de lijn van de 120 en 90 verkopen zie je dit als een blauwe stip in de grafiek. Goed onderzoek waarom dit zo is is een vereiste. Het kan zijn dat er een speciale dag van verkopen zijn geweest of iets anders. Je kan dan eventueel op basis van je onderzoek de dataset aanpassen en de 2 gevonden uitschieters verwijderen. Zo krijg een iets zuiverder beeld van je dataset. Deze uitschieters zijn niet altijd aanwezig, maar houd in het achterhoofd dat deze ‘uitschieters’ altijd eerst onderzocht moeten worden waarom deze er zijn. Beoordeel dan of je deze uitschieters in je dataset wilt behouden of niet…. Bij het presenteren van de grafiek zal dit wel duidelijk aangegeven moeten worden zodat vragen dan ook beantwoord kunnen worden.

Alhoewel dit een korte uitleg is van de Boxplot en hoe deze is te maken in Excel, is hier een link als je verder in wilt verdiepen in de theorie.