Box Plot in Excel

Excel Box Plot

Ein Box-Plot in Excel ist eine bildliche Darstellung oder ein Diagramm, mit dem die Verteilung von Zahlen in einem Datensatz dargestellt wird. Es zeigt an, wie die Werte im Datensatz verteilt sind. In einem Boxplot werden die numerischen Daten unter Verwendung von fünf Zahlen als Zusammenfassung angezeigt: Minimum, Maximum, Erstes Quartil, Zweites Quartil (Median), Drittes Quartil.

Zwischen dem ersten und dritten Quartil wird ein Kästchen zusammen mit einer zusätzlichen Linie gezeichnet, die entlang des zweiten Quartils gezogen wird, um den Median zu markieren. Erweiterte Linien werden außerhalb des ersten und dritten Quartils gezeichnet, um das Minimum und Maximum darzustellen. Diese erweiterten Linien werden im Boxplot als Whisker bezeichnet.

Die Box des Boxplots zeigt das erste bis dritte Quartil mit einer Linie am zweiten Quartil, dh dem Median. Die Enden der Whisker zeigen das Minimum und das Maximum.

Die fünf durch das Boxplot dargestellten Zahlen:

  • Minimum: Kleinster / Kleinster Wert des Datensatzes.
  • Erstes Quartil: Mittelwert von Minimum und Median.
  • Zweites Quartil / Median: Mittelwert des Datensatzes.
  • Drittes Quartil: Mittelwert von Median und Maximum.
  • Maximum: Der größte Wert des Datensatzes.

Wie erstelle ich ein Boxplot in Excel? (mit einem Beispiel)

Sie können diese Box Plot Excel-Vorlage hier herunterladen - Box Plot Excel-Vorlage

Angenommen, wir haben einen Datensatz einer Klasse, der die Gesamtpunktzahl ihrer Schüler in allen Fächern enthält (von 500, Höchstpunktzahl: 100 für jedes Fach), und wir möchten für dasselbe ein Box-Diagramm in Excel erstellen.

Wir haben die folgenden Markendaten der Schüler in einem Excel-Blatt:

Mit den folgenden Schritten können Sie nun ein Box-Diagramm für die oben genannten Daten erstellen (im Grunde genommen in Excel 2013):

Es ist sehr einfach, ein Box-Diagramm mit Excel 2016 zu erstellen, da es standardmäßig ein "Box and Whisker" -Diagramm unter den statistischen Diagrammen im Diagrammbereich enthält. Excel 2013 verfügt jedoch standardmäßig nicht über eine Diagrammvorlage für Boxplots. Daher müssen Sie diese mithilfe der folgenden Schritte erstellen:

Berechnen Sie die fünf Statistiken aus dem Datensatz, die für das Box-Plot erforderlich sind: Minimum, Drei Quartile und Maximum, indem Sie die folgenden Funktionen verwenden:

Berechnen Sie nun die Mindeststatistik aus dem Datensatz.

Berechnen Sie nun die quantile1-Statistik aus dem Datensatz.

Die Berechnung von fünf Statistiken für das Box-Diagramm wird -

Wir werden nun eine endgültige Tabelle (z. B. Differenztabelle) erstellen, mit der wir das Box-Diagramm in Excel erstellen. In dieser Final Table kopieren wir den Mindestwert und dies ist der erste Eintrag in unserer Final Table. Der Rest der Einträge dieser Final Table wären die Unterschiede zwischen den einzelnen Statistiken wie folgt:

Jetzt erstellen wir mit dieser Final Table ein gestapeltes Säulendiagramm und verwandeln es in ein Box-Diagramm.

Lassen Sie uns zunächst ein gestapeltes Säulendiagramm in Excel erstellen:

Wählen Sie dann Unterschiede und Werte aus und klicken Sie auf "Einfügen" -> Alle Diagramme -> Gestapelte Säulendiagramme:

Dabei erhalten wir ein gestapeltes Diagramm wie folgt:

Wir können sehen, dass dies einem Box-Plot nicht ähnlich ist, da Excel mit diesem gestapelten Diagramm standardmäßig gestapelte Spalten aus der Horizontalen und nicht aus einem vertikalen Datensatz zeichnet. Wir müssen also die Diagrammachsen umkehren.

Klicken Sie dazu mit der rechten Maustaste auf das Diagramm und klicken Sie auf "Daten auswählen".

Klicken Sie nun auf Zeile / Spalte wechseln.

Wir erhalten ein gestapeltes Diagramm wie folgt:

Wir werden diesen gestapelten Diagrammtyp nun wie folgt in einen Boxplot konvertieren:

Wählen Sie den unteren Teil der Spalte (blauer Bereich) aus und klicken Sie auf "Datenreihen formatieren".

Erweitern Sie im Bereich "Datenreihen formatieren" die Option "Füllen" und wählen Sie die Schaltfläche "Keine Füllung". Erweitern Sie sie in der Dropdown-Liste "Rand" und wählen Sie die Schaltfläche "Keine Linie":

Wir erhalten das folgende Box-Plot-Diagramm wie folgt:

Der nächste Schritt besteht darin, Whisker zu erstellen, indem die obersten und zweiten von den unteren Segmenten, dh die roten und orangefarbenen Bereiche (wie wir die untersten gelöscht haben), durch Linien / Whisker ersetzt werden.

Um den oberen Whisker zu zeichnen, wählen wir den obersten Bereich / das oberste Segment (rot) aus und erweitern die Registerkarte 'Füllen'.

Und wählen Sie die Schaltfläche "Keine Füllung".

Klicken Sie nun auf 'Design' -> 'Diagrammelemente hinzufügen' -> 'Fehlerbalken' -> 'Standardabweichung':

Jetzt klicken wir oben rechts im Diagramm auf die Plus-Schaltfläche, wählen und erweitern "Fehlerbalken in Excel" und wählen dann "Weitere Optionen".

Dadurch wird das Fenster "Formatfehlerbalken" geöffnet und Folgendes festgelegt:

Set: Richtung auf 'Plus'

End Style to 'Cap'

Prozentsatz auf '100%'

Wir haben jetzt einen Top-Whisker wie folgt gezeichnet:

Um den unteren Whisker zu zeichnen, wählen wir den zweiten aus dem unteren Bereich (orange, der jetzt als letzter sichtbar ist) und wiederholen die gleichen Schritte wie oben. Die einzige Änderung wäre, dass die 'Richtung' in Fehlerbalken 'auf' Minus 'gesetzt wird.

Wir haben jetzt einen unteren Whisker wie folgt gezeichnet:

So können wir im obigen Screenshot sehen, dass das gestapelte Säulendiagramm jetzt einem Boxplot ähnelt. Box-Plots haben im Allgemeinen die gleiche Farbe, daher können wir eine Füllfarbe mit einem leichten Rand verwenden.

Lassen Sie uns nun sehen, wie ein Boxplot interpretiert oder angezeigt wird:

Wir können im obigen Screenshot sehen, dass:

  • Senken Sie die Endpunkte des Whiskers auf 300, was den Mindestwert darstellt.
  • Die Endpunkte des oberen Whiskers liegen irgendwo unter 500, was genau 492 entspricht und das Maximum darstellt.
  • Die obere Zeile des grünen Kästchens zeigt Quartil3, das wir bei 480,5 sehen.
  • Die Mittellinie des grünen Kästchens zeigt den Median / das Quartil2, bei dem wir Punkte bei 450 sehen.
  • Die letzte Zeile des grünen Kästchens zeigt das Quartil1, das wir bei 392 sehen.

Das Box-Diagramm für den angegebenen Datensatz wird also korrekt gezeichnet, wobei die fünf Statistiken (Minimum, drei Quartile und Maximum) wie oben berechnet werden.

Dinge, an die man sich erinnern sollte

  • Ein Box-Plot ist eine bildliche Darstellung eines numerischen Datensatzes, der eine fünfstellige Zusammenfassung verwendet, um die Datensatzverteilung darzustellen.
  • Box-Plot wird auch als Box- und Whisker-Plot bezeichnet.
  • Es wird im Allgemeinen zur erklärenden Datenanalyse verwendet.
  • Sie werden im Allgemeinen verwendet, wenn wir einige Stichproben vergleichen und testen müssen, ob die Daten symmetrisch verteilt sind.
  • Box-Plots benötigen im Vergleich zu Dichtediagrammen oder Histogrammen weniger Platz.
  • Es wird verwendet, um die Form einer Verteilung, den zentralen Wert und ihre Variabilität anzuzeigen.
  • Es ist nicht erforderlich, dass sich der Median in der Mitte des Felds befindet.
  • Die Whisker können unterschiedlich lang sein.
  • Boxplot kann verwendet werden, um Ausreißer zu erkennen.