[tool_anchor_carousel]

Boxplot

  • Zweck des Tools

Der Boxplot ist ein grafisches Werkzeug zur Darstellung der Verteilung einer Messgröße. Er zeigt nicht nur die Lage und Streuung der Daten, sondern macht auch Ausreißer sichtbar. Durch die kompakte Darstellung können verschiedene Datensätze schnell miteinander verglichen werden, beispielsweise vor und nach einer Prozessverbesserung oder zwischen unterschiedlichen Maschinen, Schichten oder Materialchargen.

  • Beispiel Tomatensoße:

Bei der Herstellung von Tomatensoße werden regelmäßig Viskositätsmessungen durchgeführt. Um einen ersten Überblick über die Verteilung zu erhalten, wird ein Boxplot erstellt. Dieser zeigt auf einen Blick, wie symmetrisch oder schief die Daten verteilt sind und ob mögliche Ausreißer vorliegen.

Erklärungen zu den Ergebnissen:

Ein Boxplot besteht aus mehreren Elementen, die gemeinsam die Verteilung der Daten beschreiben:

  • Median: Die Linie innerhalb der Box zeigt den mittleren Wert der Daten.
  • Box (Interquartilsabstand): Sie umfasst die mittleren 50 % aller Werte, also den Bereich zwischen dem 25%- und dem 75%-Perzentil.
  • „Whisker“ (Antennen): Diese Linien zeigen den Wertebereich außerhalb der Box an. Typisch reicht ein Whisker bis 1,5-fache des Interquartilsabstands.
  • Ausreißer: Werte außerhalb der Whisker werden als einzelne Punkte dargestellt.
  • Vorgehensweise

Vorarbeit

  1. Eine stetige Messgröße auswählen und Messwerte erheben (z. B. Viskosität).

Nutzung in AlphadiTab

  1. In der Measure-Phase das Tool Boxplot auswählen.
  2. Bei Daten „Viskosität“ auswählen.
  3. Diagramm mit dem Button „Neu erstellen“ generieren.

Interpretation

  1. Liegt der Median zentral in der Box? → Symmetrische Verteilung.
  2. Ist die Box stark verschoben oder ungleich breit? → Hinweis auf Schiefe.
  3. Sind Ausreißer vorhanden? → Daten prüfen, ggf. Ursachen analysieren.
  4. Sind mehrere Boxplots dargestellt? → Vergleichen Sie Median, Boxbreite und Whiskerlänge zwischen den Gruppen.
  • Interpretationshilfe

Allgemeine Betrachtung

  • Wie ist die Lage der Box (Median)?
  • Wie ist die Streuung der Daten (Boxbreite / Whisker)?
  • Gibt es Ausreißer?
  • Liegt der Median zentral in der Box oder nahe an einer Boxkante?
  • Ist ein Whisker deutlich länger als der andere?

Bei bekannten Spezifikationen

  • Stimmt die Lage mit dem Sollwert überein?
  • Liegt die Streuung innerhalb des Spezifikationsfensters?

Bei mehreren Boxplots

  • Ist die Lage bei allen Boxplots gleich?
  • Ist die Streuung bei allen Boxplots gleich?
  • Darstellungsformen

Für Boxplots stehen verschiedene Darstellungsformen zur Verfügung. Abhängig davon, ob eine oder mehrere Datenreihen sowie zusätzliche Gruppen oder Serien ausgewählt werden, ändert sich die Darstellung im Diagramm. Daten können so gruppiert oder nach Serien aufgeschlüsselt visualisiert und gezielt miteinander verglichen werden. Alle folgenden Darstellungsformen basieren auf derselben Datei, unterscheiden sich jedoch in der Auswahl der verwendeten Spalten. Das jeweilige Vorgehen ist in den einzelnen Kacheln beschrieben.

Vorgehen:

Schritt 1: Bei Daten nur die Spalte A auswählen

Vorgehen:

Schritt 1: Bei Daten nur die Spalte A auswählen

Schritt 2: Bei Gruppe die Spalte D (Prozessstatus) auswählen

Vorgehen:

Schritt 1: Bei Daten nur die Spalte A auswählen.

Schritt 2: Bei Gruppe die Spalte D (Prozessstatus) auswählen.

Schritt 3: Bei Serie die Spalte E (Produkt) auswählen.

Vorgehen:

Schritt 1: Bei Daten die Spalten A-C auswählen.

Vorgehen:

Schritt 1: Bei Daten die Spalten A-C auswählen.

Schritt 2: Bei Gruppe die Spalte D (Prozessstatus) auswählen.

Vorgehen:

Schritt 1: Bei Daten die Spalten A-C auswählen

Schritt 2: Bei Gruppe die Spalte D (Prozessstatus) auswählen

Schritt 3: Bei Serie die Spalte E (Produkt) auswählen

  • Voraussetzungen

  • Mindestens quantitative Daten (zählbare oder messbare Daten)
  • Ein geeignetes Messmittel, da Ausreißer oft durch Messfehler entstehen können.
  • Werkzeuge

    (Wann sind andere besser geeignet?)

  • Daten sind nominal oder ordinal → Balkendiagramm
  • Beispiele

Development

Entwicklung alte vs. neue Rezeptur

In der Entwicklung wird eine neue Rezeptur getestet. Mit dem Boxplot soll überprüft werden, ob sich die Viskosität der neuen Rezeptur ähnlich verteilt wie bei der bisherigen Rezeptur.

Der Boxplot zeigt, dass sich die Lage der Viskosität bei der alten und der neuen Rezeptur kaum unterscheidet, da die Mediane nahezu auf gleicher Höhe liegen. Allerdings weist die neue Rezeptur eine deutlich größere Streuung auf, was sich an der breiteren Box und längeren Whiskern erkennen lässt.
Dies deutet darauf hin, dass die neue Rezeptur im Mittel vergleichbare Viskositätswerte erreicht, jedoch eine schlechtere Streuung hat.

Produktion/ Qualitätssicherung

In der Qualitätssicherung wurde festgestellt, dass einzelne Viskositätswerte außerhalb der erwarteten Range lagen. Nun soll geprüft werden, ob dieses Verhalten bei allen Produktionslinien auftritt oder nur bei einzelnen Linien.

Der Boxplot zeigt, dass die Produktionslinien 1 und 2 eine ähnliche Lage und Streuung der Viskosität aufweisen. Produktionslinie 3 unterscheidet sich hingegen deutlich in der Lage, da der Median höher liegt als bei den anderen Linien.

Die Streuung ist bei allen drei Linien vergleichbar.

Dienstleistung

Bearbeitungszeit IT-Tickets nach Standort

Im IT-Service-Desk werden Anfragen an mehreren Standorten bearbeitet. Obwohl dieselben Serviceprozesse gelten, können sich die Rahmenbedingungen zwischen den Standorten unterscheiden, zum Beispiel durch unterschiedliche Ticketarten, Zeitzonen oder organisatorische Abläufe.
Mithilfe eines Boxplots soll überprüft werden, ob sich die Verteilung der Ticket-Durchlaufzeiten zwischen den Standorten unterscheidet.

Im Boxplot liegen die Mediane der Durchlaufzeiten an allen Standorten auf einem ähnlichen Niveau. Gleichzeitig ist ein einzelner Ausreißer beim Standort Ost erkennbar.
Dies zeigt, dass sich die durchschnittlichen Durchlaufzeiten zwischen den Standorten nicht wesentlich unterscheiden, jedoch vereinzelte außergewöhnlich lange Bearbeitungszeiten auftreten. Der Boxplot macht diese Ausreißer deutlich sichtbar, ohne dass sich die zentrale Lage stark verändert.

Vertrieb

Verkaufsquote nach Region

Im Vertrieb werden Verkaufschancen in mehreren Regionen bearbeitet. Obwohl dieselben Produkte angeboten werden, können sich Marktbedingungen, Kundentypen und Wettbewerbsintensität unterscheiden.
Mithilfe eines Boxplots soll untersucht werden, ob sich die Verteilung der Verkaufsquote zwischen den Regionen unterscheidet.

Der Boxplot zeigt deutliche Unterschiede in der Lage der Verkaufsquoten zwischen den Regionen. Region West weist insgesamt höhere Verkaufsquoten auf, während Region Süd niedrigere Werte zeigt. Die Streuung innerhalb der Regionen ist vergleichbar.
Der Boxplot eignet sich hier besonders gut, um regionale Unterschiede in der Verkaufsperformance übersichtlich darzustellen, ohne einzelne Abschlüsse oder Personen zu bewerten. Auffällig ist, dass die Whisker mit den Boxen identisch sind. Dies tritt auf, wenn die Messwerte sehr ähnlich sind und beispielsweise durch die Auflösung des Messmittels keine Nachkommastellen vorhanden sind.

Logistik

Lieferzeit nach Logistikzentrum

In der Logistik werden Kundenaufträge über mehrere Logistikzentren abgewickelt. Obwohl dieselben Prozesse und Systeme genutzt werden, können sich Lieferzeiten aufgrund unterschiedlicher Auslastung, Infrastruktur oder regionaler Gegebenheiten unterscheiden.
Mithilfe eines Boxplots soll untersucht werden, ob sich die Verteilung der Lieferzeiten zwischen den Logistikzentren unterscheidet.

Im Boxplot liegen die Mediane der Durchlaufzeiten an allen Standorten auf einem ähnlichen Niveau. Gleichzeitig ist bei einem Standort ein einzelner Ausreißer erkennbar.

Dies zeigt, dass sich die typischen Durchlaufzeiten zwischen den Standorten nicht wesentlich unterscheiden, jedoch vereinzelt außergewöhnlich lange Bearbeitungszeiten auftreten. Der Boxplot macht diese Ausreißer deutlich sichtbar, ohne dass sich die zentrale Lage der Daten wesentlich verändert.

Einkauf

Lieferantenvergleich

Im Einkauf werden Materialien von verschiedenen Lieferanten bezogen. Mithilfe eines Boxplots soll untersucht werden, ob sich die Verteilung von Lieferzeiten oder Qualitätskennzahlen zwischen den Lieferanten unterscheidet. Liefertreue [%] gibt an, wie häufig Lieferungen termingerecht erfolgen. Eine Lieferung gilt als termingerecht, wenn sie innerhalb des vereinbarten Lieferfensters eintrifft. Die Liefertreue wird als prozentualer Anteil termingerechter Lieferungen berechnet.

Für jede Woche wird die Liefertreue berechnet, z. B.:

\( \text{Liefertreue}\,[\%] = \frac{\text{termingerechte Lieferungen}}{\text{Gesamtlieferungen}} \cdot 100 \)

Für den Boxplot wird die Liefertreue über mehrere Kalenderwochen berechnet. Jeder Datenpunkt entspricht der Liefertreue eines Lieferanten in einer Woche. Der Boxplot zeigt damit die Verteilung der Liefertreue über die Zeit und ermöglicht einen Vergleich zwischen Lieferanten.

Der Boxplot zeigt Unterschiede in der Lage und Streuung der Liefertreue zwischen den Lieferanten. Lieferant A weist eine hohe Liefertreue mit einer geringen Variation auf, was sich in einem hohen Median und einer engen Box widerspiegelt.
Lieferant C zeigt ebenfalls eine geringe Streuung, jedoch im Mittel eine niedrigere Liefertreue. Lieferant B weist die größte Streuung auf und zeigt eine leicht bessere Liefertreue als Lieferant C aber eine schlechtere als Lieferant A.

Planung

Prognoseabweichung

In der Produktionsplanung werden Bedarfsprognosen erstellt. Ein Boxplot wird genutzt, um zu analysieren, ob sich die Verteilung der Prognoseabweichungen zwischen verschiedenen Produkten oder Planungszeiträumen unterscheidet.

Die Prognoseabweichung ergibt sich aus dem Vergleich zwischen dem geplanten Bedarf und dem tatsächlich eingetretenen Bedarf. Um die Abweichung vergleichbar darzustellen, wird sie in Prozent angegeben.

Die Berechnung erfolgt wie folgt:

\( \text{Prognoseabweichung}\,[\%] = \frac{\text{geplanter Bedarf} – \text{tatsächlicher Bedarf}}{\text{tatsächlicher Bedarf}} \cdot 100 \)

  • Ein positiver Wert bedeutet, dass der Bedarf überschätzt wurde.
  • Ein negativer Wert bedeutet, dass der Bedarf unterschätzt wurde.
  • Ein Wert nahe 0 % zeigt eine sehr genaue Prognose.

Durch die prozentuale Darstellung lassen sich Prognoseabweichungen unabhängig von absoluten Mengen vergleichen und übersichtlich im Boxplot darstellen.

Der Boxplot zeigt deutliche Unterschiede in der Lage und Streuung der Prognoseabweichung zwischen den Planungshorizonten. Die kurzfristige Planung weist eine geringe Streuung und eine Lage nahe bei 0 % auf.
Bei der mittelfristigen Planung ist sowohl die Streuung als auch die Abweichung vom Zielwert größer. Die langfristige Planung zeigt die größte Streuung sowie deutliche positive und negative Abweichungen. Der Boxplot macht damit sichtbar, dass die Prognoseunsicherheit mit zunehmendem Planungshorizont deutlich zunimmt.

  • Begriffe

Median: Zentralwert der sortierten Daten.

Quartile: Werte, die die Daten in vier gleiche Abschnitte teilen.

Interquartilsabstand (IQR): Differenz zwischen dem 75%- und 25%-Perzentil.

Whisker: Bereich, der die Daten außerhalb der Box abdeckt.

Ausreißer: Datenpunkte, die außerhalb des typischen Wertebereichs liegen.

  • Formeln

Mittelwert

\( \mathrm{x̄}=\frac{\sum_{i=1}^{\mathrm{n}}\mathrm{x}_i}{\mathrm{n}} \)

Allgemeine Quartilsformeln

Gegeben ist eine sortierte Datenreihe mit \( \mathrm{n} \) Datenwerten.

\( \mathrm{x}_{(1)} \le \mathrm{x}_{(2)} \le \dots \le \mathrm{x}_{(\mathrm{n})} \)

Position der Quartile

Position Q1:

\( \mathrm{r}_1=\frac{\mathrm{n}+1}{4} \)

Position Q2 (Median):

\( \mathrm{r}_2=\frac{\mathrm{n}+1}{2} \)

Position Q3:

\( \mathrm{r}_3=\frac{3(\mathrm{n}+1)}{4} \)

Zerlegung der Position r

Die Position r kann in die Zahl vor dem Komma (hier N) und die Nachkommastelle (hier p) zerlegt werden:

\( \mathrm{r}=\mathrm{N},\mathrm{p} \)

Interpolationsformel für die Berechnung der Quartile

Falls \( \mathrm{r} \) keine ganze Zahl:

\( \mathrm{Q}=\mathrm{x}_{(\mathrm{N})}+\mathrm{p}\cdot\left(\mathrm{x}_{(\mathrm{N}+1)}-\mathrm{x}_{(\mathrm{N})}\right) \)

Mit x(N) ist der N-te Wert der sortierten Datenreihe gemeint.

Falls \( \mathrm{r} \) eine ganze Zahl:

\( \mathrm{Q}=\mathrm{x}_{(\mathrm{r})} \)

Beispiel mit n = 10

Datenreihe: x1 = 3, x2 = 4, x3 = 5, x4 = 7, x5 = 8, x6 = 10, x7 = 10, x8 = 11, x9 = 14, x10 = 15

Position von Q1

\( \mathrm{r}_1=\frac{\mathrm{n}+1}{4}=\frac{11}{4}=2{,}75 \)

\( \mathrm{r}_1=\frac{\mathrm{n}+1}{4}=\frac{11}{4}=\underset{\mathrm{N}=2}{\underset{\downarrow}{2}}{,}\underset{\mathrm{p}=0{,}75}{\underset{\downarrow}{75}} \)

Interpolation mit x2 = 4 und x3 = 5:

\( \mathrm{Q}_1=4+0{,}75\cdot(5-4) \)

Ergebnis

\( \mathrm{Q}_1=4{,}75 \)

  • Schlagwörter