Zweck des Tools
Vorgehensweise
Einstellmöglichkeiten
Interpretationshilfe
Darstellungsformen
Voraussetzungen
Werkzeuge
Beispiele
Begriffe
Formeln
-
Zweck des Tools
Der t-Test dient dazu, zu prüfen, ob sich die Mittelwerte zweier Gruppen statistisch signifikant unterscheiden.
Er wird eingesetzt, um zu beurteilen, ob ein beobachteter Unterschied zwischen zwei Gruppen über zufällige Schwankungen hinausgeht.
Die Entscheidung erfolgt über den Vergleich des p-Wertes mit dem festgelegten Signifikanzniveau (in der Regel α = 0,05):
- p ≤ α → H₁ annehmen (H₀ verwerfen)
- p > α → H₀ beibehalten
-
Beispiel Tomatensoße
In der Produktentwicklung wird eine neue Rezeptur für Tomatensoße getestet.
Ziel ist es zu prüfen, ob sich die Viskosität der neuen Rezeptur im Mittel von der bisherigen Rezeptur unterscheidet.
Hierzu werden Viskositätsmessungen an Proben der alten Rezeptur und der neuen Rezeptur durchgeführt.
Die Messwerte beider Gruppen werden unabhängig voneinander erhoben und jeweils als Stichprobe betrachtet.
Mithilfe des t-Tests (2 Stichproben) soll geprüft werden, ob der beobachtete Unterschied der Mittelwerte statistisch signifikant ist oder durch zufällige Streuung erklärt werden kann.
Interpretation der Ergebnisse:
Der ermittelte p-Wert liegt deutlich über dem Signifikanzniveau von 0,05, sodass die Nullhypothese beibehalten wird. Wir entscheiden uns dafür, dass die durchschnittliche Viskosität der alten und der neuen Rezeptur gleich sind.
Es gibt damit keine Hinweise darauf, dass sich die mittlere Viskosität der neuen Rezeptur von der bisherigen Rezeptur unterscheidet.
Erklärungen zur Grafik:
- Die Punkte markieren die Mittelwerte der Viskosität für die alte und neue Rezeptur.
- Die Fehlerbalken stellen das 95-%-Konfidenzintervall des Mittelwerts dar.
- Die deutliche Überlappung der Konfidenzintervalle zeigt, dass kein statistisch gesicherter Unterschied zwischen den Mittelwerten vorliegt.
-
Vorgehensweise
(Wie ist diese Grafik entstanden?)
Vorarbeit
- Eine stetige Messgröße auswählen (z. B. Viskosität).
- Zwei Gruppen festlegen, deren Mittelwerte verglichen werden sollen (z. B. Viskosität alte vs. neue Rezeptur).
- Signifikanzniveau festlegen (in der Regel α = 0,05).
- Prüfen, ob die Daten keine Hinweise auf starke Abweichungen von der Normalverteilung zeigen.
- Sicherstellen, dass die Messwerte unabhängig voneinander erhoben wurden.
Nutzung in AlphadiTab
- In der Analyze-Phase das Tool 2-Stichproben-t auswählen.
- Bei Stichprobe 1 „Viskositaet_mPas_Alt“
- Bei Stichprobe 2 „Viskositaet_mPas_Neu“
- Die Analyze durch „Neu erstellen“ durchführen.
Interpretation
- Prüfen, ob der p-Wert kleiner oder gleich dem Signifikanzniveau ist.
p ≤ α → statistisch signifikanter Unterschied der Mittelwerte.
p > α → kein statistisch signifikanter Unterschied der Mittelwerte.
Wichtig: Die Interpretation bezieht sich ausschließlich auf den Mittelwert
-
Einstellmöglichkeiten
Daten
Manuelle Eingabe:

Der Vergleich erfolgt auf Basis von manuell eingegebenen Standardabweichungen und Stichprobengrößen zweier Stichproben.
Nicht-manuelle Eingabe:

Der Vergleich erfolgt auf Basis der ausgewählten Datenspalten.
Richtung (Hypothesenart)
Mit der Richtung legen Sie fest, welche Art von Unterschied zwischen den beiden Stichproben geprüft werden soll.
Zweiseitig
Nullhypothese
H0: μ1 − μ2 = Δ0
Alternativhypothese
HA: μ1 − μ2 ≠ Δ0
Wählen Sie zweiseitig, wenn Sie prüfen möchten, ob sich die Mittelwerte der beiden Stichproben unterscheiden, ohne eine bestimmte Richtung vorzugeben.
- Es wird getestet, ob der Mittelwert der ersten Stichprobe größer oder kleiner als der der zweiten ist.
- Diese Einstellung ist sinnvoll, wenn keine konkrete Erwartung über die Richtung des Unterschieds besteht.
Beispiel:
Unterscheiden sich die durchschnittlichen Testergebnisse von Gruppe A und Gruppe B?
Größer
Nullhypothese
H0: μ1 − μ2 = Δ0
Alternativhypothese
HA: μ1 − μ2 > Δ0
Wählen Sie größer, wenn Sie prüfen möchten, ob der Mittelwert der ersten Stichprobe größer ist als der der zweiten Stichprobe.
- Es wird nur getestet, ob Stichprobe 1 signifikant höhere Werte als Stichprobe 2 aufweist.
- Unterschiede in die andere Richtung werden nicht berücksichtigt.
Beispiel:
Ist der durchschnittliche Umsatz nach einer Werbekampagne höher als vor der Kampagne?
Kleiner
Nullhypothese
H0: μ1 − μ2 = Δ0
Alternativhypothese
HA: μ1 − μ2 < Δ0
Wählen Sie kleiner, wenn Sie prüfen möchten, ob der Mittelwert der ersten Stichprobe kleiner ist als der der zweiten Stichprobe.
- Es wird nur getestet, ob Stichprobe 1 signifikant niedrigere Werte als Stichprobe 2 hat.
- Unterschiede in die entgegengesetzte Richtung werden nicht berücksichtigt.
Beispiel:
Ist die durchschnittliche Bearbeitungszeit nach einer Optimierung geringer als vorher?
-
Voraussetzungen
Zwei Gruppen
Es müssen genau zwei Gruppen vorliegen, deren Mittelwerte miteinander verglichen werden sollen (z. B. alte vs. neue Rezeptur).
Warum ist das wichtig?
Der t-Test ist ein Verfahren zum Vergleich von zwei Mittelwerten.
Unabhängige Stichproben
Die Messwerte der beiden Gruppen dürfen sich nicht gegenseitig beeinflussen (keine Paarung derselben Teile).
Warum ist das wichtig?
Der Test setzt voraus, dass die Gruppen unabhängig voneinander erhoben wurden.
Stetige Messdaten
Die Messwerte müssen stetig sein.
Warum ist das wichtig?
Der t-Test vergleicht Mittelwerte numerischer Messdaten.
Normalverteilte Daten
Die wiederholten Messwerte sollten keine Hinweise auf eine relevante Abweichung von der Normalverteilung zeigen.
Warum ist das wichtig?
- Der t-Test basiert auf Annahmen der Normalverteilung. Bei starken Abweichungen können die Testergebnisse unzuverlässig sein.
- Der t-Test ist gegenüber leichten Abweichungen von der Normalverteilung robust. Bei stark schiefen Verteilungen oder ausgeprägten Ausreißern sollte jedoch ein alternatives Verfahren verwendet werden.
-
Werkzeuge
(Wann sind andere besser geeignet?)
Wenn mehr als zwei Gruppen miteinander verglichen werden sollen, dann ist eine Varianzanalyse (ANOVA) besser geeignet.
Wenn die Daten stark schief verteilt sind oder ausgeprägte Ausreißer enthalten, dann sollte ein nichtparametrisches Verfahren verwendet werden.
Wenn dieselben Teile oder Personen vor und nach einer Maßnahme verglichen werden, dann ist ein gepaarter t-Test
Wenn nicht Mittelwerte, sondern Varianzen verglichen werden sollen, dann sind ein F-Test oder der Levene-Test besser geeignet.
Wenn nicht Mittelwerte, sondern Anteile verglichen werden sollen, dann ist ein Anteils- Test das passende Werkzeug.
-
Beispiele
Produktion
Abfüllmenge Tomatensoße
In der Produktion werden zwei Abfüllmaschinen eingesetzt. Es soll untersucht werden, ob sich die mittlere Abfüllmenge zwischen Maschine A und Maschine B unterscheidet.
Für beide Maschinen liegen die Messdaten in zusammengefasster Form vor.
- Maschine A: n = 25, Mittelwert = 500,2 ml, Standardabweichung = 1,1 ml
- Maschine B: n = 25, Mittelwert = 498,9 ml, Standardabweichung = 1,0 ml
Der Vergleich der Mittelwerte erfolgt mithilfe eines t-Tests (2 Stichproben).
Interpretation:
Der t-Test zeigt einen statistisch signifikanten Unterschied der mittleren Abfüllmenge zwischen den beiden Maschinen.
Der p-Wert liegt unter 0,05, sodass die Nullhypothese verworfen wird.
Die Maschinen unterscheiden sich im Mittelwert der Abfüllmenge.
IT-Helpdesks
Reaktionszeit Anfragen
Im IT-Service-Desk werden Tickets an mehreren Standorten bearbeitet.
Die Reaktionszeiten werden regelmäßig ausgewertet, um Unterschiede in der Servicequalität zu erkennen.
Im Beispiel der IT-Tickets liegen Daten von drei Standorten vor.
Der t-Test (2 Stichproben) ist grundsätzlich nur für den Vergleich von zwei Gruppen geeignet.
Sind mehr als zwei Standorte vorhanden, gibt es zwei mögliche Vorgehensweisen:
Paarweise Vergleiche mit dem t-Test
Jeder Standort kann paarweise mit den anderen Standorten verglichen werden (z. B. Standort A vs. B, A vs. C, B vs. C).
Dabei wird jeweils geprüft, ob sich die mittleren Reaktionszeiten zwischen zwei Standorten statistisch signifikant unterscheiden.
Alternative: Varianzanalyse (ANOVA)
Sollen alle Standorte gleichzeitig betrachtet werden, ist eine Varianzanalyse (ANOVA) das geeignetere Werkzeug.
Die ANOVA prüft, ob es mindestens einen signifikanten Unterschied zwischen den Mittelwerten der Standorte gibt, ohne mehrere Einzeltests durchführen zu müssen.
Hinweis zur Interpretation
Bei mehreren paarweisen t-Tests steigt das Risiko von Zufallstreffern. Für eine Gesamtbetrachtung der Standorte ist daher die ANOVA in der Regel vorzuziehen.
Interpretation:
Der t-Test zeigt keinen statistisch signifikanten Unterschied zwischen den mittleren Durchlaufzeiten der Standorte DLZ Nord und DLZ Ost.
Der p-Wert liegt über dem Signifikanzniveau von 0,05, sodass die Nullhypothese beibehalten wird.
Aus statistischer Sicht unterscheiden sich die mittleren Durchlaufzeiten der beiden Standorte nicht.
Vertrieb
Verkaufsquote nach Region
Im Vertrieb werden Kundenangebote von zwei Teams bearbeitet.
Es soll untersucht werden, ob sich die mittlere Durchlaufzeit (DLZ) zwischen Team A und Team B unterscheidet.
Interpretation:
Der t-Test zeigt keinen statistisch signifikanten Unterschied in der mittleren Durchlaufzeit zwischen den beiden Teams.
Der p-Wert liegt über 0,05, sodass die Nullhypothese beibehalten wird.
Beide Teams bearbeiten die Angebote im Mittel gleich schnell.
Logistik
Lieferzeit nach Logistikzentrum
In der Logistikabteilung werden Kundenaufträge kommissioniert und versendet.
Zur Effizienzsteigerung wurden neue Stapler eingeführt.
Es soll untersucht werden, ob sich die mittlere Lieferzeit (in Stunden) nach der Einführung der neuen Stapler verringert hat.
Die Analyse erfolgt mithilfe eines t-Tests für zwei Stichproben als einseitiger Test, hier wurde „größer“ ausgewählt.
H₀: μ_Vorher − μ_Nachher = 0
H₁: μ_Vorher − μ_ Nachher > 0
Interpretation:
Der einseitige t-Test zeigt einen statistisch signifikanten Unterschied zwischen den mittleren Lieferzeiten vor und nach der Einführung der neuen Stapler (t = 3,29; p = 0,001).
Da der p-Wert unter dem Signifikanzniveau von 0,05 liegt, wird die Nullhypothese verworfen.
Die mittlere Lieferzeit vor der Einführung ist signifikant höher als nach der Einführung.
Damit kann geschlossen werden, dass die Einführung der neuen Stapler zu einer signifikanten Verkürzung der durchschnittlichen Lieferzeit geführt hat.
Einkauf
Lieferantenvergleich
Im Einkauf werden Bauteile von zwei Lieferanten bezogen. Es soll untersucht werden, ob sich der mittlere Ausschussanteil pro Lieferung zwischen Lieferant A und Lieferant B unterscheidet. Der Ausschussanteil wird je Lieferung in % gemessen.
Hinweis:
Der t-Test setzt annähernd normalverteilte, stetige Daten voraus.
Prozentwerte wie die Ausschussquote können diskret sein, da sie aus Zählwerten entstehen.
Bei kleinen Liefermengen (z. B. 10 Teile pro Lieferung) entstehen nur wenige mögliche Prozentwerte (0 %, 10 %, 20 % …). In solchen Fällen kann die Normalverteilungsannahme verletzt sein und der t-Test ist möglicherweise nicht geeignet.
Bei größeren Liefermengen mit vielen möglichen Ausprägungen ist der t-Test in der Praxis in der Regel unproblematisch anwendbar.
Interpretation:
Der t-Test zeigt einen statistisch signifikanten Unterschied im mittleren Ausschussanteil zwischen den Lieferanten (p < 0,05). Die Nullhypothese wird verworfen. Die Lieferanten unterscheiden sich hinsichtlich der durchschnittlichen Ausschussquote. Lieferant A hat die bessere Ausschussquote.
Planung
Prognoseabweichung
In der Produktionsplanung werden Bedarfsprognosen für unterschiedliche Planungszeiträume erstellt.
Zur Bewertung der Prognosegüte wird die Prognoseabweichung berechnet.
Es soll untersucht werden, ob sich die durchschnittliche Prognoseabweichung zwischen kurzfristigem und langfristigem Planungszeitraum unterscheidet.
Kurzfristiger Planungshorizont:
n = 30, Mittelwert = 0,0 %, Standardabweichung = 1,5 %
Langfristiger Planungshorizont
n = 30, Mittelwert = 0,0 %, Standardabweichung = 3,8 %
Interpretation:
Der t-Test für zwei unabhängige Stichproben zeigt, dass sich die mittleren Prognoseabweichungen der kurzfristigen und langfristigen Planungszeiträume statistisch nicht signifikant unterscheiden.
Da der p-Wert über dem Signifikanzniveau von 0,05 liegt, wird die Nullhypothese nicht verworfen.
Es gibt somit keinen statistischen Hinweis darauf, dass sich die durchschnittliche Prognoseabweichung zwischen den beiden Planungshorizonten unterscheidet.
-
Begriffe
Stetige Daten: Daten, die mit einem Messmittel erfasst werden und sowohl Einheiten als auch Nachkommastellen besitzen können.
Normalverteilte Daten: Daten, die sich gut durch eine Normalverteilung beschreiben lassen. Dies kann z. B. über einen Test auf Normalverteilung überprüft werden.
x̄ = Mittelwert der Stichprobe: Durchschnittswert der erhobenen Messdaten.
s = Standardabweichung der Stichprobe: Maß für die Streuung der Daten um den Mittelwert.
n = Stichprobengröße: Anzahl der Beobachtungen innerhalb einer Stichprobe.
α = Signifikanzniveau: Vorgegebene Irrtumswahrscheinlichkeit, mit der die Nullhypothese fälschlicherweise verworfen wird.
p-Wert: Ergebnis des Hypothesentestes mit dem eine Entscheidung zwischen den beiden Hypothesen zu treffen.
t-Wert: Prüfgröße des t-Tests. Er beschreibt, wie stark die beobachtete Mittelwertdifferenz im Verhältnis zur Streuung der Daten ist.
df = Freiheitsgrade: Wert, der sich aus der Stichprobengröße ergibt und die Form der t-Verteilung bestimmt.
Δ₀ = Hypothesendifferenz: Referenzwert, gegen den die Differenz der Mittelwerte getestet wird. In der Regel ist Δ₀ = 0.
Konfidenzniveau: Wahrscheinlichkeit, mit der das berechnete Konfidenzintervall den wahren Parameterwert überdeckt (z. B. 95 %).
Konfidenzintervall: Wertebereich, der mit dem gewählten Konfidenzniveau den wahren Mittelwertunterschied enthält.
Nullhypothese: Ausgangshypothese, die von keinem Unterschied bzw. von der Hypothesendifferenz ausgeht. Sie wird im Hypothesentest geprüft.
Alternativhypothese: Gegenhypothese zur Nullhypothese. Sie beschreibt die inhaltliche Fragestellung z. B. ob sich Mittelwerte signifikant unterscheiden.
Richtung des Tests: Gibt an, ob ein Unterschied ohne Vorgabe der Richtung (zweiseitig) oder eine konkrete Richtung (größer/kleiner) geprüft wird.
Zweiseitig: Es wird geprüft, ob sich die Mittelwerte unterscheiden, unabhängig davon, in welche Richtung.
Größer: Es wird geprüft, ob der Mittelwert der ersten Stichprobe größer ist als der der zweiten Stichprobe.
Kleiner: Es wird geprüft, ob der Mittelwert der ersten Stichprobe kleiner ist als der der zweiten Stichprobe.
-
Formeln
Standardfehler der Differenz der Mittelwerte
\( \mathrm{SE}=\sqrt{\frac{\mathrm{s}_1^2}{\mathrm{n}_1}+\frac{\mathrm{s}_2^2}{\mathrm{n}_2}} \)
Teststatistik (t-Wert)
\( \mathrm{t}=\frac{(\bar{\mathrm{x}}_1-\bar{\mathrm{x}}_2)-\Delta_0}{\mathrm{SE}} \)
Freiheitsgrade (Welch)
\( \mathrm{df}=\frac{\left(\frac{\mathrm{s}_1^2}{\mathrm{n}_1}+\frac{\mathrm{s}_2^2}{\mathrm{n}_2}\right)^2}{\frac{\left(\frac{\mathrm{s}_1^2}{\mathrm{n}_1}\right)^2}{\mathrm{n}_1-1}+\frac{\left(\frac{\mathrm{s}_2^2}{\mathrm{n}_2}\right)^2}{\mathrm{n}_2-1}} \)
Konfidenzintervall der Mittelwertdifferenz
\( (\bar{\mathrm{x}}_1-\bar{\mathrm{x}}_2)\pm \mathrm{t}_{1-\alpha/2,\mathrm{df}}\cdot \mathrm{SE} \)
-
Schlagwörter