[tool_anchor_carousel]

t-Test

Zweck des Tools

Der t-Test dient dazu, zu prüfen, ob sich die Mittelwerte zweier Gruppen statistisch signifikant unterscheiden.
Er wird eingesetzt, um zu beurteilen, ob ein beobachteter Unterschied zwischen zwei Gruppen über zufällige Schwankungen hinausgeht.

Die Entscheidung erfolgt über den Vergleich des p-Wertes mit dem festgelegten Signifikanzniveau (in der Regel α = 0,05):

p ≤ α → H₁ annehmen (H₀ verwerfen)
p > α → H₀ beibehalten

Beispiel Tomatensoße

In der Produktentwicklung wird eine neue Rezeptur für Tomatensoße getestet.
Ziel ist es zu prüfen, ob sich die Viskosität der neuen Rezeptur im Mittel von der bisherigen Rezeptur unterscheidet.

Hierzu werden Viskositätsmessungen an Proben der alten Rezeptur und der neuen Rezeptur durchgeführt.
Die Messwerte beider Gruppen werden unabhängig voneinander erhoben und jeweils als Stichprobe betrachtet.

Mithilfe des t-Tests (2 Stichproben) soll geprüft werden, ob der beobachtete Unterschied der Mittelwerte statistisch signifikant ist oder durch zufällige Streuung erklärt werden kann.

Interpretation der Ergebnisse:

Der ermittelte p-Wert liegt deutlich über dem Signifikanzniveau von 0,05, sodass die Nullhypothese beibehalten wird. Wir entscheiden uns dafür, dass die durchschnittliche Viskosität der alten und der neuen Rezeptur gleich sind.

Es gibt damit keine Hinweise darauf, dass sich die mittlere Viskosität der neuen Rezeptur von der bisherigen Rezeptur unterscheidet.

Erklärungen zur Grafik:

Die Punkte markieren die Mittelwerte der Viskosität für die alte und neue Rezeptur.
Die Fehlerbalken stellen das 95-%-Konfidenzintervall des Mittelwerts dar.
Die deutliche Überlappung der Konfidenzintervalle zeigt, dass kein statistisch gesicherter Unterschied zwischen den Mittelwerten vorliegt.

Vorgehensweise

(Wie ist diese Grafik entstanden?)

Vorarbeit

Eine stetige Messgröße auswählen (z. B. Viskosität).
Zwei Gruppen festlegen, deren Mittelwerte verglichen werden sollen (z. B. Viskosität alte vs. neue Rezeptur).
Signifikanzniveau festlegen (in der Regel α = 0,05).
Prüfen, ob die Daten keine Hinweise auf starke Abweichungen von der Normalverteilung zeigen.
Sicherstellen, dass die Messwerte unabhängig voneinander erhoben wurden.

Nutzung in AlphadiTab

In der Analyze-Phase das Tool 2-Stichproben-t auswählen.
Bei Stichprobe 1 „Viskositaet_mPas_Alt“
Bei Stichprobe 2 „Viskositaet_mPas_Neu“
Die Analyze durch „Neu erstellen“ durchführen.

Interpretation

Prüfen, ob der p-Wert kleiner oder gleich dem Signifikanzniveau ist.
p ≤ α → statistisch signifikanter Unterschied der Mittelwerte.
p > α → kein statistisch signifikanter Unterschied der Mittelwerte.

Wichtig: Die Interpretation bezieht sich ausschließlich auf den Mittelwert

Einstellmöglichkeiten

Daten

Manuelle Eingabe:

Der Vergleich erfolgt auf Basis von manuell eingegebenen Standardabweichungen und Stichprobengrößen zweier Stichproben.

Nicht-manuelle Eingabe:

Der Vergleich erfolgt auf Basis der ausgewählten Datenspalten.

Richtung (Hypothesenart)

Mit der Richtung legen Sie fest, welche Art von Unterschied zwischen den beiden Stichproben geprüft werden soll.

Zweiseitig

Nullhypothese
H₀: μ₁ − μ₂ = Δ₀

Alternativhypothese
H_A: μ₁ − μ₂ ≠ Δ₀

Wählen Sie zweiseitig, wenn Sie prüfen möchten, ob sich die Mittelwerte der beiden Stichproben unterscheiden, ohne eine bestimmte Richtung vorzugeben.

Es wird getestet, ob der Mittelwert der ersten Stichprobe größer oder kleiner als der der zweiten ist.
Diese Einstellung ist sinnvoll, wenn keine konkrete Erwartung über die Richtung des Unterschieds besteht.

Beispiel:
Unterscheiden sich die durchschnittlichen Testergebnisse von Gruppe A und Gruppe B?

Größer

Nullhypothese
H₀: μ₁ − μ₂ = Δ₀

Alternativhypothese
H_A: μ₁ − μ₂ > Δ₀

Wählen Sie größer, wenn Sie prüfen möchten, ob der Mittelwert der ersten Stichprobe größer ist als der der zweiten Stichprobe.

Es wird nur getestet, ob Stichprobe 1 signifikant höhere Werte als Stichprobe 2 aufweist.
Unterschiede in die andere Richtung werden nicht berücksichtigt.

Beispiel:
Ist der durchschnittliche Umsatz nach einer Werbekampagne höher als vor der Kampagne?

Kleiner

Nullhypothese
H₀: μ₁ − μ₂ = Δ₀

Alternativhypothese
H_A: μ₁ − μ₂ < Δ₀

Wählen Sie kleiner, wenn Sie prüfen möchten, ob der Mittelwert der ersten Stichprobe kleiner ist als der der zweiten Stichprobe.

Es wird nur getestet, ob Stichprobe 1 signifikant niedrigere Werte als Stichprobe 2 hat.
Unterschiede in die entgegengesetzte Richtung werden nicht berücksichtigt.

Beispiel:
Ist die durchschnittliche Bearbeitungszeit nach einer Optimierung geringer als vorher?

Voraussetzungen

Zwei Gruppen

Es müssen genau zwei Gruppen vorliegen, deren Mittelwerte miteinander verglichen werden sollen (z. B. alte vs. neue Rezeptur).

Warum ist das wichtig?

Der t-Test ist ein Verfahren zum Vergleich von zwei Mittelwerten.

Unabhängige Stichproben

Die Messwerte der beiden Gruppen dürfen sich nicht gegenseitig beeinflussen (keine Paarung derselben Teile).

Warum ist das wichtig?

Der Test setzt voraus, dass die Gruppen unabhängig voneinander erhoben wurden.

Stetige Messdaten

Die Messwerte müssen stetig sein.

Warum ist das wichtig?

Der t-Test vergleicht Mittelwerte numerischer Messdaten.

Normalverteilte Daten
Die wiederholten Messwerte sollten keine Hinweise auf eine relevante Abweichung von der Normalverteilung zeigen.

Warum ist das wichtig?

Der t-Test basiert auf Annahmen der Normalverteilung. Bei starken Abweichungen können die Testergebnisse unzuverlässig sein.
Der t-Test ist gegenüber leichten Abweichungen von der Normalverteilung robust. Bei stark schiefen Verteilungen oder ausgeprägten Ausreißern sollte jedoch ein alternatives Verfahren verwendet werden.

Werkzeuge

(Wann sind andere besser geeignet?)

Wenn mehr als zwei Gruppen miteinander verglichen werden sollen, dann ist eine Varianzanalyse (ANOVA) besser geeignet.

Wenn die Daten stark schief verteilt sind oder ausgeprägte Ausreißer enthalten, dann sollte ein nichtparametrisches Verfahren verwendet werden.

Wenn dieselben Teile oder Personen vor und nach einer Maßnahme verglichen werden, dann ist ein gepaarter t-Test

Wenn nicht Mittelwerte, sondern Varianzen verglichen werden sollen, dann sind ein F-Test oder der Levene-Test besser geeignet.

Wenn nicht Mittelwerte, sondern Anteile verglichen werden sollen, dann ist ein Anteils- Test das passende Werkzeug.

Beispiele

Produktion

Abfüllmenge Tomatensoße

In der Produktion werden zwei Abfüllmaschinen eingesetzt. Es soll untersucht werden, ob sich die mittlere Abfüllmenge zwischen Maschine A und Maschine B unterscheidet.

Für beide Maschinen liegen die Messdaten in zusammengefasster Form vor.

Maschine A: n = 25, Mittelwert = 500,2 ml, Standardabweichung = 1,1 ml
Maschine B: n = 25, Mittelwert = 498,9 ml, Standardabweichung = 1,0 ml

Der Vergleich der Mittelwerte erfolgt mithilfe eines t-Tests (2 Stichproben).

Interpretation:

Der t-Test zeigt einen statistisch signifikanten Unterschied der mittleren Abfüllmenge zwischen den beiden Maschinen.
Der p-Wert liegt unter 0,05, sodass die Nullhypothese verworfen wird.
Die Maschinen unterscheiden sich im Mittelwert der Abfüllmenge.

IT-Helpdesks

Reaktionszeit Anfragen

Im IT-Service-Desk werden Tickets an mehreren Standorten bearbeitet.
Die Reaktionszeiten werden regelmäßig ausgewertet, um Unterschiede in der Servicequalität zu erkennen.

Im Beispiel der IT-Tickets liegen Daten von drei Standorten vor.
Der t-Test (2 Stichproben) ist grundsätzlich nur für den Vergleich von zwei Gruppen geeignet.

Sind mehr als zwei Standorte vorhanden, gibt es zwei mögliche Vorgehensweisen:

Paarweise Vergleiche mit dem t-Test
Jeder Standort kann paarweise mit den anderen Standorten verglichen werden (z. B. Standort A vs. B, A vs. C, B vs. C).
Dabei wird jeweils geprüft, ob sich die mittleren Reaktionszeiten zwischen zwei Standorten statistisch signifikant unterscheiden.

Alternative: Varianzanalyse (ANOVA)
Sollen alle Standorte gleichzeitig betrachtet werden, ist eine Varianzanalyse (ANOVA) das geeignetere Werkzeug.
Die ANOVA prüft, ob es mindestens einen signifikanten Unterschied zwischen den Mittelwerten der Standorte gibt, ohne mehrere Einzeltests durchführen zu müssen.

Hinweis zur Interpretation

Bei mehreren paarweisen t-Tests steigt das Risiko von Zufallstreffern. Für eine Gesamtbetrachtung der Standorte ist daher die ANOVA in der Regel vorzuziehen.

Interpretation:

Der t-Test zeigt keinen statistisch signifikanten Unterschied zwischen den mittleren Durchlaufzeiten der Standorte DLZ Nord und DLZ Ost.
Der p-Wert liegt über dem Signifikanzniveau von 0,05, sodass die Nullhypothese beibehalten wird.

Aus statistischer Sicht unterscheiden sich die mittleren Durchlaufzeiten der beiden Standorte nicht.

Vertrieb

Verkaufsquote nach Region

Im Vertrieb werden Kundenangebote von zwei Teams bearbeitet.
Es soll untersucht werden, ob sich die mittlere Durchlaufzeit (DLZ) zwischen Team A und Team B unterscheidet.

Interpretation:

Der t-Test zeigt keinen statistisch signifikanten Unterschied in der mittleren Durchlaufzeit zwischen den beiden Teams.
Der p-Wert liegt über 0,05, sodass die Nullhypothese beibehalten wird.
Beide Teams bearbeiten die Angebote im Mittel gleich schnell.

Logistik

Lieferzeit nach Logistikzentrum

In der Logistikabteilung werden Kundenaufträge kommissioniert und versendet.
Zur Effizienzsteigerung wurden neue Stapler eingeführt.

Es soll untersucht werden, ob sich die mittlere Lieferzeit (in Stunden) nach der Einführung der neuen Stapler verringert hat.

Die Analyse erfolgt mithilfe eines t-Tests für zwei Stichproben als einseitiger Test, hier wurde „größer“ ausgewählt.

H₀: μ_Vorher − μ_Nachher = 0
H₁: μ_Vorher − μ_ Nachher > 0

Interpretation:

Der einseitige t-Test zeigt einen statistisch signifikanten Unterschied zwischen den mittleren Lieferzeiten vor und nach der Einführung der neuen Stapler (t = 3,29; p = 0,001).

Da der p-Wert unter dem Signifikanzniveau von 0,05 liegt, wird die Nullhypothese verworfen.
Die mittlere Lieferzeit vor der Einführung ist signifikant höher als nach der Einführung.

Damit kann geschlossen werden, dass die Einführung der neuen Stapler zu einer signifikanten Verkürzung der durchschnittlichen Lieferzeit geführt hat.

Einkauf

Lieferantenvergleich

Im Einkauf werden Bauteile von zwei Lieferanten bezogen. Es soll untersucht werden, ob sich der mittlere Ausschussanteil pro Lieferung zwischen Lieferant A und Lieferant B unterscheidet. Der Ausschussanteil wird je Lieferung in % gemessen.

Hinweis:

Der t-Test setzt annähernd normalverteilte, stetige Daten voraus.

Prozentwerte wie die Ausschussquote können diskret sein, da sie aus Zählwerten entstehen.
Bei kleinen Liefermengen (z. B. 10 Teile pro Lieferung) entstehen nur wenige mögliche Prozentwerte (0 %, 10 %, 20 % …). In solchen Fällen kann die Normalverteilungsannahme verletzt sein und der t-Test ist möglicherweise nicht geeignet.

Bei größeren Liefermengen mit vielen möglichen Ausprägungen ist der t-Test in der Praxis in der Regel unproblematisch anwendbar.

Interpretation:

Der t-Test zeigt einen statistisch signifikanten Unterschied im mittleren Ausschussanteil zwischen den Lieferanten (p < 0,05). Die Nullhypothese wird verworfen. Die Lieferanten unterscheiden sich hinsichtlich der durchschnittlichen Ausschussquote. Lieferant A hat die bessere Ausschussquote.

Planung

Prognoseabweichung

In der Produktionsplanung werden Bedarfsprognosen für unterschiedliche Planungszeiträume erstellt.
Zur Bewertung der Prognosegüte wird die Prognoseabweichung berechnet.

Es soll untersucht werden, ob sich die durchschnittliche Prognoseabweichung zwischen kurzfristigem und langfristigem Planungszeitraum unterscheidet.

Kurzfristiger Planungshorizont:

n = 30, Mittelwert = 0,0 %, Standardabweichung = 1,5 %

Langfristiger Planungshorizont

n = 30, Mittelwert = 0,0 %, Standardabweichung = 3,8 %

Interpretation:

Der t-Test für zwei unabhängige Stichproben zeigt, dass sich die mittleren Prognoseabweichungen der kurzfristigen und langfristigen Planungszeiträume statistisch nicht signifikant unterscheiden.

Da der p-Wert über dem Signifikanzniveau von 0,05 liegt, wird die Nullhypothese nicht verworfen.

Es gibt somit keinen statistischen Hinweis darauf, dass sich die durchschnittliche Prognoseabweichung zwischen den beiden Planungshorizonten unterscheidet.

Begriffe

Stetige Daten: Daten, die mit einem Messmittel erfasst werden und sowohl Einheiten als auch Nachkommastellen besitzen können.

Normalverteilte Daten: Daten, die sich gut durch eine Normalverteilung beschreiben lassen. Dies kann z. B. über einen Test auf Normalverteilung überprüft werden.

x̄ = Mittelwert der Stichprobe: Durchschnittswert der erhobenen Messdaten.

s = Standardabweichung der Stichprobe: Maß für die Streuung der Daten um den Mittelwert.

n = Stichprobengröße: Anzahl der Beobachtungen innerhalb einer Stichprobe.

α = Signifikanzniveau: Vorgegebene Irrtumswahrscheinlichkeit, mit der die Nullhypothese fälschlicherweise verworfen wird.

p-Wert: Ergebnis des Hypothesentestes mit dem eine Entscheidung zwischen den beiden Hypothesen zu treffen.

t-Wert: Prüfgröße des t-Tests. Er beschreibt, wie stark die beobachtete Mittelwertdifferenz im Verhältnis zur Streuung der Daten ist.

df = Freiheitsgrade: Wert, der sich aus der Stichprobengröße ergibt und die Form der t-Verteilung bestimmt.

Δ₀ = Hypothesendifferenz: Referenzwert, gegen den die Differenz der Mittelwerte getestet wird. In der Regel ist Δ₀ = 0.

Konfidenzniveau: Wahrscheinlichkeit, mit der das berechnete Konfidenzintervall den wahren Parameterwert überdeckt (z. B. 95 %).

Konfidenzintervall: Wertebereich, der mit dem gewählten Konfidenzniveau den wahren Mittelwertunterschied enthält.

Nullhypothese: Ausgangshypothese, die von keinem Unterschied bzw. von der Hypothesendifferenz ausgeht. Sie wird im Hypothesentest geprüft.

Alternativhypothese: Gegenhypothese zur Nullhypothese. Sie beschreibt die inhaltliche Fragestellung z. B. ob sich Mittelwerte signifikant unterscheiden.

Richtung des Tests: Gibt an, ob ein Unterschied ohne Vorgabe der Richtung (zweiseitig) oder eine konkrete Richtung (größer/kleiner) geprüft wird.

Zweiseitig: Es wird geprüft, ob sich die Mittelwerte unterscheiden, unabhängig davon, in welche Richtung.

Größer: Es wird geprüft, ob der Mittelwert der ersten Stichprobe größer ist als der der zweiten Stichprobe.

Kleiner: Es wird geprüft, ob der Mittelwert der ersten Stichprobe kleiner ist als der der zweiten Stichprobe.

Formeln

Standardfehler der Differenz der Mittelwerte

\( \mathrm{SE}=\sqrt{\frac{\mathrm{s}_1^2}{\mathrm{n}_1}+\frac{\mathrm{s}_2^2}{\mathrm{n}_2}} \)

Teststatistik (t-Wert)

\( \mathrm{t}=\frac{(\bar{\mathrm{x}}_1-\bar{\mathrm{x}}_2)-\Delta_0}{\mathrm{SE}} \)

Freiheitsgrade (Welch)

\( \mathrm{df}=\frac{\left(\frac{\mathrm{s}_1^2}{\mathrm{n}_1}+\frac{\mathrm{s}_2^2}{\mathrm{n}_2}\right)^2}{\frac{\left(\frac{\mathrm{s}_1^2}{\mathrm{n}_1}\right)^2}{\mathrm{n}_1-1}+\frac{\left(\frac{\mathrm{s}_2^2}{\mathrm{n}_2}\right)^2}{\mathrm{n}_2-1}} \)

Konfidenzintervall der Mittelwertdifferenz

\( (\bar{\mathrm{x}}_1-\bar{\mathrm{x}}_2)\pm \mathrm{t}_{1-\alpha/2,\mathrm{df}}\cdot \mathrm{SE} \)

Schlagwörter

Zweck des Tools

Vorgehensweise

Einstellmöglichkeiten

Interpretationshilfe

Darstellungsformen

Voraussetzungen

Werkzeuge

Beispiele

Begriffe

Formeln

t-Test

Zweck des Tools

Beispiel Tomatensoße

Interpretation der Ergebnisse:

Erklärungen zur Grafik:

Vorgehensweise

Vorarbeit

Nutzung in AlphadiTab

Interpretation

Einstellmöglichkeiten

Daten

Richtung (Hypothesenart)

Zweiseitig

Größer

Kleiner

Voraussetzungen

Werkzeuge

Beispiele

Produktion

Abfüllmenge Tomatensoße

IT-Helpdesks

Reaktionszeit Anfragen

Vertrieb

Verkaufsquote nach Region

Logistik

Lieferzeit nach Logistikzentrum

Einkauf

Lieferantenvergleich

Planung

Prognoseabweichung

Begriffe

Formeln

Standardfehler der Differenz der Mittelwerte

\( \mathrm{SE}=\sqrt{\frac{\mathrm{s}_1^2}{\mathrm{n}_1}+\frac{\mathrm{s}_2^2}{\mathrm{n}_2}} \)

Teststatistik (t-Wert)

\( \mathrm{t}=\frac{(\bar{\mathrm{x}}_1-\bar{\mathrm{x}}_2)-\Delta_0}{\mathrm{SE}} \)

Freiheitsgrade (Welch)

\( \mathrm{df}=\frac{\left(\frac{\mathrm{s}_1^2}{\mathrm{n}_1}+\frac{\mathrm{s}_2^2}{\mathrm{n}_2}\right)^2}{\frac{\left(\frac{\mathrm{s}_1^2}{\mathrm{n}_1}\right)^2}{\mathrm{n}_1-1}+\frac{\left(\frac{\mathrm{s}_2^2}{\mathrm{n}_2}\right)^2}{\mathrm{n}_2-1}} \)

Konfidenzintervall der Mittelwertdifferenz

\( (\bar{\mathrm{x}}_1-\bar{\mathrm{x}}_2)\pm \mathrm{t}_{1-\alpha/2,\mathrm{df}}\cdot \mathrm{SE} \)

Schlagwörter

Ihre Frage war nicht dabei? Schreiben Sie uns.