Zweck des Tools
Vorgehensweise
Einstellmöglichkeiten
Interpretationshilfe
Darstellungsformen
Voraussetzungen
Werkzeuge
Beispiele
Begriffe
Formeln
-
Zweck des Tools
Der Test von Anteilen, 2 Stichproben dient dazu, zu prüfen, ob sich die Anteile zweier Gruppen statistisch signifikant unterscheiden.
Er wird eingesetzt, um zu beurteilen, ob ein beobachteter Unterschied zwischen zwei Anteilen über zufällige Schwankungen hinausgeht. Grundlage ist ein Hypothesentest für binäre Ereignisse (Ereignis / kein Ereignis).
- p ≤ α → H₁ annehmen (H₀ verwerfen)
- p > α → H₀ beibehalten
-
Beispiel undichte Deckel
Ein Hersteller von Tomatensoße möchte prüfen, ob sich der Anteil undichter Gläser zwischen zwei Abfülllinien unterscheidet.
Dazu wird bei beiden Linien erfasst, wie viele Gläser im Dichtigkeitstest auffällig sind und wie viele Gläser insgesamt geprüft wurden:
- Linie A: 30 von 100 Gläsern undicht
- Linie B: 50 von 100 Gläsern undicht
Mithilfe des Tests von Anteilen, 2 Stichproben wird geprüft, ob der beobachtete Unterschied der Ausschussanteile statistisch signifikant ist oder durch Zufall erklärt werden kann.
Interpretation der Ergebnisse:
Der ermittelte p-Wert liegt unter dem Signifikanzniveau von 0,05, sodass die Nullhypothese verworfen wird. Wir entscheiden uns dafür, dass sich die Anteile der beiden Abfülllinien unterscheiden.
Es gibt damit statistische Hinweise darauf, dass die Wahrscheinlichkeit für undichte Gläser auf den beiden Linien nicht gleich ist.
Erklärungen zur Grafik:
- Die Punkte markieren die beobachteten Stichprobenanteile der beiden Abfülllinien.
- Die Fehlerbalken stellen das 95-%-Konfidenzintervall der jeweiligen Anteile dar.
- Wenn sich die Konfidenzintervalle gar nicht bis wenig überlappen, spricht dies für einen statistisch signifikanten Unterschied (Die Entscheidung wird über den p-Wert getroffen).
-
Vorgehensweise
(Wie ist diese Grafik entstanden?)
Vorarbeit
- Ein binäres Ereignis auswählen (z. B. Deckel dicht: Ja/Nein oder Etikett korrekt: Ja/Nein).
- Zwei Gruppen festlegen, deren Anteile verglichen werden sollen (z. B. Abfülllinie A vs. Abfülllinie B oder Lieferant 1 vs. Lieferant 2).
- Signifikanzniveau α festlegen (in der Regel α = 0,05).
- Sicherstellen, dass die Beobachtungen innerhalb und zwischen den Gruppen unabhängig voneinander erhoben wurden.
Nutzung in AlphadiTab
- In der Analyze-Phase das Tool „Test von Anteilen, 2 Stichproben“ auswählen.
- Den Regler bei „Manuell“ aktivieren.
- Unter Stichprobe 1 bei Anzahl der Ereignisse 30 und bei Anzahl der Versuche 100 angeben.
- Unter Stichprobe 2 bei Anzahl der Ereignisse 50 und bei Anzahl der Versuche 100 angeben.
Interpretation
- Prüfen, ob der p-Wert kleiner oder gleich dem Signifikanzniveau ist.
p ≤ α → statistisch signifikanter Unterschied der Anteile.
p > α → kein statistisch signifikanter Unterschied der Anteile.Wichtig: Die Interpretation bezieht sich auf Anteile bzw. auf die Differenz der Anteile – nicht auf Mittelwerte.
Der p-Wert der Fishers exakten Methode ist für alle Stichprobengrößen gültig. Die Normalapproximation kann ungenau sein, wenn in einer der beiden Stichproben die Anzahl der Ereignisse oder Gegenereignisse kleiner als 5 ist.
-
Einstellmöglichkeiten
Daten
Manuelle Eingabe:

Der Vergleich erfolgt auf Basis von Anzahl der Ereignisse und Anzahl der Versuche in beiden Stichproben.
Nicht-manuelle Eingabe:

Der Vergleich erfolgt auf Basis der ausgewählten Datenspalten.
Richtung (Hypothesenart)
Mit der Richtung legen Sie fest, welche Art von Unterschied zwischen den beiden Stichproben geprüft werden soll.
Zweiseitig
Nullhypothese
H₀: p₁ – p₂ = Δ₀
Alternativhypothese
H₁: p₁ – p₂ ≠ Δ₀
Wählen Sie zweiseitig, wenn Sie prüfen möchten, ob sich die Anteile der beiden Stichproben unterscheiden, ohne eine bestimmte Richtung vorzugeben.
- Es wird getestet, ob der Anteil der ersten Stichprobe größer oder kleiner als der der zweiten ist.
- Diese Einstellung ist sinnvoll, wenn keine konkrete Erwartung über die Richtung des Unterschieds besteht.
Beispiel:
Unterscheidet sich die Quote undichter Gläser zwischen Abfülllinie A und Abfülllinie B?
Größer
Nullhypothese
H₀: p₁ – p₂ = Δ₀
Alternativhypothese
H₁: p₁ – p₂ > Δ₀
Wählen Sie größer, wenn Sie prüfen möchten, ob der Anteil der ersten Stichprobe größer ist als der der zweiten Stichprobe.
- Es wird nur getestet, ob Stichprobe 1 signifikant höhere Anteile als Stichprobe 2 aufweist.
- Unterschiede in die andere Richtung werden nicht berücksichtigt.
Beispiel:
Ist der Anteil pünktlich bereitgestellter Paletten am Standort Nord höher als am Standort Süd?
Kleiner
Nullhypothese
H₀: p₁ – p₂ = Δ₀
Alternativhypothese
H₁: p₁ – p₂ < Δ₀
Wählen Sie kleiner, wenn Sie prüfen möchten, ob der Anteil der ersten Stichprobe kleiner ist als der der zweiten Stichprobe.
- Es wird nur getestet, ob Stichprobe 1 signifikant niedrigere Anteile als Stichprobe 2 hat.
- Unterschiede in die entgegengesetzte Richtung werden nicht berücksichtigt.
Beispiel:
Ist der Anteil fehlerhaft etikettierter Gläser in Schicht A geringer als in Schicht B?
-
Voraussetzungen
Zwei Gruppen
Es müssen genau zwei Gruppen vorliegen, deren Anteile miteinander verglichen werden sollen (z. B.Schicht A vs. Schicht B).
Warum ist das wichtig?
Der Test von Anteilen, 2 Stichproben ist ein Verfahren zum Vergleich von zwei Anteilen.
Unabhängige Stichproben
Die Beobachtungen der beiden Gruppen dürfen sich nicht gegenseitig beeinflussen. Jede Einheit darf nur einer Gruppe zugeordnet sein.
Warum ist das wichtig?
Der Test setzt voraus, dass die Gruppen unabhängig voneinander erhoben wurden.
Nominale Daten mit 2 Ausprägungen
Die Daten müssen als Ereignis / kein Ereignis vorliegen.
Warum ist das wichtig?
Der Test vergleicht Anteile auf Basis nominaler Daten, die genau zwei verschiedene Werte annehmen können. Daher dürfen in den beiden Spalten nur zwei verschiedene Werte stehen.
-
Werkzeuge
(Wann sind andere besser geeignet?)
Wenn nicht Anteile, sondern Mittelwerte stetiger Messdaten verglichen werden sollen, dann ist ein t-Test besser geeignet.
Wenn Prozentwerte verglichen werden sollen, kann ein t-Test geeignet sein, sofern die Stichproben unabhängig sind und die Werte annähernd normalverteilt bzw. die Stichprobe ausreichend groß ist.
Wenn zwei abhängige Stichproben, also dieselben Teile oder Personen, verglichen werden sollen, sind andere Verfahren besser geeignet.
-
Beispiele
Produktion
Ausschussquote - Abfülllinie A vs. Abfülllinie B
In der Produktion von Tomatensoße werden zwei Abfülllinien eingesetzt. Es soll untersucht werden, ob sich der Anteil undichter Gläser zwischen Maschine A und Maschine B unterscheidet.
Für beide Maschinen liegen die Daten in zusammengefasster Form vor.
- Maschine A: 14 undichte Gläser bei 320 geprüften Gläsern
- Maschine B: 29 undichte Gläser bei 340 geprüften Gläsern
Der Vergleich der Anteile erfolgt mithilfe eines Tests von Anteilen (2 Stichproben).
Interpretation:
Der Anteilstest zeigt einen statistisch signifikanten Unterschied in der Ausschussquote zwischen den beiden Maschinen, da der p-Wert unter 0,05 liegt. In diesem Fall kann der p-Wert der Normalapproximation herangezogen werden, weil weder die Anzahl der Ereignisse noch die der Gegenereignisse kleiner als 5 ist. Sowohl die Normalapproximation als auch der exakte Fisher-Test führen zum gleichen Ergebnis. Da die Voraussetzungen für die Normalapproximation erfüllt sind, kann sie hier verwendet werden. Im Vergleich zum Fisher-Test fällt sie häufig weniger konservativ aus und weist daher unter Umständen eher auf signifikante Unterschiede hin.
Development
Erfolgsquote neuer Deckelgeometrie
In der Entwicklung von Tomatensoße wird eine neue Deckelgeometrie getestet. Es soll untersucht werden, ob sich der Anteil bestandener Dichtheitsprüfungen zwischen der bisherigen und der neuen Variante unterscheidet.
Interpretation:
Der Test von Anteilen zeigt keinen statistisch signifikanten Unterschied in der Erfolgsquote der Dichtheitsprüfung zwischen den beiden Varianten, da der p-Wert über 0,05 liegt. Die Nullhypothese wird beibehalten.
IT-Support
Erstlösungsquote von Service-Tickets
Im IT-Service eines Tomatensoßenherstellers soll untersucht werden, ob sich der Anteil direkt gelöster Service-Tickets zwischen Standort Nord und Standort Süd unterscheidet.
Interpretation:
Der Test von Anteilen zeigt keinen statistisch signifikanten Unterschied in der Erstlösungsquote zwischen den beiden Standorten, da der p-Wert über 0,05 liegt. Die Nullhypothese wird beibehalten.
Vertrieb
Verlustquote nach Vertriebsansatz
Im Vertrieb eines Tomatensoßenherstellers soll untersucht werden, ob sich der Anteil verlorener Angebote zwischen Vertriebsansatz A und Vertriebsansatz B unterscheidet.
Interpretation:
Es ergeben sich zwei unterschiedliche p-Werte.
Der p-Wert der Normalapproximation weist auf einen statistisch signifikanten Unterschied hin, sodass die Nullhypothese verworfen wird.
Der p-Wert des exakten Fisher-Tests liegt dagegen über dem Signifikanzniveau, sodass die Nullhypothese dort nicht verworfen wird.
Sind die Voraussetzungen für die Normalapproximation erfüllt, wird in der Regel dieser p-Wert zur Beurteilung herangezogen. Voraussetzung ist, dass in beiden Stichproben sowohl die Anzahl der Ereignisse als auch der Gegenereignisse jeweils mindestens 5 beträgt.
Diese Voraussetzung ist hier erfüllt. Daher kann der p-Wert der Normalapproximation verwendet werden.
Mit p = 0,029 wird die Nullhypothese verworfen.
Logistik
Pünktlich bereitgestellte Paletten nach Standort
In der Logistik eines Tomatensoßenherstellers werden Auslieferungen an zwei Standorten vorbereitet. Zur Prozessverbesserung soll geprüft werden, ob Standort Nord einen höheren Anteil pünktlich bereitgestellter Paletten erreicht als Standort Süd.
Es soll untersucht werden, ob sich der Anteil pünktlich bereitgestellter Paletten nach der gewählten Richtungshypothese unterscheidet.
Die Analyse erfolgt mithilfe eines Tests von Anteilen für zwei Stichproben als einseitiger Test, hier wurde „größer“ ausgewählt.
H₀: p_Nord – p_Sued = 0 H₁: p_Nord – p_Sued > 0
Interpretation:
Der Test von Anteilen zeigt keinen statistisch signifikanten Unterschied in der Erstlösungsquote zwischen den beiden Standorten, da der p-Wert über 0,05 liegt. Die Nullhypothese wird beibehalten.
Einkauf
Lieferantenvergleich bei Schraubdeckeln
Im Einkauf werden Schraubdeckel für Tomatensoßengläser von zwei Lieferanten bezogen. Es soll untersucht werden, ob sich der Anteil beschädigter Lieferungen zwischen Lieferant A und Lieferant B unterscheidet.
Hinweis:
Für den Test von Anteilen werden Ereignisse und Versuche gezählt, zum Beispiel „beschädigt“ ja/nein pro Lieferung oder Charge.
Bei sehr kleinen Anzahlen von Ereignissen oder Nicht-Ereignissen kann die Normalapproximation ungenau sein. In diesen Fällen ist die exakte Methode besonders wichtig.
Bei größeren Stichproben ist die Normalapproximation in der Praxis in der Regel gut anwendbar.
Interpretation:
Es liegen zwei unterschiedliche p-Werte vor. Der p-Wert der Normalapproximation spricht dafür, die Nullhypothese zu verwerfen. Der p-Wert des exakten Fisher-Tests zeigt dagegen, dass die Nullhypothese nicht verworfen werden kann. Für die Anwendung der Normalapproximation muss in beiden Stichproben sowohl die Anzahl der Ereignisse als auch die Anzahl der Gegenereignisse ausreichend groß sein. Diese Voraussetzung ist hier nicht erfüllt, da in Stichprobe 1 die Anzahl der Gegenereignisse kleiner als 5 ist. Daher wird die Entscheidung auf Grundlage des exakten Fisher-Tests getroffen. Dieser zeigt keinen statistisch signifikanten Unterschied, sodass die Nullhypothese nicht verworfen wird.
Planung
Prognosetrefferquote nach Planungshorizont
In der Planung eines Tomatensoßenherstellers soll untersucht werden, ob sich der Anteil ausreichend genauer Absatzprognosen zwischen kurzfristigem und langfristigem Planungshorizont unterscheidet.
Interpretation:
Sowohl der p-Wert des exakten Fisher-Tests als auch der p-Wert der Normalapproximation liegen auf oder unter dem Signifikanzniveau von 5 %. Beide Tests weisen damit auf einen statistisch signifikanten Unterschied hin. Die Nullhypothese wird verworfen.
-
Begriffe
Binäre Daten: Daten mit genau zwei Ausprägungen, z. B. Ja/Nein, Deckel dicht/undicht oder Erfolg/Misserfolg.
Normalapproximation: Näherungsverfahren zur Berechnung des Tests und des Konfidenzintervalls für Anteile; gut geeignet bei ausreichend großen Stichproben.
p̂ = Stichprobenanteil: Anteil der Ereignisse in einer Stichprobe; berechnet als Ereignisse / Anzahl der Versuche.
Ereignis: Der interessierende Erfolgsfall in der Stichprobe, z. B. „Deckel undicht“ oder „Etikett korrekt angebracht“.
n = Stichprobengröße: Anzahl der Beobachtungen bzw. Versuche innerhalb einer Stichprobe.
α = Signifikanzniveau: Vorgegebene Irrtumswahrscheinlichkeit, mit der die Nullhypothese fälschlicherweise verworfen wird.
p-Wert: Wahrscheinlichkeit, unter Annahme der Nullhypothese ein mindestens so extremes Ergebnis zu erhalten wie das beobachtete.
z-Wert: Prüfgröße des Anteilstests. Er beschreibt, wie stark die beobachtete Differenz der Anteile im Verhältnis zur erwarteten Streuung ist.
Fishers exakte Methode: Exakte Testmethode für den Vergleich zweier Anteile; besonders wichtig bei kleinen Stichproben oder kleinen Ereigniszahlen.
Δ₀ = Hypothesendifferenz: Referenzwert, gegen den die Differenz der Anteile getestet wird. In der Regel ist Δ₀ = 0.
Konfidenzniveau: Wahrscheinlichkeit, mit der das berechnete Konfidenzintervall bei wiederholter Stichprobenziehung den wahren Parameterwert überdeckt (z. B. 95 %).
Konfidenzintervall: Wertebereich, der mit dem gewählten Konfidenzniveau die wahre Differenz der Anteile plausibel enthält.
H₀ = Nullhypothese: Ausgangshypothese, die von keinem Unterschied bzw. von der Hypothesendifferenz ausgeht. Sie wird im Hypothesentest geprüft.
H₁ = Alternativhypothese: Gegenhypothese zur Nullhypothese. Sie beschreibt die inhaltliche Fragestellung, z. B. ob sich Anteile unterscheiden oder eine Richtung vorliegt (größer/kleiner).
Richtung des Tests: Gibt an, ob ein Unterschied ohne Vorgabe der Richtung (zweiseitig) oder eine konkrete Richtung (größer/kleiner) geprüft wird.
Zweiseitig: Es wird geprüft, ob sich die Anteile unterscheiden, unabhängig davon, in welche Richtung.
Größer: Es wird geprüft, ob der Anteil der ersten Stichprobe größer ist als der der zweiten Stichprobe.
Kleiner: Es wird geprüft, ob der Anteil der ersten Stichprobe kleiner ist als der der zweiten Stichprobe.
-
Schlagwörter