Bei einem Hypothesentest stehen sich zwei einander widersprechende Behauptungen / Vermutungen (sog. Hypothesen) gegenüber. Welche der beiden Hypothesen wahr ist und welche falsch, weiß man nicht und man kann es auch nicht wissen, da in den Hypothesen Aussagen über vom Zufall beeinflusste Vorgänge gemacht werden.
Der Hypothesentest dient nun dazu, anhand des Ergebnisses einer Stichprobe zu einer Entscheidung darüber zu kommen, welche der beiden Hypothesen man eher zu glauben bereit ist oder anders ausgedrückt: Welche der beiden Hypothesen angenommen (bzw. beibehalten) und welche verworfen wird.
Eine ige Sicherheit, dass die angenommene Hypothese auch tatsächlich wahr ist, kann der Hypothesentest naturgemäß niemals bieten.
Zur Berechnung der Wahrscheinlichkeiten eines solchen Tests benutzt man die Binomialverteilung.
Vorgehensweise
Die beiden Hypothesen
Als Erstes muss man aus der Aufgabenstellung die beiden einander gegenüberstehenden Hypothesen herauslesen.
In der Regel werden in den beiden Hypothesen Aussagen über die Wahrscheinlichkeit für das Eintreten eines bestimmten Ereignisses gemacht.
- Um welches Ereignis handelt es sich? Dieses Ereignis wird dann als „Treffer“ (im Sinne des Treffers einer Bernoulli-Kette) aufgefasst und seine Wahrscheinlichkeit üblicherweise mit abgekürzt.
- Welche Aussagen über p stehen einander gegenüber? Oft wird in der Aufgabenstellung nur eine der beiden Hypothesen konkret formuliert. Die andere muss man dann (zumeist einfach durch logische Verneinung der angegebenen Hypothese) selbst erschließen.
- Bei einem Signifikanztest: Welche der beiden Hypothesen ist die Nullhypothese und welche die Gegenhypothese?
Details anzeigen
Handwerksmeister Xaver besitzt eine Maschine, die bestimmte Bauteile fertigt. Erfahrungsgemäß sind ca. der angefertigten Bauteile Ausschuss, d. h. sie sind so misslungen, dass Xaver sie nicht verwenden kann.
Xaver vermutet nun, dass sich der Ausschussanteil in letzter Zeit erhöht hat. Da er sich jedoch nicht sicher ist, will er einen Test durchführen…
Welche beiden Hypothesen stehen sich gegenüber und welches ist die Nullhypothese?
Zugrunde liegendes Bernoulli-Experiment: | Anfertigen eines Bauteils durch die Maschine. |
|---|---|
"Treffer": | Das Bauteil ist Ausschuss. |
Hypothesen in Worten: | "Die Trefferwahrscheinlichkeit hat sich erhöht" (Vermutung von Xaver) und "Die Trefferwahrscheinlichkeit hat sich nicht erhöht". |
Da Xaver seine Vermutung prüfen will, muss er zunächst einmal davon ausgehen, dass seine Vermutung nicht stimmt und dann versuchen seine Vermutung doch zu belegen und nicht umgekehrt von der Richtigkeit seiner Annahme bereits ausgehen.
Nullhypothese | |
|---|---|
Gegenhypothese |
Die Stichprobe: Testgröße und Stichprobenlänge
Um zu einer Entscheidung darüber zu gelangen, welche der beiden Hypothesen angenommen und welche verworfen werden soll, plant man nun die Durchführung einer Stichprobe: Das Zufallsexperiment wird n-mal voneinander unabhängig durchgeführt und dabei notiert, wie oft das betreffende Ereignis eintritt.
Die Anzahl n der Wiederholungen des Zufallsexperiments bezeichnet man als die Länge der Stichprobe.
Das, worauf bei der Durchführung der einzelnen Versuche geachtet wird (also die Anzahl der "Treffer"), nennt man die Testgröße. Sie wird manchmal mit , oft auch mit oder abgekürzt.
Bei der Stichprobe handelt es sich dabei um eine Bernoulli-Kette. Die Testgröße ist daher binomialverteilt.
Details anzeigen
Um den Test durchzuführen, achtet Xaver bei den nächsten von der Maschine gefertigten Bauteilen darauf, wie viele davon Ausschuss sind.
Was ist in diesem Fall die Stichprobenlänge und was ist bei dieser Stichprobe die Testgröße?
Stichprobenlänge | 100 Bauteile |
|---|---|
Testgröße | Anzahl der Ausschussstücke unter den 100 Bauteilen der Stichprobe. |
Die Entscheidungsregel: Annahme- und Ablehnungsbereich
Abhängig vom Wert, den die Testgröße in der Stichprobe annimmt, wird man die Richtigkeit der einen bzw. der anderen der beiden Hypothesen annehmen.
Diejenigen Werte zwischen und n, bei denen die Richtigkeit der Hypothese angenommen werden soll, bezeichnet man als den Annahmebereich von . Die anderen Werte, also die, bei denen verworfen (d. h. abgelehnt) wird, bilden den Ablehnungsbereich von .
Die Entscheidungsregel aufstellen heißt, für eine der beiden Hypothesen – üblicherweise für die Nullhypothese - Annahme- und Ablehnungsbereich festzulegen.
Details anzeigen
Xaver entscheidet, die Maschine bei mehr als vier defekten Teilen zur Reparatur zu schicken, bei weniger will er die Sache nicht weiter verfolgen.
Was ist hier der Annahme- und was der Ablehnungsbereich?
Lösung:
ist der Annahmebereich, ist der Ablehnungsbereich
Weitere wichtige Begriffe
Fehler 1. Art und 2. Art
Bei einem Hypothesentest können zwei spezielle Fehler auftreten:
- Ein Fehler 1. Art liegt vor, wenn bei einem Hypothesentest die Nullhypothese zu Unrecht verworfen wird.
- Ein Fehler 2. Art liegt vor, wenn bei einem Hypothesentest die Nullhypothese zu Unrecht beibehalten wird.
Damit ergeben sich vier mögliche Ausgänge für einen Hypothesentest. Diese lassen sich mit einer Tabelle veranschaulichen:
ist wahr | ist falsch | |
|---|---|---|
Die Testgröße T nimmt bei der Stichprobe einen Wert im Annahmebereich von an. | Richtige Entscheidung ist wahr und wird (zu Recht) beibehalten. | Falsche Entscheidung ist falsch und wird zu Unrecht beibehalten. Fehler 2. Art |
Die Testgröße T nimmt bei der Stichprobe einen Wert im Ablehnungsbereich von an. | Falsche Entscheidung ist wahr und wird zu Unrecht verworfen. Fehler 1. Art | Richtige Entscheidung ist falsch und wird (zu Recht) verworfen. |
Der Fehler 2. Art lässt sich im Allgemeinen nicht berechnen, da für die Gegenhypothese keine Trefferwahrscheinlichkeit angegeben ist (Ausnahme Alternativtest).
Details anzeigen
Wie hoch ist die Wahrscheinlichkeit, dass Xaver fälschlicherweise annimmt, die Maschine arbeite schlechter?
Um diesen Fehler 1. Art zu berechnen, muss man die Wahrscheinlichkeit dafür bestimmen, dass die Maschine Ausschuss produziert, in der Stichprobe aber trotzdem fünf oder mehr defekte Teile sind.
Dies kann man beispielsweise im Tafelwerk der Binomialverteilung nachschlagen. Dort sind die Wahrscheinlichkeiten für null bis k Treffer bei verschiedenen Testlängen und Trefferwahrscheinlichkeiten angegeben.
Da hier die Chance für mehr als k Treffer gesucht ist, muss man über das Gegenereignis gehen: In unserem Beispiel wird die Wahrscheinlichkeit für bis Treffer mit Trefferwahrscheinlichkeit bei Versuchen gesucht.
Xaver schickt die Maschine also mit einem Risiko von zur Reparatur, obwohl sie fehlerfrei arbeitet.
Signifikanzniveau
Die Entscheidungsregel sollte nicht willkürlich oder nach Gefühl aufgestellt werden. Denn dann kann es passieren, dass Hypothesen zu leicht angenommen oder abgelehnt werden, was die Aussagekraft des Tests verschlechtert.
Um das zu verhindern, bestimmt man vorher ein Signifikanzniveau. Dieses stellt sicher, dass das Ergebnis des Tests aussagekräftig ist.
Das Signifikanzniveau ist dabei gleich der Wahrscheinlichkeit einen Fehler 1. Art zu begehen. Übliche Werte sind und bei großen Stichproben manchmal auch .
Details anzeigen
Wie ist das Signifikanzniveau im Test von Xaver?
Es ist gleich dem Fehler 1. Art. Dieser wurde im oberen Absatz schon berechnet, er ist gleich .
Wie man für ein vorgegebenes Signifikanzniveau die entsprechende Entscheidungsregel aufstellt, wird im zugehörigen Artikel gezeigt.
Eingebetteter Serlo-Inhalt
Eingebetteter Serlo-Inhalt