Testen von Hypothesen
Eine Hypothese ist eine Behauptung bzw. eine (wissenschaftlich) begründete Vermutung. Um herauszufinden, ob man die Hypothese annehmen kann oder besser ablehnen sollte, testet man die Hypothese anhand einer Stichprobe vom Umfang \(n\). Die Wahrscheinlichkeit einer Fehlentscheidung lässt sich damit berechnen und sogar im Vorfeld begrenzen.
Hinführungsbeispiel
Nach der Einführung des Euros war in einer Zeitung zu lesen, dass die neuen Euro-Münzen keine Laplace-Münzen seien. Beim Werfen bleibt die Zahl angeblich häufiger oben liegen, als dies bei einer Laplace-Münze der Fall sei.
Wie lässt sich nun überprüfen, ob z.B. die 1-Euro-Münze eine Laplace-Münze ist oder nicht?
Idee: Man wirft die Münze einige Male (z.B. \(100\)-mal), zählt, wie oft Zahl oben lag, und entscheidet sich dann.
Die wesentliche Frage ist natürlich, wie man die Entscheidung fällt. Liegt bei \(100\) Würfen \(50\)-mal Zahl oben, wird man sich für eine Laplace-Münze entscheiden. Was macht man bei \(51\)- oder \(52\)-mal Zahl? Wie entscheidet man bei \(60\)- oder \(40\)-mal? Und wie groß ist der Fehler, den man macht, wenn man annimmt, es ist eine Laplace – Münze, tatsächlich ist es aber keine und umgekehrt.
Diese Fragen lassen sich mit Hilfe des Hypothesentests klären:
Zuerst muss man überlegen, welche Hypothese und welche Größe man testet.
„Es handelt sich um eine Laplace-Münze“, also \(p = 0,5\) ist die sogenannte Nullhypothese \(H_{ 0 }\).
Die Testgröße \(T\) ist: „Anzahl von Zahl“.
Zu jeder Hypothese gibt es eine Gegenhypothese \(H_{ 1 }\). Diese ist hier „Es fällt häufiger Zahl als Kopf“, also \(H_{ 1 }: p > 0,5\).
Nehmen wir an, die Münze wird \(100\)-mal geworfen. Die Zahl \(100\) ist der sog. Stichprobenlänge \(n\).
Nun muss man noch eine Entscheidungsregel vorgeben: Fällt \(55\)-mal oder weniger Zahl, entscheidet man, dass es sich um eine Laplace-Münze handelt. Man nimmt also die Nullhypothese an. Dementsprechend nennt man das Intervall \(A = \{0; 1; … 55\}\) Annahmebereich der Nullhypothese.
Fällt 56 mal oder öfter Kopf, so lehnt man die Nullhypothese ab, man entscheidet, dass es sich nicht um eine Laplace-Münze handelt. Das Intervall \(\overline{A} = \{56; 57; … 100\}\) heißt Ablehnungsbereich oder Nicht-Annahmebereich der Nulhypothese.
Zusammengefasst:
Testgröße \(T\): „Anzahl von Zahl“, Stichprobenlänge: \(n = 100\),
Nullhypothese \(H_{ 0}: p = 0,5\),
Gegenhypothese \(H_{ 1 }: p > 0,5\),
Annahmebereich von \(H_{ 0}\): \(A = \{0; 1; … 55\}\)
Ablehnungsbereich von \(H_{ 0}\): \(\overline{A} = \{56; 57;… 100\}\).
Wie groß ist jetzt die Wahrscheinlichkeit, dass man tatsächlich im Annahmebereich landet, wenn eine Laplace-Münze vorliegt?
Es handelt sich um eine Bernoulli – Kette der Länge \(n = 100\) mit Trefferwahrscheinlichkeit \(p = 0,5\). Gesucht ist \(P(T \leq 55)\). Diese Wahrscheinlichkeit kann man aus dem Tafelwerk ablesen: \(P(T \leq 55) = F^{ 100 }_{0,5}(55) = 0,86437\). Dementsprechend kann man natürlich den Fehler machen, dass man die Nullhypothese ablehnt, obwohl sie zutrifft. Das heißt man landet im Ablehnungsbereich, obwohl es sich um eine Laplace-Münze handelt (sog. Fehler 1. Art, \(\alpha\) – Fehler). Die zugehörige Wahrscheinlichkeit ist \(P(\overline{A}) = P(T \geq 56) = 1 – P(T \leq 55) = 0,13563\).
Die Anzahl von Zahl kann natürlich auch im Annahmebereich liegen, obwohl die vorliegende Münze keine Laplace-Münze ist. Auch hier macht man mit der Annahme der Nullhypothese einen Fehler, den sogenannten Fehler 2. Art, \(\beta\) – Fehler. Diesen kann man nur berechnen, wenn man weiß, wie groß die Gegenwahrscheinlichkeit \(p_{1}\) tatsächlich ist. Ist z.B. bei obigen Test \(p_{1} = 0,6\), so beträgt \(\beta^{/} = P(T \leq 55) = F^{ 100 }_{0,5}(55) = 0,17890\). Auch hier kann man natürlich eine richtige Entscheidung treffen. Die Zahl der Treffer liegt im Ablehnungsbereich und man lehnt die Nullhypothese ab. Die Wahrscheinlichkeit dafür lässt sich ebenfalls wieder nur dann berechnen, wenn man \(p_{1}\) kennt. In obigem Beispiel wäre diese Wahrscheinlichkeiten \(P(T \geq 56) = 1 – P(T \leq 55) = 1 – F^{ 100 }_{0,6}(55) = 0,82110\).