Exakter Test nach Fisher

Der Exakte Fisher-Test (Fisher-Yates-Test, exakter Chi-Quadrat-Test)<ref>ISI Glossary – Fisher-Yates test ; Fisher-Irwin test ; Fisher exact test ; exact chi-squared test. In: isi-web.org. International Statistical Institute, abgerufen am 6. April 2024 (Lua-Fehler in Modul:Multilingual, Zeile 153: attempt to index field 'data' (a nil value)). </ref> ist ein exakter Signifikanztest auf Unabhängigkeit in Kontingenztafeln. Im Gegensatz zum Chi-Quadrat-Unabhängigkeits-Test stellt er jedoch keine Voraussetzungen an den Stichprobenumfang und liefert auch bei einer geringen Anzahl von Beobachtungen zuverlässige Resultate. Er geht auf den britischen Statistiker Ronald Aylmer Fisher zurück. Ursprünglich wurde er für zwei dichotome Variablen entwickelt, also für 2x2-Kontingenztafeln, aber er kann auch auf größere Kontingenztafeln erweitert werden.<ref>Mehta, C. R. and Patel, N. R. (1986) Algorithm 643. FEXACT: A Fortran subroutine for Fisher's exact test on unordered r*c contingency tables. ACM Transactions on Mathematical Software, 12, S. 154–161, doi:10.1145/6497.214326.</ref>

Idee

	A	nicht A	<math>\sum</math>
Erwartete Häufigkeiten bei Gültigkeit der Nullhypothese.
B	<math>h_a</math>	<math>h_c</math>	<math>h_B</math>
nicht B	<math>h_b</math>	<math>h_d</math>	<math>h_{\bar{B}}</math>
<math>\sum</math>	<math>h_A</math>	<math>h_{\bar{A}}</math>	<math>n</math>

	A	nicht A	<math>\sum</math>
Beobachtete Häufigkeiten in der Stichprobe.
B	<math>a</math>	<math>c</math>	<math>a+c</math>
nicht B	<math>b</math>	<math>d</math>	<math>b+d</math>
<math>\sum</math>	<math>a+b</math>	<math>c+d</math>	<math>n=a+b+c+d</math>

Fishers exakter Test ist eine Alternative zum Chi-Quadrat-Unabhängigkeits-Test bei einer 2x2-Kontingenztafel. Die rechte obere Kontingenztabelle enthält die beobachteten Häufigkeiten <math>a</math>, <math>b</math>, <math>c</math> und <math>d</math> für die vier Merkmalskombinationen, während die linke obere Kontingenztabelle die erwarteten Häufigkeiten unter der Gültigkeit der Nullhypothese enthält. Der Wert der Teststatistik ergäbe sich beim Chi-Quadrat-Unabhängigkeits-Test als

und die zugehörige Teststatistik <math>T</math> wäre dann approximativ <math>\chi^2</math>-verteilt mit einem Freiheitsgrad, falls die Hypothese der Unabhängigkeit richtig ist. Damit die Approximation gilt, muss jedoch gelten <math>h_a\geq5</math>, <math>h_b\geq5</math>, <math>h_c\geq5</math> und <math>h_d\geq5</math>.

Sind die vier Randhäufigkeiten <math>h_A</math>, <math>h_B</math>, <math>h_{\bar{A}}</math> und <math>h_{\bar{B}}</math> fest, dann reicht es jedoch eine der Zellen zu betrachten. Sobald z. B. der Wert von <math>h_a</math> festliegt, liegen aufgrund der fixierten Randhäufigkeiten auch die Werte für <math>h_b</math>, <math>h_c</math> und schließlich auch <math>h_d</math> fest.

Fisher zeigte, dass die Anzahl der Beobachtungen <math>H_a</math> in der linken oberen Ecke einer hypergeometrischen Verteilung folgt:

<math>H_a \sim Hyp(N_{hyp}=n, M_{hyp}=h_B, n_{hyp}=h_A)</math>.

Die unbekannten Randverteilungen werden aus der Stichprobe mittels deren Randhäufigkeiten geschätzt, so dass folgt:

und die Wahrscheinlichkeit, dass <math>H_a=a</math>, ergibt sich zu

<math>P(H_a=a) = \frac{ {M_{hyp} \choose a} {N_{hyp} - M_{hyp} \choose n_{hyp} - a} }{ {N_{hyp} \choose n_{hyp}} } = \frac{ {a+c \choose a} {b+d \choose b} }{ {n \choose a+b } }</math>

Alternativ kann nach Bortz, Lienert und Boehnke (1990) die Wahrscheinlichkeit geschrieben werden als

Ist der Wert von <math>a</math> in der Stichprobe zu klein oder zu groß, dann muss die Nullhypothese abgelehnt werden.

Vorgehensweise

Datei:Fstest.svg

Wahrscheinlichkeitsverteilung für <math>a</math> für das Schülerbeispiel.

Leistungen der Schüler einer kleinen Klasse	männlich	weiblich	Summe
genügend	3	1	4
ungenügend	2	2	4
Summe	5	3

Die Unabhängigkeit der Schülerleistung vom Geschlecht kann bei dem Beispiel nicht mit dem Chi-Quadrat-Test bzw. dem Vierfeldertest auf seine statistische Signifikanz geprüft werden. Der exakte Test von Fisher hält dagegen auch bei wenigen Beobachtungen das geforderte Niveau ein.

Wählt man z. B. ein Signifikanzniveau <math>\alpha=15\,\%</math>, so ergeben sich die kritischen Werte als 2 bzw. 3, d. h. die Nullhypothese der Unabhängigkeit der Schülerleistung vom Geschlecht kann nicht verworfen werden, wenn <math>a=2</math> oder <math>a=3</math> ist. Ist <math>a<2</math> oder ist <math>a>3</math>, dann kann die Nullhypothese verworfen werden. Im Beispiel ist <math>a=3</math>, d. h. die Nullhypothese der Unabhängigkeit der Schülerleistung vom Geschlecht kann nicht verworfen werden.

Daneben gibt es noch drei weitere Tabellen (siehe unten), für die gilt, dass die Summe der Spalten- und Zeilenhäufigkeiten gleich den beobachteten Werten sind.

<math>a=1</math>	männl.	weibl.
genügend	1	3
ungenügend	4	0

<math>a=2</math>	männl.	weibl.
genügend	2	2
ungenügend	3	1

<math>a=4</math>	männl.	weibl.
genügend	4	0
ungenügend	1	3

Dieses Beispiel zeigt auch, dass der exakte Test nach Fisher ein konservativer Test ist. Denn die Wahrscheinlichkeit, dass man fälschlicherweise die Alternativhypothese annimmt (Fehler 1. Art), ergibt sich zu

<math>P(H_1|H_0) = P(H_a=0)+P(H_a=1)+P(H_a=4)+P(H_a=5)=14{,}28\,\% < \alpha=15\,\%</math>,

also kleiner als das vorgegebene Signifikanzniveau.

Weblinks

Wikibooks: Fisher-Test mit R durchführen – Lern- und Lehrmaterialien

Fisher-Test online berechnen

Einzelnachweise