Bonferroni-Korrektur

Die Bonferroni-Korrektur ist ein Verfahren der mathematischen Statistik zur Adjustierung der Signifikanzniveaus der Einzeltests bei multiplen Testen, um der Alphafehler-Kumulierung entgegenzuwirken und für die Durchschnittshypothese ein vorgegebenes Signifikanzniveau einzuhalten. Die Adjustierung vermindert die Signifikanzniveaus der Einzeltests und damit tendenziell die Anzahl der Ablehnungen richtiger Nullhypothesen (falsch-positiver Befunde in biometrischer Terminologie), so dass die verbleibenden Ablehnungen von Nullhypothesen mit einer höheren statistischen Signifikanz verbunden sind. Die Bonferroni-Methode (nach Carlo Emilio Bonferroni) umfasst neben der Bonferroni-Korrektur ein ähnliches Vorgehen zur Anpassung der Konfidenzniveaus bei der Konstruktion simultaner Konfidenzintervalle für einen mehrdimensionalen Parametervektor.

Adjustierte Signifikanzniveaus

Zu <math> k \geq 2 </math> statistischen Tests mit den Nullhypothesen <math>H_1,\dots,H_k</math> kann die Durchschnittshypothese <math> H_0 = \cap_{j=1}^k H_j </math> gebildet werden. Die Hypothesen <math> H_1,\dots, H_k </math> heißen in diesem Zusammenhang Elementarhypothesen und <math> H_0 </math> heißt Globalhypothese. Ein Test für die Nullhypothese <math> H_0 </math> kann auf den Tests für die einzelnen Elementarhypothesen aufgebaut werden, da die Nullhypothese <math> H_0 </math> genau dann falsch ist, wenn mindestens eine der Elementarhypothesen falsch ist. Eine mögliche Testprozedur besteht also darin, <math> H_0 </math> genau dann abzulehnen, wenn mindestens eine der Hypothesen <math> H_1,\dots, H_k </math> abgelehnt wird. Ein vorgegebenes globales Signifikanzniveau <math> \alpha_\text{global} \in (0,1) </math> für den Test von <math> H_0 </math> kann im Allgemeinen nicht eingehalten werden, wenn dieses als Signifikanzniveau für jeden der Einzeltests verwendet wird, da es dann zur so genannten Alphafehler-Kumulierung kommen kann.

Um das gewünschte globale Signifikanzniveau <math>\alpha_\text{global} \in (0,1)</math> für den Test der Globalhypothese <math> H_0</math> einzuhalten, besteht die Bonferroni-Korrektur darin, für die einzelnen Tests das lokale Signifikanzniveau

<math> \alpha_\text{lokal} = \frac{\alpha_\text{global}}{k} </math>

vorzugeben. Die so angepassten Signifikanzniveaus

<math> \alpha_j = \alpha_\text{lokal}\quad\text{für }j = 1,\dots,k </math>

für die Einzeltests werden auch adjustierte Signifikanzniveaus genannt. Die Verwendung der adjustierten Signifikanzniveaus führt dazu, dass für den Test der Globalhypothese das Signifikanzniveau <math> \alpha_\text{global} </math> gültig ist.

Adjustierte p-Werte

Bei einer klassischen Testdurchführung erfolgt die Ablehnung einer Nullhypothese, falls eine Teststatistik im Ablehnbereich (kritischen Bereich) liegt, der vom vorgegebenen Signifikanzniveau abhängt. Bei einer <math> p </math>-Wert-basierten Testdurchführung, die typisch für die Anwendung statistischer Software ist, wird ein berechneter <math>p</math>-Wert mit dem vorgegebenen Signifikanzniveau verglichen und die Nullhypothese wird abgelehnt, falls der <math> p </math>-Wert kleiner als das vorgegebene Signifikanzniveau ist.

Bei einer <math> p </math>-Wert-basierten Testdurchführung wird die Bonferroni-Korrektur durchgeführt, indem die <math> p </math>-Werte der Einzeltests mit den adjustierten Signifikanzniveaus verglichen werden, dabei wird die <math> j </math>-te Nullhypothese abgelehnt, falls <math> p_j < \alpha_\text{lokal} </math> gilt.

Alternativ können adjustierte <math>p</math>-Werte

für die Einzeltests gebildet werden, die um den Faktor <math> k </math> größer sind als die ursprünglichen <math> p </math>-Werte, und diese mit dem globalen Signifikanzniveau verglichen werden. Die <math> j </math>-te Nullhypothese wird abgelehnt, falls <math> p_j^* < \alpha_\text{global} </math> gilt.

Beide Vorgehensweisen führen zu denselben Testentscheidungen, da die beiden Regeln <math>p_j < \alpha_\text{lokal}</math> und <math>p_j^* < \alpha_\text{global}</math> äquivalent sind.

Beispiel

Gegeben seien die p-Werte <math>p_1=0{,}01, p_2=0{,}04, p_3=0{,}1</math> dreier Hypothesentests, die eine Hypothesenfamilie bilden. Unter Vernachlässigung der multiplen Testung und alleiniger Betrachtung lokaler Signifikanzniveaus <math>\alpha_\text{lokal} = 0{,}05</math> erfolgt die Ablehnung der Nullhypothesen 1 und 2, da <math>p_1 <\alpha_\text{lokal} </math> und <math>p_2<\alpha_\text{lokal} </math>, während die dritte Hypothese nicht abgelehnt wird, da <math>p_3 > \alpha_\text{lokal}</math>. Berücksichtigt man jedoch die Bonferroni-Korrektur (mit <math>\alpha_\text{global}=0{,}05 \implies \alpha_\text{lokal}=\alpha_\text{global}/3 \approx 0{,}0166</math>), so erfolgt nur noch die Ablehnung der Nullhypothese 1, da <math>p_1<\alpha_\text{lokal}</math> und <math>p_2>\alpha_\text{lokal}, p_3>\alpha_\text{lokal}</math>.

Theoretischer Hintergrund

Die Globalhypothese <math> H_0</math> wird genau dann abgelehnt, wenn mindestens eine der Elementarhypothesen abgelehnt wird. Das Ereignis <math>\{H_0 \text{ wird abgelehnt}\}</math> kann als Vereinigung der Ereignisse <math> \{H_j \text{ wird abgelehnt}\} </math> für <math> j=1,\dots,k </math> dargestellt werden. Mit der ersten Bonferroni-Ungleichung, die auch Boolesche Ungleichung heißt, ergibt sich die Ungleichung

<math> P(H_0 \text{ wird abgelehnt}) = P\left(\bigcup_{j=1}^k \{ H_j \text{ wird abgelehnt} \}\right) \leq \sum_{j=1}^k P(H_j \text{ wird abgelehnt})\;. </math>

Betrachtet man den Fall, dass <math> H_0 </math> richtig ist, und damit auch die Hypothesen <math> H_1,\dots,H_k </math> richtig sind, und beschränkt für diesen Fall die Wahrscheinlichkeiten <math>P(H_j \text{ wird abgelehnt})</math>, die dann Fehlerwahrscheinlichkeiten 1. Art sind, jeweils durch das lokale Signifikanzniveau <math>\alpha_\text{lokal} = \alpha_\text{global}/k</math> nach oben, so ist <math>P(H_0 \text{ wird abgelehnt})</math> durch

<math> \sum_{j=1}^k P(H_j \text{ wird abgelehnt}) \leq \sum_{j=1}^k \alpha_\text{lokal} = \sum_{j=1}^k \frac{\alpha_\text{global}}{k} = \alpha_\text{global}</math>

nach oben beschränkt.

Die Bonferroni-Korrektur kann sehr konservativ sein. Deshalb wurden genauere Methoden entwickelt, die den <math>\alpha</math>-Fehler weniger konservativ kontrollieren und das Signifikanzniveau der multiplen Testprozedur weiter ausschöpfen (siehe Alphafehler-Kumulierung). Im Vergleich zur allgemein anwendbaren Bonferroni-Methode ergibt sich, allerdings nur unter einschränkenden Voraussetzungen, mit der Šidák-Korrektur ein verbessertes Verfahren.

Literatur

{{#invoke:Vorlage:Literatur|f}}

Weblinks

Manitoba Centre for Health Policy (MCHP) 2003, Concept: Multiple Comparisons.
Perneger, Thomas V, What's wrong with Bonferroni adjustments, BMJ 1998;316:1236-1238 (18. April).
School of Psychology, University of New England, New South Wales, Australia, 2000.
{{#if: | {{{author}}} | Eric W. Weisstein }}: Bonferroni Correction. In: MathWorld (englisch). {{#if: BonferroniCorrection | {{#ifeq: {{#property:P2812}} | BonferroniCorrection | | {{#if: {{#property:P2812}} | {{#ifeq: 0 | 0 | }} | {{#ifeq: 0 | 0 | }} }} }} }}