Boxscher M-Test

Der Boxsche M-Test ist ein Verfahren aus der mathematischen Statistik. Er wurde 1949 von G. E. P. Box entwickelt<ref>Box, G. E. P. (1949). A general distribution theory for a class of likelihood criteria. Biometrika, 36, 317–346, {{#invoke:Vorlage:Handle|f|scheme=doi|class=plainlinks|parProblem=Problem|errCat=Wikipedia:Vorlagenfehler/Parameter:DOI|errClasses=error editoronly|errHide=1|errNS=0 4 10 100}}, {{#invoke:JSTOR|f|1=2332671}}{{#if:

 | {{#ifeq: 0 | 0
     |  }}

}}.</ref> und ist eine Erweiterung des Bartlett-Tests auf Gleichheit der Varianzen für den multivariaten Fall. Er wird in den multivariaten Verfahren angewendet, beispielsweise bei der Diskriminanzanalyse zum Test auf Gleichheit von Streuungen in den Gruppen.

Vorausgesetzt wird, dass die <math>m</math>-dimensionalen Daten in den <math>p</math> Gruppen multivariat normalverteilt sind: <math>\mathcal{N}(\mu_k; \Sigma_k)</math> mit Erwartungswertvektoren <math>\mu_k = (\mu_{k1}, ..., \mu_{km})</math> und Kovarianzmatrizen <math>\Sigma_k=(\sigma_{k;rs})_{r,s=1,...,m}</math> verteilt (<math>k=1,...,p</math>).

Die Hypothese soll geprüft werden, dass alle Kovarianzmatrizen gleich sind, also

<math>H_0: \Sigma_1 = \Sigma_2 = ... = \Sigma_p </math> vs. <math>H_1:</math> es gibt min. ein Paar <math>i</math> und <math>j</math> mit <math> \Sigma_i \neq \Sigma_j</math>.

Die Prüfgröße für den Test ist das so genannte M von Box,

<math>M= \gamma \sum _{k=1}^p(n_k - 1) \cdot \log| S_k^{-1} \cdot S| </math>

wobei

<math> \gamma =1- \frac {2m^2 + 3m-1} {6 \cdot (m + 1) \cdot (p-1)} \left(\sum _{k=1}^p \frac {1} {n_k -1} - \frac {1} {n-p} \right) </math>

als Korrektur dient. Die Kovarianzmatrix <math>\Sigma_k</math> wird aus den Beobachtungen, die zur Gruppe <math>k</math> gehören, geschätzt

und die gepoolte, also mittlere, Kovarianzmatrix durch

<math> S=\frac {1}{n-p} \sum_{k=1}^p (n_k - 1) \cdot S_k .

</math>

Bei jeweils genügend großem <math>n_{k}</math> ist die Prüfgröße annähernd Chi-Quadrat-verteilt mit <math>m(m+1)(p-1)/2</math> Freiheitsgraden. Wenn die <math>S_k</math> sich insgesamt sehr von <math>S</math> unterscheiden, wird der Wert der Prüfgröße hoch. <math>H_0</math> wird also beim Signifikanzniveau <math>\alpha</math> abgelehnt, wenn M größer ist als das <math>1- \alpha</math>-Quantil der Chi-Quadrat-Verteilung mit <math>m(m+1)(p-1)/2</math> Freiheitsgraden.

Der Test reagiert sensitiv auf Verletzungen der Voraussetzung der mehrdimensionalen Normalverteilung.

Einzelnachweise