Zum Inhalt springen

Boxscher M-Test

aus Wikipedia, der freien Enzyklopädie
Dies ist die aktuelle Version dieser Seite, zuletzt bearbeitet am 28. Juli 2023 um 05:53 Uhr durch imported>ManuBu (+link).
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)

Der Boxsche M-Test ist ein Verfahren aus der mathematischen Statistik. Er wurde 1949 von G. E. P. Box entwickelt<ref>Box, G. E. P. (1949). A general distribution theory for a class of likelihood criteria. Biometrika, 36, 317–346, doi:10.1093/biomet/36.3-4.317, Modul:JSTOR * Modul:JSTOR:170: attempt to index field 'wikibase' (a nil value).</ref> und ist eine Erweiterung des Bartlett-Tests auf Gleichheit der Varianzen für den multivariaten Fall. Er wird in den multivariaten Verfahren angewendet, beispielsweise bei der Diskriminanzanalyse zum Test auf Gleichheit von Streuungen in den Gruppen.

Vorausgesetzt wird, dass die <math>m</math>-dimensionalen Daten in den <math>p</math> Gruppen multivariat normalverteilt sind: <math>\mathcal{N}(\mu_k; \Sigma_k)</math> mit Erwartungswertvektoren <math>\mu_k = (\mu_{k1}, ..., \mu_{km})</math> und Kovarianzmatrizen <math>\Sigma_k=(\sigma_{k;rs})_{r,s=1,...,m}</math> verteilt (<math>k=1,...,p</math>).

Die Hypothese soll geprüft werden, dass alle Kovarianzmatrizen gleich sind, also

<math>H_0: \Sigma_1 = \Sigma_2 = ... = \Sigma_p </math> vs. <math>H_1:</math> es gibt min. ein Paar <math>i</math> und <math>j</math> mit <math> \Sigma_i \neq \Sigma_j</math>.

Die Prüfgröße für den Test ist das so genannte M von Box,

<math>M= \gamma \sum _{k=1}^p(n_k - 1) \cdot \log| S_k^{-1} \cdot S| </math>

wobei

<math> \gamma =1- \frac {2m^2 + 3m-1} {6 \cdot (m + 1) \cdot (p-1)} \left(\sum _{k=1}^p \frac {1} {n_k -1} - \frac {1} {n-p} \right) </math>

als Korrektur dient. Die Kovarianzmatrix <math>\Sigma_k</math> wird aus den Beobachtungen, die zur Gruppe <math>k</math> gehören, geschätzt

<math> s_{k;rs} = \frac {1} {n_k-1} \sum_{i=1}^{n_k} (x_{ir}- \bar x_r) (x_{is}- \bar x_s)</math>

und die gepoolte, also mittlere, Kovarianzmatrix durch

<math> S=\frac {1}{n-p} \sum_{k=1}^p (n_k - 1) \cdot S_k .

</math>

Bei jeweils genügend großem <math>n_{k}</math> ist die Prüfgröße annähernd Chi-Quadrat-verteilt mit <math>m(m+1)(p-1)/2</math> Freiheitsgraden. Wenn die <math>S_k</math> sich insgesamt sehr von <math>S</math> unterscheiden, wird der Wert der Prüfgröße hoch. <math>H_0</math> wird also beim Signifikanzniveau <math>\alpha</math> abgelehnt, wenn M größer ist als das <math>1- \alpha</math>-Quantil der Chi-Quadrat-Verteilung mit <math>m(m+1)(p-1)/2</math> Freiheitsgraden.

Der Test reagiert sensitiv auf Verletzungen der Voraussetzung der mehrdimensionalen Normalverteilung.

Einzelnachweise

<references />