Vollständigkeit (Statistik)
Als Vollständigkeit bezeichnet man in der Schätztheorie, einem Teilgebiet der mathematischen Statistik, eine Eigenschaft von Verteilungsklassen, σ-Algebren oder messbaren Funktionen. Im Allgemeinen sind vollständige Verteilungsklassen „groß“, wohingegen vollständige σ-Algebren „klein“ sind.
Die Vollständigkeit spielt meist in Verbindung mit der Suffizienz eine Rolle. So liefert sie Kriterien für die Minimalsuffizienz oder die Existenz gleichmäßig bester erwartungstreuer Schätzer mittels des Satzes von Lehmann-Scheffé.
Definition
Für Verteilungsklassen
Gegeben sei ein Messraum <math> (X, \mathcal A) </math> und eine Menge <math> \mathcal P </math> von Wahrscheinlichkeitsmaßen auf diesem Messraum. Dann heißt <math> \mathcal P </math> vollständig, wenn die Menge der <math> \mathcal P </math>-Nullschätzer <math> \mathcal P</math>-trivial ist. Sprich für alle
- <math> f \in \mathcal L(X, \mathcal A, \mathcal P) \text{ mit } \operatorname{E}_P(f)=0 \quad \mathrm{f\ddot ur \;alle\;}P \in \mathcal P</math>
gilt
- <math> f=0 \quad \mathcal P\text{-fast sicher} </math>.
Dabei bezeichnet <math> \mathcal L(X, \mathcal A, \mathcal P) </math> den Raum aller <math> \mathcal P </math>-integrierbaren Funktionen (siehe Lp-Raum).
Für σ-Algebren
Eine Unter-σ-Algebra <math> \mathcal T </math> von <math> \mathcal A </math> heißt vollständig für <math> \mathcal P </math>, wenn <math> \mathcal P|_{\mathcal T} </math> vollständig auf dem Messraum <math> (X, \mathcal T) </math> ist. Dabei bedeutet <math> \mathcal P|_{\mathcal T} </math>, dass man den Definitionsbereich aller Wahrscheinlichkeitsmaße in <math> \mathcal P </math> auf die kleinere σ-Algebra <math> \mathcal T </math> einschränkt.
Für Statistiken
Eine Statistik
- <math> T:(X, \mathcal A) \to (Y, \mathcal A^*) </math>
heißt vollständig, wenn die von ihr erzeugte σ-Algebra <math> \sigma(T) </math> vollständig ist bzw. <math> \mathcal P|_{\sigma(T)} </math> vollständig ist.
Häufig wird die Verteilungsklasse <math> \mathcal P </math> mit einem Index <math> \vartheta </math> versehen, man schreibt dann <math> \mathcal P =(P_\vartheta)_{\vartheta \in \Theta} </math>. Formuliert man in dieser Schreibweise die Vollständigkeit aus, so erhält man die gängige Definition:
Eine Statistik <math> T </math> heißt vollständig, wenn für alle integrierbaren <math> g </math> mit
- <math> \operatorname E_\vartheta(g(T)) = 0\quad \mathrm{f\ddot ur \;alle\;} \vartheta \in \Theta </math>
immer folgt, dass
- <math> P_\vartheta(g(T)=0)=1 \quad \mathrm{f\ddot ur \;alle\;}\vartheta \in \Theta </math>.
Erläuterung
Intuitiv zugänglicher ist die folgende Definition der Vollständigkeit einer Verteilungsklasse: Eine Verteilungsklasse ist vollständig genau dann, wenn sie eine trennende Familie für <math> \mathcal L(X, \mathcal A, \mathcal P) </math> ist. Das heißt, für beliebige <math> f,g \in \mathcal L(X, \mathcal A, \mathcal P) </math> mit
- <math> \int f \mathrm d P = \int g \mathrm d P \quad \text{für alle } P \in \mathcal P </math>
folgt
- <math> f=g \quad \mathcal P\text{-fast sicher.} </math>
Die Verteilungsklasse <math> \mathcal P </math> ist also groß genug, um alle Funktionen aus <math> \mathcal L(X, \mathcal A, \mathcal P) </math> unterscheiden zu können.
Gegenbeispiele
Seien <math>X_1, X_2</math> unabhängig und identisch verteilte Zufallsvariablen mit Erwartungswert <math>\vartheta</math> und beschränkter Varianz.
Dann ist <math>\operatorname{E}[ X_1 - X_2 ] = \operatorname{E}[ g(X_1,X_2) ] = 0</math>. Die Funktion <math>g</math> ist also ein erwartungstreuer Schätzer von 0 und der Integrand ist nicht die Nullfunktion.
Präzisierungen
Beschränkte Vollständigkeit
Sei <math> B(X, \mathcal A) </math> die Menge der beschränkten Funktionen auf <math> (X, \mathcal A) </math>. Eine Verteilungsklasse <math> \mathcal P </math> heißt beschränkt vollständig, wenn sie vollständig für <math> B(X, \mathcal A) \cap L(X, \mathcal A, \mathcal P) </math> ist. Die Definitionen einer beschränkt vollständigen σ-Algebra und einer beschränkt vollständigen Statistik folgen wie oben.
L-Vollständigkeit
Für eine gegebene Menge von Funktionen <math> \mathcal L </math> heißt eine Verteilungsklasse <math> \mathcal L </math>-vollständig, wenn sie vollständig für <math> \mathcal L \cap L(X, \mathcal A, \mathcal P) </math> ist. Die Definitionen einer <math> \mathcal L </math>-vollständigen σ-Algebra und einer <math> \mathcal L </math>-vollständigen Statistik folgen wie oben.
Beschränkte L-Vollständigkeit
Die beiden obigen Begriffe lassen sich auch kombinieren: Eine Verteilungsklasse heißt beschränkt <math> \mathcal L </math>-vollständig, wenn sie vollständig für <math> \mathcal L \cap B(X, \mathcal A) \cap L(X, \mathcal A, \mathcal P) </math> ist. Die Definitionen einer beschränkt <math> \mathcal L </math>-vollständigen σ-Algebra und einer beschränkt <math>\mathcal L </math>-vollständigen Statistik folgen wie oben.
Anwendung
Statistische Vollständigkeit ist eine Voraussetzung für den Satz von Lehmann-Scheffé, in diesem Zusammenhang wurde der Begriff von E. L. Lehmann und H. Scheffé auch in die Statistik eingeführt. Die Sätze von Basu stellen einen Zusammenhang zwischen der Vollständigkeit, der Suffizienz und der Verteilungsfreiheit her.
Literatur
- Ludger Rüschendorf: Mathematische Statistik. Springer Verlag, Berlin Heidelberg 2014, ISBN 978-3-642-41996-6, doi:10.1007/978-3-642-41997-3.
- Claudia Czado, Thorsten Schmidt: Mathematische Statistik. Springer-Verlag, Berlin Heidelberg 2011, ISBN 978-3-642-17260-1, doi:10.1007/978-3-642-17261-8.
- E.L. Lehmann, H. Scheffé: Completeness, similar regions, and unbiased estimation. I. In: Sankhyā. 10, Nr. 4, 1950, S. 305–340.
- E.L. Lehmann, H. Scheffé: Completeness, similar regions, and unbiased estimation. II. In: Sankhyā. 15, Nr. 3, 1955, S. 219–236.
- Helmut Pruscha: Vorlesungen über Mathematische Statistik. B. G. Teubner, Stuttgart 2000, ISBN 3-519-02393-8, Abschnitt II.3.