Bernoulli-Verteilung

Datei:Bernoulli Distribution de.svg

Wahrscheinlichkeitsfunktion der Bernoulli-Verteilung für <math>p=0{,}2</math> (blau), <math>p=0{,}5</math> (grün) und <math>p=0{,}8</math> (rot)

Zufallsvariablen mit einer Bernoulli-Verteilung (auch als Bernoullische Verteilung<ref name="Lex-527">P. H. Müller (Hrsg.): Lexikon der Stochastik – Wahrscheinlichkeitsrechnung und mathematische Statistik. 5. Auflage. Akademie-Verlag, Berlin 1991, ISBN 978-3-05-500608-1, S. 527. </ref>, Null-Eins-Verteilung<ref name="Lex-527"/>, Alternativ-Verteilung<ref>Norbert Kusolitsch: Maß- und Wahrscheinlichkeitstheorie. Eine Einführung. 2., überarbeitete und erweiterte Auflage. Springer-Verlag, Berlin Heidelberg 2014, ISBN 978-3-642-45386-1, S. 63, doi:10.1007/978-3-642-45387-8. </ref> oder Boole-Verteilung<ref>Klaus D. Schmidt: Maß und Wahrscheinlichkeit. 2., durchgesehene Auflage. Springer-Verlag, Heidelberg Dordrecht London New York 2011, ISBN 978-3-642-21025-9, S. 254, doi:10.1007/978-3-642-21026-6. </ref> bezeichnet) benutzt man zur Beschreibung von zufälligen Ereignissen, bei denen es nur zwei mögliche Versuchsausgänge gibt. Einer der Versuchsausgänge wird meistens mit Erfolg bezeichnet und der komplementäre Versuchsausgang mit Misserfolg. Die zugehörige Wahrscheinlichkeit <math>p</math> für einen Erfolg nennt man Erfolgswahrscheinlichkeit und <math>q=1-p</math> die Wahrscheinlichkeit eines Misserfolgs. Beispiele:

Werfen einer Münze: Kopf (Erfolg), <math>p=1/2</math>, und Zahl (Misserfolg), <math>q=1/2</math>.
Werfen eines Würfels, wobei nur eine „6“ als Erfolg gewertet wird: <math>p=1/6</math>, <math>q=5/6</math>.
Betrachte sehr kleines Raum/Zeit-Intervall: Ereignis tritt ein <math>(p\gtrapprox 0)</math>, tritt nicht ein <math>(q\lessapprox 1)</math>.

Die Bezeichnung Bernoulli-Versuch (Bernoullian trials nach Jakob I Bernoulli) wurde erstmals 1937 in dem Buch Introduction to Mathematical Probability von James Victor Uspensky verwendet.<ref>James Victor Uspensky: Introduction to Mathematical Probability, McGraw-Hill, New York 1937, Seite 45</ref>

Definition

Eine diskrete Zufallsgröße <math>X</math> mit Werten in der Menge <math>\{0,1\}</math> unterliegt der Bernoulli-Verteilung oder Null-Eins-Verteilung mit dem Parameter <math>p \in (0,1)</math>, wenn sie der folgenden Wahrscheinlichkeitsfunktion folgt

<math> f(x) = P(X=x) = \begin{cases} 1-p & \text{falls} \quad x=0, \\

p & \text{falls} \quad x=1, \\ 0 & \text{sonst.}\end{cases}</math>

Die Verteilungsfunktion ist dann

<math> F(x)= P(X \leq x) = \begin{cases}

0 & \text{ falls } \quad x <0 \\ 1-p & \text{ falls } \quad 0 \leq x < 1 \\ 1 & \text{ falls } \quad x \geq 1 \end{cases}</math>. Man schreibt dann <math> X \sim \mathcal{B}(p) </math>, <math> X \sim \mathrm{Ber}(p) </math> oder <math> X \sim Ber_p </math>. Der Parameter <math>p</math> heißt in diesem Zusammenhang auch Bernoulli-Parameter.

Eine Zufallsvariable, deren Verteilung eine Bernoulli-Verteilung ist, heißt Bernoulli-verteilt. Eine Bernoulli-verteilte Zufallsvariable wird auch als Bernoulli-Variable bezeichnet.

Ein Zufallsexperiment, dessen Ausgang durch eine Bernoulli-Variable beschrieben ist, heißt Bernoulli-Experiment oder Bernoulli-Versuch. Eine Folge von Bernoulli-Versuchen, deren Zufallsvariablen stochastisch unabhängig und identisch – d. h. mit demselben Bernoulli-Parameter – verteilt sind, heißt Bernoulli-Prozess oder bernoullisches Versuchsschema.

Für bestimmte statistische Anwendungen ist es sinnvoll, den erweiterten Parameterraum <math>[0,1]</math> ergänzt durch die beiden Grenzfälle <math>p=0</math> und <math>p=1</math> zugrunde zu legen, bei denen die Bernoulli-Verteilung zu einer Einpunktverteilung auf 0 oder 1 degeneriert. In diesen Fällen gilt <math>P(X=0)=1</math> bzw. <math>P(X=1)=1</math>.

Eigenschaften

Im Folgenden ist <math>X \sim \mathrm{Ber}(p)</math> mit <math>0 < p <1 </math> vorausgesetzt.

Erwartungswert

Die Bernoulli-Verteilung mit Parameter <math>p</math> hat den Erwartungswert:

<math>\operatorname{E}\left(X\right)=p</math>

Dies hat den Grund, dass für eine Bernoulli-verteilte Zufallsvariable <math>X</math> mit <math>P(X=1)=p</math> und <math>P(X=0)=q</math> gilt:

<math>\operatorname{E}(X) = P(X=1)\cdot 1 + P(X=0)\cdot 0 = p \cdot 1 + q\cdot 0 = p</math>

Varianz und weitere Streumaße

Die Bernoulli-Verteilung besitzt die Varianz

<math>\operatorname{Var}(X) = p\cdot(1-p)= pq</math>

denn es ist <math>\operatorname{E}(X^2)=p\cdot 1^2+ q\cdot 0^2=p</math> und damit

<math>\operatorname{E}\left(X^2\right)-\operatorname{E}(X)^2=p-p^2 = p\cdot(1-p) = pq</math>.

Damit ist die Standardabweichung

<math> \sigma_X= \sqrt{pq} </math>

und der Variationskoeffizient

<math>

\operatorname{VarK}(X) = \sqrt{\frac{q}{p}}</math>.

Symmetrie

Für den Parameter <math> p= \tfrac 12 </math> ist die Bernoulli-Verteilung symmetrisch um den Punkt <math> a= \tfrac 12 </math>.

Schiefe

Die Schiefe der Bernoulli-Verteilung ist

<math> \operatorname{v}(X)=\frac{1-2p}{\sqrt{pq}} </math>.

Dies kann folgendermaßen gezeigt werden. Eine standardisierte Zufallsvariable <math>\tfrac{X-\operatorname{E}(X)}{\sqrt{\operatorname{Var}(X)}}</math> mit <math>X</math> Bernoulli-verteilt nimmt den Wert <math>\tfrac{q}{\sqrt{pq}}</math> mit Wahrscheinlichkeit <math>p</math> an und den Wert <math>-\tfrac{p}{\sqrt{pq}}</math> mit Wahrscheinlichkeit <math>q</math>. Damit erhalten wir für die Schiefe

<math>\begin{align}

\operatorname{v}(X) &= \operatorname{E} \left[\left(\frac{X-\operatorname{E}(X)}{\sqrt{\operatorname{Var}(X)}}\right)^3\right] \\ &= p \cdot \left(\frac{q}{\sqrt{pq}}\right)^3 + q \cdot \left(-\frac{p}{\sqrt{pq}}\right)^3 \\ &= \frac{1}{\sqrt{pq}^3} \left(pq^3-qp^3\right) \\ &= \frac{pq}{\sqrt{pq}^3} (q-p) \\ &= \frac{q-p}{\sqrt{pq}} \end{align}</math>

Wölbung und Exzess

Der Exzess der Bernoulli-Verteilung ist

<math> \gamma (X)=\frac{1-6pq}{pq} </math>

und damit ist die Wölbung

<math> \beta _2 (X)= \frac{1-3pq}{pq}</math>.

Momente

Alle k-ten Momente <math> m_k </math> sind gleich und es gilt

<math> m_k=p </math>.

Es ist nämlich

<math>m_k = \operatorname{E}\left(X^k\right) = p \cdot 1^k + q \cdot 0^k = p</math>.

Entropie

Die Entropie der Bernoulli-Verteilung ist

gemessen in Bit.

Modus

Der Modus der Bernoulli-Verteilung ist

<math>x_D=\begin{cases}

0 & \text{falls }\quad q > p\\ 0; 1 & \text{falls }\quad q=p\\ 1 & \text{falls }\quad q < p \end{cases}</math>.

Median

Der Median der Bernoulli-Verteilung ist

<math>\tilde m_X=\begin{cases}

0 & \text{falls }\quad q > p,\\ 1 & \text{falls }\quad q<p, \end{cases}</math> falls <math>p = q</math> gilt, ist jedes <math>\tilde m_X \in [0,1]</math> ein Median.

Kumulanten

Die kumulantenerzeugende Funktion ist

<math> g_X(t)=\ln (pe^t+q) </math>.

Damit sind die ersten Kumulanten <math> \kappa_1=p, \kappa_2=pq </math> und es gilt die Rekursionsgleichung

<math>\kappa_{n+1}=p (1-p) \frac{d\kappa_n}{dp}.</math>

Wahrscheinlichkeitserzeugende Funktion

Die wahrscheinlichkeitserzeugende Funktion ist

<math> m_X(t) = 1-p + p t</math>.

Charakteristische Funktion

Die charakteristische Funktion ist

<math>\varphi_X(t)=1-p+pe^{\mathrm{i}t}</math>.

Momenterzeugende Funktion

Die momenterzeugende Funktion ist

<math>M_X(t) = 1-p+pe^t</math>.

Beziehung zu anderen Verteilungen

Beziehung zur Binomialverteilung

Die Bernoulli-Verteilung ist ein Spezialfall der Binomialverteilung für <math>n=1</math>. Mit anderen Worten, die Summe von unabhängigen Bernoulli-verteilten Zufallsgrößen mit identischem Parameter <math>p</math> genügt der Binomialverteilung, demnach ist die Bernoulli-Verteilung nicht reproduktiv. Die Binomialverteilung ist die <math>n</math>-fache Faltung der Bernoulli-Verteilung bei gleichem Parameter <math>p</math> bzw. mit gleicher Wahrscheinlichkeit <math>p</math>.

Beziehung zur verallgemeinerten Binomialverteilung

Die Summe von <math> n </math> voneinander unabhängigen Bernoulli-verteilten Zufallsvariablen, die alle einen unterschiedlichen Parameter <math> p_i </math> besitzen, ist verallgemeinert binomialverteilt.

Beziehung zur Poisson-Verteilung

Die Summe von Bernoulli-verteilten Zufallsgrößen genügt für <math>n\to\infty</math>, <math>p_{n}\to 0</math> und <math>\lim\limits_{n\to\infty}np_{n}=\lambda>0</math> einer Poisson-Verteilung mit dem Parameter <math>\lambda</math>. Dies folgt direkt daraus, dass die Summe binomialverteilt ist und für die Binomialverteilung die Poisson-Approximation gilt.

Beziehung zur Zweipunktverteilung

Die Bernoulli-Verteilung ist ein Spezialfall der Zweipunktverteilung mit <math> a=0 , b=1 </math>. Umgekehrt ist die Zweipunktverteilung eine Verallgemeinerung der Bernoulli-Verteilung auf beliebige zweielementige Punktmengen.

Beziehung zur Rademacher-Verteilung

Sowohl die Bernoulli-Verteilung mit <math> p=q=0{,}5 </math> als auch die Rademacher-Verteilung modellieren einen fairen Münzwurf (oder eine faire, zufällige Ja/Nein-Entscheidung). Der Unterschied besteht lediglich darin, dass Kopf (Erfolg) und Zahl (Misserfolg) unterschiedlich codiert werden.

Beziehung zur geometrischen Verteilung

Bei Hintereinanderausführung von Bernoulli-verteilten Experimenten ist die Wartezeit auf den ersten Erfolg (oder letzten Misserfolg, je nach Definition) geometrisch verteilt.

Beziehung zur diskreten Gleichverteilung

Die Bernoulli-Verteilung mit <math> p=q=\tfrac{1}{2} </math> ist eine diskrete Gleichverteilung auf <math> \{0,1\}</math>.

Urnenmodell

Die Bernoulli-Verteilung lässt sich auch aus dem Urnenmodell erzeugen, wenn <math> p=\tfrac{k}{n}</math> mit <math>k, n \in \N</math> ist. Dann entspricht dies dem einmaligen Ziehen aus einer Urne mit <math>n</math> Kugeln, von denen genau <math>k</math> rot sind und alle anderen eine andere Farbe besitzen. Die Wahrscheinlichkeit, eine rote Kugel zu ziehen, ist dann <math>p</math>.

Simulation

Bei der Simulation macht man sich zunutze, dass, wenn <math> \mathcal{U} </math> eine stetig gleichverteilte Zufallsvariable auf <math> [0,1] </math> ist, die Zufallsvariable <math> Y=\mathbf{1}_{\{\mathcal{U}\geq 1-p\}} </math> Bernoulli-verteilt ist mit Parameter <math> p </math>. Da fast jeder Computer Standardzufallszahlen erzeugen kann, ist die Simulation wie folgend:

Erzeuge eine Standardzufallszahl <math> u_i </math>
Ist <math> u_i \leq 1-p </math>, gib 0 aus, ansonsten gib 1 aus.

Dies entspricht genau der Inversionsmethode. Die einfache Simulierbarkeit von Bernoulli-verteilten Zufallsvariablen kann auch zur Simulation von binomialverteilten oder verallgemeinert Binomialverteilten Zufallsvariablen genutzt werden.

Literatur

Hans-Otto Georgii: Stochastik: Einführung in die Wahrscheinlichkeitstheorie und Statistik. 4. Auflage, de Gruyter, 2009, ISBN 978-3-11-021526-7.

Einzelnachweise