Bernoulli-Verteilung
Zufallsvariablen mit einer Bernoulli-Verteilung (auch als Bernoullische Verteilung<ref name="Lex-527">{{#invoke:Vorlage:Literatur|f}}</ref>, Null-Eins-Verteilung<ref name="Lex-527"/>, Alternativ-Verteilung<ref>{{#invoke:Vorlage:Literatur|f}}</ref> oder Boole-Verteilung<ref>{{#invoke:Vorlage:Literatur|f}}</ref> bezeichnet) benutzt man zur Beschreibung von zufälligen Ereignissen, bei denen es nur zwei mögliche Versuchsausgänge gibt. Einer der Versuchsausgänge wird meistens mit Erfolg bezeichnet und der komplementäre Versuchsausgang mit Misserfolg. Die zugehörige Wahrscheinlichkeit <math>p</math> für einen Erfolg nennt man Erfolgswahrscheinlichkeit und <math>q=1-p</math> die Wahrscheinlichkeit eines Misserfolgs. Beispiele:
- Werfen einer Münze: Kopf (Erfolg), <math>p=1/2</math>, und Zahl (Misserfolg), <math>q=1/2</math>.
- Werfen eines Würfels, wobei nur eine „6“ als Erfolg gewertet wird: <math>p=1/6</math>, <math>q=5/6</math>.
- Betrachte sehr kleines Raum/Zeit-Intervall: Ereignis tritt ein <math>(p\gtrapprox 0)</math>, tritt nicht ein <math>(q\lessapprox 1)</math>.
Die Bezeichnung Bernoulli-Versuch (Bernoullian trials nach Jakob I Bernoulli) wurde erstmals 1937 in dem Buch Introduction to Mathematical Probability von James Victor Uspensky verwendet.<ref>James Victor Uspensky: Introduction to Mathematical Probability, McGraw-Hill, New York 1937, Seite 45</ref>
Definition
Eine diskrete Zufallsgröße <math>X</math> mit Werten in der Menge <math>\{0,1\}</math> unterliegt der Bernoulli-Verteilung oder Null-Eins-Verteilung mit dem Parameter <math>p \in (0,1)</math>, wenn sie der folgenden Wahrscheinlichkeitsfunktion folgt
- <math> f(x) = P(X=x) = \begin{cases} 1-p & \text{falls} \quad x=0, \\
p & \text{falls} \quad x=1, \\ 0 & \text{sonst.}\end{cases}</math>
Die Verteilungsfunktion ist dann
- <math> F(x)= P(X \leq x) = \begin{cases}
0 & \text{ falls } \quad x <0 \\ 1-p & \text{ falls } \quad 0 \leq x < 1 \\ 1 & \text{ falls } \quad x \geq 1 \end{cases}</math>. Man schreibt dann <math> X \sim \mathcal{B}(p) </math>, <math> X \sim \mathrm{Ber}(p) </math> oder <math> X \sim Ber_p </math>. Der Parameter <math>p</math> heißt in diesem Zusammenhang auch Bernoulli-Parameter.
Eine Zufallsvariable, deren Verteilung eine Bernoulli-Verteilung ist, heißt Bernoulli-verteilt. Eine Bernoulli-verteilte Zufallsvariable wird auch als Bernoulli-Variable bezeichnet.
Ein Zufallsexperiment, dessen Ausgang durch eine Bernoulli-Variable beschrieben ist, heißt Bernoulli-Experiment oder Bernoulli-Versuch. Eine Folge von Bernoulli-Versuchen, deren Zufallsvariablen stochastisch unabhängig und identisch – d. h. mit demselben Bernoulli-Parameter – verteilt sind, heißt Bernoulli-Prozess oder bernoullisches Versuchsschema.
Für bestimmte statistische Anwendungen ist es sinnvoll, den erweiterten Parameterraum <math>[0,1]</math> ergänzt durch die beiden Grenzfälle <math>p=0</math> und <math>p=1</math> zugrunde zu legen, bei denen die Bernoulli-Verteilung zu einer Einpunktverteilung auf 0 oder 1 degeneriert. In diesen Fällen gilt <math>P(X=0)=1</math> bzw. <math>P(X=1)=1</math>.
Eigenschaften
Im Folgenden ist <math>X \sim \mathrm{Ber}(p)</math> mit <math>0 < p <1 </math> vorausgesetzt.
Erwartungswert
Die Bernoulli-Verteilung mit Parameter <math>p</math> hat den Erwartungswert:
- <math>\operatorname{E}\left(X\right)=p</math>
Dies hat den Grund, dass für eine Bernoulli-verteilte Zufallsvariable <math>X</math> mit <math>P(X=1)=p</math> und <math>P(X=0)=q</math> gilt:
- <math>\operatorname{E}(X) = P(X=1)\cdot 1 + P(X=0)\cdot 0 = p \cdot 1 + q\cdot 0 = p</math>
Varianz und weitere Streumaße
Die Bernoulli-Verteilung besitzt die Varianz
- <math>\operatorname{Var}(X) = p\cdot(1-p)= pq</math>
denn es ist <math>\operatorname{E}(X^2)=p\cdot 1^2+ q\cdot 0^2=p</math> und damit
- <math>\operatorname{E}\left(X^2\right)-\operatorname{E}(X)^2=p-p^2 = p\cdot(1-p) = pq</math>.
Damit ist die Standardabweichung
- <math> \sigma_X= \sqrt{pq} </math>
und der Variationskoeffizient
- <math>
\operatorname{VarK}(X) = \sqrt{\frac{q}{p}}</math>.
Symmetrie
Für den Parameter <math> p= \tfrac 12 </math> ist die Bernoulli-Verteilung symmetrisch um den Punkt <math> a= \tfrac 12 </math>.
Schiefe
Die Schiefe der Bernoulli-Verteilung ist
- <math> \operatorname{v}(X)=\frac{1-2p}{\sqrt{pq}} </math>.
Dies kann folgendermaßen gezeigt werden. Eine standardisierte Zufallsvariable <math>\tfrac{X-\operatorname{E}(X)}{\sqrt{\operatorname{Var}(X)}}</math> mit <math>X</math> Bernoulli-verteilt nimmt den Wert <math>\tfrac{q}{\sqrt{pq}}</math> mit Wahrscheinlichkeit <math>p</math> an und den Wert <math>-\tfrac{p}{\sqrt{pq}}</math> mit Wahrscheinlichkeit <math>q</math>. Damit erhalten wir für die Schiefe
- <math>\begin{align}
\operatorname{v}(X) &= \operatorname{E} \left[\left(\frac{X-\operatorname{E}(X)}{\sqrt{\operatorname{Var}(X)}}\right)^3\right] \\ &= p \cdot \left(\frac{q}{\sqrt{pq}}\right)^3 + q \cdot \left(-\frac{p}{\sqrt{pq}}\right)^3 \\ &= \frac{1}{\sqrt{pq}^3} \left(pq^3-qp^3\right) \\ &= \frac{pq}{\sqrt{pq}^3} (q-p) \\ &= \frac{q-p}{\sqrt{pq}} \end{align}</math>
Wölbung und Exzess
Der Exzess der Bernoulli-Verteilung ist
- <math> \gamma (X)=\frac{1-6pq}{pq} </math>
und damit ist die Wölbung
- <math> \beta _2 (X)= \frac{1-3pq}{pq}</math>.
Momente
Alle k-ten Momente <math> m_k </math> sind gleich und es gilt
- <math> m_k=p </math>.
Es ist nämlich
- <math>m_k = \operatorname{E}\left(X^k\right) = p \cdot 1^k + q \cdot 0^k = p</math>.
Entropie
Die Entropie der Bernoulli-Verteilung ist
- <math>\Eta = -q\log_2(q)-p\log_2(p)</math>
gemessen in Bit.
Modus
Der Modus der Bernoulli-Verteilung ist
- <math>x_D=\begin{cases}
0 & \text{falls }\quad q > p\\ 0; 1 & \text{falls }\quad q=p\\ 1 & \text{falls }\quad q < p \end{cases}</math>.
Median
Der Median der Bernoulli-Verteilung ist
- <math>\tilde m_X=\begin{cases}
0 & \text{falls }\quad q > p,\\ 1 & \text{falls }\quad q<p, \end{cases}</math> falls <math>p = q</math> gilt, ist jedes <math>\tilde m_X \in [0,1]</math> ein Median.
Kumulanten
Die kumulantenerzeugende Funktion ist
- <math> g_X(t)=\ln (pe^t+q) </math>.
Damit sind die ersten Kumulanten <math> \kappa_1=p, \kappa_2=pq </math> und es gilt die Rekursionsgleichung
- <math>\kappa_{n+1}=p (1-p) \frac{d\kappa_n}{dp}.</math>
Wahrscheinlichkeitserzeugende Funktion
Die wahrscheinlichkeitserzeugende Funktion ist
- <math> m_X(t) = 1-p + p t</math>.
Charakteristische Funktion
Die charakteristische Funktion ist
- <math>\varphi_X(t)=1-p+pe^{\mathrm{i}t}</math>.
Momenterzeugende Funktion
Die momenterzeugende Funktion ist
- <math>M_X(t) = 1-p+pe^t</math>.
Beziehung zu anderen Verteilungen
Beziehung zur Binomialverteilung
Die Bernoulli-Verteilung ist ein Spezialfall der Binomialverteilung für <math>n=1</math>. Mit anderen Worten, die Summe von unabhängigen Bernoulli-verteilten Zufallsgrößen mit identischem Parameter <math>p</math> genügt der Binomialverteilung, demnach ist die Bernoulli-Verteilung nicht reproduktiv. Die Binomialverteilung ist die <math>n</math>-fache Faltung der Bernoulli-Verteilung bei gleichem Parameter <math>p</math> bzw. mit gleicher Wahrscheinlichkeit <math>p</math>.
Beziehung zur verallgemeinerten Binomialverteilung
Die Summe von <math> n </math> voneinander unabhängigen Bernoulli-verteilten Zufallsvariablen, die alle einen unterschiedlichen Parameter <math> p_i </math> besitzen, ist verallgemeinert binomialverteilt.
Beziehung zur Poisson-Verteilung
Die Summe von Bernoulli-verteilten Zufallsgrößen genügt für <math>n\to\infty</math>, <math>p_{n}\to 0</math> und <math>\lim\limits_{n\to\infty}np_{n}=\lambda>0</math> einer Poisson-Verteilung mit dem Parameter <math>\lambda</math>. Dies folgt direkt daraus, dass die Summe binomialverteilt ist und für die Binomialverteilung die Poisson-Approximation gilt.
Beziehung zur Zweipunktverteilung
Die Bernoulli-Verteilung ist ein Spezialfall der Zweipunktverteilung mit <math> a=0 , b=1 </math>. Umgekehrt ist die Zweipunktverteilung eine Verallgemeinerung der Bernoulli-Verteilung auf beliebige zweielementige Punktmengen.
Beziehung zur Rademacher-Verteilung
Sowohl die Bernoulli-Verteilung mit <math> p=q=0{,}5 </math> als auch die Rademacher-Verteilung modellieren einen fairen Münzwurf (oder eine faire, zufällige Ja/Nein-Entscheidung). Der Unterschied besteht lediglich darin, dass Kopf (Erfolg) und Zahl (Misserfolg) unterschiedlich codiert werden.
Beziehung zur geometrischen Verteilung
Bei Hintereinanderausführung von Bernoulli-verteilten Experimenten ist die Wartezeit auf den ersten Erfolg (oder letzten Misserfolg, je nach Definition) geometrisch verteilt.
Beziehung zur diskreten Gleichverteilung
Die Bernoulli-Verteilung mit <math> p=q=\tfrac{1}{2} </math> ist eine diskrete Gleichverteilung auf <math> \{0,1\}</math>.
Urnenmodell
Die Bernoulli-Verteilung lässt sich auch aus dem Urnenmodell erzeugen, wenn <math> p=\tfrac{k}{n}</math> mit <math>k, n \in \N</math> ist. Dann entspricht dies dem einmaligen Ziehen aus einer Urne mit <math>n</math> Kugeln, von denen genau <math>k</math> rot sind und alle anderen eine andere Farbe besitzen. Die Wahrscheinlichkeit, eine rote Kugel zu ziehen, ist dann <math>p</math>.
Simulation
Bei der Simulation macht man sich zunutze, dass, wenn <math> \mathcal{U} </math> eine stetig gleichverteilte Zufallsvariable auf <math> [0,1] </math> ist, die Zufallsvariable <math> Y=\mathbf{1}_{\{\mathcal{U}\geq 1-p\}} </math> Bernoulli-verteilt ist mit Parameter <math> p </math>. Da fast jeder Computer Standardzufallszahlen erzeugen kann, ist die Simulation wie folgend:
- Erzeuge eine Standardzufallszahl <math> u_i </math>
- Ist <math> u_i \leq 1-p </math>, gib 0 aus, ansonsten gib 1 aus.
Dies entspricht genau der Inversionsmethode. Die einfache Simulierbarkeit von Bernoulli-verteilten Zufallsvariablen kann auch zur Simulation von binomialverteilten oder verallgemeinert Binomialverteilten Zufallsvariablen genutzt werden.
Literatur
- Hans-Otto Georgii: Stochastik: Einführung in die Wahrscheinlichkeitstheorie und Statistik. 4. Auflage, de Gruyter, 2009, ISBN 978-3-11-021526-7.
Einzelnachweise
<references />
<templatestyles src="BoxenVerschmelzen/styles.css" />
{{#if:Navigationsleiste DUWahrscheinlichkeitsverteilungen |{{safesubst:#ifeq:0|10| {{#switch: Bernoulli-Verteilung |Navigationsleiste|NaviBlock|0=|#default= Vorlage:Templatetransclusioncheck Vorlage:Dokumentation/ruler }}}}Vorlage:Klappleiste/Anfang {{#if:
|Diskrete univariate Verteilungen für endliche Mengen:
Benford |
Bernoulli |
beta-binomial |
binomial |
Dirac |
diskret uniform |
empirisch |
hypergeometrisch |
kategorial |
negativ hypergeometrisch |
Rademacher |
verallgemeinert binomial |
Zipf |
Zipf-Mandelbrot |
Zweipunkt
Diskrete univariate Verteilungen für unendliche Mengen:
Boltzmann |
Conway-Maxwell-Poisson |
discrete-Phase-Type |
erweitert negativ binomial |
Gauss-Kuzmin |
gemischt Poisson |
geometrisch |
logarithmisch |
negativ binomial |
parabolisch-fraktal |
Poisson |
Skellam |
verallgemeinert Poisson |
Yule-Simon |
Zeta
|
Diskrete univariate Verteilungen für endliche Mengen:
Benford |
Bernoulli |
beta-binomial |
binomial |
Dirac |
diskret uniform |
empirisch |
hypergeometrisch |
kategorial |
negativ hypergeometrisch |
Rademacher |
verallgemeinert binomial |
Zipf |
Zipf-Mandelbrot |
Zweipunkt
Diskrete univariate Verteilungen für unendliche Mengen:
Boltzmann |
Conway-Maxwell-Poisson |
discrete-Phase-Type |
erweitert negativ binomial |
Gauss-Kuzmin |
gemischt Poisson |
geometrisch |
logarithmisch |
negativ binomial |
parabolisch-fraktal |
Poisson |
Skellam |
verallgemeinert Poisson |
Yule-Simon |
Zeta
}}
Vorlage:Klappleiste/Ende}}{{#if:Navigationsleiste KUWahrscheinlichkeitsverteilungen
|{{safesubst:#ifeq:0|10| {{#switch: Bernoulli-Verteilung |Navigationsleiste|NaviBlock|0=|#default=
Vorlage:Templatetransclusioncheck
Vorlage:Dokumentation/ruler
}}}}Vorlage:Klappleiste/Anfang
{{#if:
Kontinuierliche univariate Verteilungen mit kompaktem Intervall:
Beta |
Cantor |
Kumaraswamy |
raised Cosine |
Dreieck |
Trapez |
U-quadratisch |
stetig uniform |
Wigner-Halbkreis
Kontinuierliche univariate Verteilungen mit halboffenem Intervall:
Beta prime |
Bose-Einstein |
Burr |
Chi |
Chi-Quadrat |
Coxian |
Erlang |
Exponential |
Extremwert |
F |
Fermi-Dirac |
Folded normal |
Fréchet |
Gamma |
Gamma-Gamma |
verallgemeinert invers Gauß |
halblogistisch |
halbnormal |
Hartman-Watson |
Hotellings T-Quadrat |
hyper-exponentiale |
hypoexponential |
invers Chi-Quadrat |
scale-invers Chi-Quadrat |
Invers Normal |
Invers Gamma |
Kolmogorow-Verteilung |
Lévy |
log-normal |
log-logistisch |
Maxwell-Boltzmann |
Maxwell-Speed |
Nakagami |
nichtzentriert Chi-Quadrat |
Pareto |
Phase-Type |
Rayleigh |
relativistisch Breit-Wigner |
Rice |
Rosin-Rammler |
shifted Gompertz |
truncated normal |
Type-2-Gumbel |
Weibull |
Wilks’ Lambda
Kontinuierliche univariate Verteilungen mit unbeschränktem Intervall:
Cauchy |
Extremwert |
exponential Power |
Fishers z |
Fisher-Tippett (Gumbel) |
generalized hyperbolic |
Hyperbolic-secant |
Landau |
Laplace |
alpha-stabil |
logistisch |
normal (Gauß) |
normal-invers Gauß’sch |
Skew-normal |
Studentsche t |
Type-1-Gumbel |
Variance-Gamma |
Voigt
|
Kontinuierliche univariate Verteilungen mit kompaktem Intervall:
Beta |
Cantor |
Kumaraswamy |
raised Cosine |
Dreieck |
Trapez |
U-quadratisch |
stetig uniform |
Wigner-Halbkreis
Kontinuierliche univariate Verteilungen mit halboffenem Intervall:
Beta prime |
Bose-Einstein |
Burr |
Chi |
Chi-Quadrat |
Coxian |
Erlang |
Exponential |
Extremwert |
F |
Fermi-Dirac |
Folded normal |
Fréchet |
Gamma |
Gamma-Gamma |
verallgemeinert invers Gauß |
halblogistisch |
halbnormal |
Hartman-Watson |
Hotellings T-Quadrat |
hyper-exponentiale |
hypoexponential |
invers Chi-Quadrat |
scale-invers Chi-Quadrat |
Invers Normal |
Invers Gamma |
Kolmogorow-Verteilung |
Lévy |
log-normal |
log-logistisch |
Maxwell-Boltzmann |
Maxwell-Speed |
Nakagami |
nichtzentriert Chi-Quadrat |
Pareto |
Phase-Type |
Rayleigh |
relativistisch Breit-Wigner |
Rice |
Rosin-Rammler |
shifted Gompertz |
truncated normal |
Type-2-Gumbel |
Weibull |
Wilks’ Lambda
Kontinuierliche univariate Verteilungen mit unbeschränktem Intervall:
Cauchy |
Extremwert |
exponential Power |
Fishers z |
Fisher-Tippett (Gumbel) |
generalized hyperbolic |
Hyperbolic-secant |
Landau |
Laplace |
alpha-stabil |
logistisch |
normal (Gauß) |
normal-invers Gauß’sch |
Skew-normal |
Studentsche t |
Type-1-Gumbel |
Variance-Gamma |
Voigt
}}
Vorlage:Klappleiste/Ende}}{{#if:Navigationsleiste MUWahrscheinlichkeitsverteilungen
|{{safesubst:#ifeq:0|10| {{#switch: Bernoulli-Verteilung |Navigationsleiste|NaviBlock|0=|#default=
Vorlage:Templatetransclusioncheck
Vorlage:Dokumentation/ruler
}}}}Vorlage:Klappleiste/Anfang
{{#if:
Diskrete multivariate Verteilungen:
Dirichlet compound multinomial |
Ewens |
gemischt Multinomial |
multinomial |
multivariat hypergeometrisch |
multivariat Poisson |
negativmultinomial |
Pólya/Eggenberger |
polyhypergeometrisch
Kontinuierliche multivariate Verteilungen:
Dirichlet |
GEM |
generalized Dirichlet |
multivariat normal |
multivariat Student |
normalskaliert invers Gamma |
Normal-Gamma |
Poisson-Dirichlet
Multivariate Matrixverteilungen:
Gleichverteilung auf der Stiefel-Mannigfaltigkeit |
Invers Wishart |
Matrix Beta |
Matrix Gamma |
Matrix invers Beta |
Matrix invers Gamma |
Matrix Normal |
Matrix Student-t |
Matrix-Von-Mises-Fisher-Verteilung |
Normal-invers-Wishart |
Normal-Wishart |
Wishart
|
Diskrete multivariate Verteilungen:
Dirichlet compound multinomial |
Ewens |
gemischt Multinomial |
multinomial |
multivariat hypergeometrisch |
multivariat Poisson |
negativmultinomial |
Pólya/Eggenberger |
polyhypergeometrisch
Kontinuierliche multivariate Verteilungen:
Dirichlet |
GEM |
generalized Dirichlet |
multivariat normal |
multivariat Student |
normalskaliert invers Gamma |
Normal-Gamma |
Poisson-Dirichlet
Multivariate Matrixverteilungen:
Gleichverteilung auf der Stiefel-Mannigfaltigkeit |
Invers Wishart |
Matrix Beta |
Matrix Gamma |
Matrix invers Beta |
Matrix invers Gamma |
Matrix Normal |
Matrix Student-t |
Matrix-Von-Mises-Fisher-Verteilung |
Normal-invers-Wishart |
Normal-Wishart |
Wishart
}}