Beta-Binomialverteilung
Die Beta-Binomialverteilung ist eine spezielle Wahrscheinlichkeitsverteilung in der Stochastik. Sie zählt zu den diskreten Wahrscheinlichkeitsverteilungen und ist univariat. Sie kann als eine Art Verallgemeinerung der Binomialverteilung angesehen werden, da in dieser die Wahrscheinlichkeit von <math>x</math> Erfolgen auf <math>n</math> bei gegebener Wahrscheinlichkeit eines Einzelerfolges angegeben wird, während in der Beta-Binomialverteilung die Erfolgswahrscheinlichkeit nur ungenau bekannt ist und durch eine Betaverteilung B(a,b) beschrieben wird. Es handelt sich somit um eine Mischverteilung.
Die Beta-Binomialverteilung hat drei Parameter: n, a, b.
Definition
Eine Zufallsvariable <math>X</math> hat eine Beta-Binomialverteilung mit den Parametern <math>n \in \N_0</math>, <math>a > 0</math> und <math>b > 0</math>, in Zeichen <math>X \sim BeB(n,a,b)</math>, wenn sie für alle <math>x</math> aus dem Träger <math>\{0,1,\ldots,n\}</math> die Wahrscheinlichkeitsfunktion
- <math>P(X=x) = {n \choose x} \frac{\Beta(a+x , b+n-x)}{\Beta (a, b)}</math>
hat, wobei <math>\Beta</math> die Betafunktion ist.
Konstruktion
Ist <math> f(x|p,n) </math> die Wahrscheinlichkeitsfunktion der Binomialverteilung und <math> b(p|a,b) </math> die Dichte der Beta-Verteilung, so berechnet sich die Wahrscheinlichkeitsfunktion der Mischverteilung als
- <math>P(X=x)= M(x|n,a,b)=\int_0^1f(x|p,n)b(p|a,b) dp </math>.
Das Integral entspricht genau der obigen Wahrscheinlichkeitsfunktion.
Alternative Darstellung
Alternativ lässt sich die Wahrscheinlichkeitsfunktion auch darstellen als
- <math>P(X=x) = C {n \choose x} \Gamma(a+x) \Gamma(b+n-x).</math>
Dabei ist die Konstante C eine Normierungskonstante und wird folgendermaßen berechnet:
- <math>C = \frac{\Gamma(a+b)}{\Gamma(a) \Gamma(b) \Gamma (a+b+n)}</math>
Dabei ist <math>\Gamma</math> die Gammafunktion.
Eigenschaften
Erwartungswert
Der Erwartungswert hängt von allen drei Parametern ab:
- <math>E(X) = n \frac{a}{a+b},</math>
Varianz
Die Varianz ist:
- <math>Var(X) = n \frac{a b}{(a+b)^2} \frac{a+b+n}{a+b+1}.</math>
Schiefe
Die Schiefe wird angegeben mit
- <math>\operatorname{v}(X)=(a + b + 2 n)\frac{b-a}{a+b+2} \sqrt{\frac{1+a+b}{n a b (n+a+b)}}</math>
Wahrscheinlichkeitserzeugende Funktion
Die wahrscheinlichkeitserzeugende Funktion der Beta-Binomialverteilung ist
- <math> m_X\left(t\right)={_{2}F_{1}}\left(-n,a;a+b;1-t\right)\!</math>.
Hierbei ist <math>_2F_1 </math> die gaußsche hypergeometrische Funktion.
Charakteristische Funktion
Durch Substitution folgt daraus die charakteristische Funktion:
- <math> \varphi_X\left(t\right)={_{2}F_{1}}\left(-n,a;a+b;1-e^{it}\right)\!</math>.
Momenterzeugende Funktion
Damit ist die momenterzeugende Funktion
- <math> M_X\left(t\right)={_{2}F_{1}}\left(-n,a;a+b;1-e^{t}\right)\!</math>.
Spezialfälle
Falls <math> a=1</math> und <math> b=1</math>, dann handelt es sich um eine diskrete Gleichverteilung mit <math>P(X=x)=\tfrac1{n+1}</math>, da der Träger <math>n+1</math> Werte beinhaltet.
Anwendungsbereiche
Die Beta-Binomialverteilung wird typischerweise in Fällen angewendet, bei denen man üblicherweise eine Binomialverteilung benutzen würde, aber nicht davon ausgehen kann, dass alle Einzelereignisse dieselbe Wahrscheinlichkeit haben einzutreten, sondern diese Wahrscheinlichkeiten mehr oder minder glockenförmig um einen Wert liegen.
Will man zum Beispiel wissen, wie viele Glühlampen innerhalb der nächsten 12 Monaten ausfallen werden, geht aber davon aus, dass die Wahrscheinlichkeit eines Ausfalls einer Glühlampe zwischen verschiedenen Lieferkartons abweicht, dann ist eine Beta-Binomialverteilung angebracht.
Empirisch kann man vermuten, mit einer Beta-Binomialverteilung zu tun zu haben, obwohl man eher an ein Binomialmodell denken würde, falls die Daten mehr streuen als von der Binomialverteilung vorgesehen.
Beispiel
Modell in der bayesschen Statistik
Eine Urne enthält eine unbekannte Anzahl von Bällen, von denen man aus anderen Stichproben weiß, dass der Anteil roter Bälle von einer Betaverteilung <math>B(a,b)</math> beschrieben wird.
Es sollen n-mal Bälle gezogen werden (mit Zurücklegen). Die Wahrscheinlichkeit, dass x-mal ein roter Ball gezogen wird, ist in der Beta-Binomialverteilung <math>BeB(n,a,b)</math>.
Zahlenbeispiel
Ausgehend von einer kompletten Unwissenheit der apriori Verteilung, die mit einer <math>Beta(1,1)</math> beschrieben wird (Alternativen sind z. B. <math>Beta(\tfrac 12,\tfrac 12)</math>), wird eine „Vorstudie“ mit einer Ziehung (mit Wiederholung) von 15 Bällen organisiert. Einer dieser Bälle ist rot. Somit wird die a posteriori Verteilung mit der <math>Beta(1+1,1+14)=Beta(2,15)</math> beschrieben.
Die eigentliche „Studie“ sieht eine Ziehung von 40 Bällen vor. Gefragt ist die Wahrscheinlichkeit, dass genau zwei Mal ein roter Ball gezogen wird.
Da in dieser zweiten Ziehung die Wahrscheinlichkeit <math>P(X=x)</math> jene einer <math>BeB(40,2,15)</math> ist, lässt sie sich wie folgt berechnen:
- <math>P(X=2, n=40, a=2, b=15) = C {40 \choose 2} \Gamma(2+2) \Gamma(15+40-2)</math>,
wobei
- <math>C = \frac{\Gamma(2+15)}{\Gamma(2) \Gamma(15) \Gamma (2+15+40)}</math>
und da <math>{40 \choose 2} = 780</math> und außerdem allgemein <math>\Gamma(k) = (k-1)!\, </math> ist, erhält man
- <math>
\begin{align}P(X=2 | n=40, a=2, b=15) &= \frac{16!}{1 \cdot 14! \cdot 56!} (780 \cdot 6 \cdot 52!) \\ &= 780 \cdot 6 \cdot \frac{16!}{14!} \cdot \frac{54!}{56!} = \frac{780}{53} \cdot \frac{6}{54} \cdot \frac{15}{55} \cdot \frac{16}{56}\\ &= \frac{260}{53} \cdot \frac{2}{77} = 0{,}12741975 = 12{,}74\,\%. \end{align} </math>
Dieses Ergebnis weicht wesentlich von jenem, welches mit einer „einfachen“ Binomialverteilung <math>B(n=40, p=\tfrac 1{15})</math> berechnet worden wäre, ab. In diesem Fall wäre das Ergebnis <math>P(X=2,n=40, p=\tfrac1{15})= 25{,}19\,\%</math>.
Aus der Grafik wird ersichtlich, dass die „einfache“ Binomialverteilung <math>B(n=40, p=\tfrac 1{15})</math> weniger Ergebnisse „zulässt“ als die <math>BeB(n=40,a=2,b=15)</math>. Dies geschieht, da man in dem bayesschen Modell nicht vernachlässigt, dass der „wahre“ Anteil an roten Bällen im Grunde unbekannt ist, und somit die Ergebnisse stärker streuen.
Literatur
- Leonhard Held: Methoden der statistischen Inferenz. Likelihood und Bayes, Unter Mitwirkung von Daniel Sabanés Bové, Spektrum Akademischer Verlag, Heidelberg 2008, ISBN 978-3-8274-1939-2.
- Jim Albert: Bayesian Computation With R, Springer New York, 2009, ISBN 978-0-387-92297-3, {{#invoke:Vorlage:Handle|f|scheme=doi|class=plainlinks|parProblem=Problem|errCat=Wikipedia:Vorlagenfehler/Parameter:DOI|errClasses=error editoronly|errHide=1|errNS=0 4 10 100}}.
Siehe auch
Weblinks
- http://www.vosesoftware.com/ModelRiskHelp/Distributions/Discrete_distributions/Beta-Binomial_distribution.htm
- {{#if: | {{{author}}} | Eric W. Weisstein }}: Beta-Binomial Distribution. In: MathWorld (englisch). {{#if: | {{#ifeq: {{#property:P2812}} | {{{id}}} | | {{#if: {{#property:P2812}} | {{#ifeq: 0 | 0 | }} | {{#ifeq: 0 | 0 | }} }} }} }}
<templatestyles src="BoxenVerschmelzen/styles.css" />
{{#if:Navigationsleiste DUWahrscheinlichkeitsverteilungen |{{safesubst:#ifeq:0|10| {{#switch: Beta-Binomialverteilung |Navigationsleiste|NaviBlock|0=|#default= Vorlage:Templatetransclusioncheck Vorlage:Dokumentation/ruler }}}}Vorlage:Klappleiste/Anfang {{#if:
|Diskrete univariate Verteilungen für endliche Mengen:
Benford |
Bernoulli |
beta-binomial |
binomial |
Dirac |
diskret uniform |
empirisch |
hypergeometrisch |
kategorial |
negativ hypergeometrisch |
Rademacher |
verallgemeinert binomial |
Zipf |
Zipf-Mandelbrot |
Zweipunkt
Diskrete univariate Verteilungen für unendliche Mengen:
Boltzmann |
Conway-Maxwell-Poisson |
discrete-Phase-Type |
erweitert negativ binomial |
Gauss-Kuzmin |
gemischt Poisson |
geometrisch |
logarithmisch |
negativ binomial |
parabolisch-fraktal |
Poisson |
Skellam |
verallgemeinert Poisson |
Yule-Simon |
Zeta
|
Diskrete univariate Verteilungen für endliche Mengen:
Benford |
Bernoulli |
beta-binomial |
binomial |
Dirac |
diskret uniform |
empirisch |
hypergeometrisch |
kategorial |
negativ hypergeometrisch |
Rademacher |
verallgemeinert binomial |
Zipf |
Zipf-Mandelbrot |
Zweipunkt
Diskrete univariate Verteilungen für unendliche Mengen:
Boltzmann |
Conway-Maxwell-Poisson |
discrete-Phase-Type |
erweitert negativ binomial |
Gauss-Kuzmin |
gemischt Poisson |
geometrisch |
logarithmisch |
negativ binomial |
parabolisch-fraktal |
Poisson |
Skellam |
verallgemeinert Poisson |
Yule-Simon |
Zeta
}}
Vorlage:Klappleiste/Ende}}{{#if:Navigationsleiste KUWahrscheinlichkeitsverteilungen
|{{safesubst:#ifeq:0|10| {{#switch: Beta-Binomialverteilung |Navigationsleiste|NaviBlock|0=|#default=
Vorlage:Templatetransclusioncheck
Vorlage:Dokumentation/ruler
}}}}Vorlage:Klappleiste/Anfang
{{#if:
Kontinuierliche univariate Verteilungen mit kompaktem Intervall:
Beta |
Cantor |
Kumaraswamy |
raised Cosine |
Dreieck |
Trapez |
U-quadratisch |
stetig uniform |
Wigner-Halbkreis
Kontinuierliche univariate Verteilungen mit halboffenem Intervall:
Beta prime |
Bose-Einstein |
Burr |
Chi |
Chi-Quadrat |
Coxian |
Erlang |
Exponential |
Extremwert |
F |
Fermi-Dirac |
Folded normal |
Fréchet |
Gamma |
Gamma-Gamma |
verallgemeinert invers Gauß |
halblogistisch |
halbnormal |
Hartman-Watson |
Hotellings T-Quadrat |
hyper-exponentiale |
hypoexponential |
invers Chi-Quadrat |
scale-invers Chi-Quadrat |
Invers Normal |
Invers Gamma |
Kolmogorow-Verteilung |
Lévy |
log-normal |
log-logistisch |
Maxwell-Boltzmann |
Maxwell-Speed |
Nakagami |
nichtzentriert Chi-Quadrat |
Pareto |
Phase-Type |
Rayleigh |
relativistisch Breit-Wigner |
Rice |
Rosin-Rammler |
shifted Gompertz |
truncated normal |
Type-2-Gumbel |
Weibull |
Wilks’ Lambda
Kontinuierliche univariate Verteilungen mit unbeschränktem Intervall:
Cauchy |
Extremwert |
exponential Power |
Fishers z |
Fisher-Tippett (Gumbel) |
generalized hyperbolic |
Hyperbolic-secant |
Landau |
Laplace |
alpha-stabil |
logistisch |
normal (Gauß) |
normal-invers Gauß’sch |
Skew-normal |
Studentsche t |
Type-1-Gumbel |
Variance-Gamma |
Voigt
|
Kontinuierliche univariate Verteilungen mit kompaktem Intervall:
Beta |
Cantor |
Kumaraswamy |
raised Cosine |
Dreieck |
Trapez |
U-quadratisch |
stetig uniform |
Wigner-Halbkreis
Kontinuierliche univariate Verteilungen mit halboffenem Intervall:
Beta prime |
Bose-Einstein |
Burr |
Chi |
Chi-Quadrat |
Coxian |
Erlang |
Exponential |
Extremwert |
F |
Fermi-Dirac |
Folded normal |
Fréchet |
Gamma |
Gamma-Gamma |
verallgemeinert invers Gauß |
halblogistisch |
halbnormal |
Hartman-Watson |
Hotellings T-Quadrat |
hyper-exponentiale |
hypoexponential |
invers Chi-Quadrat |
scale-invers Chi-Quadrat |
Invers Normal |
Invers Gamma |
Kolmogorow-Verteilung |
Lévy |
log-normal |
log-logistisch |
Maxwell-Boltzmann |
Maxwell-Speed |
Nakagami |
nichtzentriert Chi-Quadrat |
Pareto |
Phase-Type |
Rayleigh |
relativistisch Breit-Wigner |
Rice |
Rosin-Rammler |
shifted Gompertz |
truncated normal |
Type-2-Gumbel |
Weibull |
Wilks’ Lambda
Kontinuierliche univariate Verteilungen mit unbeschränktem Intervall:
Cauchy |
Extremwert |
exponential Power |
Fishers z |
Fisher-Tippett (Gumbel) |
generalized hyperbolic |
Hyperbolic-secant |
Landau |
Laplace |
alpha-stabil |
logistisch |
normal (Gauß) |
normal-invers Gauß’sch |
Skew-normal |
Studentsche t |
Type-1-Gumbel |
Variance-Gamma |
Voigt
}}
Vorlage:Klappleiste/Ende}}{{#if:Navigationsleiste MUWahrscheinlichkeitsverteilungen
|{{safesubst:#ifeq:0|10| {{#switch: Beta-Binomialverteilung |Navigationsleiste|NaviBlock|0=|#default=
Vorlage:Templatetransclusioncheck
Vorlage:Dokumentation/ruler
}}}}Vorlage:Klappleiste/Anfang
{{#if:
Diskrete multivariate Verteilungen:
Dirichlet compound multinomial |
Ewens |
gemischt Multinomial |
multinomial |
multivariat hypergeometrisch |
multivariat Poisson |
negativmultinomial |
Pólya/Eggenberger |
polyhypergeometrisch
Kontinuierliche multivariate Verteilungen:
Dirichlet |
GEM |
generalized Dirichlet |
multivariat normal |
multivariat Student |
normalskaliert invers Gamma |
Normal-Gamma |
Poisson-Dirichlet
Multivariate Matrixverteilungen:
Gleichverteilung auf der Stiefel-Mannigfaltigkeit |
Invers Wishart |
Matrix Beta |
Matrix Gamma |
Matrix invers Beta |
Matrix invers Gamma |
Matrix Normal |
Matrix Student-t |
Matrix-Von-Mises-Fisher-Verteilung |
Normal-invers-Wishart |
Normal-Wishart |
Wishart
|
Diskrete multivariate Verteilungen:
Dirichlet compound multinomial |
Ewens |
gemischt Multinomial |
multinomial |
multivariat hypergeometrisch |
multivariat Poisson |
negativmultinomial |
Pólya/Eggenberger |
polyhypergeometrisch
Kontinuierliche multivariate Verteilungen:
Dirichlet |
GEM |
generalized Dirichlet |
multivariat normal |
multivariat Student |
normalskaliert invers Gamma |
Normal-Gamma |
Poisson-Dirichlet
Multivariate Matrixverteilungen:
Gleichverteilung auf der Stiefel-Mannigfaltigkeit |
Invers Wishart |
Matrix Beta |
Matrix Gamma |
Matrix invers Beta |
Matrix invers Gamma |
Matrix Normal |
Matrix Student-t |
Matrix-Von-Mises-Fisher-Verteilung |
Normal-invers-Wishart |
Normal-Wishart |
Wishart
}}