Zum Inhalt springen

Multinomialverteilung

aus Wikipedia, der freien Enzyklopädie

Die Multinomialverteilung oder Polynomialverteilung ist eine Wahrscheinlichkeitsverteilung in der Stochastik. Sie ist eine diskrete Wahrscheinlichkeitsverteilung und kann als multivariate Verallgemeinerung der Binomialverteilung aufgefasst werden. Sie hat in der Bayesschen Statistik als konjugierte A-priori-Verteilung die Dirichlet-Verteilung.

Definition und Modell

Seien <math>n,k \in \mathbb{N}_0</math> und <math> p_1, \dotsc, p_k \in [0,1]</math> mit <math>p_1+ \dotsb +p_k = 1</math>. Dann ist die Zähldichte der Multinomialverteilung <math>M(n,(p_1,\dotsc,p_k))</math> gegeben durch

<math>f(n_1, \dotsc, n_k) \;=\; \begin{cases} {n \choose n_1, \dotsc, n_k} \; p_1^{n_1} \dotsm p_k^{n_k}\text{,} & \text{wenn } n_1, \dotsc, n_k \in \mathbb{N}_0\text{ und } n_1 + \dotsb + n_k = n, \\ 0 & \text{sonst.} \end{cases}</math>.

Hierbei ist <math> {n \choose n_1, \dotsc, n_k} = \frac{n!}{n_1!\dotsm n_k!}</math> der Multinomialkoeffizient.

Anwendung und Motivation

Die Multinomialverteilung kann ausgehend von einem Urnenmodell mit Zurücklegen motiviert werden. In einer Urne sind <math>k</math> Sorten Kugeln. Der Anteil der Sorten Kugeln in der Urne ist <math>p_i, (i \in \{1, \dotsc, k\})</math>. Der Urne wird <math>n</math>-mal jeweils eine Kugel entnommen, ihre Eigenschaft (Sorte) notiert und die Kugel danach wieder in die Urne zurückgelegt.

Man interessiert sich nun für die Anzahl <math>x_i</math> der Kugeln einer jeden Sorte <math>i</math> in dieser Stichprobe. Da <math>(X_1, \dotsc, X_k)</math> der Multinomialverteilung folgt, besitzt die Stichprobe <math>x_1, \dotsc, x_k</math> die Wahrscheinlichkeit:

<math>P(X_1=x_1, X_2=x_2, \dotsc, X_k=x_k)= \frac {n!}{x_1! \cdot x_2! \dotsm x_k!}p_1^{x_1} \cdot p_2^{x_2} \dotsm p_k^{x_k}

</math>.

Nimmt man eine Urne mit <math>k=6</math> Sorten Kugeln mit jeweils einer Kugel pro Sorte, so erhält man den klassischen Würfel: Man wirft diesen <math>n</math>-mal, hat dabei <math>k=6</math> mögliche Ausgänge und interessiert sich dafür, wie groß die Wahrscheinlichkeit dafür ist, dass <math>X_1</math> gerade <math>x_1</math>-mal auftritt, <math>X_2</math> gerade <math>x_2</math>-mal und so weiter. Weiter beschreiben die jeweiligen <math>p</math> die Wahrscheinlichkeiten der Würfelflächen und somit, ob es sich um einen fairen oder unfairen Würfel handelt.

Eigenschaften

Erwartungswert

Für jedes <math>i</math> ist die Zufallsvariable <math>X_i</math> binomialverteilt mit den Parametern <math>n</math> und <math>p_i</math>, hat also den Erwartungswert

<math>\operatorname{E}(X_i) = np_i</math>

Varianz

Für die Varianz gilt

<math>\operatorname{Var}(X_i) = n p_i (1-p_i)</math>.

Kovarianz und Korrelationskoeffizient

Die Kovarianz zweier Zufallsvariablen <math>X_i</math> und <math>X_j</math> mit <math>i\ne j</math> berechnet sich als

<math>\operatorname{Cov}(X_i,X_j) = -n p_i p_j </math>,

und für den Korrelationskoeffizienten (nach Pearson) folgt:

<math> \varrho(X_i,X_j) = -\sqrt{\frac{p_i}{1-p_i}\frac{p_j}{1-p_j}} </math>.

Wahrscheinlichkeitserzeugende Funktion

Die multivariate wahrscheinlichkeitserzeugende Funktion ist

<math>m_X(t)=\left( \sum_{i=1}^k p_i t_i \right)^n</math>

Beispiel

In einer Schulklasse sind 31 Schüler, 12 aus Dorf A, 11 aus Dorf B und 8 aus Dorf C. Jeden Tag wird ein Schüler ausgelost, der die Tafel wischen muss. Wie groß ist die Wahrscheinlichkeit, dass in einer Woche kein Schüler aus Dorf A, zwei Schüler aus Dorf B und 3 Schüler aus Dorf C die Tafel wischen müssen? Es ist <math> n_\mathrm{A}=0 , n_\mathrm{B}=2, n_\mathrm{C}=3 </math> und <math> p_\mathrm{A}= \frac{12}{31}, p_\mathrm{B}= \frac{11}{31}, p_\mathrm{C}= \frac{8}{31} </math>, da jeder Schüler gleich wahrscheinlich gezogen werden soll. Dann ist <math> M((0,2,3),p_\mathrm{A},p_\mathrm{B},p_\mathrm{C})=\frac{5!}{0!2!3!} \left(\frac{11}{31}\right)^2\left(\frac{8}{31}\right)^3 = \frac{10\cdot 11^2 \cdot 8^3}{31^5} \approx 0 {,}022</math>

Beziehung zu anderen Verteilungen

Beziehung zur Binomialverteilung

Im Spezialfall <math>k=2</math> ergibt sich die Binomialverteilung, genauer ist <math>M(n,(p,1-p))</math> die gemeinsame Verteilung von <math>X</math> und <math>n-X</math> für eine <math>B(n,p)</math>-verteilte Zufallsvariable <math>X</math>.

Beziehung zur multivariaten hypergeometrischen Verteilung

Die Multinomialverteilung und die multivariate hypergeometrische Verteilung sind miteinander verwandt, da sie aus demselben Urnenmodell hervorgehen. Einziger Unterschied ist, dass bei der multivariaten hypergeometrischen Verteilung ohne Zurücklegen gezogen wird. Die multivariate hypergeometrische Verteilung lässt sich unter gewissen Umständen durch die Multinomialverteilung approximieren, siehe hierfür den Artikel über die multivariate hypergeometrische Verteilung.

Siehe auch

Literatur

  • Norbert Henze: Stochastik für Einsteiger, Wiesbaden: Vieweg 1997, 11. Auflage Springer Spektrum 2016, ISBN 978-3-658-14738-9, {{#invoke:Vorlage:Handle|f|scheme=doi|class=plainlinks|parProblem=Problem|errCat=Wikipedia:Vorlagenfehler/Parameter:DOI|errClasses=error editoronly|errHide=1|errNS=0 4 10 100}}, S. 144-147
  • Ulrich Krengel: Einführung in die Wahrscheinlichkeitstheorie und Statistik. 8. Auflage, Vieweg, 2005. ISBN 978-3-834-80063-3
  • Hans-Otto Georgii: Stochastik: Einführung in die Wahrscheinlichkeitstheorie und Statistik, 4. Auflage, de Gruyter, 2009. ISBN 978-3-110-21526-7
  • Christian Hesse: Angewandte Wahrscheinlichkeitstheorie: eine fundierte Einführung mit über 500 realitätsnahen Beispielen und Aufgaben, Vieweg, Braunschweig/Wiesbaden 2003, ISBN 978-3-528-03183-1.

Weblinks

<templatestyles src="BoxenVerschmelzen/styles.css" />

{{#if:Navigationsleiste DUWahrscheinlichkeitsverteilungen‎ |{{safesubst:#ifeq:0|10| {{#switch: Multinomialverteilung |Navigationsleiste|NaviBlock|0=|#default= Vorlage:Templatetransclusioncheck Vorlage:Dokumentation/ruler }}}}Vorlage:Klappleiste/Anfang {{#if:

|
 |

Diskrete univariate Verteilungen für endliche Mengen:
Benford | Bernoulli | beta-binomial | binomial | Dirac | diskret uniform | empirisch | hypergeometrisch | kategorial | negativ hypergeometrisch | Rademacher | verallgemeinert binomial | Zipf | Zipf-Mandelbrot | Zweipunkt

Diskrete univariate Verteilungen für unendliche Mengen:
Boltzmann | Conway-Maxwell-Poisson | discrete-Phase-Type | erweitert negativ binomial | Gauss-Kuzmin | gemischt Poisson | geometrisch | logarithmisch | negativ binomial | parabolisch-fraktal | Poisson | Skellam | verallgemeinert Poisson | Yule-Simon | Zeta }} Vorlage:Klappleiste/Ende}}{{#if:Navigationsleiste KUWahrscheinlichkeitsverteilungen‎ |{{safesubst:#ifeq:0|10| {{#switch: Multinomialverteilung |Navigationsleiste|NaviBlock|0=|#default= Vorlage:Templatetransclusioncheck Vorlage:Dokumentation/ruler }}}}Vorlage:Klappleiste/Anfang {{#if:

|
 |

Kontinuierliche univariate Verteilungen mit kompaktem Intervall:
Beta | Cantor | Kumaraswamy | raised Cosine | Dreieck | Trapez | U-quadratisch | stetig uniform | Wigner-Halbkreis

Kontinuierliche univariate Verteilungen mit halboffenem Intervall:
Beta prime | Bose-Einstein | Burr | Chi | Chi-Quadrat | Coxian | Erlang | Exponential | Extremwert | F | Fermi-Dirac | Folded normal | Fréchet | Gamma | Gamma-Gamma | verallgemeinert invers Gauß | halblogistisch | halbnormal | Hartman-Watson | Hotellings T-Quadrat | hyper-exponentiale | hypoexponential | invers Chi-Quadrat | scale-invers Chi-Quadrat | Invers Normal | Invers Gamma | Kolmogorow-Verteilung | Lévy | log-normal | log-logistisch | Maxwell-Boltzmann | Maxwell-Speed | Nakagami | nichtzentriert Chi-Quadrat | Pareto | Phase-Type | Rayleigh | relativistisch Breit-Wigner | Rice | Rosin-Rammler | shifted Gompertz | truncated normal | Type-2-Gumbel | Weibull | Wilks’ Lambda

Kontinuierliche univariate Verteilungen mit unbeschränktem Intervall:
Cauchy | Extremwert | exponential Power | Fishers z | Fisher-Tippett (Gumbel) | generalized hyperbolic | Hyperbolic-secant | Landau | Laplace | alpha-stabil | logistisch | normal (Gauß) | normal-invers Gauß’sch | Skew-normal | Studentsche t | Type-1-Gumbel | Variance-Gamma | Voigt }} Vorlage:Klappleiste/Ende}}{{#if:Navigationsleiste MUWahrscheinlichkeitsverteilungen‎ |{{safesubst:#ifeq:0|10| {{#switch: Multinomialverteilung |Navigationsleiste|NaviBlock|0=|#default= Vorlage:Templatetransclusioncheck Vorlage:Dokumentation/ruler }}}}Vorlage:Klappleiste/Anfang {{#if:

|
 |

Diskrete multivariate Verteilungen:
Dirichlet compound multinomial | Ewens | gemischt Multinomial | multinomial | multivariat hypergeometrisch | multivariat Poisson | negativmultinomial | Pólya/Eggenberger | polyhypergeometrisch

Kontinuierliche multivariate Verteilungen:
Dirichlet | GEM | generalized Dirichlet | multivariat normal | multivariat Student | normalskaliert invers Gamma | Normal-Gamma | Poisson-Dirichlet

Multivariate Matrixverteilungen:
Gleichverteilung auf der Stiefel-Mannigfaltigkeit | Invers Wishart | Matrix Beta | Matrix Gamma | Matrix invers Beta | Matrix invers Gamma | Matrix Normal | Matrix Student-t | Matrix-Von-Mises-Fisher-Verteilung | Normal-invers-Wishart | Normal-Wishart | Wishart }}

Vorlage:Klappleiste/Ende}}{{#if:|{{{{{4}}}}}}}{{#if:|{{{{{5}}}}}}}{{#if:|{{{{{6}}}}}}}{{#if:|{{{{{7}}}}}}}{{#if:|{{{{{8}}}}}}}{{#if:|{{{{{9}}}}}}}{{#if:|{{{{{10}}}}}}}{{#if:|{{{{{11}}}}}}}{{#if:|{{{{{12}}}}}}}{{#if:|{{{{{13}}}}}}}{{#if:|{{{{{14}}}}}}}{{#if:|{{{{{15}}}}}}}{{#if:|{{{{{16}}}}}}}{{#if:|{{{{{17}}}}}}}{{#if:|{{{{{18}}}}}}}{{#if:|{{{{{19}}}}}}}{{#if:|{{{{{20}}}}}}}{{#if:|
Zu viele Navigationsleisten (>20)
}}