Arithmetisches Mittel
Das arithmetische Mittel, auch arithmetischer Mittelwert genannt (umgangssprachlich auch Durchschnitt), ist der gebräuchlichste Mittelwert. Er wird berechnet, indem die Summe der betrachteten Zahlen durch ihre Anzahl geteilt wird. Wie andere Mittelwerte beschreibt er das Zentrum einer Verteilung durch eine Zahl. Das arithmetische Mittel ist ein wichtiger Lageparameter in der Statistik.
Das arithmetische Mittel einer Stichprobe wird auch empirischer Mittelwert genannt.<ref>{{#invoke:Vorlage:Literatur|f}}</ref>
Definition
Das arithmetische Mittel einer Stichprobe mit Beobachtungswerten <math>x_1,x_2,\ldots, x_n</math> ist definiert als die Summe der Beobachtungswerte geteilt durch die Anzahl der Beobachtungen:<ref>{{#invoke:Vorlage:Literatur|f}}</ref>
- <math> \overline x := \frac{x_1 + x_2 + \cdots + x_n}{n} = \frac1n \sum_{i=1}^n{x_i}</math>.
Das Symbol <math>\overline x</math> spricht man als „<math>x</math> quer“. Wird das arithmetische Mittel nicht gewichtet (siehe Abschnitt Gewichtetes arithmetisches Mittel), dann wird es auch als einfaches arithmetisches Mittel oder ungewichtetes arithmetisches Mittel bezeichnet.
Zum Beispiel ist das arithmetische Mittel der beiden Zahlen <math>1</math> und <math>2</math>
- <math>\overline x = \frac{1+2}{2} = 1{,}5</math>.
Das arithmetische Mittel beschreibt das Zentrum einer Verteilung durch eine Zahl und stellt somit einen Lageparameter dar. Das arithmetische Mittel ist sinnvoll für metrische Merkmale definiert. Im Allgemeinen ist es für qualitative Merkmale nicht geeignet, jedoch liefert es für dichotome Merkmale mit zwei Kategorien <math>k_1=0</math> und <math>k_2=1</math> eine sinnvolle Interpretation. In diesem Fall ist das arithmetische Mittel identisch mit der relativen Häufigkeit <math>f_2=f(k_2)</math>.<ref>Ludwig Fahrmeir, Rita Künstler, Iris Pigeot, Gerhard Tutz: Statistik. Der Weg zur Datenanalyse. 8., überarb. und erg. Auflage. Springer Spektrum, Berlin / Heidelberg 2016, ISBN 978-3-662-50371-3, S. 49.</ref> Gelegentlich wird zur Bezeichnung des arithmetischen Mittels auch das Durchschnittszeichen <math>\varnothing</math> verwendet. Das arithmetische Mittel ist im Gegensatz zum empirischen Median anfällig gegenüber Ausreißern (siehe Median). Das arithmetische Mittel kann als „Mittelpunkt“ der Messwerte interpretiert werden. Es gibt allerdings keine Auskunft darüber, wie stark die Messwerte um das arithmetische Mittel streuen. Dieses Problem kann mit der Einführung der „mittleren quadratischen Abweichung“ vom arithmetischen Mittel, der empirischen Varianz, behoben werden.
Arithmetisches Mittel bei Häufigkeitsdaten
Für Häufigkeitsdaten mit den Ausprägungen <math>a_1, a_2,\ldots, a_k</math> und den dazugehörigen absoluten Häufigkeiten <math>H_1,H_2, \ldots, H_k</math> ergibt sich das arithmetische Mittel als<ref>{{#invoke:Vorlage:Literatur|f}}</ref><ref>{{#invoke:Vorlage:Literatur|f}}</ref>
- <math> \overline x = \frac{1}{n} (a_1 H_1 + a_2 H_2 + \cdots + a_k H_k)=\frac{1}{n}\sum_{j=1}^k{a_j H_j}</math>
mit
- <math> n = \sum_{j=1}^k{H_j}</math>.
Das arithmetische Mittel lässt sich auch mithilfe der relativen Häufigkeiten <math>h_1, h_2, \ldots , h_k</math> berechnen:<ref>{{#invoke:Vorlage:Literatur|f}}</ref><ref name="L. Fahrmeir, R. Künstler u. a. 2016">Ludwig Fahrmeir, Rita Künstler, Iris Pigeot, Gerhard Tutz: Statistik. Der Weg zur Datenanalyse. 8., überarb. und erg. Auflage. Springer Spektrum, Berlin / Heidelberg 2016, ISBN 978-3-662-50371-3, S. 50.</ref>
- <math>\overline x = a_1 h_1 + a_2 h_2 + \cdots + a_k h_k = \sum_{j=1}^k a_j h_j</math>.
Die Ausprägungen werden also mit den relativen Häufigkeiten gewichtet und aufsummiert.
Arithmetisches Mittel bei Schichtenbildung
Bei einer geschichteten Stichprobe lässt sich das arithmetische Mittel für die Gesamterhebung aus den arithmetischen Mitteln in den Schichten berechnen: Ist eine Erhebungsgesamtheit <math>E</math> vom Umfang <math>n</math> in <math>r</math> Schichten <math>E_1,E_2, \ldots, E_r</math> mit jeweiligen Umfängen <math>n_1,n_2,\ldots,n_r</math> und arithmetischen Mitteln <math>\overline x_1,\overline x_2,\ldots,\overline x_r</math> zerlegt, so gilt für das arithmetische Mittel <math>\overline x</math> in <math>E</math><ref name="L. Fahrmeir, R. Künstler u. a. 2016" />
- <math> \overline x = \frac{1}{n} (n_1 \overline x_1 + n_2 \overline x_2 + \cdots + n_r \overline x_r)=\frac{n_1}{n}\cdot \overline x_1 + \frac{n_2}{n}\cdot \overline x_2 + \cdots + \frac{n_r}{n}\cdot \overline x_r</math>.
Das arithmetische Mittel der Gesamterhebung ist also das gewichtete arithmetische Mittel der Mittelwerte <math>\overline x_1,\overline x_2,\ldots,\overline x_r</math>, wobei die Gewichte die relativen Größen der Schichten in der Erhebnungsgesamtheit widerspiegeln.
Rekursive Darstellung des arithmetischen Mittels
Bei der Betrachtung stationärer stochastischer Prozesse, bei denen die Daten <math>x_k</math> in einer zeitlich geordneten Reihenfolge erfasst werden, bietet es sich an, eine Rekursions-Formel zur Berechnung des arithmetischen Mittelwertes zu verwenden. Diese lässt sich direkt anhand der Grundformel des arithmetischen Mittelwertes herleiten. Wie in der angegebenen Formel ersichtlich werden für kleine <math>n</math> die Daten <math>x_k</math> stärker gewichtet und für große <math>n</math> der zuvor berechnete arithmetische Mittelwert. Der Vorteil der Rekursions-Formel ist, dass die Daten <math>x_k</math> nicht gespeichert werden müssen, was sich z. B. bei Anwendungen auf einem Microcontroller anbietet.
- <math>\overline{x}_{n+1} = \frac{n}{n+1}\cdot \overline{x}_{n} + \frac{1}{n+1} \cdot x_{n+1}, \quad \overline{x}_0 = x_0, \quad n = 0, 1, 2, ...</math>
eite <math>h_n=\tfrac{b-a}{n}</math> das arithmetische MittelEin erster Schritt, diese rekursive Variante des arithmetischen Mittelwertes auch für zeitvariable stochastische Prozesse verwendbar zu machen, ist die Einführung eines sogenannten Vergessens-Faktors <math>\gamma</math>. Zeitvariabel bedeutet hier, dass der tatsächliche Erwartungswert in Abhängigkeit der Zeit variiert. Typischerweise ist davon auszugehen, dass die Scharmittelwerte den zeitlichen Mittelwerten entsprechen. Die Einführung des Vergessens-Faktors führt dazu, dass die Rekursions-Gleichung auf solche Änderungen reagieren kann. Eine Möglichkeit ist z. B. eine prozentuale Gewichtung des Grenzwertes für <math>n\rightarrow \infty</math>:
- <math>\overline{x}_{n+1} = \frac{\gamma \cdot n}{n+1} \cdot \overline{x}_n + \left( (1 - \gamma) + \frac{1}{n+1} \right) \cdot x_{n+1} , \quad \overline{x}_0 = x_0, \quad n = 0, 1, 2, ... \; , \quad \gamma \lesssim 1</math>
Zur Umgehung der rationalen Terme in Abhängigkeit von <math>n</math>, lässt sich diese Gleichung auch direkt im Grenzwert <math>n \rightarrow \infty </math> wie folgt angeben:
- <math>\overline{x}_{n+1} = \gamma \cdot \overline{x}_n + (1 - \gamma) \cdot x_{n+1} , \quad \overline{x}_0 = x_0, \quad n = 0, 1, 2, ... \; , \quad \gamma \lesssim 1</math>
Ob diese Vorgehensweise in einer bestimmten Anwendung praktikabel ist, gilt es natürlich zu klären. Zu beachten ist, dass sich durch die Verwendung des Grenzwertes ein anderes „Einschwingverhalten“ ergibt. Von systemtheoretischer (bzw. regelungstechnischer) Warte aus betrachtet, wird eine solche Rekursionsgleichung auch als zeitdiskretes PT1-Glied bezeichnet. In der praktischen Umgangssprache würde man den Parameter <math>\gamma</math>, so wie er hier beschrieben ist, als „Fummel-Faktor“ bezeichnen, was zum Vorschein bringen soll, dass dieser zunächst einmal nicht optimal gewählt ist. Weiterführend zu diesem Thema sind das Kalman-Filter, das Wiener-Filter, der rekursive Least-Square-Algorithmus, das Maximum-Likelihood-Verfahren und generell Optimalfilter zu nennen.
Nebenstehend ist exemplarisch das Verhalten der hier angegebenen Rekursions-Gleichungen, bei einem einfachen instationären, stochastischen Prozess (bereichsweise normalverteilt) zu sehen. Im Verlaufe der Zeit weisen der Erwartungswert sowie die Varianz der Zufalls-Daten ein sprunghaftes Verhalten auf. Die einfache Rekursionsgleichung ohne Vergessensfaktor (Arithmetic Mean 1) reagiert nur sehr träge auf das Verhalten des Datensatzes. Wohingegen die Rekursionsgleichungen mit Vergessensfaktor (Arithmetic Mean 2 und 3, <math>\gamma = 0{,}988</math>) deutlich schneller reagieren. Es fällt weiterhin auf, dass die Algorithmen mit Vergessensfaktor zu einem etwas größeren Rauschen führen. In diesem Beispiel sollte jedoch klar sein, dass die schnellere Reaktionszeit Vorrang hat. Die Ergebnisse „Arithmetic Mean 2“ und „Arithmetic Mean 3“ unterscheiden sich hier nur sehr gering voneinander. Je nach Datensatz, vor allem je nach Menge an Daten, kann dies deutlich anders aussehen.
Eigenschaften
Ersatzwerteigenschaft
Direkt aus der Definition des arithmetischen Mittels folgt
- <math>\sum_{i=1}^n{x_i}=n\overline{x}</math>.
Wenn man das arithmetische Mittel mit dem Stichprobenumfang <math>n</math> multipliziert, dann erhält man die Merkmalssumme.<ref>Horst Degen, Peter Lorscheid: Statistik-Lehrbuch: mit Wirtschafts- und Bevölkerungsstatistik. S. 42.</ref> Diese Rechenregel wird als Ersatzwerteigenschaft oder Hochrechnungseigenschaft bezeichnet und oft bei mathematischen Beweisen verwendet. Sie kann wie folgt interpretiert werden: Die Summe aller <math>n</math> Einzelwerte kann man sich ersetzt denken durch <math>n</math> gleiche Werte von der Größe des arithmetischen Mittels.
Schwerpunkteigenschaft
Die Abweichungen <math>\nu_i</math> der Messwerte <math>x_i</math> vom Mittelwert <math>\overline x</math>
- <math>\nu_i= x_i - \overline{x} \quad i=1,\ldots,n</math>
werden auch als „scheinbare Fehler“ bezeichnet. Die Schwerpunkteigenschaft (auch Nulleigenschaft genannt) besagt, dass die Summe der scheinbaren Fehler bzw. die Summe der Abweichungen aller beobachteten Messwerte vom arithmetischen Mittel gleich Null ist, also
- <math>\sum\nolimits_{i=1}^n \nu_i=\sum_{i=1}^n \left(x_i - \overline{x}\right)=0 </math> beziehungsweise im Häufigkeitsfall <math>\sum_{i=1}^n \left(x_i - \overline{x}\right)f_i=0 </math>.
Dies lässt sich mithilfe der Ersatzwerteigenschaft wie folgt zeigen:
- <math>\sum_{i=1}^n \left(x_i - \overline{x}\right) =\sum_{i=1}^n x_i-\sum_{i=1}^n \overline{x}=n\overline{x}-n\overline{x}=0 </math>
Die Schwerpunkteigenschaft spielt für das Konzept der Freiheitsgrade eine große Rolle. Aufgrund der Schwerpunkteigenschaft des arithmetischen Mittels <math>\sum\nolimits_{i=1}^n \left(x_i - \bar{x}\right)=0</math> ist die letzte Abweichung <math>\left(x_n-\overline x\right)</math> bereits durch die ersten <math>(n-1)</math> bestimmt. Folglich variieren nur <math>(n-1)</math> Abweichungen frei und man mittelt deshalb, z. B. bei der empirischen Varianz, indem man durch die Anzahl der Freiheitsgrade <math>(n-1)</math> dividiert.<ref>Ludwig Fahrmeir, Rita Künstler, Iris Pigeot, Gerhard Tutz: Statistik. Der Weg zur Datenanalyse. 8., überarb. und erg. Auflage. Springer Spektrum, Berlin / Heidelberg 2016, ISBN 978-3-662-50371-3, S. 65.</ref>
Optimalitätseigenschaft
{{#if: Empirische Risikominimierung|{{#ifexist:Empirische Risikominimierung|
|{{#if: |{{#ifexist:{{{2}}}|
|{{#if: |{{#ifexist:{{{3}}}|
|}}|}}|}}|}}|}}|Einbindungsfehler: Die Vorlage Hauptartikel benötigt immer mindestens ein Argument.}}
In der Statistik ist man oft daran interessiert die Summe der Abweichungsquadrate <math>Q</math> von einem Zentrum zu minimieren. Wenn man das Zentrum durch einen Wert <math>z</math> auf der horizontalen Achse festlegen will, der die Summe der quadratischen Abweichungen
- <math>Q(z;x_1,\ldots,x_n)=\sum_{i=1}^n \left(x_i - z\right)^2</math>
zwischen Daten <math>x_1,\ldots,x_n</math> und Zentrum <math>z</math> minimiert, dann ist <math>z=\overline x</math> der minimierende Wert. Dieses Resultat kann durch einfaches Ableiten der Zielfunktion <math>Q</math> nach <math>z</math> gezeigt werden:
- <math>\frac{\partial \, Q(z;x_1,\ldots,x_n)}{\partial\, z} = -2\sum_{i=1}^n (x_i - z) \;\overset \mathrm{!} = \; 0 \Rightarrow z= \overline x </math>.
Dies ist ein Minimum, da die zweite Ableitung von <math>Q</math> nach <math>z</math> gleich 2, also größer als 0 ist, was eine hinreichende Bedingung für ein Minimum ist.
Daraus ergibt sich die folgende Optimalitätseigenschaft (auch Minimierungseigenschaft genannt):
- <math>\sum_{i=1}^n \left(x_i - \overline x\right)^2< \sum_{i=1}^n \left(x_i - z\right)^2</math> für alle <math>z \ne \overline x\;</math><ref name="ReferenceA">Ludwig Fahrmeir, Rita Künstler, Iris Pigeot, Gerhard Tutz: Statistik. Der Weg zur Datenanalyse. 8., überarb. und erg. Auflage. Springer Spektrum, Berlin / Heidelberg 2016, ISBN 978-3-662-50371-3, S. 54.</ref> oder anders ausgedrückt <math>\underset{ z\in \R}{\arg\min}\,\sum_{i=1}^n \left(x_i - z\right)^2= \overline x</math>.<ref><math>\arg\min(\cdot)</math> bezeichnet analog zu <math>\arg\max(\cdot)</math>(Argument des Maximums) das Argument des Minimums</ref>
Lineare Transformationseigenschaft
Je nach Skalenniveau ist das arithmetische Mittel äquivariant gegenüber speziellen Transformationen. Werden die Beobachtungswerte <math>x_i</math> linear in <math>y_i = a + b \cdot x_i</math> transformiert, so gilt für das arithmetische Mittel der transformierten y-Werte<ref name="ReferenceA" />
- <math> \overline y = a + b \cdot \overline x</math>,
da
- <math>\overline y = \frac{1}{n}\sum_{i=1}^n y_i = \frac{1}{n}\sum_{i=1}^n(a+b\cdot x_i) = a + b \cdot \overline x</math>.
Dreiecksungleichungen
{{#if: Ungleichung vom arithmetischen und geometrischen Mittel|{{#ifexist:Ungleichung vom arithmetischen und geometrischen Mittel|
|{{#if: |{{#ifexist:{{{2}}}|
|{{#if: |{{#ifexist:{{{3}}}|
|}}|}}|}}|}}|}}|Einbindungsfehler: Die Vorlage Hauptartikel benötigt immer mindestens ein Argument.}}
Für das arithmetische Mittel gilt die folgende Dreiecksungleichung: Das arithmetische Mittel von <math>n</math> positiven Merkmalsausprägungen <math>x_i>0</math> ist größer oder gleich dem geometrischen Mittel dieser Merkmalsausprägungen, also
- <math>\frac{x_1 +x_2+\ldots +x_n}{n} \geq \sqrt[n]{x_1 \cdot x_2\cdot\ldots \cdot x_n}</math>.
Die Gleichheit ist nur gegeben, wenn alle Merkmalsausprägungen gleich sind. Weiterhin gilt für den Absolutbetrag des arithmetischen Mittels mehrerer Merkmalsausprägungen, dass er kleiner oder gleich dem quadratischen Mittel ist:
- <math>\left|\frac{x_1 +x_2+\ldots +x_n}{n}\right|\leq\sqrt{\frac{x_1^2+x_2^2+\ldots+x_n^2}{n}}</math>.<ref>I. N. Bronstein, K. A. Semendjajew u. a.: Taschenbuch der Mathematik. 2. Auflage. 1995, S. 19 ff.</ref>
Beispiele
Standardbeispiele
Einfache Beispiele
- Das arithmetische Mittel aus 50 und 100 ist <math>\quad \overline{x} = \frac{50+100}{2} = 75</math>.
- Das arithmetische Mittel aus 8, 5 und −1 ist <math>\quad \overline{x} = \frac{ 8 + 5 + \left ( -1 \right ) }{3} = 4 </math>.
Durchschnittspreis
Ein kleiner Lebensmittelladen möchte alle Sorten Kartoffeln zum gleichen Preis verkaufen. Die Kartoffeln kosten je nach Sorte und Menge unterschiedlich viel. Um den durchschnittlichen Preis der Kartoffeln zu berechnen, wird die Methode der Berechnung des arithmetischen Mittels für Häufigkeitsdaten verwendet. Dabei sind die unterschiedlichen Mengen die absoluten Häufigkeiten und die unterschiedlichen Preise die Häufigkeiten, für die der Mittelwert berechnet wird.
| Sorte | Adretta (mk) | Agata (vfk) | Linda (fk) | insgesamt |
|---|---|---|---|---|
| Menge | 25 kg | 25 kg | 100 kg | 150 kg |
| pro kg | 1,80 € | 2,00 € | 2,20 € | 2,10 € |
- <math> \overline x =\frac {1}{150\,\mathrm{kg}} \cdot \left(25\,\mathrm{kg}\cdot1{,}80\,\euro + 25\,\mathrm{kg}\cdot2{,}00\,\euro + 100\,\mathrm{kg}\cdot2{,}20\,\euro \right) = \frac{1}{150} \cdot \left( 45\,\euro + 50\,\euro + 220\,\euro \right) = \frac {315\,\euro}{150} = 2{,}10\,\euro</math>
Der Lebensmittelladen kann also alle 150 kg Kartoffeln zu 2,10 € pro kg verkaufen und erzielt damit den gleichen Umsatz (315 €) als wenn er die unterschiedlichen Preise für jede Sorte genommen hätte.
Geschwindigkeitsvergleich
Ein Auto fährt eine Stunde lang 100 km/h und die darauf folgende Stunde 200 km/h. Mit welcher konstanten Geschwindigkeit muss ein anderes Auto fahren, um denselben Weg ebenfalls in zwei Stunden zurückzulegen?
Der Weg <math>s_1</math>, den das erste Auto insgesamt zurückgelegt hat, beträgt
- <math>s_1 = 100\,\mathrm{km/h} \cdot 1\,\mathrm{h} + 200\,\mathrm{km/h} \cdot 1\,\mathrm{h}</math>
und der des zweiten Autos
- <math>s_2 = v_2 \cdot 2\,\mathrm{h},</math>
wobei <math>v_2</math> die Geschwindigkeit des zweiten Autos ist. Aus <math>s_1 = s_2</math> ergibt sich
- <math>v_2 \cdot 2\,\mathrm{h} = 100\,\mathrm{km/h} \cdot 1\,\mathrm{h} + 200\,\mathrm{km/h} \cdot 1\,\mathrm{h}</math>
und damit
- <math>v_2 = \frac{100\,\mathrm{km/h}\cdot 1\,\mathrm{h} + 200\,\mathrm{km/h} \cdot 1\mathrm{h}}{2\,\mathrm{h}} = \frac{100\,\mathrm{km} + 200\,\mathrm{km}}{2\,\mathrm{h}} = 150\,\mathrm{km/h}.</math>
Komplexeres Beispiel (Notengebung)
Die Bildung arithmetischer Mittel aus Schulnoten kann in bestimmten Fällen auf den ersten Blick paradox erscheinen.
Angenommen, eine Endnote setzt sich zu jeweils 50 Prozent aus zwei Teilnoten zusammen, den Klassenarbeiten einerseits und der sonstigen Mitarbeit andererseits.
Das nachfolgende Beispiel zeigt, wie in diesem Fall die Endnote berechnet wird:
- Aus den Noten 4, 3 und 6 der Klassenarbeiten wird das arithmetische Mittel <math>\frac{4+3+6}{3}=4{,}\overline{3}</math> ermittelt.
- Aus den Noten 3, 1, 2, 4, 1, 3, 2, 3, 5 und 3 der sonstigen Mitarbeit ergibt sich das arithmetische Mittel <math>\frac{3+1+2+4+1+3+2+3+5+3}{10} = 2{,}70</math>.
- Aus den beiden arithmetischen Mitteln berechnet sich die Endnote zu <math>\frac{4{,}\overline{3}+2{,}70}{2} = 3{,}51\overline{6}</math>.
Vergleicht man nun die Teilnote der sonstigen Mitarbeit mit derjenigen vor Erteilung der letzten 3, so wäre die Teilnote geringfügig besser, nämlich <math>\frac{3+1+2+4+1+3+2+3+5}{9} = 2{,}\overline{6}</math>.
Damit hätte sich die Endnote ergeben als <math>\frac{4{,}\overline{3}+2{,}\overline{6}}{2}=3{,}50</math>.
Die Endnote 3,50 hat sich somit durch die letzte 3 in der sonstigen Mitarbeit nicht verbessert, sondern auf <math>3{,}51\overline{6}</math> verschlechtert.
Bei oberflächlicher Betrachtung erscheint dies paradox. Die Gesamtverschlechterung ist jedoch dadurch begründet, dass bei Betrachtung der Teilnote für die sonstige Mitarbeit die letzte Einzelnote 3 das arithmetische Mittel <math>2{,}\overline{6}</math> zwangsläufig verschlechtert, nämlich von <math>2{,}\overline{6}</math> auf 2,70.<ref>Stefan Schwarz: Notenparadoxon - Wie gute Noten zu schlechten Zensuren führen aus: Alexander Blinne, Matthias Müller, Konrad Schöbel (Hrsg.): Was wäre die Mathematik ohne die Wurzel? Springer Spektrum, Springer Fachmedien Wiesbaden 2017, ISBN 978-3-658-14758-7, DOI:10.1007/978-3-658-14759-4, S. 201–204</ref>
Gewichtetes arithmetisches Mittel
Das gewichtete (auch gewogene) arithmetische Mittel erweitert den Anwendungsbereich des einfachen arithmetischen Mittels auf Werte mit unterschiedlicher Gewichtung. Ein Beispiel ist die Berechnung einer Schulnote, in die mündliche und schriftliche Leistungen unterschiedlich stark einfließen. Bei Anwendung der Richmannsche Mischungsregel zur Bestimmung der Mischtemperatur zweier Körper aus gleichem Material wird ebenfalls ein gewichtetes arithmetisches Mittel berechnet.
Deskriptive Statistik
Das gewichtete Mittel wird beispielsweise verwendet, wenn man Mittelwerte <math>\overline{x}_i</math>, <math>i=1,\dots, n</math> aus <math>n</math> Stichproben der gleichen Grundgesamtheit mit verschiedenen Stichprobenumfängen <math>w_i</math> miteinander kombinieren will:
- <math> \overline{x} = \frac{\sum_{i=1}^n{w_i \cdot \overline{x}_i}}{\sum_{i=1}^n w_i} </math>.
Wahrscheinlichkeitsrechnung
Stichprobenmittel
{{#if: Stichprobenmittel|{{#ifexist:Stichprobenmittel|
|{{#if: |{{#ifexist:{{{2}}}|
|{{#if: |{{#ifexist:{{{3}}}|
|}}|}}|}}|}}|}}|Einbindungsfehler: Die Vorlage Hauptartikel benötigt immer mindestens ein Argument.}}
Die konkreten Merkmalausprägungen <math>x_1,x_2,\ldots, x_n</math> lassen sich als Realisierungen von Zufallsvariablen <math>X_1,X_2,\ldots, X_n</math> auffassen. Jeder <math>x_i</math>-Wert stellt somit nach der Ziehung der Stichprobe eine Realisierung der jeweiligen Zufallsvariablen <math>X_i</math> dar. Das arithmetische Mittel dieser Zufallsvariablen
- <math> \overline{X} = \frac{1}{n} \sum_{i=1}^n X_i</math>
wird auch als Stichprobenmittel bezeichnet und ist ebenfalls eine Zufallsvariable.
Inverse Varianzgewichtung
Sind die <math>X_i</math> unabhängig verteilte Zufallsvariablen (d. h. <math>X_1</math> ist eine Zufallsvariable mit den Zufallsvariablen <math>X_{11}, \dots, X_{1n}</math> und <math>X_2</math> ist eine Zufallsvariable mit den Zufallsvariablen <math>X_{21},\dots,X_{2m}</math>) mit gemeinsamem Erwartungswert <math>\mu</math> aber unterschiedlichen Varianzen <math>\sigma_i^2</math>, so hat der gewichtete Mittelwert ebenfalls Erwartungswert <math>\mu</math> und seine Varianz beträgt
- <math>\sigma^2_{\overline{x}} = \frac{\sum_{i=1}^n w_i^2\sigma_i^2}{\left(\sum_{i=1}^n w_i\right)^2}</math>.
Wählt man als Gewicht <math> w_i = 1/\sigma_{i}^2</math>, so vereinfacht sich die Varianz zu
- <math>\sigma^2_{\overline{x}} = \frac{\sum_{i=1}^n \frac{1}{\sigma_i^4}\sigma_i^2}{\left(\sum_{i=1}^n \frac{1}{\sigma_i^2}\right)^2} = \frac{\sum_{i=1}^n \frac{1}{\sigma_i^2}}{\left(\sum_{i=1}^n \frac{1}{\sigma_i^2}\right)^2} = \frac{1}{\sum_{i=1}^n\frac{1}{\sigma_i^2}}</math>.
Aus der Cauchy-Schwarzschen Ungleichung folgt
- <math>\left(\sum_{i=1}^n w_i^2\sigma_i^2\right)\cdot\left(\sum_{i=1}^n\frac{1}{\sigma_i^2}\right)\geq \left(\sum_{i=1}^n w_i\right)^2</math>.
Die Wahl der Gewichte <math> w_i = 1/\sigma_{i}^2</math> oder eine Wahl proportional dazu minimiert also die Varianz <math> \sigma^2_{\overline{x}}</math> des gewichteten Mittels. Mit dieser Formel lassen sich die Gewichte <math>w_i</math> abhängig von der Varianz des jeweiligen Wertes, der dementsprechend den Mittelwert mehr oder weniger stark beeinflusst, zweckmäßig wählen.
Unabhängig und identisch verteilte Zufallsvariablen
Sind <math>X_1, \dotsc, X_n</math> Zufallsvariablen, die unabhängig und identisch verteilt mit Erwartungswert <math>\mu</math> und Varianz <math>\sigma^2</math> sind, so hat der Stichprobenmittel <math>\overline{X}:=\frac{1}{n}\sum\nolimits_{i=1}^n X_i</math> ebenfalls den Erwartungswert <math>\mu</math>, aber die kleinere Varianz <math>Var(\overline{X}) = \sigma^2/n</math> (siehe Standardfehler). Hat also eine Zufallsvariable endlichen Erwartungswert und endliche Varianz, so folgt aus der Tschebyscheff-Ungleichung, dass das arithmetische Mittel einer Stichprobe gegen den Erwartungswert der Zufallsvariablen stochastisch konvergiert. Das arithmetische Mittel ist daher nach vielen Kriterien eine geeignete Schätzung für den Erwartungswert der Verteilung, aus der die Stichprobe stammt.
Sind die <math>X_i</math> speziell Stichprobenmittelwerte vom Umfang <math>n_i</math> aus derselben Grundgesamtheit, so hat <math>X_i</math> die Varianz <math>\sigma^2/n_i</math>, also ist die Wahl <math>w_i=n_i</math> optimal.
Gewichtetes arithmetisches Mittel als Erwartungswert
Im Falle einer diskreten Zufallsvariable <math>X</math> mit abzählbar endlichem Träger ergibt sich der Erwartungswert der Zufallsvariable <math>\operatorname E(X)</math> als
- <math>\operatorname E(X)=p_1 x_1 +p_2 x_2 + \ldots + p_n x_n</math>.
Hierbei ist <math>p_i=P(X=x_i)</math> die Wahrscheinlichkeit, dass <math>X</math> den Wert <math>x_i</math> annimmt. Dieser Erwartungswert kann als ein gewichtetes Mittel der Werte <math>x_1,x_2,\ldots,x_n</math> mit den Wahrscheinlichkeiten <math>p_i \;(i=1,\ldots,n)</math> interpretiert werden. Bei Gleichverteilung gilt <math>p_1=p_2=\ldots=p_n=1/n</math> und somit wird <math>\operatorname E(X)</math> zum arithmetischen Mittel der Werte <math>x_i</math><ref>I. N. Bronstein, K. A. Semendjajew u. a.: Taschenbuch der Mathematik. 2. Auflage. 1995, S. 629.</ref>
- <math> \operatorname E(X)= \frac{1}{n} (x_1 + x_2 + \ldots + x_n)=\frac1n \sum_{i=1}^n{x_i}= \overline x</math>.
Beispiele für gewichtete Mittelwerte
Ein Bauer stellt im Nebenerwerb 100 kg Butter her. 10 kg kann er für 10 €/kg verkaufen, weitere 10 kg für 6 €/kg und den Rest muss er für 3 €/kg abgeben. Zu welchem (gewichteten) Durchschnittspreis hat er seine Butter verkauft? Lösung: <math>\frac\mathrm{10\; kg \cdot 10\; \euro /kg + 10 \; kg \cdot 6 \;\euro/kg + 80 \; kg \cdot 3 \;\euro/kg}\mathrm{10 \; kg + 10 \; kg + 80 \; kg} = 4\;\mathrm{\euro/kg} </math>. Der mit der jeweils verkauften Menge gewichtete Durchschnittspreis entspricht also dem fixen Preis, zu dem die Gesamtmenge verkauft werden müsste, um den gleichen Erlös zu erzielen wie beim Verkauf von Teilmengen zu wechselnden Preisen.
Das arithmetische Mittel <math>\overline{x}_1</math> der <math>n_1=3</math> Zahlen 1, 2 und 3 beträgt 2, das arithmetische Mittel <math>\overline{x}_2</math> der <math>n_2=2</math> Zahlen 4 und 5 beträgt 4,5. Das arithmetische Mittel aller 5 Zahlen ergibt sich als mit dem Stichprobenumfang gewichteter Mittelwert der Teilmittelwerte:
- <math>\overline{x}=\frac{n_1\overline{x}_1+n_2\overline{x}_2}{n_1+n_2}=\frac{3\frac{1+2+3}{3}+2\frac{4+5}{2}}{3+2}=\frac{6+9}{3+2}=3=\frac{1+2+3+4+5}{5}.</math>
Liegen die Beobachtungen als klassierte Häufigkeit vor, kann man das arithmetische Mittel näherungsweise als gewichtetes Mittel bestimmen, wobei die Klassenmitten als Wert und der Klassenumfang als Gewicht zu wählen sind. Sind beispielsweise in einer Schulklasse ein Kind in der Gewichtsklasse 20 bis 25 kg, 7 Kinder in der Gewichtsklasse 25 bis 30 kg, 8 Kinder in der Gewichtsklasse 30 bis 35 kg und 4 Kinder in der Gewichtsklasse 35 bis 40 kg, so lässt sich das Durchschnittsgewicht als
- <math>\frac{1 \cdot 22{,}5 + 7 \cdot 27{,}5 + 8 \cdot 32{,}5 + 4 \cdot 37{,}5}{1 + 7 + 8 + 4} = \frac{625}{20} = 31{,}25</math>
abschätzen. Um die Güte dieser Schätzung zu ermitteln, muss man dann den minimal / maximal möglichen Mittelwert ermitteln, indem man pro Intervall die kleinsten / größten Werte zugrunde legt. Damit ergibt sich dann, dass der tatsächliche Mittelwert zwischen 28,75 kg und 33,75 kg liegt. Der Fehler der Schätzung 31,25 beträgt also maximal ±2,5 kg oder ±8 %.
Der Mittelwert einer Funktion
Der Mittelwert einer Lebesgue-integrierbaren (bzgl. des Lebesgue-Maßes) <math>f\colon[a,b]\to\R</math> ist definiert durch
- <math>\overline{f}:=\frac{1}{b-a}\int_a^b f(x)\, \mathrm{d}x\,.</math>
Falls <math>f</math> zusätzlich Riemann-integrierbar ist, ist die Bezeichnung „Mittelwert“ ist insofern gerechtfertigt, als für äquidistante Zerlegungen <math>\{x_0,x_1, x_2,\dotsc, x_n\}</math> des Intervalls mit der Schrittweite <math>h_n=\tfrac{b-a}{n}</math> das arithmetische Mittel
- <math>m_n(f):=\frac{1}{n}(f(x_1)+f(x_2)+\ldots+f(x_n))=\frac{1}{b-a}\sum_{k=1}^nf(x_k)h_n</math>
für <math>n \to \infty </math> gegen <math>\overline{f}\;</math> konvergiert.<ref name="Heuser 1">H. Heuser: Lehrbuch der Analysis. Teil 1. 8. Auflage. Teubner, Stuttgart 1990, ISBN 3-519-12231-6.</ref>
Ist <math>f\;</math> stetig, so besagt der Mittelwertsatz der Integralrechnung, dass es ein <math>\xi\in[a,b]</math> gibt mit <math>f(\xi)=\overline{f}</math>, die Funktion nimmt also an mindestens einer Stelle ihren Mittelwert an.
Der Mittelwert bzgl. einer positiven Gewichtungsfunktion <math>w</math> (wobei <math>w</math> auf <math>[a,b]</math> integrierbar ist mit <math> \textstyle 0< \int_a^b w(x)< \infty</math>) einer integrierbare funktion <math>f(x)</math> ist definiert durch
- <math> \overline{f} := \frac{\int_a^b f(x) w(x)\, \mathrm{d}x}{\int_a^b w(x)\, \mathrm{d}x} </math>.
Allgemein lässt sich auf Maßraum <math>(\Omega, \mathcal A, \mu)</math> mit endlichem Maß <math>\mu(\Omega)\in (0, \infty)</math> der Mittelwert einer <math>\mu</math>-integrierbaren Funktion <math>f</math> mittels des Lebesgue-Integrals definieren
- <math>\overline{f}:=\frac{1}{\mu(\Omega)}\int_\Omega f\,\mathrm{d}\mu\,
</math>.
Diese Definition ist eine Verallgemeinerung des gewichteten Mittels. Sind <math>\mu</math>, <math>\nu</math> nichttriviale endliche Maße auf <math>(\Omega, \mathcal A)</math> und ist <math>\nu</math> absolut stetig bezüglich <math>\mu</math> (in Zeichen <math>\nu \ll \mu </math>) so lässt sich der Mittelwert bzgl. <math>\nu</math> auch als gewichteter Mittelwert bzgl. <math>\mu</math> auffassen
- <math>\overline f = \frac{1}{\nu(\Omega)}\int_\Omega f\, \mathrm d\nu = \frac{\int_\Omega f \cdot w\, \mathrm d\mu}{\int_\Omega w\, \mathrm d\mu}
</math>, wobei <math>\textstyle w := \dfrac{\mathrm d \nu}{\mathrm d \mu}
</math> die Radon-Nikodým-Dichte von <math>\nu
</math> bezüglich <math>\mu
</math> ist. Ist <math>\mu
</math> das Zählmaß auf <math> (\{1,\dots, n\}, \mathfrak P(\{1,\dots, n\}))
</math> so erhält man die Definition des gewichteten arithmetischen Mittels bzl. <math>w
</math>. Ist <math>\mu
</math> das Lebesgue-Maß auf <math>([a,b], \mathcal B([a,b])) </math> so erhält man die Definition des gewichteten Mittelwerts bzgl. <math>w
</math> für Funktionen.
Handelt es sich bei <math>\mu</math> um ein Wahrscheinlichkeitsmaß, gilt also <math>\mu(\Omega)=1\;</math>, so entspricht die Definition des Mittelwerts von <math>f</math> gerade der des Erwartungswerts:
- <math>\overline{f}= \mathbb E_{\mu} [f] =\int_\Omega f\,\mathrm{d}\mu</math>.
Der Mittelwert einer Funktion hat in Physik und Technik erhebliche Bedeutung insbesondere bei periodischen Funktionen der Zeit, siehe Gleichwert.
Quasi-arithmetischer Mittelwert (f-Mittel)
Sei <math>f</math> eine auf einem reellen Intervall <math>I</math> streng monotone stetige (und daher invertierbare) Funktion und seien
- <math>w_i, 0\leq w_i\leq 1, \sum_i w_i =1</math>
Gewichtsfaktoren. Dann ist für <math>x_i\in I</math> das mit den Gewichten <math>w_i</math> gewichtete quasi-arithmetische Mittel definiert als
- <math>\overline{x}_f = f^{-1}\left(\sum_{i=1}^n w_i f(x_i)\right)</math>.
Offensichtlich gilt
- <math>\min(x_i)\leq \overline{x}_f \leq\max(x_i).</math>
Für <math>f(x)=x</math> erhält man das arithmetische, für <math>f(x)=\log(x)</math> das geometrische Mittel und für <math>f(x)=x^k</math> das <math>k</math>-Potenzmittel.
Dieser Mittelwert lässt sich auf das gewichtete quasi-arithmetische Mittel einer Funktion <math>x</math> verallgemeinern, wobei <math>f</math> in einem die Bildmenge von <math>x</math> umfassenden Intervall streng monoton und stetig sei:
- <math> \overline{x}_f = f^{-1}\left(\frac{\int f(x(t)) w(t)\, \mathrm{d}t}{\int w(t)\, \mathrm{d}t}\right) </math>
Siehe auch
Weblinks
|1|= – Lern- und Lehrmaterialien |0|-= |X|x={{#switch: 0
|0|4|10|12|14|100=}}
|#default= – -
}}{{#if: | ({{#invoke:Multilingual|format|{{{lang}}}|slang=!|shift=m}}) }}{{#invoke:TemplatePar|check
|opt= 1= 2= lang= suffix= |template=Vorlage:Wikibooks |cat=Wikipedia:Vorlagenfehler/Schwesterprojekt }}
|1|= – Lern- und Lehrmaterialien |0|-= |X|x={{#switch: 0
|0|4|10|12|14|100=}}
|#default= – Lageparameter
}}{{#if: | ({{#invoke:Multilingual|format|{{{lang}}}|slang=!|shift=m}}) }}{{#invoke:TemplatePar|check
|opt= 1= 2= lang= suffix= |template=Vorlage:Wikibooks |cat=Wikipedia:Vorlagenfehler/Schwesterprojekt }}
Einzelnachweise
<references />
{{#ifeq: s | p | | {{#if: 4143009-8 | |
}} }}{{#ifeq:||{{#if: | [[Kategorie:Wikipedia:GND fehlt {{#invoke:Str|left|{{{GNDCheck}}}|7}}]] }}{{#if: | {{#if: | | }} }} }}{{#if: | {{#ifeq: 0 | 2 | | }} }}{{#if: | {{#ifeq: 0 | 2 | | }} }}{{#ifeq: s | p | {{#if: 4143009-8 | | {{#if: {{#statements:P227}} | | }} }} }}{{#ifeq: s | p | {{#if: 4143009-8 | {{#if: {{#invoke:Wikidata|pageId}} | {{#if: {{#statements:P227}} | | }} }} }} }}{{#ifeq: s | p | {{#if: | | {{#if: {{#statements:P244}} | | }} }} }}{{#ifeq: s | p | {{#if: | {{#if: {{#invoke:Wikidata|pageId}} | {{#if: {{#statements:P244}} | | }} }} }} }}{{#ifeq: s | p | {{#if: | | {{#if: {{#statements:P214}} | | }} }} }}{{#ifeq: s | p | {{#if: | {{#if: {{#invoke:Wikidata|pageId}} | {{#if: {{#statements:P214}} | | }} }} }} }}Vorlage:Wikidata-Registrierung
- Wikipedia:Vorlagenfehler/Schwesterprojekt
- Wikipedia:GND fehlt
- Wikipedia:Normdaten-TYP falsch oder fehlend
- Wikipedia:GND in Wikipedia fehlt, in Wikidata vorhanden
- Wikipedia:GND in Wikipedia vorhanden, fehlt jedoch in Wikidata
- Wikipedia:LCCN in Wikipedia fehlt, in Wikidata vorhanden
- Wikipedia:LCCN in Wikipedia vorhanden, fehlt jedoch in Wikidata
- Wikipedia:VIAF in Wikipedia fehlt, in Wikidata vorhanden
- Wikipedia:VIAF in Wikipedia vorhanden, fehlt jedoch in Wikidata
- Mittelwert