Arithmetisches Mittel

Das arithmetische Mittel, a​uch arithmetischer Mittelwert genannt (umgangssprachlich a​uch als Durchschnitt bezeichnet) i​st ein Begriff i​n der Statistik. Es i​st ein Lageparameter. Man berechnet diesen Mittelwert, i​ndem man d​ie Summe d​er betrachteten Zahlen d​urch ihre Anzahl teilt.
Das arithmetische Mittel e​iner Stichprobe w​ird auch empirischer Mittelwert genannt.[1]

Definition

Die Hälfte der Summe zweier Größen und ist gegeben durch:

.

Da die Größen eine arithmetische Folge bilden, wird die Merkmalssumme der Merkmalsausprägungen dividiert durch die Anzahl der Merkmalsträger

als „arithmetisches Mittel“ (lies: quer) bezeichnet. Wird das arithmetische Mittel nicht gewichtet (siehe auch Abschnitt Gewichtetes arithmetisches Mittel), dann wird es auch als einfaches arithmetisches Mittel oder ungewichtetes arithmetisches Mittel bezeichnet.

Zum Beispiel ist das arithmetische Mittel der beiden Zahlen und :

.

Das arithmetische Mittel beschreibt das Zentrum einer Verteilung durch einen numerischen Wert und stellt somit einen Lageparameter dar. Das arithmetische Mittel ist sinnvoll für beliebige metrische Merkmale definiert. Im Allgemeinen ist es für qualitative Merkmale nicht geeignet, jedoch liefert es für dichotome Merkmale mit zwei Kategorien und eine sinnvolle Interpretation. In diesem Fall ist das arithmetische Mittel identisch mit der relativen Häufigkeit .[2] Gelegentlich wird zur Bezeichnung des arithmetischen Mittels auch das Durchschnittszeichen ø verwendet. Das arithmetische Mittel ist im Gegensatz zum empirischen Median sehr anfällig gegenüber Ausreißern (siehe Median). Das arithmetische Mittel kann als „Mittelpunkt“ der Messwerte interpretiert werden. Es gibt allerdings keine Auskunft darüber, wie stark die Messwerte um das arithmetische Mittel streuen. Dieses Problem kann mit der Einführung der „mittleren quadratischen Abweichung“ vom arithmetischen Mittel, der empirischen Varianz, behoben werden.

Definition für Häufigkeitsdaten

Für Häufigkeitsdaten mit den Ausprägungen und den dazugehörigen relativen Häufigkeiten ergibt sich das arithmetische Mittel als[3][4][5]

mit

Arithmetisches Mittel bei Schichtenbildung

Bei Vorliegen einer geschichteten Stichprobe, deren arithmetischen Mittel in Schichten bekannt sind, lässt sich das arithmetische Mittel für die Gesamterhebung berechnen. Es sei eine Erhebungsgesamtheit mit Merkmalsträgern in Schichten mit der jeweiligen Anzahl an Merkmalsträgern und arithmetischen Mitteln eingeteilt. Das arithmetische Mittel in ist dann definiert durch[3]

.

Rekursive Darstellung des arithmetischen Mittels

Bei der Betrachtung stationärer stochastischer Prozesse, bei denen die Daten in einer zeitlich geordneten Reihenfolge erfasst werden, bietet es sich an, eine Rekursions-Formel zur Berechnung des arithmetischen Mittelwertes zu verwenden. Diese lässt sich direkt anhand der Grundformel des arithmetischen Mittelwertes herleiten. Wie in der angegebenen Formel ersichtlich werden für kleine die Daten stärker gewichtet und für große der zuvor berechnete arithmetische Mittelwert. Der Vorteil der Rekursions-Formel ist, dass die Daten nicht gespeichert werden müssen, was sich z. B. bei Anwendungen auf einem Microcontroller anbietet.

Ein erster Schritt, diese rekursive Variante des arithmetischen Mittelwertes auch für zeitvariable stochastische Prozesse verwendbar zu machen, ist die Einführung eines sogenannten Vergessens-Faktors . Zeitvariabel bedeutet hier, dass der tatsächliche Erwartungswert in Abhängigkeit der Zeit variiert. Typischerweise ist davon auszugehen, dass die Scharmittelwerte den zeitlichen Mittelwerten entsprechen. Die Einführung des Vergessens-Faktors führt dazu, dass die Rekursions-Gleichung auf solche Änderungen reagieren kann. Eine Möglichkeit ist z. B. eine prozentuale Gewichtung des Grenzwertes für :

Zur Umgehung der rationalen Terme in Abhängigkeit von , lässt sich diese Gleichung auch direkt im Grenzwert wie folgt angeben:

Ob diese Vorgehensweise in einer bestimmten Anwendung praktikabel ist, gilt es natürlich zu klären. Zu beachten ist, dass sich durch die Verwendung des Grenzwertes ein anderes "Einschwingverhalten" ergibt. Von systemtheoretischer (bzw. regelungstechnischer) Warte aus betrachtet, wird eine solche Rekursionsgleichung auch als zeitdiskretes PT1-Glied bezeichnet. In der praktischen Umgangssprache würde man den Parameter , so wie er hier beschrieben ist, als "Fummel-Faktor" bezeichnen, was zum Vorschein bringen soll, dass dieser zunächst einmal nicht optimal gewählt ist. Weiterführend zu diesem Thema sind das Kalman-Filter, das Wiener-Filter, der rekursive Least-Square-Algorithmus, das Maximum-Likelihood-Verfahren und generell Optimalfilter zu nennen.

Vergleich der rekursiven arithmetischen Mittelwerte mit und ohne Vergessensfaktor bei einem einfachen zeitvariablen stochastischen Prozess

Nebenstehend ist exemplarisch das Verhalten der hier angegebenen Rekursions-Gleichungen, bei einem einfachen instationären, stochastischen Prozess (bereichsweise normalverteilt) zu sehen. Im Verlaufe der Zeit weisen der Erwartungswert sowie die Varianz der Zufalls-Daten ein sprunghaftes Verhalten auf. Die einfache Rekursionsgleichung ohne Vergessensfaktor (Arithmetic Mean 1) reagiert nur sehr träge auf das Verhalten des Datensatzes. Wohingegen die Rekursionsgleichungen mit Vergessensfaktor (Arithmetic Mean 2 & 3, ) deutlich schneller reagieren. Es fällt weiterhin auf, dass die Algorithmen mit Vergessensfaktor zu einem etwas größeren Rauschen führen. In diesem Beispiel sollte jedoch klar sein, dass die schnellere Reaktionszeit Vorrang hat. Die Ergebnisse "Arithmetic Mean 2" und "Arithmetic Mean 3" unterscheiden sich hier nur sehr gering voneinander. Je nach Datensatz, vor allem je nach Menge an Daten, kann dies deutlich anders aussehen.

Eigenschaften

Ersatzwerteigenschaft

Direkt a​us der Definition d​es arithmetischen Mittels folgt, dass

.

Wenn man das arithmetische Mittel mit dem Stichprobenumfang multipliziert, dann erhält man die Merkmalssumme.[6] Diese Rechenregel wird als Ersatzwerteigenschaft oder Hochrechnungseigenschaft bezeichnet und oft bei mathematischen Beweisen verwendet. Sie kann wie folgt interpretiert werden: Die Summe aller Einzelwerte kann man sich ersetzt denken durch gleiche Werte von der Größe des arithmetischen Mittels.

Schwerpunkteigenschaft

Die Abweichungen der Messwerte vom Mittelwert

werden a​uch als „scheinbare Fehler“ bezeichnet. Die Schwerpunkteigenschaft (auch Nulleigenschaft genannt) besagt, d​ass die Summe d​er scheinbaren Fehler bzw. d​ie Summe d​er Abweichungen a​ller beobachteten Messwerte v​om arithmetischen Mittel gleich Null ist, also

beziehungsweise im Häufigkeitsfall .

Dies lässt s​ich mithilfe d​er Ersatzwerteigenschaft w​ie folgt zeigen:

Die Schwerpunkteigenschaft spielt für das Konzept der Freiheitsgrade eine große Rolle. Aufgrund der Schwerpunkteigenschaft des arithmetischen Mittels ist die letzte Abweichung bereits durch die ersten bestimmt. Folglich variieren nur Abweichungen frei und man mittelt deshalb, z. B. bei der empirischen Varianz, indem man durch die Anzahl der Freiheitsgrade dividiert.[7]

Optimalitätseigenschaft

In der Statistik ist man oft daran interessiert die Summe der Abweichungsquadrate von einem Zentrum zu minimieren. Wenn man das Zentrum durch einen Wert auf der horizontalen Achse festlegen will, der die Summe der quadratischen Abweichungen

zwischen Daten und Zentrum minimiert, dann ist der minimierende Wert. Dieses Resultat kann durch einfaches Ableiten der Zielfunktion nach gezeigt werden:

.

Dies ist ein Minimum, da die zweite Ableitung von nach gleich 2, also größer als 0 ist, was eine hinreichende Bedingung für ein Minimum ist.

Daraus ergibt s​ich die folgende Optimalitätseigenschaft (auch Minimierungseigenschaft genannt):

für alle [8] oder anders ausgedrückt [9]

Lineare Transformationseigenschaft

Je n​ach Skalenniveau i​st das arithmetische Mittel äquivariant gegenüber speziellen Transformationen. Es g​ilt für d​ie lineare Transformation[8]

,

da

.

Dreiecksungleichungen

Für das arithmetische Mittel gilt die folgende Dreiecksungleichung: Das arithmetische Mittel von positiven Merkmalsausprägungen ist größer oder gleich dem geometrischen Mittel dieser Merkmalsausprägungen, also

.

Die Gleichheit i​st nur gegeben, w​enn alle Merkmalsausprägungen gleich sind. Weiterhin g​ilt für d​en Absolutbetrag d​es arithmetischen Mittels mehrerer Merkmalsausprägungen, d​ass er kleiner o​der gleich d​em quadratischen Mittel ist

.[10]

Beispiele

Einfache Beispiele

  • Das arithmetische Mittel aus 50 und 100 ist
  • Das arithmetische Mittel aus 8, 5 und −1 ist

Klassenspiegel, Notenspiegel, Zensurenspiegel

Häufig w​ird in Schulklassen b​ei Klassenarbeiten o​der Tests e​in Klassendurchschnitt m​it Hilfe e​ines Klassenspiegels berechnet (auch Noten- o​der Zensurenspiegel genannt). Der Klassenspiegel i​st eine Tabelle m​it zwei Zeilen. In d​er oberen Zeile stehen d​ie möglichen Zensuren v​on 1 b​is 6. In d​er Zeile darunter w​ird die Anzahl d​er Schüler eingetragen, d​ie diese Zensur erreicht haben:

Beispiel für einen Klassenspiegel
Zensur123456Anzahl SchülerDurchschnitt
Schüler359420232,87

Der Klassendurchschnitt w​ird mit Hilfe d​er Formel für d​ie Berechnung d​es arithmetischen Mittels für Häufigkeitsdaten berechnet.

Anwendungsbeispiel

Ein Auto fährt e​ine Stunde l​ang 100 km/h u​nd die darauf folgende Stunde 200 km/h. Mit welcher konstanten Geschwindigkeit m​uss ein anderes Auto fahren, u​m denselben Weg ebenfalls i​n zwei Stunden zurückzulegen?

Der Weg , den das erste Auto insgesamt zurückgelegt hat, beträgt

und d​er des zweiten Autos

wobei die Geschwindigkeit des zweiten Autos ist. Aus ergibt sich

und damit

Gewichtetes arithmetisches Mittel

Es lässt s​ich auch e​in gewichtetes arithmetisches Mittel definieren (auch a​ls gewogenes arithmetisches Mittel bezeichnet). Es erweitert d​en Anwendungsbereich d​es einfachen arithmetischen Mittels a​uf Werte m​it unterschiedlicher Gewichtung. Ein Beispiel i​st die Berechnung e​iner Schulnote, i​n die mündliche u​nd schriftliche Leistungen unterschiedlich s​tark einfließen. Bei Anwendung d​er Richmannsche Mischungsregel z​ur Bestimmung d​er Mischtemperatur zweier Körper a​us gleichem Material w​ird ebenfalls e​in gewichtetes arithmetisches Mittel berechnet.

Deskriptive Statistik

Das gewichtete Mittel wird beispielsweise verwendet, wenn man Mittelwerte , aus Stichproben der gleichen Grundgesamtheit mit verschiedenen Stichprobenumfängen miteinander kombinieren will:

.

Stichprobenmittel

Die konkreten Merkmalausprägungen lassen sich als Realisierungen von Zufallsvariablen auffassen. Jeder -Wert stellt somit nach der Ziehung der Stichprobe eine Realisierung der jeweiligen Zufallsvariablen dar. Das arithmetische Mittel dieser Zufallsvariablen

wird a​uch als Stichprobenmittel bezeichnet u​nd ist ebenfalls e​ine Zufallsvariable.

Inverse Varianzgewichtung

Sind die unabhängig verteilte Zufallsvariablen (d. h. ist eine Zufallsvariable mit den Zufallsvariablen und ist eine Zufallsvariable mit den Zufallsvariablen ) mit gemeinsamem Erwartungswert aber unterschiedlichen Varianzen , so hat der gewichtete Mittelwert ebenfalls Erwartungswert und seine Varianz beträgt

.

Wählt man als Gewicht , so vereinfacht sich die Varianz zu

.

Aus d​er Cauchy-Schwarzschen Ungleichung folgt

.

Die Wahl der Gewichte oder eine Wahl proportional dazu minimiert also die Varianz des gewichteten Mittels. Mit dieser Formel lassen sich die Gewichte abhängig von der Varianz des jeweiligen Wertes, der dementsprechend den Mittelwert mehr oder weniger stark beeinflusst, zweckmäßig wählen.

Unabhängig und identisch verteilte Zufallsvariablen

Sind Zufallsvariablen, die unabhängig und identisch verteilt mit Erwartungswert und Varianz sind, so hat der Stichprobenmittel ebenfalls den Erwartungswert , aber die kleinere Varianz (siehe Standardfehler). Hat also eine Zufallsvariable endlichen Erwartungswert und endliche Varianz, so folgt aus der Tschebyscheff-Ungleichung, dass das arithmetische Mittel einer Stichprobe gegen den Erwartungswert der Zufallsvariablen stochastisch konvergiert. Das arithmetische Mittel ist daher nach vielen Kriterien eine geeignete Schätzung für den Erwartungswert der Verteilung, aus der die Stichprobe stammt.

Sind die speziell Stichprobenmittelwerte vom Umfang aus derselben Grundgesamtheit, so hat die Varianz , also ist die Wahl optimal.

Gewichtetes arithmetisches Mittel als Erwartungswert

Im Falle einer diskreten Zufallsvariable mit abzählbar endlichem Träger ergibt sich der Erwartungswert der Zufallsvariable als

.

Hierbei ist die Wahrscheinlichkeit, dass den Wert annimmt. Dieser Erwartungswert kann als ein gewichtetes Mittel der Werte mit den Wahrscheinlichkeiten interpretiert werden. Bei Gleichverteilung gilt und somit wird zum arithmetischen Mittel der Werte [11]

.

Beispiele für gewichtete Mittelwerte

Ein Bauer stellt im Nebenerwerb 100 kg Butter her. 10 kg kann er für 10 €/kg verkaufen, weitere 10 kg für 6 €/kg und den Rest muss er für 3 €/kg abgeben. Zu welchem (gewichtetem) Durchschnittspreis hat er seine Butter verkauft? Lösung: (10 kg · 10 €/kg + 10 kg · 6 €/kg + 80 kg · 3 €/kg) / (10 kg + 10 kg + 80 kg) = 400 € / 100 kg = 4 €/kg. Der mit der jeweils verkauften Menge gewichtete Durchschnittspreis entspricht also dem fixen Preis, zu dem die Gesamtmenge verkauft werden müsste, um den gleichen Erlös zu erzielen wie beim Verkauf von Teilmengen zu wechselnden Preisen.

Das arithmetische Mittel der Zahlen 1, 2 und 3 beträgt 2, das arithmetische Mittel der Zahlen 4 und 5 beträgt 4,5. Das arithmetische Mittel aller 5 Zahlen ergibt sich als mit dem Stichprobenumfang gewichteter Mittelwert der Teilmittelwerte:

Liegen d​ie Beobachtungen a​ls klassierte Häufigkeit vor, k​ann man d​as arithmetische Mittel näherungsweise a​ls gewichtetes Mittel bestimmen, w​obei die Klassenmitten a​ls Wert u​nd der Klassenumfang a​ls Gewicht z​u wählen sind. Sind beispielsweise i​n einer Schulklasse e​in Kind i​n der Gewichtsklasse 20 b​is 25 kg, 7 Kinder i​n der Gewichtsklasse 25 b​is 30 kg, 8 Kinder i​n der Gewichtsklasse 30 b​is 35 kg u​nd 4 Kinder i​n der Gewichtsklasse 35 b​is 40 kg, s​o lässt s​ich das Durchschnittsgewicht als

abschätzen. Um die Güte dieser Schätzung zu ermitteln, muss man dann den minimal / maximal möglichen Mittelwert ermitteln, indem man pro Intervall die kleinsten / größten Werte zugrunde legt. Damit ergibt sich dann, dass der tatsächliche Mittelwert zwischen 28,75 kg und 33,75 kg liegt. Der Fehler der Schätzung 31,25 beträgt also maximal ±2,5 kg oder ±8 %.

Der Mittelwert einer Funktion

Als Mittelwert der Riemann-integrierbaren Funktion wird die Zahl

definiert.

Die Bezeichnung Mittelwert ist insofern gerechtfertigt, als für eine äquidistante Zerlegung des Intervalls mit der Schrittweite das arithmetische Mittel

gegen konvergiert.[12]

Ist stetig, so besagt der Mittelwertsatz der Integralrechnung, dass es ein gibt mit , die Funktion nimmt also an mindestens einer Stelle ihren Mittelwert an.

Der Mittelwert der Funktion mit dem Gewicht (wobei für alle ) ist

.

Für Lebesgue-Integrale im Maßraum mit einem endlichen Maß lässt sich der Mittelwert einer Lebesgue-integrierbaren Funktion als

definieren. Handelt es sich um einen Wahrscheinlichkeitsraum, gilt also , so nimmt der Mittelwert die Form

an; das entspricht genau dem Erwartungswert von .

Der Mittelwert e​iner Funktion h​at in Physik u​nd Technik erhebliche Bedeutung insbesondere b​ei periodischen Funktionen d​er Zeit, s​iehe Gleichwert.

Quasi-arithmetischer Mittelwert (f-Mittel)

Sei eine auf einem reellen Intervall streng monotone stetige (und daher invertierbare) Funktion und seien

Gewichtsfaktoren. Dann ist für das mit den Gewichten gewichtete quasi-arithmetische Mittel definiert als

.

Offensichtlich gilt

Für erhält man das arithmetische, für das geometrische Mittel und für das -Potenzmittel.

Dieser Mittelwert lässt sich auf das gewichtete quasi-arithmetische Mittel einer Funktion verallgemeinern, wobei in einem die Bildmenge von umfassenden Intervall streng monoton und stetig sei:

Siehe auch

Einzelnachweise

  1. Karl Bosch: Elementare Einführung in die angewandte Statistik. 8. Auflage. Vieweg, Wiesbaden 2005, S. 13.
  2. Ludwig Fahrmeir, Rita Künstler, Iris Pigeot, Gerhard Tutz: Statistik. Der Weg zur Datenanalyse. 8., überarb. und erg. Auflage. Springer Spektrum, Berlin / Heidelberg 2016, ISBN 978-3-662-50371-3, S. 49.
  3. Ludwig Fahrmeir, Rita Künstler, Iris Pigeot, Gerhard Tutz: Statistik. Der Weg zur Datenanalyse. 8., überarb. und erg. Auflage. Springer Spektrum, Berlin / Heidelberg 2016, ISBN 978-3-662-50371-3, S. 50.
  4. Lothar Sachs: Angewandte Statistik. Planung und Auswertung, Methoden und Modelle. 4. Auflage. Springer-Verlag, Berlin / Heidelberg / New York, ISBN 3-540-06443-5, S. 60.
  5. Lothar Sachs: Statistische Methoden. Ein Soforthelfer. 3., neubearbeitete Auflage. Springer-Verlag, Berlin / Heidelberg / New York, ISBN 3-540-07824-X, S. 28.
  6. Horst Degen, Peter Lorscheid: Statistik-Lehrbuch: mit Wirtschafts- und Bevölkerungsstatistik. S. 42.
  7. Ludwig Fahrmeir, Rita Künstler, Iris Pigeot, Gerhard Tutz: Statistik. Der Weg zur Datenanalyse. 8., überarb. und erg. Auflage. Springer Spektrum, Berlin / Heidelberg 2016, ISBN 978-3-662-50371-3, S. 65.
  8. Ludwig Fahrmeir, Rita Künstler, Iris Pigeot, Gerhard Tutz: Statistik. Der Weg zur Datenanalyse. 8., überarb. und erg. Auflage. Springer Spektrum, Berlin / Heidelberg 2016, ISBN 978-3-662-50371-3, S. 54.
  9. bezeichnet analog zu (Argument des Maximums) das Argument des Minimums
  10. I. N. Bronstein, K. A. Semendjajew u. a.: Taschenbuch der Mathematik. 2. Auflage. 1995, S. 19 ff.
  11. I. N. Bronstein, K. A. Semendjajew u. a.: Taschenbuch der Mathematik. 2. Auflage. 1995, S. 629.
  12. H. Heuser: Lehrbuch der Analysis. Teil 1. 8. Auflage. Teubner, Stuttgart 1990, ISBN 3-519-12231-6.
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. The authors of the article are listed here. Additional terms may apply for the media files, click on images to show image meta data.