Schätzproblem

Ein Schätzproblem ist ein Begriff aus der mathematischen Statistik, der die Schätztheorie als statistisches Entscheidungsproblem auffasst und alle für die Schätzung relevanten Informationen zusammenfasst. Dazu gehört, welche Werte die Daten annehmen, welche Wahrscheinlichkeitsmaße in Betracht gezogen werden, welche Eigenschaften der betrachteten Wahrscheinlichkeitsmaße geschätzt werden sollen und wie groß der Schaden ist, der durch einen Schätzfehler entsteht.

Definition

Ein Schätzproblem ist ein Quadrupel

({\mathcal {M}},E,g,L)

bestehend aus

Einem statistischen Modell ${\mathcal {M}}=({\mathcal {X}},{\mathcal {A}},(P_{\vartheta })_{\vartheta \in \Theta })$
Einem Entscheidungsraum $E=(\Delta ,{\mathcal {A}}_{\Delta })$ .
Einer zu schätzenden Funktion

g\colon \Theta \to \Delta

Einer Verlustfunktion

L\colon \Theta \times \Delta \to \mathbb {R}

Erläuterungen

Das Schätzproblem fasst alle relevanten Informationen über die Schätzung zusammen:

Das statistische Modell liefert Informationen darüber, welche Werte die Daten annehmen (Werte in ${\mathcal {X}}$ ). Des Weiteren enthält ${\mathcal {A}}$ alle Mengen, denen Wahrscheinlichkeiten zugeordnet werden sollen. Hierbei wird das Mengensystem kanonisch gewählt. Die Familie $(P_{\vartheta })_{\vartheta \in \Theta }$ enthält alle Wahrscheinlichkeitsmaße, welche in der gegebenen Situation als relevant erachtet werden. So kommen bei der Untersuchung eines Würfelwurfs andere Wahrscheinlichkeitsmaße in Frage als für die Untersuchung von Schuhgrößen.
Der Entscheidungsraum $E$ ist ein spezieller Messraum und enthält alle Informationen darüber, für was man sich entscheiden kann. Will man den Parameter einer Bernoulli-Verteilung schätzen, so ist jede Schätzung eine Entscheidung. Für Entscheidungen kommen in diesem Fall folglich alle Zahlen zwischen null und eins in Frage. Anders sieht es bei der Schätzung des Erwartungswertes einer Normalverteilung aus: Hier kommt jede reelle Zahl als Schätzung und damit als Entscheidung in Frage. Somit ist hier der Entscheidungsraum größer.
Die Funktion $g$ , welche im parametrischen Fall auch Parameterfunktion genannt wird, ordnet jedem $\vartheta \in \Theta$ eine Entscheidung zu, oft besteht sogar, wie in den folgenden Beispielen, eine funktionale Abhängigkeit von $P_{\vartheta }$ . Sie gibt an, was geschätzt werden soll, so dass hinterher untersucht werden kann, wie weit die Schätzung abweicht. Ein typisches Beispiel ist die Funktion, die jedem $\vartheta$ den Erwartungswert $\operatorname {E} (P_{\vartheta })$ zuordnet. Alternativ könnte sie auch jedem $\vartheta$ den entsprechenden Median zuordnen.
Die Verlustfunktion ordnet einer Entscheidung $e$ aus dem Entscheidungsraum in Abhängigkeit von $\vartheta$ eine reelle Zahl zu, die angibt, wie groß der Schaden durch die Entscheidung für $e$ ist, wenn $\vartheta$ vorliegt. Sie wird dann zur Risikofunktion erweitert, mit der sich verschiedene Schätzer und Entscheidungsregeln vergleichen lassen.

Beispiel Erwartungswertschätzung

Ein typischer Fall eines Schätzproblems ist die Schätzung des Erwartungswertes einer Wahrscheinlichkeitsverteilung bei $n$ unabhängig wiederholten Versuchen. Dabei betrachtet man meist die Menge ${\mathcal {X}}=\mathbb {R} ^{n}$ , versehen mit der σ-Algebra ${\mathcal {A}}={\mathcal {B}}(\mathbb {R} ^{n})$ . Verfügt man über keine weiteren Informationen, so definiert man zuerst die Familie $(P_{\vartheta })_{\vartheta \in \Theta }$ aller Wahrscheinlichkeitsmaße auf $\mathbb {R}$ mit endlichem Erwartungswert und betrachtet dann deren n-fache Produktmaße. (Die Schreibweise $(P_{\vartheta })_{\vartheta \in \Theta }$ als indizierte Familie wirkt hier unnatürlich und ist aus Gründen einer einheitliche Darstellung beibehalten. In diesem Fall würde man $\Theta$ selbst als Menge aller betrachteten Wahrscheinlichkeitsmaße wählen und $P_{\vartheta }=\vartheta$ setzen.)

Das statistische Modell ist also gegeben durch

{\mathcal {M}}=(\mathbb {R} ^{n},{\mathcal {B}}(\mathbb {R} ^{n}),(P_{\vartheta }^{\otimes n})_{\vartheta \in \Theta })

.

Der Entscheidungsraum ist lautet

E=(\mathbb {R} ,{\mathcal {B}}(\mathbb {R} ))

,

denn die Entscheidung entspricht der Schätzung des Erwartungswertes und dieser ist eine reelle Zahl.

Die zu schätzende Funktion ist dann

g(\vartheta )=\operatorname {E} (P_{\vartheta })

.

Sie ordnet jedem $\vartheta$ den Erwartungswert des zugehörigen Wahrscheinlichkeitsmaßes $P_{\vartheta }$ zu.

Eine mögliche Verlustfunktion wäre der Gauß-Verlust, der durch

L(e,\vartheta )=(e-g(\vartheta ))^{2}

gegeben ist.

Literatur

Ludger Rüschendorf: Mathematische Statistik. Springer Verlag, Berlin Heidelberg 2014, ISBN 978-3-642-41996-6, S. 20, doi:10.1007/978-3-642-41997-3.
Friedrich Liese, Klaus-J. Miescke: Statistical Decision Theory. Estimation, Testing, and Selection. Springer-Verlag, New York 2008, ISBN 978-0-387-73193-3, S. 107, doi:10.1007/978-0-387-73194-0.

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. The authors of the article are listed here. Additional terms may apply for the media files, click on images to show image meta data.