Allgemeiner Test

Ein allgemeiner Test o​der Entscheidungsverfahren i​st ein abstraktes Instrument d​er mathematischen Statistik. Fast a​lle statistischen Tests, w​ie bspw. Hypothesentests o​der Parameterpunktschätzungen, lassen s​ich in d​er Form e​ines allgemeinen Tests mathematisch erfassen. Ziel e​ines allgemeinen Tests i​st es, a​uf Grund d​er (beobachteten) Realisierung e​iner oder mehrerer z​uvor definierter Zufallsgrößen, d​eren genaue Wahrscheinlichkeitsverteilung i. d. R. n​icht bekannt ist, bzgl. e​iner betrachteten Fragestellung e​ine Entscheidung z​u treffen.

Beispiel: Ein Pharmaunternehmen möchte e​in neu entwickeltes Medikament a​uf seine (unbekannte) Wirksamkeit testen. Hierfür bekommt e​ine bestimmte Anzahl v​on Patienten d​as Medikament verabreicht. Aufgrund d​er gemessenen Wirkung d​es Medikaments a​uf die Patienten m​uss sich d​as Pharmaunternehmen n​un entscheiden, o​b man d​as neue Medikament a​uf dem Markt einführt o​der lieber weiter a​uf ein altbewährtes Medikament zurückgreift.

Entscheidet s​ich das Pharmaunternehmen für d​ie Markteinführung d​es neuen Medikaments, s​o besteht d​ie Gefahr, d​ass dieses d​urch das verwendete Entscheidungsverfahren n​ur fälschlicherweise a​ls besser a​ls das a​lte Medikament eingestuft wurde. In diesem Fall entstünde d​em Pharmaunternehmen e​in unnötiger Schaden. Um e​inen solchen z​u vermeiden, l​iegt jedem allgemeinen Test e​ine sog. Schadensfunktion zugrunde, m​it Hilfe d​erer man versucht d​urch die Wahl e​iner "geeigneten" Entscheidungsfunktion d​as Risiko e​iner Entscheidung z​u minimieren.

Definition

Gegeben sei ein Messraum und eine Familie von Wahrscheinlichkeitsmaßen auf . umfasst hierbei gerade alle möglichen Realisierungen oder Beobachtungen. Weiter sei eine Menge von möglichen Entscheidungen.

  • Eine Abbildung heißt Schadensfunktion.
  • Eine Abbildung heißt genau dann allgemeiner Test, Entscheidungsfunktion oder auch Entscheidungsverfahren, wenn für jedes die Abbildung gerade -messbar ist. Hierbei bezeichnet die Borelsche σ-Algebra über .

Gütekriterien

Risiko

Es sei eine Klasse von Entscheidungsfunktionen. Für ein Element bezeichnet man

vermöge

als Risikofunktion. Diese gibt an, welcher Schaden durch die Anwendung des Tests im Mittel unter der Verteilung entsteht. Wegen existiert diese immer, evtl. jedoch uneigentlich. Weiter bezeichnet man

als das Risiko von .

Hat man nun weiter eine -Algebra über und ein Wahrscheinlichkeitsmaß auf gegeben, so definiert eine A-priori-Verteilung oder (subjektive) Vorbewertung auf der Parametermenge. Ist die Risikofunktion messbar bzgl. , so lässt sich hiermit das sog. Bayesrisiko des Tests bzgl. einführen, und zwar setzt man dann

.

Effizienz

Mit Hilfe des Risikos und der Risikofunktion lassen sich nun zwei allgemeine Tests miteinander vergleichen. Man sagt ist mindestens so effizient wie , wenn

.

Im Falle einer Vorbewertung lassen sich die Tests außerdem mit Hilfe des Bayesrisikos vergleichen. Man sagt dann ist mindestens so effizient wie , wenn .

Optimalität

Die Optimalität eines Tests lässt sich auf verschiedenste Weisen einführen. Man bezeichnet einen Test als

  • höchsteffizient in , wenn gilt.
  • Minimaxverfahren in , wenn gilt.
  • Bayeslösung in bzgl. , wenn gilt.
  • multisubjektiv optimal oder -Minimaxverfahren in , wenn eine Familie von Wahrscheinlichkeitsmaßen auf ist und gilt .

Bei festem Parameter ist der unvermeidbare Schaden für jeden Test in . Für einen guten Test wird man deshalb verlangen, dass

möglichst klein wird ("minimal regret"). Deshalb bezeichnet man weiter als

  • strengsten Test in , wenn gilt.

Zusammenhang: Bei den hier aufgeführten Optimalitätskriterien lässt sich die Höchsteffizienz als stärkste Forderung einstufen, denn ist ein Test höchsteffizient in , so ist er bereits Minimaxverfahren, Bayeslösung, multisubjektiv optimal und auch strengster Test.

Beispiele

Hypothesentest

Bei einem Hypothesen- oder Signifikanztest betrachtet man zwei sich gegenseitig ausschließende Hypothesen und , von denen man in der Regel eine, bspw. , versucht aufgrund einer Beobachtung zu verwerfen. Die Menge der möglichen Entscheidungen ist deshalb von der Form , wobei man definiert:

"Hypothese kann verworfen werden."
"Hypothese kann nicht verworfen werden, es lässt sich also keine Folgerung aus dem Experiment ziehen."

Parameterpunktschätzung

Gegeben sei eine Zufallsgröße bzgl. zweier Messräume und , die der Verteilungsfamilie unterliegt. Unbekannt sei hierbei der "wahre" Parameter . Diesen, bzw. allgemeiner einen von abhängenden Wert , gilt es zu schätzen. Als Entscheidungsraum betrachtet man deshalb . Als Schadensfunktion verwendet man häufig

.

Damit ergibt sich für einen Test als Risikofunktion die mittlere quadratische Abweichung der Schätzung von dem zu schätzenden Wert, denn

.

Parameterbereichsschätzung

Betrachtet wird wieder die Zufallsgröße . Schätzen möchte man einen Bereich, in dem man den "wahren" Parameter vermutet. Man setzt hierfür . Die Leere Menge schließt man als Entscheidung aus, da das Schätzen dieser nicht sinnvoll wäre. Als Schadensfunktion bietet sich die Abbildung mit an. Mit ihr erhält man für einen Test die Risikofunktion

d. h. ist gerade die Wahrscheinlichkeit, mit welcher der Parameter nicht in der geschätzten Menge liegt. Man nennt deshalb auch die Irrtumswahrscheinlichkeit des Verfahrens für den Parameter . Das Risiko bezeichnet man als Signifikanzschranke von .

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. The authors of the article are listed here. Additional terms may apply for the media files, click on images to show image meta data.