Umtauschparadoxon
Das Umtauschparadoxon (oder Briefumschlagparadoxon) beschreibt eine spezielle mathematische Situation, bei der das naive Rechnen mit Erwartungswerten, insbesondere die Anwendung des Indifferenzprinzips, zu einem Widerspruch zum gesunden Menschenverstand führt. Es hat Ähnlichkeit mit dem Zwei-Zettel-Spiel und dem Ziegenproblem, dieses hat jedoch einen anderen wahrscheinlichkeitstheoretischen Hintergrund.
Geschichte
Das Umtauschparadoxon lässt sich zumindest bis 1953 zurückverfolgen und wurde damals in einem Buch des belgischen Mathematikers Maurice Kraitchik sinngemäß folgendermaßen formuliert:
„Zwei gleich wohlhabende Personen treffen einander und wollen die Inhalte ihrer Geldbörsen vergleichen. Keiner weiß, wie viel Geld der andere in der Börse hat. Sie vereinbaren folgendes Spiel: Derjenige, der weniger Geld in der Börse hat, gewinnt den Inhalt der Geldbörse des anderen. Falls beide gleich viel haben sollten, behält jeder sein Geld. Nun könnte einer der beiden folgende Überlegung anstellen: „Angenommen, ich habe den Betrag A in meiner Börse. Dann ist das das Maximum, das ich verlieren kann. Mit Wahrscheinlichkeit 0,5 gewinne ich allerdings und habe danach mehr als 2A. Daher ist das Spiel günstig für mich.“ Der andere könnte allerdings genauso argumentieren. Aus Symmetriegründen muss das Spiel aber fair sein. Worin liegt der Trugschluss dieser Argumentation?“[1]
Martin Gardner verbreitete das Rätsel 1982 in seinem Buch Aha! Gotcha, ebenfalls in der Gestalt eines Geldbörsenspiels.[2] Die heutige Form mit den beiden Briefumschlägen wurde 1989 von Barry Nalebuff formuliert.[3]
Die Umtauschsituation
Herr Lemke möchte Herrn Schmidt beschenken und gibt ihm zwei Briefumschläge mit den Worten „Ich schenke Ihnen einen dieser Umschläge. In beiden befindet sich ein Geldbetrag, im einen doppelt so viel wie im anderen. Sie dürfen einen Umschlag öffnen und dann entscheiden, welchen der beiden Umschläge Sie nehmen.“
Herr Schmidt öffnet einen zufällig ausgewählten der beiden Umschläge, findet zum Beispiel 100 Euro und überlegt: „Ich habe in diesem Umschlag 100 Euro. Wenn ich tausche, habe ich mit einer Wahrscheinlichkeit von 50 % 200 Euro und mit der gleichen Wahrscheinlichkeit 50 Euro. Dies macht einen Erwartungswert von 125 Euro.“
Nach dieser Überlegung würde sich das Tauschen lohnen.
Das Paradoxon
Die folgende Überlegung führt Herrn Schmidts Rechnung vermeintlich ad absurdum: Wenn die Rechnung von Herrn Schmidt für jeden beliebigen Betrag das Ergebnis lieferte, dass sich Tauschen lohne, so bräuchte er den Umschlag gar nicht zu öffnen, sondern könnte gleich den anderen Umschlag nehmen. Es kann aber nicht sein, dass der andere Umschlag immer besser ist, da ja beide Umschläge vor dem Öffnen offensichtlich gleichwertig sind.
Die Denkfalle
Eine mögliche Denkfalle besteht darin, dass Herr Schmidt entweder das Indifferenzprinzip oder die bedingte Wahrscheinlichkeit falsch anwendet, also davon ausgeht, dass die 100 Euro mit einer 50-50-Wahrscheinlichkeit den halben oder den doppelten Betrag darstellen. Abhängig von Herrn Lemkes Auswahlverfahren kann das für diesen Betrag richtig sein, jedoch nicht für alle Beträge. Zunächst wird tatsächlich mit einer 50 %-Wahrscheinlichkeit der Umschlag mit dem kleineren oder größeren Betrag geöffnet. Es handelt sich daher entweder um die 50/100- oder um die 100/200-Euro-Kombination. Daraus kann aber nicht geschlossen werden, dass unter der Bedingung, dass 100 Euro gefunden wurden, die Wahrscheinlichkeiten für die beiden Kombinationen gleich sind. Über die Wahrscheinlichkeiten dieser Fälle ist nichts bekannt, und das Indifferenzprinzip ist ausgehend von einem aufgedeckten Betrag auf die Ereignisse „doppelter Betrag“ () und „halber Betrag“ () aus grundsätzlichen Erwägungen heraus nicht anwendbar. In der Denkfallen-Sammlung[4] wird das an einigen Rechenbeispielen weiter verdeutlicht.[5][6]
Hingegen ist es durchaus möglich, dass, ausgehend vom Wert des geöffneten Umschlags, der bedingte Erwartungswert des ungeöffneten Umschlags immer höher ist; dies aber nur, wenn der Erwartungswert des ungeöffneten Umschlags größer als der Erwartungswert des geöffneten Umschlags ist oder wenn beide Erwartungswerte unendlich sind.
Analyse mit bedingten Wahrscheinlichkeiten
Die Rechnung mit einer 50-50-Wahrscheinlichkeit entspringt also einer unzulässigen Anwendung des Indifferenzprinzips. Die Berechnung des Erwartungswertes kann aber auch bei anderen Wahrscheinlichkeiten zu dem scheinbaren Widerspruch führen, dass ein Tausch immer angezeigt wäre. Um allgemein eine sinnvolle Tauschentscheidung zu treffen, muss sich Herr Schmidt vor Augen halten, dass er bedingte Wahrscheinlichkeiten verwenden muss, wenn er den Betrag im geöffneten Umschlag in seine Rechnung einbezieht. Der folgende Abschnitt enthält eine formale Analyse, ob bei einer gegebenen Wahrscheinlichkeitsverteilung ein Tausch für gewisse Beträge sinnvoll sein kann und ob es überhaupt eine Wahrscheinlichkeitsverteilung geben kann, bei der ein Tausch immer angezeigt ist. Ob diese Wahrscheinlichkeitsverteilung eine subjektive Einschätzung von Herrn Schmidt ist oder ob eine Wahrscheinlichkeitsverteilung der Beträge tatsächlich bekannt ist, ist für die Analyse unwesentlich.[7] Dazu kann beispielsweise folgende Notation verwendet werden:
- die Zufallsvariable bezeichnet den kleineren Betrag in den Umschlägen (im anderen Umschlag befindet sich dann der Betrag ).
- die Zufallsvariable bezeichnet den Betrag, den Herr Schmidt im zuerst geöffneten Briefumschlag findet.
- die Zufallsvariable bezeichnet den Betrag, der im anderen, noch ungeöffneten Umschlag ist.
Da beide Umschläge mit gleicher Wahrscheinlichkeit gewählt werden, haben und die gleiche Verteilung, sind aber wegen voneinander stochastisch abhängig. Für die Erwartungswerte gilt . Herr Schmidt will offensichtlich die Erwartung von berechnen, wenn er kennt, also die bedingte Erwartung .
Diskrete Verteilungen
Zunächst soll der Fall behandelt werden, dass (und damit auch und ) eine diskrete Verteilung besitzt. In diesem Fall bezeichne die Wahrscheinlichkeit, dass der kleinere Betrag in den Umschlägen gleich ist. Für die Verteilung von und folgt dann
Im diskreten Fall gilt für die gesuchte bedingte Erwartung[8]
Die bedingte Wahrscheinlichkeit ist laut Problemstellung nur dann von Null verschieden, wenn entweder oder . In diesen Fällen gilt für die Wahrscheinlichkeit, dass Herr Schmidt den doppelten Betrag im anderen Briefumschlag findet,
Die bedingte Wahrscheinlichkeit, dass Herr Schmidt den halben Betrag im anderen Briefumschlag findet, ist gerade komplementär hierzu, also gilt:
Sofern der Erwartungswert der Verteilung mit den korrekten Wahrscheinlichkeiten existiert, erhielte man
Zu tauschen würde sich demnach genau dann auszahlen, wenn gilt; dies ist genau dann der Fall, wenn gilt. Verteilungen, die diese Bedingung für alle möglichen erfüllen, lassen sich konstruieren, hat dann aber keinen endlichen Erwartungswert. Für so eine a-priori-Verteilung ist der gegebene Vorteil der Tauschentscheidung für jeden vorgefundenen Wert im geöffneten Umschlag zwar nicht intuitiv, aber nicht paradox.[7]
Natürlich widerspricht die Annahme, dass beliebig hohe Beträge im Umschlag sein können, der praktischen Einschränkung, dass niemand, also auch nicht Herr Lemke, beliebig viel Geld zur Verfügung hat.
Beispiel
Wenn man eine Wahrscheinlichkeitsverteilung annimmt, mit der Herr Lemke das Geld in die Briefumschläge verteilt, lässt sich die Situation sehr gut simulieren. Beispielsweise sei angenommen, er bestimmt den Betrag, indem er einen fairen Würfel wirft. Zeigt der Würfel Augen, so steckt er Euro in den einen und Euro in den anderen Umschlag. Herr Schmidt findet dann mit Wahrscheinlichkeit den Betrag 25 Euro im Umschlag, mit Wahrscheinlichkeit je einen der Beträge 50, 100, 200, 400 oder 800 Euro und wieder mit Wahrscheinlichkeit den Betrag 1600 Euro. Tauscht er nicht, so beträgt der Erwartungswert des Geldgeschenkes also
Tauscht Herr Schmidt in jedem Fall, so ändert sich sein Erwartungswert nicht, da er insbesondere auch den Betrag von 1600 Euro tauscht, obwohl er in diesem Fall nichts gewinnen kann. Vermutet Herr Schmidt aber, dass wohl kaum mehr als 1000 Euro im Umschlag sind, und entscheidet sich daher, dann und nur dann zu tauschen, wenn höchstens 500 Euro im Umschlag sind, so ändern sich die Wahrscheinlichkeiten: Nach dem Tausch hat Herr Schmidt dann weiterhin mit Wahrscheinlichkeit den Betrag 25 Euro im Umschlag, ebenso mit Wahrscheinlichkeit je einen der Beträge 50, 100 oder 200 Euro, den Betrag von 400 Euro allerdings nur noch mit Wahrscheinlichkeit (da Herr Schmidt bei 800 Euro nicht mehr tauscht), dafür aber mit Wahrscheinlichkeit den Betrag von 800 Euro und wieder mit Wahrscheinlichkeit den Betrag 1600 Euro. Der Erwartungswert des Geldgeschenkes ist nun also
Schätzt Herr Schmidt die Situation besser ein und beschließt, erst ab 1000 Euro aufs Tauschen zu verzichten, kann er den Erwartungswert sogar auf 460,62 Euro erhöhen; wird er aber zu gierig und tauscht beispielsweise bis zu 2000 Euro, so fällt er wieder auf den Ausgangswert 393,75 Euro zurück.
Für Herrn Schmidt ist es natürlich schwierig, Herrn Lemke richtig einzuschätzen; wesentlich ist aber, dass das Paradoxon verschwindet, sobald man irgendeine konkrete Wahrscheinlichkeitsverteilung annimmt. Je nach Tauschstrategie von Herrn Schmidt ändert sich der Erwartungswert des Geldgeschenks; die Strategie „Tausche immer“ ist aber gleich gut (oder schlecht) wie die Strategie „Tausche nie“.
Stetige Verteilungen
Im Falle, dass der kleinere Geldbetrag (und damit auch und ) eine stetige Verteilung besitzt, ergeben sich im Wesentlichen qualitativ die gleichen Ergebnisse, allerdings können die obigen Formeln für den diskreten Fall nicht einfach analog übernommen werden.[7]
Außerdem muss beachtet werden, dass im stetigen Fall das bedingende Ereignis für alle die Wahrscheinlichkeit null hat, so dass nicht mehr die elementaren Definitionen für die bedingte Wahrscheinlichkeit und den bedingten Erwartungswert verwendet werden können, sondern abstraktere Versionen benutzt werden müssen.
Es bezeichne die Dichtefunktion von . Die Variablen und haben dann beide die gleiche Dichte und es gilt
Im Vergleich zum diskreten Fall erscheint vielleicht der Faktor zunächst überraschend. Allerdings wäre die durch den „analog“ gebildeten Ausdruck definierte Funktion nicht einmal eine Wahrscheinlichkeitsdichte. Die korrekte Formel erhält man beispielsweise durch Betrachten der Verteilungsfunktionen und . Da die Auswahl der Umschläge mit gleicher Wahrscheinlichkeit und unabhängig von erfolgt, gilt
also
Differenzieren nach ergibt wegen und obige Formel für .
Als bedingte Wahrscheinlichkeit, dass Herr Schmidt im anderen Umschlag den doppelten Betrag findet, kann nun
und entsprechend für den anderen Fall
gesetzt werden.[7]
Damit erhält man
als mögliche Version des bedingten Erwartungswerts. Somit gilt genau dann, wenn ist.
Wird beispielsweise für eine stetige Gleichverteilung auf dem Intervall angenommen, so ergibt sich
Der erste und der dritte Fall sind anschaulich klar: Wenn im geöffneten Umschlag weniger als 50 Euro sind, muss es sich um den kleineren der beiden Beträge handeln, bei mehr als 800 Euro um den größeren. Im mittleren Fall ist hingegen ein Vergleich mit dem diskreten Fall interessant, denn eine diskrete Gleichverteilung von auf der Menge ergibt in diesem Bereich nur für gerades , aber für ungerades als bedingten Erwartungswert.
Es existieren auch stetige Verteilungen, so dass formal für alle gilt. Wie im diskreten Fall hat dann jedoch keinen endlichen Erwartungswert. Ein Beispiel ist die Verteilung von mit der Dichte für (und sonst). Hier gilt formal für alle
Erklärung durch die Formel vom totalen Erwartungswert
Der diskrete Fall kann durch die Formel vom totalen Erwartungswert[9] anschaulich erklärt werden. Hierzu wird die Ausgangssituation leicht verallgemeinert. Es wird vorab nur angenommen, dass die beiden Umschläge über einen Zufallsprozess simultan mit Geld gefüllt werden und dass einer der beiden Umschläge danach ausgewählt und geöffnet wird. Dazu wird die Notation leicht verändert:
- der diskrete Zufallsvektor bezeichnet die Geldbeträge, die sich in den beiden Umschlägen befinden.
- die Zufallsvariable bezeichnet den Betrag im geöffneten Umschlag, die Zufallsvariable den Betrag im anderen, nicht geöffneten Umschlag.
- und sind die Wahrscheinlichkeiten, dass der erste bzw. der zweite Umschlag geöffnet wird.
Es soll und sein und die Erwartungswerte und sollen existieren. Dann berechnen sich die Erwartungswerte von und zu:
Zuerst wird angenommen, dass der geöffnete Umschlag zufällig auswählt wird. Dann gilt und beide Erwartungswerte sind gleich:
Die zufällige Auswahl der Umschläge kann immer durch eine Änderung der Verteilung von erreicht werden. Deshalb kann für die folgenden Überlegungen o. B. d. A. und angenommen werden. Es wird also immer der erste Umschlag geöffnet und es ist , und somit .
Nun wird angenommen, dass für jeden möglichen Geldbetrag im geöffneten Umschlag der bedingte Erwartungswert des anderen Umschlags immer größer ist:
Dieses ergibt sich automatisch, wenn man annimmt, dass der andere Umschlag stets den halben oder den doppelten Betrag enthält und dass die bedingten Wahrscheinlichkeiten für beide Ereignismöglichkeiten immer gleichverteilt sind:
Denn dann berechnet sich der bedingte Erwartungswert des anderen Umschlags zu:
Aus der Formel vom totalen Erwartungswert folgt nun:
Zuletzt wird angenommen, dass für jeden möglichen Geldbetrag im anderen Umschlag der bedingte Erwartungswert des geöffneten Umschlags immer größer ist:
Dieses ergibt sich automatisch, wenn man annimmt, dass der geöffnete Umschlag stets den halben oder den doppelten Betrag enthält und dass die bedingten Wahrscheinlichkeiten für beide Ereignismöglichkeiten immer gleichverteilt sind:
Denn dann berechnet sich der bedingte Erwartungswert des geöffneten Umschlags zu:
Aus der Formel vom totalen Erwartungswert folgt nun völlig analog:
Das Umtauschparadoxon lebt einzig und allein von der Tatsache, dass diese drei Annahmen nicht miteinander verträglich sind:
- Nimmt man an, dass der geöffnete Umschlag zufällig auswählt wird, dann muss sein.
- Nimmt man an, dass der bedingte Erwartungswert des anderen Umschlags immer größer als der Geldbetrag im geöffneten Umschlag ist, dann muss sein.
- Nimmt man an, dass der bedingte Erwartungswert des geöffneten Umschlags immer größer als der Geldbetrag im anderen Umschlag ist, dann muss sein.
Das Prinzip vom unzureichenden Grund bietet jedoch eine Lösung für dieses Problem an. Es besagt ja nur, dass ohne Vorliegen weiterer Informationen eine diskrete Gleichverteilung für die unbekannten Eintrittswahrscheinlichkeiten anzusetzen sei. Es gibt jedoch einen Grund, nicht die Gleichverteilung anzusetzen, wenn man schon die Information hat, dass der geöffnete Umschlag zufällig auswählt wird und dass somit ist: Um nicht in den Widerspruch zu geraten, dass auch oder ist. Nimmt man anstelle der Gleichverteilung an, dass die bedingte Wahrscheinlichkeit für den kleineren Geldbetrag immer doppelt so groß wie für den größeren Geldbetrag ist, ergibt sich dieser Widerspruch nicht, denn aus
folgt stets
und somit auch
- .
Genauso ergibt sich aus
stets
und ebenfalls
- .
Ein einfaches Beispiel illustriert, wie sehr man mit der scheinbar plausiblen Annahme einer Gleichverteilung bei den bedingten Wahrscheinlichkeiten danebenliegen kann. Dazu werden die Umschläge immer mit 100 und 200 Euro befüllt. Es wird also eine bivariate Zweipunktverteilung von angenommen:
Dann ergeben sich die folgenden bedingten Wahrscheinlichkeiten:
Von der angenommenen Gleichverteilung sind diese bedingten Wahrscheinlichkeiten meilenweit entfernt.
Anwendung des Zwei-Zettel-Spiels
In den obigen Beispielen wurde angenommen, dass bekannt ist, nach welchem Prinzip die Geldbeträge verteilt sind. Unter dieser Annahme lassen sich leicht Gewinnstrategien angeben. Die Problemformulierung enthält aber keine Information über die Verteilung. Es gibt allerdings auch eine allgemeine Gewinnstrategie für Herrn Schmidt, die diese Annahme nicht benötigt. Diese Strategie besteht darin, dass Herr Schmidt, bevor er den Umschlag öffnet, eine Zufallszahl S wählt. Die Wahrscheinlichkeitsverteilung von S muss dabei eine Dichte haben, die zwischen 0 und unendlich echt größer 0 ist, ist ansonsten aber beliebig. Dann öffnet er den Umschlag und findet den Betrag n. Ist der gefundene Betrag n kleiner gleich S, so tauscht er den Umschlag; ist der Betrag n größer als S, so behält er den Umschlag. Diese Strategie geht auf Thomas M. Cover zurück.[10] Wie im Artikel Zwei-Zettel-Spiel erklärt, erhöht er so theoretisch seine Chancen, den größeren Betrag zu erhalten.[11][12]
Angenommen, Herr Schmidt entschließt sich, das Zwei-Zettel-Spiel anzuwenden. Enthalten die Briefumschläge die Beträge und und öffnet Herr Schmidt zuerst den Umschlag mit Inhalt , so wechselt er, falls . Die bedingte Erwartung seines Gewinns beträgt dann
Öffnet er zuerst den Umschlag mit Inhalt , so wechselt er, falls . Die bedingte Erwartung seines Gewinns beträgt dann
Insgesamt beträgt die bedingte Erwartung bei fixen Inhalten, aber vor der Wahl des ersten Umschlags
Tauscht er immer oder tauscht er nie, beträgt sein Erwartungswert
Bei Anwendung des Zwei-Zettel-Spieles ist der Erwartungswert also um
höher als bei der „Tausche-nie“ oder „Tausche-immer“-Vorgangsweise.
Beispiel
Für wählt Herr Schmidt beispielsweise eine Zufallsvariable S, die exponentialverteilt mit Erwartungswert 1000 ist, also . Falls die Geldbeträge wie im oben angegebenen Beispiel auf der Menge gleichverteilt sind, ergibt sich insgesamt folgender Erwartungswert des Geldgeschenkes:
25 | 50 | 1/6 | 0,975 | 49,382 | 0,951 | 26,219 | 37,801 | 37,5 | 6,300 | |
50 | 100 | 1/6 | 0,951 | 97,561 | 0,904 | 54,758 | 76,160 | 75,0 | 12,693 | |
100 | 200 | 1/6 | 0,904 | 190,484 | 0,819 | 118,127 | 154,305 | 150,0 | 25,718 | |
200 | 400 | 1/6 | 0,819 | 363,746 | 0,670 | 265,936 | 314,841 | 300,0 | 52,473 | |
400 | 800 | 1/6 | 0,670 | 688,128 | 0,449 | 620,268 | 644,198 | 600,0 | 107,366 | |
800 | 1600 | 1/6 | 0,449 | 1159,463 | 0,202 | 1438,483 | 1298,973 | 1200,0 | 216,496 | |
Summe | 1 | 421,046 |
Der Erwartungswert des Geldgeschenkes beträgt bei dieser Vorgangsweise also 421,046 Euro. Das ist zwar weniger als bei der optimalen Strategie (tausche bei weniger als 1000 Euro), bei der der Erwartungswert 460,62 Euro beträgt; aber jedenfalls mehr als bei der „Tausche-nie“ oder „Tausche-immer“-Vorgangsweise, bei der der Erwartungswert 393,75 Euro beträgt. Wie aus der Tabelle ersichtlich, ist in jeder Zeile größer als . Der genaue Erwartungswert hängt natürlich stark von der Wahl der Verteilung von ab, ist aber immer größer als bei der „Tausche-nie“ oder „Tausche-immer“-Vorgangsweise.
Siehe auch
Verwandte Themen, bei denen man aus Teilinformationen die optimale Entscheidung des Restproblems treffen kann:
Weblinks
- Denkfallen vermeiden – Am Beispiel des Umtauschproblems. (PDF; 442 kB) In: Stochastik in der Schule, 30, 2010, S. 25–29.
Einzelnachweise
- Maurice Kraitchik: La mathématique des jeux. 1953
- Martin Gardner: Aha! Gotcha. 1982
- Barry Nalebuff: Puzzles: the other person’s envelope is always greener. In: Journal of Economic Perspectives. Band 3, 1989, yale.edu (PDF; 205 kB)
- Denkfallen und Paradoxa
- Denkfallen und Paradoxa: Umtauschparadoxon (Briefumschlag-Paradoxon)
- Denkfallen: Umtauschparadoxon. (PDF) hs-fulda.de
- David J. Chalmers: The Two-Envelope Paradox: A Complete Analysis?
- Robert B. Ash: Real Analysis and Probability. Academic Press, New York 1972, ISBN 0-12-065201-3, S. 246, 6.3.5 (2)
- Christoph Luchsinger: Einführung in die Statistik. Lemma 3.12, S. 70
- Franz Thomas Bruss: Der Ungewissheit ein Schnippchen schlagen. In: Spektrum der Wissenschaft. Band 6/2000, S. 106–107.
- R. Christensen, J. Utts: Bayesian Resolution of the Exchange Paradox. In: The American Statistician. 1992
- Dov Samet, Iddo Samet, David Schmeidler: One Observation behind Two-Envelope Puzzles. (PDF; 89 kB)