Erwartungswert

Aus Wikiludia
Wechseln zu: Navigation, Suche

Inhaltsverzeichnis

Motivation

In extensiven Spielen ohne vollständige bzw. vollkommene Information müssen wir den Begriff des Nutzens einer Strategie etwas allgemeiner definieren. Denn selbst wenn die Spieler reine Strategien verfolgen, wird jede Terminalhistorie im Allgemeinen nur mit einer gewissen Wahrscheinlichkeit erreicht.
Der Erwartungswert eines Strategieprofils ist nun diese neue, allgemeinere Version der bekannten Nutzenfunktion. Er ist gewissermaßen der "Durchschnitt" der möglichen Auszahlungen.

Der Begriff des Ausgangs

Der Ausgang (engl. "Outcome") eines reinen Strategieprofils, ist die Summe aller Terminalhistorien, versehen mit der jeweiligen Wahrscheinlichkeit mit der sie erreicht werden. In Zeichen:
 z(s) = \sum_{h \in Z}p(h)h


Der Begriff des Erwartungswertes

Der Erwartungswert eines Strategieprofils ist nun einfach der Nutzen des entsprechenden Ausgangs. Er ist also die Summe der Auszahlungen der Terminalhistorien, wieder versehen mit der jeweiligen Wahrscheinlichkeit. In Zeichen:
 u(s) = u(z(s)) = \sum_{h \in Z}p(h)u(h)

Die Wahrscheinlichkeit (für eine Terminalhistorie)

Definition

Die Wahrscheinlichkeit für eine Terminalhistorie ist nun das Produkt der Wahrscheinlichkeiten für die vorher durchlaufenen Historien. In Zeichen:
 p(h) = \prod_{\nu = 1}^{n}p_{\nu}(h_{\nu})
Dabei ist h_{\nu} := (a^{1},\ldots ,a^{\nu} ) und hn = h

Berechnung der Wahrscheinlichkeit

In reinen Strategien berechnet man die pν nun wie folgt:
Man überlegt sich zuerst, in welcher Entscheidungsmenge hν − 1 liegt. Gilt h_{\nu - 1} \in E_{0} (wenn also der Zufall in hν − 1 am Zug war), so ist pν(hν) = f(aν | hν − 1), also die vorgegebene Wahrscheinlichkeit, mit der der Zufall sich für die Aktion aν entscheidet. Gilt aber h_{\nu - 1} \notin E_{0}, also h_{\nu - 1} \in E_{k} für einen bestimmten Spieler k, so folgt: Es gibt genau eine Informationsmenge I, so dass h_{\nu - 1} \in I. Schreibt nun die Strategie von Spieler k vor, dass im Falle von diesem I die Aktion aν ausgeführt wird, so ist die Wahrscheinlichkeit für hν gleich 1, tut sie das nicht, ist die Wahrscheinlichkeit gleich 0. In Zeichen:
p_{\nu}(h_{\nu})= \begin{cases} 1 \ \mbox{falls } s_{k}(I) = a^{\nu} \\ 
0 \ \mbox{falls } s_{k}(I) \ \not= \ a^{\nu}
\end{cases}


Im Übrigen kann man hierfolgendes sehen:
Lässt man den Zufall weg (wenn also alle Entscheidungen nur mit Wahrscheinlichkeit 1 oder 0 getroffen werden), so ergibt sich für den Erwartungswert wieder die herkömmliche Definition des Nutzens eines Strategieprofils.

Meine Werkzeuge