Verhaltensstrategien

Aus Wikiludia
Version vom 6. November 2008, 22:23 Uhr von Schotten (Diskussion | Beiträge)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Wechseln zu: Navigation, Suche

Ein Verhaltensstragie ist - einfach gesagt - eine Wahrscheinlichkeitsverteilung über die Handlungsalternativen, die jedem Spieler in den jeweiligen Entscheidungssituationen zur Verfügung stehen.


Im Falle eines Spiels in extensiver Form mit vollkommener Information:

Definition

Eine Verhaltensstrategie eines Spielers i\in M ist eine Familie bi(h), h\in E_i, von unabhängigen Wahrscheinlichkeitsverteilungen. Hierbei ist bi(h) eine Wahrscheinlichkeitsverteilung über A(h), wenn A(h) die Menge der möglichen Aktionen in der Entscheidungshistorie h ist. Mit bi bezeichnen wir alle diese Wahrscheinlichkeitsverteilungen. Schließlich ist b = (b1,...,bN) eine Kombination von Verhaltensstrategien mit bi Verhaltensstrategie für Spieler i\in M=\{1,2,...,N\}. Diese Kombination heißt Verhaltensprofil.


Im Falle eines Spiels in extensiver Form ohne vollkommener Information:

Definition

Eine Verhaltensstrategie eines Spielers k ∈ M ist eine Familie bk(I), I ∈ Pk, von unabhängigen Wahrscheinlichkeitsverteilungen. Hierbei ist bk(I) eine Wahrscheinlichkeitsverteilung über A(I), wenn A(I) die Menge der möglichen Aktionen in der Informationsmenge I der Informationszerlegung Pk ist. Mit bk bezeichnen wir alle diese Wahrscheinlichkeitsverteilungen. Schließlich ist b=(b1, ... ,bN) eine Kombination von Verhaltensstrategien mit bi Verhaltensstrategie für Spieler i\in M=\{1,2,...,N\}. Diese Kombination heißt Verhaltensprofil.
Dabei wird einem Verhaltensprofil b der folgende Erwartungswert und Ausgang zugeordnet:
 u(b) = u(z(b)) = \sum_{h \in Z}\beta(h)u(h)
 z(b) = \sum_{h \in Z}\beta(h)h
Dabei ist h := (a^{1},\ldots ,a^{n} ) und \beta(h) = \prod_{\nu = 1}^{n}\beta_{\nu}(h_{\nu})
mit h_{\nu} := (a^{1},\ldots ,a^{\nu} )
Dabei gilt es folgende beiden Fälle zu unterscheiden:

  • h_{\nu - 1}\in E_0 :

βν(h): = f(aν | hν − 1), wobei f(. | h) ein Wahrscheinlichkeitsmaß auf A(h) ist und der Spieler 0 den Zufall repräsentiert.

  • h_{\nu - 1}\in E_k, k\neq0 :

βν(h): = bk(I)(aν) mit a^{\nu} \in A(I) und h_{\nu - 1}\in I \in P_k und \sum_{h \in Z}\beta(h) = 1, wobei Pi Informationszerlegung zu Spieler i \in M

Meine Werkzeuge