Sequentielles Gleichgewicht
Das sequentielle Gleichgewicht ist eine Verfeinerung des Nash-Gleichgewichts insbesondere für Spiele mit unvollkommener Information. Das von Kreps und Wilson 1982 entwickelte Konzept verfeinert dabei die Menge der teilspielperfekten Gleichgewichte. Indem es unplausible teilspielperfekte Gleichgewichte ausschließt, bildet die Menge der sequentiellen Gleichgewichte damit eine Teilmenge der teilspielperfekten Gleichgewichte.
Inhaltsverzeichnis |
Motivation
Um teilspielperfekte Strategien zu entwickeln, müssen Spieler über vollkommene Information verfügen, das heißt, sie müssen über den bisherigen Spielverlauf informiert sein. Ist diese Information nicht gegeben, müssen Spieler eine Wahrscheinlichkeitseinschätzung bilden, welche Strategien bisher gespielt wurden und an welchem Entscheidungsknoten sie sich gerade befinden. Auf der Grundlage dieser Einschätzungen ermitteln die Spieler ihre optimale Strategien. Die sich daraus ergebenden Gleichgewichte werden im Konzept der sequentiellen Gleichgewichte behandelt.
Definitionen und Bemerkungen
Definition: Sequentielles Gleichgewicht
(a) Jede Handlung eines Spielers ist an jeder Informationsmenge eine optimale Wahl, gegeben das Paar (s,μ), d.h., gegeben die Strategien s − i der anderen Spieler und gegeben die Wahrscheinlichkeitseinschätzung μ. (b) Die Wahrscheinlichkeitseinschätzungen über das Verhalten der anderen Spieler sind konsistent mit den im weiteren Spielverlauf optimalen Strategien dieser Spieler. |
Definition: Sequentielle Rationalität
Die in Teil a der Definition angeführte optimale Wahl wird auch als sequentiell rationale Einschätzung bezeichnet und wie folgt definiert:
|
Definition: Konsistenz
Die in Teil b der Definition für die Wahrscheinlichkeitseinschätzungen geforderte Konsistenz definieren Kreps und Wilson folgendermaßen:
|
Definition: Sequentielles Gleichgewicht (Kurzfassung)
Mit diesen Begriffen ist auch eine Kurzfassung der Definition möglich:
|
Bemerkungen
Ähnlich wie beim teilspielperfekten Gleichgewicht soll also bei jedem erreichten Punkt der folgende Spielverlauf wieder ein sequentielles Gleichgewicht sein, selbst wenn der bisher erreichte Punkt nicht mehr im Nash-Gleichgewichtspfad liegt. In letzterem Fall errechnen die Spieler dann mit Hilfe ihrer Wahrscheinlichkeitseinschätzungen µ bedingt auf den erreichten Entscheidungsknoten nach der Bayes'schen Regel neue Wahrscheinlichkeiten und spielen (bis zum nächsten abweichenden Ereignis) wieder optimale Strategien. Bei einer weiteren Abweichungen wiederholt sich dieser Vorgang.
Zu beachten ist, dass jedes Nash-Gleichgewicht bereits mit einer einzigen konsistenten Wahrscheinlichkeitseinschätzung zu einem sequentiellen Gleichgewicht wird; es ist nicht notwendig, dass alle möglichen konsistenten Wahrscheinlichkeitseinschätzungen berücksichtigt werden.
Sequentielle Gleichgewichte können ihrerseits aber ebenfalls unplausibel sein (vgl. das Beispiel "Variante des Markteintrittspiels"). Es wurden daher weitere Verfeinerungen auch des sequentiellen Gleichgewichts entwickelt. Beispielhaft sei hier nur das Konzept des perfekten Gleichgewichts genannt.
Satz (Existenz)
Satz
Sei G ein endliches extensives Spiel mit perfekter Erinnerung, sei ein perfektes Gleichgewicht von G und sei s die daraus abgeleitete Strategie.
Dann gibt es ein μ * , so dass (s * ,μ * ) ein sequentielles Gleichgewicht ist.
Beweis
Da perfektes Gleichgewicht ist, existiert nach Definition eine gegen
konvergente Folge
gemischter Strategien, deren beste Antwort
ist. Die Folgen (s)k und (μ)k, die sich daraus ableiten, sind daher offensichtlich ebenfalls konvergent mit
, also konsistent.
Zudem gilt, ebenfalls da
perfektes Gleichgewicht offenbar, dass (s,μ) sequentiell rational sind.
Damit folgt die Behauptung.
Folgerung
Da jedes endliche Spiel ein perfektes Gleichgewicht besitzt, folgt aus diesem Satz, dass jedes endliche extensive Spiel auch mindestens ein sequentielles Gleichgewicht besitzt.
Beispiele
Variante des Markteintrittspiels
In einer Version des Markteintrittspiels überlegt ein Konkurrent K eines Monopolisten M, in den Markt des Monopolisten einzutreten. Tritt K ein, so kann er zwischen zwei Alternativen E1 und E2 wählen (etwa zwischen zwei Produktionsmethoden). Tritt K ein, so kann sich M zwischen einer Duldung (D) oder einem aggressiven Verdrängungskampf (A) entscheiden, ohne jedoch zu wissen, ob K die Alternative 1 oder 2 gewählt hat. N sei Nichteintritt von K.
Sei also G = (L, H, j, u) mit
- der Spielermenge L = {K,M}
- der Historie
, wobei
die Entscheidungsmenge ist und die Endknoten
- der Spielerfunktion
mit
und j((E1)) = j((E2)) = M
- der Nutzenfunktion u mit den in Matrix 1 (bzw. 2) angegeben Auszahlungen
und den Wahrscheinlichkeitseinschätzungen μ1 bzw. μ2 = (1 - μ1) von M, dass K bei Markteintritt die Strategie E1 bzw. E2 gewählt hat.
- Matrix 1
|
Dieses Spiel hat offensichtlich zwei Nash-Gleichgewichte, (N,A) und (E1,D). Da M keine Information darüber hat, ob K E1 oder E2 gewählt hat, kann das Spiel nicht in einzelne Teilspiele zerlegt werden. Da somit das Gesamtspiel das einzige mögliche Teilspiel ist, sind diese beiden Gleichgewichte natürlich auch die beiden teilspielperfekten Gleichgewichte, obwohl (N,A) wegen der rational nicht zu rechtfertigenden Entscheidung von M für A offenbar unplausibel ist. Ist K in den Markt eingetreten, so bildet M die Wahrscheinlichkeitseinschätzung μ1, dass K die Alternative 1 gewählt hat, und kann damit seinen Erwartungsnutzen für beide Alternativen berechnen:
- wählt M die Strategie D, so beträgt sein Erwartungsnutzen 30μ1 + 10(1 − μ1) = 20μ1 + 10
- wählt M die Strategie A, so beträgt sein Erwartungsnutzen − 10μ1 − 5(1 − μ1) = − 5μ1 − 5
Da für jedes μ1 > 0 D offensichtlich besser ist als A, wird M immer D wählen. K antizipiert dies und tritt in den Markt ein, so dass (E1,D) als einziges sequentielles Gleichgewicht bestehen bleibt.
- Matrix 2
|
Ändern wir die Auszahlung von (A,E2) wie in der zweiten Matrix auf (-5,40) ab, ändert sich die Situation für M grundlegend. Nun hängt seine optimale Strategie ganz wesentlich von der von K gewählten Alternative ab: Hat K 1 gewählt, so ist D die beste Antwort, hat K 2 gewählt, ist A die optimale Strategie. M wird nun A wählen, wenn der Erwartungsnutzen der Strategie A größer als der Erwartungsnutzen von D ist, also wenn gilt:
− 10μ1 + 40(1 − μ1) = − 50μ1 + 40 > 30μ1 + 10(1 − μ1) = 20μ1 + 10.
Das heißt, schätzt M die Wahrscheinlichkeit μ1 < 5/7, so wird er sich für einen aggressiven Kampf (A) entscheiden, schätzt er jedoch μ1 als größer als 5/7, so wird er sich erneut für D entscheiden, schätzt er μ1 als genau 5/7 ein, so ist er indifferent zwischen den beiden Möglichkeiten.
Das sequentielle Gleichgewicht dieses Spiels ist also für μ1 < 5/7 die Strategie (N,A) und für μ1 > 5/7 die Strategie (E1,D). (Für die Situation μ1 = 5/7 muss sich K eine Einschätzung darüber bilden, mit welcher Wahrscheinlichkeit P(D) (bzw. p(A) = 1 - p(D)) M die Option D (bzw. A) spielt, und dies mit seinem Erwartungsnutzen abgleichen. Das sequentielle Gleichgewicht ergibt sich dann analog aus der als rational erkannten Strategie von K.)
An diesem Beispiel ist auch zu beobachten, dass nicht alle sequentiellen Gleichgewichte plausibel sind: Da für K die Strategie E2 von der Strategie N strikt dominiert wird, ist eine Wahrscheinlichkeitseinschätzung von μ1 < 5/7 nicht realitätsnah. Das sequentielle Gleichgewicht (N,A) für diese Einschätzung ist also unplausibel.
Die Abweichung Eingeschaft von Sequentielles Gleichgewicht
Sei konsistente Einschätzung in extensivem endlichem Spiel mit vollkommener Erinnerung und sei
Strategie von Spieler
. Beziechne
.
enthält Historien, die Teilhistorien in
haben. Zeige, falls
und
Informationsmenge von Spieler
sind, dann
für alle Endhistorien, die Teilhistorien in haben. Wobei
ist die Wahrscheinlichkeit nach
, dass
erreicht ist, falls
erreicht ist. Benutze diese Voraussetzung um zu beweisen dass
sequentiell rational ist genau dann wenn keine Spieler
eine Informationsmenge
hat, so dass eine Abweichung in
seine erwartete Auszahlung maximiert.
Beweis:
Beachte dass, unter der Voraussetzung von vollkommener Erinnerung, falls die Informationsmenge von Spieler
eine Historie
enthält, wobei
, alle Historien in
von der form
,für
sind. Folge von Aktionen von Spieler
in
ist die gleiche wie die Folge von Spieler
in
.
Wir nehmen an dass konsistente Einschätzung ist. Sei β' Strategie von Spieler
und
. Weiter seien
und
Informationsmenge von Spieler
und sei
Endhistorie, wobei
und
folgen von Aktionen sind.
und
.
Zuerst zeigen wir dass
Für es trivial. Wir nehmen dann an, dass
ist. Dann haben wir
und
Wobei Produkt der, von β' zugewiesenen, Wahrscheinlichkeiten von Folgen von Aktionen
ist. Sei jetzt
Teilhistorie von
in
, für alle
. Und sei
ein Teil von
. Dann,
Da konsistent ist, existiert eine Folge von gemischten Einschätzungen
mit
und
, für
und für alle
die Wahrscheinlichkeitseinschätzung
ist abgeleitet von
mit Hilfe von Bayessche Regel. Für alle
haben wir
weil . Für für
und
wir stellen fest, dass
ist.
Um eine Abweichung Eigenschaft zu zeigen, benutzen wir Rückwärtsinduktion. Wir nehmen an: ist konsistente Einschätzung mit Eigenschaft, dass kein Spieler eine Informationsmenge hat, mit der er, bei einer Änderung seiner Aktion, die erwartete Auszahlung maximieren kann. Wir nehmen eine Informationsmenge
und setzen im Voraus dass, um eine von Informationsmengen
von Spieler
zu erreichen,
eine optimale Wahl ist. Wir müssen zeigen dass
optimale Wahl ist. Nehmen wir an, dass Spieler
Strategie
benutzt. Sei
und sei
die Menge von Informationsmengen von Spieler
, die nach
folgt. Weiter sei
die Endhistorie, die Teilhistorien in
hat. Dann erwartete Auszahlung von Spieler
, bedingt auf erreichen von
, ist Summe von seinen Auszahlungen
von Historien, die nicht anderen Informationsmengen erreichen, und
Da , folgt dass erwartete Auszahlung von Spieler
ist
und dass ist gleich,
wobei ist erwartete Auszahlung unter
und dass ist nach der Induktionsvoraussetzung bestenfalls
Weiter, nach der Gleichheit in dem ersten Teil des Problems, ist das gleich
Wobei ist Strategie von Spieler
. In diese Strategie Spieler
wählt
in
und
sonst. Dann ist
optimale Wahl um
zu erreichen.
Seltens Pferd
Ein weiteres, sehr bekanntes Beispiel für ein Spiel mit sequentiellem Gleichgewicht ist das Spiel Seltens Pferd.
Quelle
- Holler, Manfred J., Illing, G.: Einführung in die Spieltheorie, Springer Verlag Berlin Heidelberg, 7. Aufl. 2009, ISBN 978-3-540-69372-7
- Schlee, Walter: Einführung in die Spieltheorie, Vieweg, Wiesbaden, 1. Aufl. 2004, ISBN 3-528-03214-6