Trigger-Strategien

Aus Wikiludia
Wechseln zu: Navigation, Suche

Trigger-Strategien

In einem wiederholten Spiel, kann jeder Spieler in seine Entscheidungen das in der Vergangenheit beobachtete Verhalten der anderen Spieler einbeziehen.
Da jeder Spieler das vergangene Verhalten der anderen Spieler beobachten kann und seine Handlungen auf deren zukünftige Verhandlungsgewinne Einfluss hat, gibt es für jeden Spieler die Möglichkeit andere Spieler für "schlechtes" Verhalten zu bestrafen.


Eine mögliche Form solcher Bestrafung sind Trigger-Strategien (also "Auslöser-Strategien"): " Wenn du jetzt nicht mit mir spielst (kooperierst), dann spiele (kooperiere) ich nie mehr mit dir!"


Trigger-Strategie: Kooperiere in Periode 1. Solange jeder kooperiert, kooperiere weiter. Falls einer defektiert, defektiere für immer.

Betrachtet wird das Stufenspiel das nur ein einziges Nash-Gleichgewicht sc enthält. Bei unendlichem Zeithorizont kann das Einhalten kooperativer Lösungen durch folgende Vergeltungsstrategien attraktiv gemacht werden: Die Spieler vereinbaren explizit oder implizit, in jeder Periode bestimmte Handlungen s^\star zu spielen, die Ihnen eine höhere Auszahlung als in sc ermöglichen:u_i(s^\star)>u_i(s^c). Sobald sich einer der Spieler nicht an die Vereinbarung hält (um sich durch diese Abweichung einen kurzfristigen Vorteil zu verschaffen), spielen alle anderen Spieler von der nächsten Periode an für immer die Nash-Strategien sc des Stufenspiels.
Wer versucht, durch eine Abweichung von den Vereinbarungen einen kurzfristigen Gewinn auf Kosten der Anderen zu erzielen, wird bestraft, indem von der Folgeperiode an nur mehr die Auszahlung ui(sc) resultiert. Jeder wird sich an die Vereinbarung s^\star halten, wenn für alle Spieler die angedrohten Verluste der Vergeltungsstrategie den bei einer Abweichung maximal erreichbaren Ein-Periodengewinn übersteigen. Diese Bedingung ist um so eher erfüllt, je geringer zukünftige Auszahlungen abdiskontiert werden. Weil sich beim Spielen von sc keiner durch eine Abweichung verbessern könnte, ist die Drohung sc glaubwürdig.
Die beschriebene Vergeltungsstrategie bezeichnet man als Trigger-Stategie, weil bei einem von der Vereinbarung abweichenden Verhalten sofort und dauerhaft die Rückkehr zum Nash-Gleichgewicht sc des Stufenspiels "ausgelöst" wird.

Beispiel

Sei folgende Auszahlungsmatrix gegeben:

NK K
NK 2,2 12,0
K 0,8 5,5

Hierbei bezeichne K die Strategie für "Kooperieren" und NK die Strategie für "Nicht kooperieren" der jeweiligen Spieler.

Wir wenden nun die Trigger-Strategie an, um festzustellen, wann ein Nash-Gleichgewicht in Abhängigkeit von \delta \in (0,1) vorliegt.

Betrachten wir hierzu Spieler 2 (wobei Spieler 1 anfängt): Wir setzen voraus: Spieler 2 spielt in Runde (i+1) (i>0,i \in \mathbb{N}) stets die Strategie K, wenn Spieler 1 K in der Runde zuvor gespielt hat. Ist dies nicht der Fall, so spielt dieser nur noch die Strategie NK. Spieler 1 spielt die Strategie K bis n (n>0,n \in \mathbb{N}) und ab der darauffolgenden Runde nur noch die Strategie NK.

Betrachten wir nun das Ergebnis für Spieler 1 in Abhängigkeit von s>0,s \in \mathbb{R}:

u_1=5+5\delta+\ldots+5\delta^{n-1}+12\delta^{n}+2\delta^{n+1}+\ldots+2\delta^{n+s}=5*(\frac{1-\delta^n}{1-\delta})+12\delta^{n}+2\delta^{n+1}+\ldots+2\delta^{n+s}

Nehmen wir nun an, Spieler 1 hält sich ausnahmslos an die Strategie K, so ergibt sich:

u^{*}_1=5+5\delta+5\delta^2+\ldots+5\delta^{n+s}=5*(\frac{1-\delta^{n}}{1-\delta})+5\delta^{n}*(\frac{1-\delta^{s+1}}{1-\delta})

Nun müssen wir prüfen, in welchen Fall u_1>u^{*}_1vorliegt und es ergibt sich:

u_1=5*(\frac{1-\delta^{n}}{1-\delta})+12\delta^n+2\delta^{n+1}*(\frac{1-\delta^s}{1-\delta})>5*(\frac{1-\delta^n}{1-\delta})+5\delta^n(\frac{1-\delta^{s+1}}{1-\delta})=u^{*}_1

< = >

12\delta^n+2\delta^{n+1}*(\frac{1-\delta^s}{1-\delta})>5\delta^n*(\frac{1-\delta^{s+1}}{1-\delta})

<=>

12δn(1 − δ) + 2δn + 1(1 − δ)s > 5δn(1 − δs + 1)

<=>

12δn − 12δn + 1 + 2δn + 1 − 2δn + 1 + s > 5δn − 5δn + s + 1

<=>

12 − 12δ + 2δ − 2δ1 + s > 5 − 5δs + 1

<=>

12 − 10δ − 2δ1 + s > 5 − 5δs + 1

Wir können jetzt in Abhängigkeit für unser s Lösungen bestimmen:

1. Möglichkeit:

s->\infty:

Es ergibt sich, da der Ausdruck 1 + s und der Ausdruck s + 1 in diesem Fall gegen 0 strebt:

12-10\delta>5 <=> 7>10\delta <=> \frac{7}{10}>\delta

Hieraus ergibt sich, dass es nur für \delta<\frac{7}{10} profitabel ist, abzuweichen.


2. Möglichkeit: s=0

12 − 10δ − 2δ > 5 − 5δ < = > 7 > 7δ.

Dies ist offensichtlich für alle \delta \in (0,1) erfüllt.

3. Möglichkeit: s=1

12 − 10δ − 2δ2 > 5 − 5δ2 < = > 7 > 10δ − 3δ2

Es folgt, dass für \delta \in (0,1) eine Lösung existiert, denn:

Sei δ: = 1 − ε,0 < ε < 1:

Es gilt: 7 > 10(1 − ε) − 3(1 − ε)2 < = > 7 > 10 − 10ε − 3(1 − 2ε + ε2) < = > 7 > 7 − 4ε − 3ε2

Dies ist für δ < 1 immer erfüllt.


Betrachten wir noch der Vollständigkeit halber Spieler 1 (wobei Spieler 2 anfängt): Wir setzen voraus: Spieler 1 spielt in Runde (i+1) (i>0,i \in \mathbb{N}) stets die Strategie K, wenn Spieler 2 K in der Runde zuvor gespielt hat. Ist dies nicht der Fall, so spielt dieser nur noch die Strategie NK. Spieler 2 spielt die Strategie K bis n (n>0,n \in \mathbb{N}) und ab der darauffolgenden Runde nur noch die Strategie NK.

Betrachten wor nun das Ergebnis für Spieler 2 in Abhängigkeit von s>0,s \in \mathbb{R}:

u_2=5+5\delta+\ldots+5\delta^{n-1}+8\delta^{n}+2\delta^{n+1}+\ldots+2\delta^{n+s}=5*(\frac{1-\delta^n}{1-\delta})+8\delta^{n}+2\delta^{n+1}+\ldots+2\delta^{n+s}

Nehmen wir nun an, Spieler 2 hält sich ausnahmslos an die Strategie K, so ergibt sich:

u^{*}_2=5+5\delta+5\delta^2+\ldots+5\delta^{n+s}=5*(\frac{1-\delta^{n}}{1-\delta})+5\delta^{n}*(\frac{1-\delta^{s+1}}{1-\delta})

Nun müssen wir prüfen, in welchen Fall u_2>u^{*}_2vorliegt und es ergibt sich:

u_2=5*(\frac{1-\delta^{n}}{1-\delta})+8\delta^n+8\delta^{n+1}*(\frac{1-\delta^s}{1-\delta})>5*(\frac{1-\delta^n}{1-\delta})+5\delta^n(\frac{1-\delta^{s+1}}{1-\delta})=u^{*}_2

< = >

8\delta^n+2\delta^{n+1}*(\frac{1-\delta^s}{1-\delta})>5\delta^n*(\frac{1-\delta^{s+1}}{1-\delta})

<=>

n(1 − δ) + 2δn + 1(1 − δ)s > 5δn(1 − δs + 1)

<=>

n − 8δn + 1 + 2δn + 1 − 2δn + 1 + s > 5δn − 5δn + s + 1

<=>

8 − 8δn + 1 + 2δn + 1 − 2δn + 1 + s > 5δn − 5δn + s + 1

<=>

8 − 8δ + 2δ − 2δ1 + s > 5 − 5δs + 1

<=>

8 − 6δ − 2δ1 + s > 5 − 5δs + 1

Wir können jetzt in Abhängigkeit für unser s Lösungen bestimmen:

1. Möglichkeit:

s->\infty:

Es ergibt sich, da der Ausdruck 1 + s und der Ausdruck s + 1 in diesem Fall gegen 0 strebt:

8-6\delta>5 <=> 3>6\delta <=> \frac{3}{6}>\delta

Hieraus ergibt sich, dass es nur für \delta<\frac{3}{6} profitabel ist, abzuweichen.

2. Möglichkeit: s=0

8 − 6δ − 2δ > 5 − 5δ < = > 3 > 3δ.

Dies ist offensichtlich für alle \delta \in (0,1) erfüllt.

3. Möglichkeit: s=1

8 − 6δ − 2δ2 > 5 − 5δ2 < = > 3 > 6δ − 3δ2

Es folgt, dass für \delta \in (0,1) eine Lösung existiert, denn:

Sei δ: = 1 − ε,0 < ε < 1:

Es gilt: 3 > 6(1 − ε) − 3(1 − ε)2 < = > 6 > 6 − 6ε − 3(1 − 2ε + ε2) < = > 3 > 6 − 6ε − 3 + 6ε − 3ε2 < = > 3 > 3 − 3ε2


Dies ist für δ < 1 immer erfüllt.



Nach Spieltheorie-Vorlesung folgt nun, dass die beidseitigen Trigger-Strategien ein Nash-Gleichgewicht im unendlich oft iterierten Spiel darstellen.



Literatur

  • M. Holler, G.Illing; Einführung in die Spieltheorie; 5. Auflage; Springer-Verlag; 2003 Berlin;
  • Professor M. Schottenloher: Skript Spieltheorie-Vorlesung WS08-09

Meine Werkzeuge