Beste Antwort

Aus Wikiludia
(Unterschied zwischen Versionen)
Wechseln zu: Navigation, Suche
(Präzisierung)
(Beste Antwort: Bezeichnungen)
 
(10 dazwischenliegende Versionen von 2 Benutzern werden nicht angezeigt)
Zeile 1: Zeile 1:
== Definition ==
+
Die Menge der besten Antworten hat in der Spieltheorie eine große Bedeutung für die Analyse eines Spiels in Normalform sowie für die Bestimmung von [[Nash-Gleichgewicht]]en. Die '''beste Antwort''' wird dabei durch die Fragestellung charakterisiert, welche Strategie sich am besten eignet, um seinen eigenen Nutzen unter Berücksichtigung einer vorgegebenen Strategiekombination der andere Spieler zu maximieren.
 +
 +
== Definitionen ==
  
In einem Normalformenspiel heißt eine Strategie <math>\quad \hat s_i \in S_i</math> für Spieler <math>i \in M=\{1,\ldots ,N\}</math> ''beste Antwort'' auf <math>s_{-i} \in S_{-i}</math>, genau dann wenn
+
=== Beste Antwort ===
<math>\forall s_i \in S_{i}: \quad u_i(\hat s_i,s_{-i}) \ge u_i(s_i,s_{-i})</math>. <br>
+
{|
Anders geschrieben: <math> \hat s_i</math> ist beste Antwort auf <math>s_{-i} \in S_{-i}</math>, genau dann wenn
+
|width="5%" style="vertical-align:top" |
<math> u_i(\hat s_i,s_{-i}) = max\{u_i(s_i,s_{-i}): s_i \in S_i\}</math>.
+
|width="90%" style="vertical-align:top"|
 +
<div style="margin: 0; margin-right:10px; padding: 0 1em 1em 1em; background-color:#DDFFFF; align:right;">
 +
<br>
 +
In einem [[Normalform|Normalformenspiel]] (M,S,u) heißt eine Strategie <math>\quad \hat s_i \in S_i</math> des Spielers <math>i \in M=\{1,\ldots ,N\}</math> genau dann eine
 +
''beste Antwort'' auf <math>s_{-i} \in S_{-i}</math>, wenn  
 +
:<math>\forall s_i \in S_{i}: \quad u_i(\hat s_i,s_{-i}) \ge u_i(s_i,s_{-i})</math>. <br>
 +
Anders geschrieben: <math> \hat s_i</math> ist genau dann beste Antwort auf <math>s_{-i} \in S_{-i}\,,</math> wenn
 +
:<math> u_i(\hat s_i,s_{-i}) = \max\{u_i(s_i,s_{-i}): s_i \in S_i\} </math>.
 +
|
 +
|}
 +
;Notationen:
 +
Dabei wird für einen Spieler <math> i \in M </math> und für ein Strategieprofil <math> s=(s_1, \ldots ,s_N) \in S=S_1\times \ldots \times S_N</math> mit <math> s_{-i} </math> das N-1 - Tupel
 +
:<math> s_{-i} = (s_1, \ldots ,s_{i-1},s_{i+1}, \ldots ,s_N) </math>
 +
bezeichnet, also das Tupel, das entsteht, wenn bei s die Komponente <math> s_i</math> weggelassen wird. Mit <math> S_{-i} </math> wird entsprechend die Menge aller dieser <math> s_{-i} </math> bezeichnet:
 +
:<math> S_{-i} = \prod_{k=1, k\neq i}^N S_k \,.</math>
 +
Schließlich steht <math> (s_i,s_{-i}) </math> für s, und <math> (\hat s_i,s_{-i})</math> für <math> (\hat s_i,s_{-i}) = (s_1, \ldots ,s_{i-1},\hat s_i,s_ {i+1}, \ldots , s_N) \,.</math>
 +
 
 +
=== Korrespondenz der besten Antworten ===
 +
 
 +
{|
 +
|width="5%" style="vertical-align:top" |
 +
|width="90%" style="vertical-align:top"|
 +
<div style="margin: 0; margin-right:10px; padding: 0 1em 1em 1em; align:right;">
 +
<br>
 +
Die mengenwertige Abbildung <math> b_i : S_{-i} \rightarrow \mathfrak {P}(S_i) </math>  mit
 +
:<math> b_i (s_{-i}) := \{ \hat s_i \in S_i: u_i(\hat s_i,s_{-i}) = \max\{u_i(s_i,s_{-i}): s_i \in S_i\} \}\subset S_i </math>
 +
heißt ''Korrespondenz der besten Antworten für den Spieler i''.
 +
<br>
 +
Die mengenwertige Abbildung
 +
<math> b : S \rightarrow \prod_{i=1}^N \mathfrak {P}(S_i) </math> mit 
 +
:<math>s=(s_1, \ldots ,s_N) \mapsto b(s) := b_1(s_{-1})\times b_2(s_{-2}) \times \ldots \times b_N (s_{-N}) </math>
 +
heißt ''Korrespondenz der besten Antworten'' oder ''Beste-Antwort-Korrespondenz''.
 +
|
 +
|}
 +
 
 +
== Existenz und Zusammenhang mit Nash-Gleichgewichten ==
 +
 
 +
;Existenz:
 +
:In jedem Normalformenspiel existiert die Beste-Antwort-Korrespondenz. Für endliche Spiele ist <math> b_k(s_{-k}) \neq \emptyset</math> für alle <math> k \in M</math> und alle <math> s_{-k}\in S_{-k}\,,</math> weil das Maximum einer Funktion (hier <math> s_k \mapsto u_k(s_k,s_{-k}) \,</math>) über einer endlichen Menge stets existiert. Dasselbe gilt für den Fall, dass alle Strategiemengen <math> S_k</math> kompakte Räume und die Nutzenfunktionen  <math> u_k : S \to \mathbb R</math> stetige Funktionen sind.
 +
 
 +
;Beste-Antwort-Funktion:
 +
Es sei <math> b_i (s_{-i}) \not= \emptyset </math> für alle Spieler i und für alle Strategiekombinationen <math>  s_{-i} \in S_{-i} </math>. Dann kann man (unter Ausnutzung des Auswahlaxioms)  <math> r_i (s_{-i}) \in b_i (s_{-i}) </math> auswählen. Die Funktion <math> r_i : S_{-i} \rightarrow S_{i} </math> ist dann eine feste ''Beste-Antwort-Funktion'' und es gilt <math> r_i(s_{-i})\in b_i(s_{-i})\,.</math>
 +
 
 +
;Satz:
 +
:Eine Strategiekombination  <math> s' \in  S  </math> ist genau dann ein Nash-Gleichgewicht, wenn <math> s' \in  b (s') </math>.
 +
 
 +
;Beweis:
 +
Sei <math> s' = (s'_1, \ldots ,s'_N) \in  b (s') </math>. Das heißt, es gilt: <math> \forall i: s'_i \in  b_i (s'_{-i}) </math>. Daher ist nach Definition <math> u_i(s') = \max_{s_i \in S_i}\ u_i(s_i,s'_{-i}) </math>, also ist die Definition des [[Nash-Gleichgewicht]]s
 +
:<math> \forall i\in M\,\, \forall s_i \in S_{i}\,\,  u_i(s') \ge u_i(s_i,s'_{-i}) </math>
 +
erfüllt.<br>
 +
Sei umgekehrt s' ein [[Nash-Gleichgewicht]]. Dann gilt <math> \forall i\in M\,\, \forall s_i \in S_{i}\,\,  u_i(s') \ge u_i(s_i,s'_{-i}) </math>, also <math> \forall i\in M: s'_i \in  b_i (s'_{-i}) </math>, also <math> s' \in  b (s') \,.</math>
 +
 
 +
== Beispiele ==
 +
 
 +
# Im Fall <math> u_j = 0 </math> sind alle Strategien beste Antworten, da trivialerweise <math>\forall s_i \in S_{i}: u_i(\hat s_i,s_{-i}) \ge u_i(s_i,s_{-i})</math> für alle Strategien erfüllt ist.
 +
# Im [[Gefangenendilemma]] ist für beide Spieler A (Aussagen) die jeweils beste Antwort sowohl auf S (Schweigen) als auch auf A:
 +
#:* <math> u_1 </math> (A, S) = 0 > -3 = <math>u_1</math> (S, S)
 +
#:* <math> u_1 </math> (A, A) = -8 > -10 = <math> u_1</math> (S, A)
 +
#:(Die Haftstrafen wurden als negative Konsequenz zum leichteren Verständnis mit negativen Jahresangaben versehen; für Spieler 2 analog)
 +
# Auch die Lösung im [[Oligopole:Cournot-Duopol|Cournot-Duopol]] beruht auf der Bestimmung der besten Antworten.
 +
# Bei der [[Rückwärtsinduktion]] wird in jedem Schritt das Prinzip der besten Antwort angewendet.
 +
# Für die beste Antwort existiert eine beste-Antwort Äquivalenz, die im Artikel [[Äquivalenz in Spielen]] näher beschrieben wird.
 +
 
 +
== Strikt und schwach beste Antwort ==
 +
 
 +
Vergleichbar mit der Unterscheidung von strikter und schwacher Dominanz kann man auch die Menge der besten Antworten in strikt oder streng beste Antworten und schwach beste Antworten unterscheiden:
 +
 
 +
;Definition '''Strikt beste Antwort'''
 +
:Eine Strategie <math> s_i^* </math> heißt strikt beste Antwort auf eine Strategie <math> s_{-i} </math> genau dann, wenn gilt: <math> u_i (s_i^*, s_{-i}) > u_i(s_i,s_{-i})  \quad \forall s_i \in S_{i} \setminus \{s_i^*\}</math>.
 +
 
 +
;Definition '''Schwach beste Antwort'''
 +
:Eine Strategie <math> s_i^* </math> heißt schwach beste Antwort auf eine Strategie <math> s_{-i} </math> genau dann, wenn gilt: <math> u_i (s_i^*, s_{-i}) \ge u_i(s_i,s_{-i})  \quad \forall s_i \in S_{i} </math> und
 +
:<math> \exists  \hat s_i \in S_i \setminus s_i^* </math> mit <math> u_i (\hat s_i, s_{-i}) = u_i(s_i^*,s_{-i}) </math>.
 +
 
 +
Es ist leicht zu sehen, dass es anders als bei schwach besten Antworten nicht zwei verschiedene strikt beste Antworten geben kann.<br>
 +
Außerdem beachte man: ''schwach beste Antwort'' ist formal stärker als ''beste Antwort''.
 +
 
 +
== Quellen ==
 +
* Riechmann, Thomas: Spieltheorie, Vahlen, München, 2., vollst. überarb. Aufl. 2007, ISBN 978-3-800-63505-4
 +
* Schlee, Walter: Einführung in die Spieltheorie, Vieweg, Wiesbaden, 1. Aufl. 2004, ISBN 3-528-03214-6

Aktuelle Version vom 11. Februar 2009, 12:51 Uhr

Die Menge der besten Antworten hat in der Spieltheorie eine große Bedeutung für die Analyse eines Spiels in Normalform sowie für die Bestimmung von Nash-Gleichgewichten. Die beste Antwort wird dabei durch die Fragestellung charakterisiert, welche Strategie sich am besten eignet, um seinen eigenen Nutzen unter Berücksichtigung einer vorgegebenen Strategiekombination der andere Spieler zu maximieren.

Inhaltsverzeichnis

Definitionen

Beste Antwort


In einem Normalformenspiel (M,S,u) heißt eine Strategie \quad \hat s_i \in S_i des Spielers i \in M=\{1,\ldots ,N\} genau dann eine beste Antwort auf s_{-i} \in S_{-i}, wenn

\forall s_i \in S_{i}: \quad u_i(\hat s_i,s_{-i}) \ge u_i(s_i,s_{-i}).

Anders geschrieben:  \hat s_i ist genau dann beste Antwort auf s_{-i} \in S_{-i}\,, wenn

 u_i(\hat s_i,s_{-i}) = \max\{u_i(s_i,s_{-i}): s_i \in S_i\} .
Notationen

Dabei wird für einen Spieler  i \in M und für ein Strategieprofil  s=(s_1, \ldots ,s_N) \in S=S_1\times \ldots \times S_N mit si das N-1 - Tupel

 s_{-i} = (s_1, \ldots ,s_{i-1},s_{i+1}, \ldots ,s_N)

bezeichnet, also das Tupel, das entsteht, wenn bei s die Komponente si weggelassen wird. Mit Si wird entsprechend die Menge aller dieser si bezeichnet:

 S_{-i} = \prod_{k=1, k\neq i}^N S_k \,.

Schließlich steht (si,si) für s, und  (\hat s_i,s_{-i}) für  (\hat s_i,s_{-i}) = (s_1, \ldots ,s_{i-1},\hat s_i,s_ {i+1}, \ldots , s_N) \,.

Korrespondenz der besten Antworten


Die mengenwertige Abbildung  b_i : S_{-i} \rightarrow \mathfrak {P}(S_i) mit

 b_i (s_{-i}) := \{ \hat s_i \in S_i: u_i(\hat s_i,s_{-i}) = \max\{u_i(s_i,s_{-i}): s_i \in S_i\} \}\subset S_i

heißt Korrespondenz der besten Antworten für den Spieler i.
Die mengenwertige Abbildung  b : S \rightarrow \prod_{i=1}^N \mathfrak {P}(S_i) mit

s=(s_1, \ldots ,s_N) \mapsto b(s) := b_1(s_{-1})\times b_2(s_{-2}) \times \ldots \times b_N (s_{-N})

heißt Korrespondenz der besten Antworten oder Beste-Antwort-Korrespondenz.

Existenz und Zusammenhang mit Nash-Gleichgewichten

Existenz
In jedem Normalformenspiel existiert die Beste-Antwort-Korrespondenz. Für endliche Spiele ist  b_k(s_{-k}) \neq \emptyset für alle  k \in M und alle  s_{-k}\in S_{-k}\,, weil das Maximum einer Funktion (hier  s_k \mapsto u_k(s_k,s_{-k}) \,) über einer endlichen Menge stets existiert. Dasselbe gilt für den Fall, dass alle Strategiemengen Sk kompakte Räume und die Nutzenfunktionen  u_k : S \to \mathbb R stetige Funktionen sind.
Beste-Antwort-Funktion

Es sei  b_i (s_{-i}) \not= \emptyset für alle Spieler i und für alle Strategiekombinationen   s_{-i} \in S_{-i} . Dann kann man (unter Ausnutzung des Auswahlaxioms)  r_i (s_{-i}) \in b_i (s_{-i}) auswählen. Die Funktion  r_i : S_{-i} \rightarrow S_{i} ist dann eine feste Beste-Antwort-Funktion und es gilt  r_i(s_{-i})\in b_i(s_{-i})\,.

Satz
Eine Strategiekombination  s' \in  S  ist genau dann ein Nash-Gleichgewicht, wenn  s' \in  b (s') .
Beweis

Sei  s' = (s'_1, \ldots ,s'_N) \in  b (s') . Das heißt, es gilt:  \forall i: s'_i \in  b_i (s'_{-i}) . Daher ist nach Definition  u_i(s') = \max_{s_i \in S_i}\ u_i(s_i,s'_{-i}) , also ist die Definition des Nash-Gleichgewichts

 \forall i\in M\,\, \forall s_i \in S_{i}\,\,  u_i(s') \ge u_i(s_i,s'_{-i})

erfüllt.
Sei umgekehrt s' ein Nash-Gleichgewicht. Dann gilt  \forall i\in M\,\, \forall s_i \in S_{i}\,\,  u_i(s') \ge u_i(s_i,s'_{-i}) , also  \forall i\in M: s'_i \in  b_i (s'_{-i}) , also  s' \in  b (s') \,.

Beispiele

  1. Im Fall uj = 0 sind alle Strategien beste Antworten, da trivialerweise \forall s_i \in S_{i}: u_i(\hat s_i,s_{-i}) \ge u_i(s_i,s_{-i}) für alle Strategien erfüllt ist.
  2. Im Gefangenendilemma ist für beide Spieler A (Aussagen) die jeweils beste Antwort sowohl auf S (Schweigen) als auch auf A:
    • u1 (A, S) = 0 > -3 = u1 (S, S)
    • u1 (A, A) = -8 > -10 = u1 (S, A)
    (Die Haftstrafen wurden als negative Konsequenz zum leichteren Verständnis mit negativen Jahresangaben versehen; für Spieler 2 analog)
  3. Auch die Lösung im Cournot-Duopol beruht auf der Bestimmung der besten Antworten.
  4. Bei der Rückwärtsinduktion wird in jedem Schritt das Prinzip der besten Antwort angewendet.
  5. Für die beste Antwort existiert eine beste-Antwort Äquivalenz, die im Artikel Äquivalenz in Spielen näher beschrieben wird.

Strikt und schwach beste Antwort

Vergleichbar mit der Unterscheidung von strikter und schwacher Dominanz kann man auch die Menge der besten Antworten in strikt oder streng beste Antworten und schwach beste Antworten unterscheiden:

Definition Strikt beste Antwort
Eine Strategie  s_i^* heißt strikt beste Antwort auf eine Strategie si genau dann, wenn gilt:  u_i (s_i^*, s_{-i}) > u_i(s_i,s_{-i})  \quad \forall s_i \in S_{i} \setminus \{s_i^*\}.
Definition Schwach beste Antwort
Eine Strategie  s_i^* heißt schwach beste Antwort auf eine Strategie si genau dann, wenn gilt:  u_i (s_i^*, s_{-i}) \ge u_i(s_i,s_{-i})  \quad \forall s_i \in S_{i} und
 \exists  \hat s_i \in S_i \setminus s_i^* mit  u_i (\hat s_i, s_{-i}) = u_i(s_i^*,s_{-i}) .

Es ist leicht zu sehen, dass es anders als bei schwach besten Antworten nicht zwei verschiedene strikt beste Antworten geben kann.
Außerdem beachte man: schwach beste Antwort ist formal stärker als beste Antwort.

Quellen

  • Riechmann, Thomas: Spieltheorie, Vahlen, München, 2., vollst. überarb. Aufl. 2007, ISBN 978-3-800-63505-4
  • Schlee, Walter: Einführung in die Spieltheorie, Vieweg, Wiesbaden, 1. Aufl. 2004, ISBN 3-528-03214-6
Ansichten
Meine Werkzeuge
Navigation
Werkzeuge