Balansen av en darrande hand

Balansen av en darrande hand
Begreppet beslut i spelteori
Relaterade beslutsuppsättningar
Superset Nash jämvikt
Delmängder Egen balans
Data
Författarskap Reinhard Selten

Skakande hand perfekt jämvikt är principen  om optimalitet i icke - samarbetande spel , vilket är en Nash-jämvikt , som har den extra egenskapen stabilitet till tillräckligt små avvikelser hos spelare från jämviktsstrategier. Formulerad av R. Selten i ett papper från 1975 [1] .

Formell definition

Låt spelet ges i normal form . En uppsättning blandade strategier för spelare q kallas en darrande hand-jämvikt om det finns en sekvens av helt blandade strategier { p ε } → q så att strategi q i är det bästa svaret för spelare i på strategierna från de andra spelarna i sätt p ε .

Liksom Nash-jämvikten existerar den darrande handens jämvikt i en blandad förlängning i alla icke-samarbetsvilliga spel med ändliga uppsättningar av spelarstrategier.

Exempel

Spelet för två personer som visas i tabellen, som visas i normal form, har två Nash-jämvikter : ( Överst , Vänster ) och ( Nederst , Höger ). Men bara ( B , L ) är balansen för den darrande handen.

vänster Höger
Topp elva tjugo
Botten 0,2 2, 2


Anta faktiskt att spelare 1 använder en blandad strategi för vissa . Spelare 2:s förväntade utdelning om han spelar vänster är:

.

Den förväntade utdelningen för spelare 2 när han väljer rätt strategi är:

.

För tillräckligt små värden på ε, maximerar spelare 2 sin förväntade utdelning genom att använda Rätt strategi med minsta vikt. Likaså måste spelare 1 använda den minsta viktade lågstrategin om spelare 2 använder en blandad strategi . Därför är ( B , L ) balansen för den darrande handen.

Liknande resonemang håller inte för strategiernas profil ( N , P ). Anta faktiskt att spelare 1 använder en blandad strategi . Spelare 2:s förväntade utdelning om han använder L är:

.

Den förväntade utdelningen för spelare 2 när du använder P -strategin :

.

I det här fallet, för alla positiva värden på ε, maximerar spelare 2 sin förväntade utdelning genom att använda P vid lägsta frekvens. Därför är ( H , P ) inte en darrande handjämvikt, eftersom spelare 2 med en liten sannolikhet för fel maximerar sin förväntade utdelning genom att avvika från denna strategi.

Länkar

  1. Selten, R. En omprövning av perfekthetskonceptet för jämviktspunkter i omfattande spel  //  International Journal of Game Theory: journal. - 1975. - Vol. 4 . - S. 25-55 .

Litteratur