Balansen av en darrande hand | |
---|---|
Begreppet beslut i spelteori | |
Relaterade beslutsuppsättningar | |
Superset | Nash jämvikt |
Delmängder | Egen balans |
Data | |
Författarskap | Reinhard Selten |
Skakande hand perfekt jämvikt är principen om optimalitet i icke - samarbetande spel , vilket är en Nash-jämvikt , som har den extra egenskapen stabilitet till tillräckligt små avvikelser hos spelare från jämviktsstrategier. Formulerad av R. Selten i ett papper från 1975 [1] .
Låt spelet ges i normal form . En uppsättning blandade strategier för spelare q kallas en darrande hand-jämvikt om det finns en sekvens av helt blandade strategier { p ε } → q så att strategi q i är det bästa svaret för spelare i på strategierna från de andra spelarna i sätt p ε .
Liksom Nash-jämvikten existerar den darrande handens jämvikt i en blandad förlängning i alla icke-samarbetsvilliga spel med ändliga uppsättningar av spelarstrategier.
Spelet för två personer som visas i tabellen, som visas i normal form, har två Nash-jämvikter : ( Överst , Vänster ) och ( Nederst , Höger ). Men bara ( B , L ) är balansen för den darrande handen.
vänster | Höger | |
---|---|---|
Topp | elva | tjugo |
Botten | 0,2 | 2, 2 |
Anta faktiskt att spelare 1 använder en blandad strategi för vissa . Spelare 2:s förväntade utdelning om han spelar vänster är:
.Den förväntade utdelningen för spelare 2 när han väljer rätt strategi är:
.För tillräckligt små värden på ε, maximerar spelare 2 sin förväntade utdelning genom att använda Rätt strategi med minsta vikt. Likaså måste spelare 1 använda den minsta viktade lågstrategin om spelare 2 använder en blandad strategi . Därför är ( B , L ) balansen för den darrande handen.
Liknande resonemang håller inte för strategiernas profil ( N , P ). Anta faktiskt att spelare 1 använder en blandad strategi . Spelare 2:s förväntade utdelning om han använder L är:
.Den förväntade utdelningen för spelare 2 när du använder P -strategin :
.I det här fallet, för alla positiva värden på ε, maximerar spelare 2 sin förväntade utdelning genom att använda P vid lägsta frekvens. Därför är ( H , P ) inte en darrande handjämvikt, eftersom spelare 2 med en liten sannolikhet för fel maximerar sin förväntade utdelning genom att avvika från denna strategi.
Spel teori | |
---|---|
Grundläggande koncept | |
Typer av spel |
|
Lösningskoncept | |
Spelexempel | |