Epsilon-jämvikt

Den aktuella versionen av sidan har ännu inte granskats av erfarna bidragsgivare och kan skilja sig väsentligt från versionen som granskades den 13 juli 2017; kontroller kräver 3 redigeringar .
ε-jämvikt
Begreppet beslut i spelteori
Relaterade beslutsuppsättningar
Delmängder Nash jämvikt
Data
Ansökan Stokastiska spel

En ε-jämvikt i spelteori  är en strategiprofil för spelare i ett icke-samarbetsspel som ungefär uppfyller Nash-jämviktsvillkoren .

Definition

För ett givet icke-samarbetsspel och en icke-negativ reell parameter ε, kallas strategiprofilen en ε-jämvikt om ingen spelare kan öka sin förväntade utdelning med mer än ε genom att ändra sin strategi. Varje Nash-jämvikt är en ε-jämvikt för ε = 0.

Formellt, låt vara  ett spel av N personer med uppsättningar av strategier för spelare och en vektor av payoff funktioner u . En uppsättning strategier är en -jämvikt i ett spel G om:

för alla

Exempel

Begreppet ε-jämvikt används i teorin om stokastiska spel med ett obegränsat antal repetitioner. Följande exempel visar spel som inte har en Nash-jämvikt men som har en ε-jämvikt för alla positiva ε.

Det enklaste exemplet är följande version av spelet " Orlyanka ", föreslagen av G. Everett. Spelare 1 väljer sidan av myntet, spelare 2 måste gissa det. Om spelare 2 gissar rätt vinner han det myntet och spelet slutar. Annars, om "örn" gissades, slutar spelet med noll vinster, om " svansar " gissades, upprepas spelet. När spelet upprepas i oändlighet får båda deltagarna noll utdelning.

För alla ε > 0 och en strategiprofil så att spelare 2 kallar huvuden med sannolikhet ε och svansar med sannolikhet 1-ε (i vilket steg som helst av spelet, oavsett historia), är ε-jämvikten i detta spel. Den förväntade utdelningen för spelare 2 är inte mindre än 1-ε. Det är dock lätt att se att ingen av Player 2:s strategier kan garantera en förväntad utdelning på 1. Därför har detta spel ingen Nash-jämvikt.

Länkar

Litteratur