Spel med ofullständig information

Bayesianskt spel eller ofullständigt informationsspel i spelteorin kännetecknas av ofullständig  information om motståndare ( deras möjliga strategier och vinster), medan spelare har övertygelser om denna osäkerhet . Ett Bayesianskt spel kan omvandlas till ett spel med fullständig men ofullkomlig information om en gemensam tidigare distribution antas. Till skillnad från ofullständig information inkluderar ofullständig information kunskap om motståndarnas strategier och utdelningar, men spelets historia (motståndarnas tidigare handlingar) är inte tillgänglig för alla deltagare.  

John Harsanyi beskrev Bayesianska spel enligt följande [1] . Förutom de faktiska deltagarna i spelet, visas den virtuella spelaren " Nature ". Naturen ger var och en av de faktiska deltagarna en slumpvariabel vars värden kallas typer . Fördelningen ( densitet eller sannolikhetsfunktion ) av typer för var och en av spelarna är känd. I början av spelet "väljer" naturen olika typer av spelare. Typen definierar i synnerhet deltagarens payoff-funktion. Alltså är ofullständigheten i informationen i ett Bayesianskt spel okunnigheten hos åtminstone en spelare av samma typ som någon annan deltagare. Spelare har övertygelser om typer av motståndare; tro är en sannolikhetsfördelning över en uppsättning möjliga typer. Allt eftersom spelet fortskrider uppdateras övertygelser enligt Bayes teorem .

Definition

Spelet definieras enligt följande: , där

  1. - många spelare.
  2. - många naturtillstånd. Ett exempel på ett naturtillstånd: kortlekens ordning i ett kortspel.
  3. är uppsättningen av spelaråtgärder . Låt .
  4. är en uppsättning spelartyper . Typen bestäms av regeln .
  5. definierar tillgängliga åtgärder för en spelare som har någon typ av .
  6. spelarens payoff-funktion . Mer formellt, låt , och .
  7. sannolikhetsfördelningen på för varje spelare , det vill säga varje spelare utvärderar på olika sätt sannolikheterna för naturtillstånden; under spelet känner de honom inte.

En ren strategi måste tillfredsställa alla . Strategin för varje spelare beror bara på hans typ, eftersom de andra spelarnas typer är dolda för honom. Den förväntade utdelningen för spelaren med denna strategiska profil är .

Låt vara uppsättningen av rena strategier,

Den Bayesianska jämvikten i ett spel definieras som Nash-jämvikten för ett (kanske i blandade strategier) spel . Om spelet är ändligt, existerar alltid Bayesiansk jämvikt.

Exempel

Sheriffens dilemma

Sheriffen konfronterar den misstänkte. Båda måste samtidigt bestämma om de ska skjuta eller inte.

Den misstänkte har två möjliga typer: "kriminell" och "laglydig". Sheriffen har bara en typ. Den misstänkte känner till sin typ, men det gör inte sheriffen. Det finns alltså ofullständig information i spelet, det tillhör Bayesian-klassen. Enligt sheriffen är den misstänkte med sannolikhet p en brottsling, med sannolikhet 1-p - en laglydig medborgare. Värdena p och 1-p är kända för båda spelarna, eftersom en gemensam tidigare fördelning antas. Det är detta som gör det möjligt att förvandla detta spel till ett spel med komplett men ofullkomlig information.

Sheriffen skulle hellre skjuta om den misstänkte skjuter och undvika att skjuta på annat sätt (även om den misstänkte verkligen är en brottsling). Brottslingen är benägen att skjuta (även om sheriffen inte skjuter), medan den laglydige medborgaren vill undvika konflikter på något sätt (även om sheriffen skjuter). Utbetalningsmatriser beror på typen av misstänkt:

 
Typ = "laglydig" Sheriffens agerande
Brand Skjut inte
Den misstänktes agerande Brand -3, -1 -12
Skjut inte -2, -1 0, 0
 
Typ = "Criminal" Sheriffens agerande
Brand Skjut inte
Den misstänktes agerande Brand 0, 0 2, -2
Skjut inte -2, -1 -1.1

Om båda har gemensam kunskap om spelarnas rationalitet (spelare 1 är rationell; spelare 1 vet att spelare 2 är rationell; spelare 1 vet att spelare 2 vet att spelare 1 är rationell etc. i det oändliga) kommer spelet att fortsätta enl. följande jämviktsscenario (perfekt Bayesiansk jämvikt) [2] [3] :

När den misstänkte är av den laglydiga typen är den dominerande strategin att han inte skjuter, när han är av den kriminella typen är den dominerande strategin att skjuta. Starkt dominerade strategier kan uteslutas från övervägande. Sedan om sheriffen skjuter får han 0 med sannolikhet p och -1 med sannolikhet 1-p. Hans förväntade utdelning är p-1. Om länsmannen inte skjuter, har han rätt till -2 med sannolikhet p och 0 med sannolikhet 1-p; den förväntade utdelningen är -2p. Sheriffen kommer alltid att skjuta när p-1 > -2p, dvs när p > 1/3.

Se även

Anteckningar

  1. Harsanyi, John C., 1967/1968. "Spel med ofullständig information som spelas av Bayesian Players, I-III." Management Science 14 (3): 159-183 (del I), 14 (5): 320-334 (del II), 14 (7): 486-502 (del III).
  2. Coursera  . _ kursra . Hämtad: 16 juni 2016.
  3. Hu, Yuhuang; Hej, Chu Kiong. En generaliserad kvantinspirerad modell för beslutsfattande för intelligent agent  //  The Scientific World Journal : journal. - 2014. - 17 mars ( vol. 2014 ). - ISSN 1537-744X . - doi : 10.1155/2014/240983 . — PMID 24778580 .

Litteratur