Spel med ofullständig information

Bayesianskt spel eller ofullständigt informationsspel i spelteorin kännetecknas av ofullständig information om motståndare ( deras möjliga strategier och vinster), medan spelare har övertygelser om denna osäkerhet . Ett Bayesianskt spel kan omvandlas till ett spel med fullständig men ofullkomlig information om en gemensam tidigare distribution antas. Till skillnad från ofullständig information inkluderar ofullständig information kunskap om motståndarnas strategier och utdelningar, men spelets historia (motståndarnas tidigare handlingar) är inte tillgänglig för alla deltagare.

John Harsanyi beskrev Bayesianska spel enligt följande [1] . Förutom de faktiska deltagarna i spelet, visas den virtuella spelaren " Nature ". Naturen ger var och en av de faktiska deltagarna en slumpvariabel vars värden kallas typer . Fördelningen ( densitet eller sannolikhetsfunktion ) av typer för var och en av spelarna är känd. I början av spelet "väljer" naturen olika typer av spelare. Typen definierar i synnerhet deltagarens payoff-funktion. Alltså är ofullständigheten i informationen i ett Bayesianskt spel okunnigheten hos åtminstone en spelare av samma typ som någon annan deltagare. Spelare har övertygelser om typer av motståndare; tro är en sannolikhetsfördelning över en uppsättning möjliga typer. Allt eftersom spelet fortskrider uppdateras övertygelser enligt Bayes teorem .

Definition

Spelet definieras enligt följande: , där $G=\langle N,\Omega ,\langle A_{i},u_{i},T_{i},\tau _{i},p_{i},C_{i}\rangle _{i \in N}\rangle$

$N$ - många spelare.
$\Omega$ - många naturtillstånd. Ett exempel på ett naturtillstånd: kortlekens ordning i ett kortspel.
$A_{i}$ är uppsättningen av spelaråtgärder . Låt . $i$ ${\displaystyle A=A_{1}\times A_{2}\times \dotsb \times A_{N))$
$T_{i}$ är en uppsättning spelartyper . Typen bestäms av regeln . $i$ ${\displaystyle \tau _{i}\colon \Omega \rightarrow T_{i))$
${\displaystyle C_{i}\subseteq A_{i}\times T_{i))$ definierar tillgängliga åtgärder för en spelare som har någon typ av . $i$ $T_{i}$
$u_{i}\colon \Omega \times A\rightarrow R$ spelarens payoff-funktion . Mer formellt, låt , och . $i$ $L=\{(\omega ,a_{1},\dotsc ,a_{N})\mid \omega \in \Omega ,\forall i,(a_{i},\tau _{i}( \omega ))\in C_{i}\}$ $u_{i}\colon L\rightarrow R$
$pi}$ sannolikhetsfördelningen på för varje spelare , det vill säga varje spelare utvärderar på olika sätt sannolikheterna för naturtillstånden; under spelet känner de honom inte. $\Omega$ $i$

En ren strategi måste tillfredsställa alla . Strategin för varje spelare beror bara på hans typ, eftersom de andra spelarnas typer är dolda för honom. Den förväntade utdelningen för spelaren med denna strategiska profil är . ${\displaystyle s_{i}\colon T_{i}\rightarrow A_{i))$ ${\displaystyle (s_{i}(t_{i}),t_{i})\in C_{i))$ $t_{i}$ $i$ $u_{i}(S)=E_{\omega \sim p_{i}}[u_{i}(\omega ,s_{1}(\tau _{1}(\omega )),\dotsc ,s_{N}(\tau _{N}(\omega )))]$

Låt vara uppsättningen av rena strategier, $Si}$ $S_{i}=\{s_{i}\colon T_{i}\rightarrow A_{i}\mid (s_{i}(t_{i}),t_{i})\in C_{i },\forall t_{i}\}.$

Den Bayesianska jämvikten i ett spel definieras som Nash-jämvikten för ett (kanske i blandade strategier) spel . Om spelet är ändligt, existerar alltid Bayesiansk jämvikt. $G$ ${\hat {G}}=\langle N,{\hat {A}}=S_{1}\times S_{2}\times \dotsb \times S_{N},{\hat {u} }=u\rangle$ $G$

Exempel

Sheriffens dilemma

Sheriffen konfronterar den misstänkte. Båda måste samtidigt bestämma om de ska skjuta eller inte.

Den misstänkte har två möjliga typer: "kriminell" och "laglydig". Sheriffen har bara en typ. Den misstänkte känner till sin typ, men det gör inte sheriffen. Det finns alltså ofullständig information i spelet, det tillhör Bayesian-klassen. Enligt sheriffen är den misstänkte med sannolikhet p en brottsling, med sannolikhet 1-p - en laglydig medborgare. Värdena p och 1-p är kända för båda spelarna, eftersom en gemensam tidigare fördelning antas. Det är detta som gör det möjligt att förvandla detta spel till ett spel med komplett men ofullkomlig information.

Sheriffen skulle hellre skjuta om den misstänkte skjuter och undvika att skjuta på annat sätt (även om den misstänkte verkligen är en brottsling). Brottslingen är benägen att skjuta (även om sheriffen inte skjuter), medan den laglydige medborgaren vill undvika konflikter på något sätt (även om sheriffen skjuter). Utbetalningsmatriser beror på typen av misstänkt:

Typ = "laglydig"		Sheriffens agerande
Typ = "laglydig"		Brand	Skjut inte
Den misstänktes agerande	Brand	-3, -1	-12
Den misstänktes agerande	Skjut inte	-2, -1	0, 0

Typ = "Criminal"		Sheriffens agerande
Typ = "Criminal"		Brand	Skjut inte
Den misstänktes agerande	Brand	0, 0	2, -2
Den misstänktes agerande	Skjut inte	-2, -1	-1.1

Om båda har gemensam kunskap om spelarnas rationalitet (spelare 1 är rationell; spelare 1 vet att spelare 2 är rationell; spelare 1 vet att spelare 2 vet att spelare 1 är rationell etc. i det oändliga) kommer spelet att fortsätta enl. följande jämviktsscenario (perfekt Bayesiansk jämvikt) [2] [3] :

När den misstänkte är av den laglydiga typen är den dominerande strategin att han inte skjuter, när han är av den kriminella typen är den dominerande strategin att skjuta. Starkt dominerade strategier kan uteslutas från övervägande. Sedan om sheriffen skjuter får han 0 med sannolikhet p och -1 med sannolikhet 1-p. Hans förväntade utdelning är p-1. Om länsmannen inte skjuter, har han rätt till -2 med sannolikhet p och 0 med sannolikhet 1-p; den förväntade utdelningen är -2p. Sheriffen kommer alltid att skjuta när p-1 > -2p, dvs när p > 1/3.

Se även

Anteckningar

↑ Harsanyi, John C., 1967/1968. "Spel med ofullständig information som spelas av Bayesian Players, I-III." Management Science 14 (3): 159-183 (del I), 14 (5): 320-334 (del II), 14 (7): 486-502 (del III).
↑ Coursera . _ kursra . Hämtad: 16 juni 2016.
↑ Hu, Yuhuang; Hej, Chu Kiong. En generaliserad kvantinspirerad modell för beslutsfattande för intelligent agent // The Scientific World Journal : journal. - 2014. - 17 mars ( vol. 2014 ). - ISSN 1537-744X . - doi : 10.1155/2014/240983 . — PMID 24778580 .

Litteratur

Gibbons, Robert. Spelteori för tillämpade ekonomer (neopr.) . - Princeton University Press , 1992. - S. 144-152.
Levin, Jonathan Spel med ofullständig information (2002). Hämtad: 25 augusti 2016. (obestämd)

Spel teori
Grundläggande koncept	Ömsesidig och gemensam kunskap Spelare Hierarki av tro Irrationell förstärkning Strategi ( dominans ) Omvänd induktion
Typer av spel	Samtidigt , sekventiellt och repetitivt Icke -samarbetsvillig och samarbetsvillig Med fullständig , ofullständig , perfekt och ofullständig information I normal och utökad form Antagonistisk Differentiell Stokastisk Kampen mellan könen Rådjursjakt
Lösningskoncept	Riskdominans Korrelerad jämvikt Balansen av en darrande hand Nash jämvikt Subgame perfekt jämvikt Rationaliserbarhet Sekventiell jämvikt stark balans Egen balans Evolutionärt stabil strategi Epsilon-jämvikt Pareto effektivitet Kärna
Spelexempel	Fångens dilemma Uppgiften för baren "El Farol" Bertrand modell Cournot modell Stackelberg modell Orlyanka Tragedin med delade resurser hökar och duvor
Epistemisk spelteori Mekanism design Rättvis uppdelning