AlphaGo mot Lee Sedol (eller Google DeepMind Challenge Match ) var en go - match mellan 9 och 15 mars 2016 mellan Google DeepMinds AlphaGo -datorprogram och Lee Sedol , ett koreanskt 9-dan-proffs . Totalt spelades 5 matcher. Spelet spelades enligt kinesiska regler, värdet på komi var 7,5 poäng. Tidskontrollen är klassisk - varje spelare får två timmar och 3 byoyomi på 60 sekunder per spel. AlphaGo använde 1920 CPU :er och 280 GPU :er som kördes indistribuerat nätverk [1] . Spelen streamades live på YouTube [2] . Matchen slutade med segern för AlphaGo med en poäng på 4:1 [3] [4] . Händelsen har jämförts med den historiska schackmatchen 1997 mellan Deep Blue och Garry Kasparov , som till viss del beseglade schackets öde [5] [6] [7] .
Vinnaren av matchen fick en belöning på 1 miljon dollar; eftersom AlphaGo var vinnaren sa Google DeepMind att prispengarna skulle doneras till välgörande ändamål, inklusive UNICEF och go-to-organisationer [8] . Lee Sedol fick $170 000 ($150 000 för deltagande och ytterligare $20 000 för att vinna ett av spelen) [9] .
Efter att ha vunnit matchen tilldelade Korea Paduk Association AlphaGo den högsta go-rankningen, " hedersnionde dan ", för programmets "uppriktiga ansträngningar" för att bemästra spelet [10] .
Go är ett komplext brädspel som kräver, förutom logik, användning av intuition, kreativt och strategiskt tänkande [11] [12] . Länge var det extremt svårt att lära datorprogram att spela Go på nivån av en stark amatör [13] . Jämfört med schack får artificiell intelligens fler uppgifter, vars lösning kräver imitation av den mänskliga tankeprocessen [14] . Redan 1965 skrev matematikern Irving John Goode :
Gå på datorn? – För att programmera en dator att spela ett meningsfullt spel Go, och inte bara spela efter reglerna, är det nödvändigt att formalisera principerna för en bra strategi eller skapa ett lärandeprogram. Principerna för spelet go är bättre och mer mystiska än schackets, och beror mer på värdebedömningar. Därför tror jag att det är till och med mycket svårare att skapa ett datorprogram som spelar Go intelligent än ett schackprogram [15] .
Fram till 2015 [16] kunde de bästa Go-programmen bara nå nivån för amatör dan [17] . Datorn klarade sig bättre på 9x9-kortet, där vissa program kunde överträffa professionella spelare. Före tillkomsten av AlphaGo hävdade vissa utvecklare att datorer aldrig skulle kunna slå de bästa mänskliga spelarna [18] . Elon Musk , en av Deepminds tidiga investerare, sa 2016 att artificiell intelligens, enligt experter, är 10 år från att slå de bästa av professionella spelare [19] .
AlphaGos match mot Lee Sedol kan jämföras med schackmatchen 1997 mellan programmet Deep Blue och Garry Kasparov , där IBM-programmets seger över den regerande mästaren blev den symboliska startpunkten för en ny era när datorer överträffade människor i schack [20 ] .
AlphaGo har betydande skillnader från sina föregångare. Den använder neurala nätverk , där heuristiska uppskattningar inte baseras på specifika värden av variabler kodade av människor, utan till stor del extraheras av programmet självt, genom tiotals miljoner visningar av spelade spel och egna spel med sig själv [16] [21 ] [22] . Inte ens AlphaGos utvecklingsteam själv kan specificera hur AlphaGo utvärderar positionen i spelet och väljer sitt nästa drag [23] . Monte Carlo-metoden har också blivit ett av de viktigaste sätten att öka effektiviteten i programmet vid val av drag. När programmet skapades användes data från teorin om mönsterigenkänning och maskininlärning [16] .
I början av 2016 publicerades material som i oktober 2015 besegrade AlphaGo trefaldiga Europamästaren Fan Hui (andra professionella dan) med en poäng på 5-0; alltså, för första gången, besegrade artificiell intelligens en professionell spelare på ett 19x19-bräde utan handikapp [24] [25] . Vissa experter pekade på en stark klyfta i spelnivån mellan Fan Hui och Li Sedol, ägaren till den högsta rangen - 9:e professionella dan och många titlar vann [26] . Tidigare kunde datorprogrammen Zen och Crazy Stone besegra professionella spelare med ett försprång på fyra eller fem stenar [27] [28] . Den kanadensiske spelteori- och artificiell intelligensforskaren Jonathan Schaeffer jämförde efter AlphaGos seger över Fan Hui programmet med ett "underbarn" som saknar erfarenhet, och konstaterade att riktiga prestationer kommer att börja när programmet spelar med en riktig toppspelare; Li Sedol förutspådde seger i matchen [25] Lee Hajin , en professionell spelare och generalsekreterare för International Go Federation , sa att AlphaGo och Lee Sedol har lika stor chans att vinna den kommande matchen [25] .
Efter sitt nederlag uppgav Fan Hui att tack vare den här matchen började han spela bättre och började se saker i spelet som han inte hade lagt märke till tidigare; i mars 2016 hade Fan Huis globala ranking ökat med cirka 300 positioner [29]
Go-experter hittade flera misstag gjorda av AlphaGo i spelen mot Fan Hui, särskilt när de bedömde positionen på hela brädet i motsats till individuella taktiska ögonblick; dock vid starten av matchen mot Lee Sedol var det inte känt hur mycket programmet hade förbättrats sedan dess [26] [30] . AlphaGo var inte specifikt inställd för Lee Sedols spelstil, vilket skulle ha varit svårt att göra ändå, eftersom AlphaGos "träning" innebar att titta på tiotals miljoner spel; några hundra eller tusen av Lee Sedols matcher räckte inte för att ändra programmets spelstil. Istället tittade AlphaGo på spel av starka amatörspelare som spelades på internetservrar och spelade sedan mot sig själv; det fanns inga Lee Sedol-spel i AlphaGos träningsdatabasen [31] [32] .
I en intervju innan matchen förutspådde Lee Sedol att han lätt skulle vinna med en poäng på 4-1 eller till och med 5-0, sedan skulle Google förfina AlphaGo i 2-3 år, varefter de skulle vilja ta revansch på honom. I det här fallet kommer det att bli riktigt intressant att spela med en uppdaterad version av AlphaGo, trodde Lee [33] [34] .
Lee Sedol, en professionell 9 dan go-spelare [35] , anses vara en av de starkaste spelarna i gos historia [36] . Hans karriär började 1996 när han befordrades till 1:a Dan vid 12 års ålder, och sedan dess har han vunnit många Go-titlar [37] . Lee Sedols stil kännetecknas av oortodoxa kreativa rörelser [38] . Lee Sedol förutspådde sin villkorslösa seger [38] och blev några veckor före matchen ägare till en av de viktigaste koreanska go-titlarna - Myeongin [39] .
AlphaGo är ett datorprogram skapat av Google DeepMind . AlphaGo-algoritmen använder en kombination av de senaste framstegen för att hitta den optimala strategin i spelträdet med de senaste maskininlärningsteknikerna kombinerat med intensiv inlärning av människors spel och träning samtidigt som man spelar med sig själv [16] . Till en början tränades AlphaGo för att imitera mänskligt spel genom att studera många spel som spelas av både proffs och starka amatörer, inklusive KGS -serverdatabasen med cirka 30 miljoner drag från 160 tusen spel av spelare från 6 till 9 och [16] [40 ] . Efter att ha nått en viss nivå i strategi och taktik gick programmet över till att spela mot sig själv och förstärkningsinlärning [41] . Systemet använder inte en databas med drag. Som en av skaparna av programmet förklarade, [23] ,
Även om vi har programmerat den här maskinen vet vi inte vilken rörelse den kommer att göra. Hennes rörelser är ett uppkomstfenomen som är resultatet av träning. Vi skapar bara dataserier och inlärningsalgoritmer. Men rörelserna hon tar till är inte i våra händer, och mycket bättre än vi som spelare kunde välja.
Den version av programmet som användes i matchen mot Li Sedol använde samma datorkraft som i spelen mot Fan Hui - 1920 CPU och 280 GPU [1] . I maj 2016 meddelade Google att AlphaGo använde TPU , en processor som utvecklats av Google specifikt för maskininlärning, [42] [43] i utbildning .
Fem matcher av matchen ägde rum den 9, 10, 12, 13 och 15 mars 2016 i Seoul [44] .
Spelen spelades enligt kinesiska regler , komi var 7,5 poäng; tidskontroll - 2 timmars ordinarie tid för varje spelare 3 byoyomi- perioder på 60 sekunder [9] . Spelen hölls i en stängd hall i närvaro av tre officiella observatörer, bland vilka var Fan Hui. Under spelen registrerades inga incidenter som ledde till ingripande av observatörer.
Matcherna sändes live på YouTube , tillsammans med livekommentarer av spelet på engelska från Michael Redmond [45] (den enda icke-asiatiska spelaren med 9 professionella dan [46] ) och på koreanska från Yoo Changhyuk , Song Taegon och andra Koreanska proffs [47] [48] [49] . Aya Huan (amatör 6-dan-spelare och medlem av DeepMinds utvecklingsteam) satte goban- stenar för AlphaGo [6] . Arbetet med programmet utfördes med hjälp av Google Cloud Platform , servern var belägen i USA [50] .
Utvecklarna bestämde sig för att använda en "fixerad" version av programmet före varje spel, så det använde inte spelen som spelades i den här matchen för självlärande och anpassade sig inte till Lee Sedols spelstil, och omdefinierade varje gång sin strategi [51] .
Vinnaren av matchen fick 1 miljon dollar som belöning. Representanter för Google DeepMind sa att om AlphaGo vinner planerar de att donera dessa pengar till välgörenhetsstiftelser (inklusive UNICEF ) och organisationer som är involverade i utvecklingen av Go [8] . Lee Sedol fick $150 000 för att delta i matchen och $20 000 för segrar i individuella set [8] [9] .
Spelet # | Svart | Vit | Resultat | datumet | rör sig | Tidsåtgång [ca. ett] |
---|---|---|---|---|---|---|
ett | Lee Sedol | Alpha Go | 0-1 (kapitulerade) | 9 mars 2016 | 186 | Lee Sedol: 1 timme 32 min. - AlphaGo: 1h. 55 min |
2 | Alpha Go | Lee Sedol | 1-0 (kapitulerade) | 10 mars 2016 | 211 | Lee Sedol: 2 timmar - AlphaGo: 2h. |
3 | Lee Sedol | Alpha Go | 0-1 (kapitulerade) | 12 mars 2016 | 176 | Lee Sedol: 2 timmar - AlphaGo: 1h. 51 min. |
fyra | Alpha Go | Lee Sedol | 0-1 (kapitulerade) | 13 mars 2016 | 180 | Lee Sedol: 2 timmar - AlphaGo: 1h. 59 min. |
5 [ca. 2] [52] [53] | Lee Sedol | Alpha Go | 0-1 (kapitulerade) | 15 mars 2016 | 280 | Lee Sedol: 2 timmar - AlphaGo: 2h. |
Totalresultat: AlphaGo - Lee Sedol: 4-1 |
När de kommenterade matchens första match, noterade både Cho Hansung (nionde professionell dan) och Michael Redmond att AlphaGo hade förbättrats avsevärt jämfört med oktobermatchen mot Fan Hui [54] . Redan på fuseki- stadiet blev det klart att programmet spelade på nivån med de bästa mänskliga spelarna; Nie Weiping (Pro 9:e dan, Kina) föreslog att AlphaGo spelar in i kraften av 6:e eller 7:e dan i fuseki och 13:e-15:e dan i tuban [55] . Lee Sedol själv, efter att ha förlorat den andra matchen, sa: "Igår blev jag förvånad, men idag har jag inga ord" [56] . Efter Lee Sedols tredje nederlag vann AlphaGo matchen före schemat och kommentatorerna var överens om att det fortfarande fanns hopp om en mänsklig seger [57] . Ke Jie , som vid den tiden ledde rankingen av spelare och även utmanade AlphaGo, uppgav att han började tvivla på sin seger över programmet [58] . Fel uppmärksammades i spelen från programmets sida; Demis Hassabis uppgav att de kommer att analyseras noggrant, och att AlphaGo uppenbarligen "inte känner till några av de klassiska tesuji och gör taktiska misstag", vilket blev tydligt efter att matchen förlorat mot den, när programmet, efter Lee Sedols viktigaste vinnande drag, började göra ologiska drag istället för att ge upp [59] . Efter matchen uppgav Lee Sedol att han var besegrad mentalt, men inte alls tekniskt [60] . Programmet visade en förmåga till kreativa lösningar, vilket överraskade många spelare (till exempel drag nummer 37 i det andra spelet); några drag motsäger den klassiska teorin om Go, men de bevisade sin effektivitet i matchen, några proffs började använda dessa fynd i sina spel [23] . Cho Hye-young (nionde professionella dan) sa att hon skulle vilja lära sig spelet från AlphaGo eftersom hon "vet allt" [61] . Lee Sedol själv bestämde sig för att ändra vissa aspekter av sitt spel efter matchen [60] . Kommentatorerna under matchen var överens om att AlphaGo gjorde misstag och var säkra på att det så småningom skulle ta slut på territoriet för att vinna [23] , men i slutändan ledde drag som från början verkade svaga till en vinst [57] .
Nyckelögonblick av festerUnder spelen noterade observatörer fyra exceptionella drag som påverkade resultatet av spelen; Lee Sedol kommenterade dem i en serie artiklar i Dong-a Ilbo [62] :
Spel 1 : Draget som träffade Lee Sedol. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Invasion, flytta 102 [63] . |
Andra spelet : Ett oväntat kreativt drag av programmet [64] . | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Drag 37, en "axelspark" som avvisats av klassisk spelteori. |
Tredje spelet : Imponerande motattack [57] . | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Drag 32 utvecklar attacken i spelet. |
Spel 4 : Lee Sedol 's Divine Move. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Efter att ha spelat tesuji (78:e draget) ändrades AlphaGos poäng dramatiskt [65] . |
I det första spelet, som ägde rum den 9 mars, vann AlphaGo (Vit). Lee Sedol höll spelet under kontroll för det mesta, programmet drog fördel under de sista 20 minuterna, vilket tvingade Lee att underkasta sig [63] . Efter spelet uppgav Lee att han gjorde ett kritiskt misstag i början av spelet, och att programmets strategi i det inledande skedet av spelet var "bra", och den artificiella intelligensen gjorde ett ovanligt drag som en person skulle aldrig spela [63] . Go Game Guru - webbplatsrecensenten David Omerod noterade att Lee Sedols sjunde drag var "ett udda drag som gjordes för att testa AlphaGos kraft i fuseki ", och att programmets returdrag var "exakt och effektivt"; enligt hans uppskattning lämnades den första delen av spelet till AlphaGo, och Lee började vinna tillbaka fördelen med drag 81, och gjorde sedan "tveksamma" drag 119 och 123, följt av 129, vilket ledde till nederlag [54] . Cho Hansung , som kommenterade spelet, noterade AlphaGos starka framsteg jämfört med matchen mot Fan Hui i oktober 2015 [54] . Michael Redmond noterade att stilen i programmet blev mer aggressiv jämfört med matcherna mot Fan Hui [66] .
Enligt Kim Sungryong (9:e proffsdan) blev Lee Sedol chockad över draget 102 [67] , varefter han tänkte på returdraget i mer än 10 minuter [67] . Lee Sedol erkände nederlag på drag 186, efter ungefär tre och en halv timmes spel, även om han fortfarande hade 28 minuter och 28 sekunder kvar på klockan [67] .
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Rörelser 1-99 |
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Rör sig 100-186 |
I det andra spelet, som ägde rum den 10 mars, vann AlphaGo med svart. Efter matchen sa Lee Sedol att "AlphaGo visade ett nästan perfekt spel" [68] och att "från början av spelet kände han inte ett enda ögonblick där han skulle vara i ledningen" [69] . En av skaparna av programmet, Demis Hassabis, konstaterade att systemet var säker på seger från mitten av spelet, när inte ens proffsen som kommenterade spelet kunde avgöra vem som var före [69] .
Michael Redmond noterade att den 37 kursen i programmet var "kreativ" och "unik" [23] . Det tog Lee Sedol en ovanligt lång tid att svara på det [23] . Ahn Yong-gil (8:e professionella dan) beskrev drag nr 37 som "ett sällsynt och spännande axelslag", men noterade att Lees återvändande drag var "utsökt". Han påstod att kontrollen över spelet hade gått från en spelare till en annan flera gånger, och noterade särskilt dragen i program nr 151, 157 och 159, kallade dem "briljanta" [64] .
AlphaGo avvek från den konventionella visdomen i det här spelet och visade ett bredare tillvägagångssätt, vilket proffsen på Go beskrev som skenbara misstag vid första anblicken, i själva verket att utföra en långtgående strategi [70] . Skaparna av programmet förklarade att AlphaGo inte försöker maximera antalet poäng eller mängden vinster, utan sannolikheten att vinna [23] [61] : Om AlphaGo måste välja mellan att vinna 20 poäng med 80 % sannolikhet eller att vinna 1 poäng med 99 % sannolikhet kommer den att välja det senare, även om det innebär att förlora poäng [23] . Till exempel verkar det som om drag 167, som ger Lee Sedol en chans att slåss, av kommentatorer betraktades som ett uppenbart misstag; Ahn Yong-gil sa att "när AlphaGo gör ett drag som ser svagt ut kan vi betrakta det som ett misstag, men det kanske vore mer korrekt att betrakta ett sådant drag som en segerförklaring?" [57] .
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Rörelser 1-99 |
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Rör sig 100-199 |
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
flyttar 200-211 |
I den tredje matchen, som hölls den 12 mars, vann AlphaGo och vann hela matchen före schemat [71] .
Efter det andra spelet uttryckte professionella spelare fortfarande sina tvivel om huruvida AlphaGo är en så stark spelare som en person kan vara. Efter det tredje spelet, enligt analytiker, var dessa tvivel skingrades, programmets skicklighet i brottning noterades - med Lee Sedols till synes allvarliga attack fick han inga fördelar från denna attack [57] .
Ahn Yong-gil och David Omerod påstod att AlphaGo är "starkare än någon mänsklig spelare som vi känner till" [57] . Det visade sig att AlphaGo kan kontrollera situationen när man genomför ko-fighting , vilket tidigare ansågs vara en betydande svaghet för de flesta program som spelade Go, i de två föregående spelen fanns det ingen viktig ko-fighting på brädet [72] . De noterade också programmets 148:e drag - mitt i en svår ko-kamp gjorde AlphaGo, som hade "förtroende" för att vinna kampen, ett stort drag någon annanstans på brädet [57] .
Li, som spelade svart, valde High Chinese Fuseki och skapade en influenssfär som AlphaGo invaderade på drag 12, varefter programmet kunde försvara sin svaga invaderande grupp [57] . Enligt An Yong-gil kan Lees 31 drag ha varit orsaken till hans nederlag [57] , Andy Jackson ( American Go Association ) beslutade att resultatet av spelet redan var bestämt på drag 35 [61] . Genom drag 48 hade AlphaGo tagit kontroll över spelet och tvingat Lee Sedol att göra defensiva drag. Lees motattack på drag 77-79 gav ingen framgång, genom drag 90 förenklade programmet positionen på brädet, varefter det förvärvade en stor mängd territorium på undersidan [57] . Lee försökte återigen starta en attack, men programmets drag var omisskännliga. På drag 131 försökte han arrangera en ko-fight, vilket provocerade programmet att göra ett misstag. Vid drag 176 avgick Lee Sedol [57] .
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Rörelser 1-99 |
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Slag 100-176 (122 på 113, 154 på 163 på 145, 164 på 151, 166 och 171 på 160, 169 på 145, 175 på ) |
Den fjärde matchen, som hölls den 13 mars, slutade med Lee Sedols seger. Enligt Demis Hassabis gjorde programmet ett misstag på drag 79, när, enligt sina egna uppskattningar, sannolikheten för dess seger var 70 %; på det 87:e draget sjönk detta värde kraftigt [73] [74] . David Omerod beskrev programflyttningen från 87 till 101 som typiska fel för ett program baserat på Monte Carlo-metoden [65] - sökmotorn försöker skära av några sekvenser som inte är relaterade till en viss situation; i vissa fall kan detta leda till att programmet skär bort de korrekta dragen och inte längre kan överväga dem i framtiden [65] .
I det här spelet valde Lee Sedol amasi- strategin (territorieorienterad stil, som låter fienden ockupera viktiga inflytandepunkter, men samtidigt får spelaren själv garanterat territorium, varefter han kan försöka bryta upp fiendens inflytande) , bestämmer sig för att vinna territorium på sidorna, inte i centrum, i motsats till AlphaGos strategi att vinna med många små förvärv [65] [75] . Genom att välja en sådan strategi hoppades Lee Sedol driva motståndaren in i en all-in-situation, vilket kan vara en trolig svag punkt i ett program vars styrka är bedömningen av utbytet; i en sådan situation skulle AlphaGos förmåga att identifiera de minsta fördelarna inte ha någon stark inverkan på sannolikheten att vinna [65] .
De första 11 dragen var identiska med början av det andra spelet, där Lee också spelade vitt. I fuseki-stadiet fokuserade Lee på att vinna territorium i hörnen och sidorna av brädan, vilket gjorde att AlphaGo kunde bygga inflytande på översidan och i mitten. Efter det invaderade Lee AlphaGos inflytandezon (rörelser 40-48), enligt principerna för amasi . AlphaGo offrade fyra stenar och tog initiativet (drag 47-69). Som svar på Lee Sedols drag från 72 till 76 gjorde programmet inga misstag, och kommentatorerna började deklarera att spelet igen skulle visa sig vara Lees nederlag, dock drag 78 (vilket var tesuji i det här läget) och kombinationen som följde upp det till drag 82 vände fullständigt resultatet av spelet [65] . Draget, som gjorde det möjligt att dela motståndaren i mitten, komplicerade spelet [76] . AlphaGos drag 83 och 85 var acceptabla, men sedan från drag 87 till 101 gjorde programmet ett antal svaga, uppriktigt sagt dåliga drag. På drag 92 tog Lee Sedol ledningen av spelet, och drag 105 beskrevs av Ahn Yong-gil som det sista draget som ledde till programmets nederlag; AlphaGo kunde inte vinna tillbaka de förlorade poängen och avgick efter drag 180 [65] . AlphaGo uppskattade att hennes sannolikhet att vinna var mindre än 20 % [76] .
Gu Li (nionde professionella dan, Kina) kallade det 78:e draget av Li Sedol för ett "gudomligt drag" (i terminologin för spelet Go - ett speciellt, enda sant och briljant drag som händer "en gång i livet", oftast vid ett kritiskt ögonblick av spelet) och noterade att jag absolut inte såg detta drag [65] . Ahn Yong-gil påstod att spelet var "Lee Sedols mästerverk och kommer nästan säkert att bli känt i Gos historia" [65] .
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Rörelser 1-99 |
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Rör sig 100-180 (177 tum , 178 tum ) |
Vem som spelar svart i sista matchen skulle enligt matchens villkor avgöras genom lottning. Lee Sedol uppgav dock på en presskonferens efter den fjärde matchen att han tyckte att AlphaGo var starkare när han spelade med vitt, så han skulle vilja spela svart i finalspelet, speciellt eftersom han redan vunnit med vitt. AlphaGos representanter höll med, så det blev ingen lottning [52] [53] .
I den sista matchen som spelades den 15 mars var vinnaren AlphaGo (vit) [77] . Ända till slutet pågick en jämlik kamp i det här spelet. Demis Hassabis uppgav att programmet redan i början gjorde ett grovt misstag, vilket ledde till en sådan jämlik kamp [77] .
När han spelade svart valde Lee Sedol en fuseki liknande den han spelade i matchens första match, varefter han bytte till en territoriell strategi som ledde till segern i föregående match. Resultatet verkade jämnt fram till drag 48 till 58, där AlphaGo, som spelade onödiga forcerade drag, förlorade ko-hot och aji , vilket gjorde att Lee Sedol kunde ta ledningen [78] . Michael Redmond föreslog att programmet med största sannolikhet inte såg de berömda tesuji- erfarna spelarna som oftast kunde en sådan kombination av drag, men programmet skulle behöva beräkna det från allra första början [77] .
Vid det 90:e draget, efter att omisskännligt ha svarat på Lee Sedols anfallsrörelser, återställde programmet balansen i spelet, varefter det gjorde en serie drag som David Omerod kallade "ovanliga ... men listigt imponerande" och lät dem fånga en liten fördel [78] . Lee försökte vinna tillbaka poängen, men programmet svarade omisskännligt. Ahn Yong-gil lyfte fram drag 154, 186 och 194. I yose- stadiet spelade AlphaGo också felfritt och behöll territoriets ledning, vilket tvingade Lee Sedol att avgå vid drag 280 [78] .
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Rörelser 1-99 |
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Rör sig 100-199 (118 i 107, 161 tum ) |
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Slag 200-280 (240 i 200, 271 in , 275 in , 276 in ) |
Livesändningar av matchens matcher och deras analys utfördes på koreanska , kinesiska , japanska och engelska och ryska . Sändningen var på koreanska på Baduk TV [79] . Den första delen kommenterades på kinesiska av Gu Li och Ke Jie för Tencent respektive LeEco , med 60 miljoner tittare [29] . Matchen sändes online på engelska av Michael Redmond och Chris Garlock, vicepresident för American Go Association ; det genomsnittliga antalet åskådare var cirka 80 tusen människor; det största antalet åskådare registrerades i slutet av den första delen och uppgick till 100 tusen [80] . Analysen av spelen på YouTube leddes av Cho Hye -young (9:e dan) och Kim Myeongwan (9:e dan) [61] . I Ryssland genomfördes livesändningar av matchens matcher med analys av 3 professionella dan Alexander Dinershtein (1 match) [81] [82] , Ilya Shikshin (1 professionell dan) och flerfaldig Europamästarinna bland kvinnorna Natalia Kovaleva (2- 5 matcher) [83] .
Segern för AlphaGo var en viktig händelse inom området för forskning om artificiell intelligens [84] . Tidigare ansågs det utom räckhåll för befintlig teknik och nivån på deras utveckling att lära en dator att spela Go [84] [85] [86] . De flesta experter var benägna att tro att det skulle ta cirka 5 år innan AlphaGo-effektnivåprogrammet dök upp [87] , vissa experter trodde att det skulle ta till och med 10 år innan datorn kunde besegra Go-mästarna [88] [89] . I början av 2016 pekade de flesta förutsägelser på Lee Sedols seger [84] .
När datorn började slå de starkaste mänskliga spelarna i schack , schack och nu, anses prestationerna av datorprogram inom området populära brädspel inte längre vara en så betydande prestation och en vändpunkt i historien om utvecklingen av artificiell intelligens jämfört med tidigare år; Deep Blue - utvecklaren Murray Campbell kallade AlphaGos seger "slutet på en era... brädspelen är nästan klara och det är dags att gå vidare" [84] . Utvecklarna av DeepMind har sagt att de överväger att vara värd för en StarCraft II -match mellan deras mjukvara och Tim Morten, en StarCraft II-mästare [90] [91] . Brädspel med ofullständig information ( poker , bridge ) kan också bli föremål för forskning om datorprogrammens möjligheter [92] [93] .
Jämfört med Deep Blue eller Watson är AlphaGos algoritmer designade för bredare uppgifter, vilket kan tyda på att framsteg även har skett inom området allmän utveckling av artificiell intelligens [94] ; AlphaGos seger kan vara drivkraften för utvecklingen av program med bredare mål. I mars 2016 uttalade den brittiske forskaren Sewart J. Russell att "tekniker för artificiell intelligens utvecklas mycket snabbare än väntat, vilket gör frågan om långsiktiga resultat mer relevant", och tillade att "att säkerställa att allt kraftfullare AI-system finns kvar skulle vara under fullständig kontroll över människan ... det finns mycket arbete att göra ” [95] . Fysikern Stephen Hawking har varnat för att framtida självutvecklande AI-system kan leda till att människor oväntat fångas av maskiner [96] , vissa forskare, särskilt Jean-Gabriel Ganasia, säger att "saker som 'sunt förnuft'...skapar aldrig" förkasta ett sådant scenario [97] ; Ganasia ser ingen anledning att "prata om rädslor. Tvärtom ger det hopp inom många områden, till exempel inom hälsovård och rymdforskning” [95] . Richard Sutton säger att "människor inte ska vara rädda ... men de måste vara uppmärksamma på det" [98] .
Innan artikeln publicerades i tidskriften Nature i januari 2016 undersökte flera organisationer redan neurala nätverk för att skapa program som spelar Go, i synnerhet höll Facebook på att utveckla programmet Darkforest , därefter gjordes programkoden allmänt tillgänglig [99] [100] . Efter matchen började utvecklingen av AphaGo konkurrerande program, bland vilka Deep Zen Go och Fine Art sticker ut.
Deep Zen Go-programmet utvecklades tidigare under namnet Zen, men det var efter framgångarna med AlphaGo som utvecklaren lade till ett element av djupinlärning till Zen . I november 2016 ägde en match rum mellan Deep Zen Go och Japans mest titulerade spelare Cho Chikun [101] [102] . Matchen slutade med segern för mannen med poängen 2: 1 [103] . I mars 2017 hölls "Tournament of Four", där de starkaste spelarna från Japan, Kina och Korea ( Yuta Iyama , Mi Yutin och Park Jong-hwan ) och Deep Zen Go slogs [104] , enligt matchens resultat vann datorn ett spel av tre (mot Yuta Iyama) [105] [106] .
Fine Art - programmet har utvecklats av det kinesiska företaget Tencent . I mars 2017 vann hon Software Go Championship, som dock inte innehöll AlphaGo; Deep Zen Go tog andraplatsen. Tidigare, i januari 2017, kunde Fine Art slå den starkaste mänskliga Go-spelaren Ke Jie flera gånger , som senare också spelade med AlphaGo , förlorade torrt och ansåg att ytterligare spel med artificiell intelligens var meningslösa [107] .
Spelet Go, som tidigare ansågs vara ett rent asiatiskt spel, inte så vanligt i västerländska länder, har vunnit stor popularitet i olika länder i världen på grund av det faktum att miljontals människor tittade på och diskuterade matchen [84] . Enligt Demis Hassabis tittade 280 miljoner människor på matchen, 35 000 artiklar publicerades om den i pressen och försäljningen av go-brädor tiodubblades [108] .
Många av toppspelarna noterade att de drag som gjorts av programmet är icke-standardiserade; vissa drag verkade initialt tveksamma, men under spelets gång visade de sin effektivitet [88] . Medan spelare försöker lära sig och ta till sig de bästa dragen från andra spel, gör AlphaGo sina egna originaldrag [84] . AlphaGo har förbättrats avsevärt jämfört med matchen mot Fan Hui, men efter hans nederlag konstaterade Li Sedol att spelet i programmet fortfarande inte är perfekt [109] [110]
Den kinesiske spelaren Ke Jie , som ledde världsrankingen, uppgav före matchen att han var kapabel att besegra AlphaGo, men ville inte spela med henne, eftersom programmet skulle börja "kopiera hans stil" [111] . Efter de tre första matcherna i matchen erkände Ke Jie redan att han "kan förlora" [112] , men efter den fjärde matchen började han återigen med tillförsikt prata om sin seger och hävdade att om programmets prestation i den fjärde matchen matchen är "dess sanna styrka, då förtjänar den inte att spela med honom" [113] .
Domaren i matchen mot Fan Hui, Toby Manning, och generalsekreteraren för International Go Federation, Li Hajin , sa att spelarna i framtiden kommer att kunna lära sig av datorn, ta reda på var de gjorde misstag i spelet och förbättra sina spelfärdigheter [110] .
Efter matchen bad Lee Sedol om ursäkt för sin förlust och sa att han "underskattade AlphaGos förmågor och kände sig maktlös" [84] . Han betonade att resultatet av matchen var "Lee Sedols nederlag" och inte "mänsklighetens nederlag." [96] [114] . Lee erkände att hans förlust var oundviklig, men att "robotar aldrig kommer att förstå skönheten i spelet på det sätt som människor gör" [96] . Lee kallade resultatet i den fjärde delen "en ovärderlig seger som han inte skulle byta mot någonting" [114] . Lee Sedol uppgav att han lärde sig mycket av att spela med AlphaGo och hans stil blev mer flexibel; han insåg hur svag mänsklig intuition kan vara, och hans skicklighet i att förutsäga motståndarens nästa drag förbättrades avsevärt [115] .
Korean Paduk Association tilldelade AlphaGo en hedersrankning av 9:e professionella dan för "uppriktiga ansträngningar för att bemästra de taoistiska grunderna för go och uppnå en nivå av spel nära gudomlig" [10] .
Efter matchens slut, den 17 mars 2016, meddelade representanter för Republiken Koreas regering att de skulle investera 863 miljoner dollar (1 biljon koreanska won) i forskning om artificiell intelligens under de kommande fem åren [116]
Många spelare uttryckte sin önskan att bli AlphaGos nästa motståndare [117] , men bland de mest troliga kandidaterna var Ke Jie , som påstod sig vinna programmet [118] . Matchen med Ke Jie ägde rum från 23 maj till 27 maj 2017, AlphaGo vann alla tre matcherna [119] [120] [121] .
Gå | |||||
---|---|---|---|---|---|
| |||||
Lager | |||||
Regler |
| ||||
Speletapper | |||||
Terminologi | |||||
Utsläpp | |||||
Organisationer | |||||
Titlar | |||||
Internationella turneringar |
| ||||
Gå i konsten |
| ||||
Övrig | |||||
|