AlphaZero är ett (Alpha Zero) neuralt nätverk utvecklat av DeepMind som använder en generaliserad AlphaGo Zero- metod . Den 5 december 2017 släppte DeepMind-teamet ett förtryck av AlphaZero-programmet, som efter att ha tränat i 24 timmar kunde besegra världsmästarna bland schack- , shogi- och go -programmen ( Stockfish , Elmo och tredagarsversionen av AlphaGo Zero, respektive [1] ). Således är AlphaZero artificiell intelligens för närvarande det starkaste av alla program för att spela shogu and go. I schack kan AlphaZeros kraft inte bedömas för tillfället, på grund av bristen på spel har de inte spelats sedan 2017.
AlphaZero (AZ) är en mer generaliserad version av AlphaGo Zero (AGZ) algoritmen, som förutom go även kan spela shogi och schack . Skillnaderna mellan AZ och AGZ är att:
Medan traditionella program utvärderar spelpositioner baserat på stormästarnas erfarenhet, använder AlphaZero djupa neurala nätverk för att utvärdera dem , vilket kräver mer tid per position. AlphaZero analyserar bara 80 000 positioner per sekund i schack och 40 000 i shogi, jämfört med 70 miljoner för Stockfish och 35 miljoner för Elmo. AlphaZero kompenserar för de låga poängen per sekund genom att använda Monte Carlo-sökning, och fokuserar därmed mycket mer selektivt på de mest lovande alternativen.
I schackspelen AlphaZero vs Stockfish hade varje program en minuts tid per drag. AlphaZero hade den bästa hårdvaran i förhållande till Stockfish. Av 100 matcher från en normal utgångsposition vann AlphaZero 25 matcher med vit, 3 med svart och oavgjort de återstående 72. [2]
I hundra matcher shogi mot Elmo vann AlphaZero nittio gånger, förlorade åtta gånger och slutade två oavgjorda.
Efter 8 timmars lärande hur man spelar Go på egen hand, i matcher mot den tidigare versionen av AlphaZero, vann AlphaZero sextio matcher och förlorade fyrtio.
Vissa stormästare, som Hikaru Nakamura och Komodo-skaparen Larry Kaufman , har betonat att kraften i AlphaZero inte bör överdrivas, med argumentet att matchresultaten skulle ha varit annorlunda om programmet hade tillgång till öppningsbaser (eftersom Stockfish var optimerat för detta scenario) [3 ] . AlphaZero besegrade Stockfish och berövade den senare tillgången till öppningsbaserna och slutspelsborden och spelade med mycket bättre datorutrustning än motståndaren [4] [5] . Stockfish var också begränsad i den tid det tog att göra ett drag: den atypiska tidskontrollen, 1 minut per drag, tillät inte djupt tänkande i kritiska positioner. Dessutom användes versionen av Stockfish 8, som släpptes för ett år sedan. Alla fyra omständigheterna: brist på kraft, tidsgräns, stängning av öppningsboken och användning av en föråldrad version bidrog till Stockfishs nederlag.
Shogi-programmeringsgemenskapen är inte heller helt nöjda med villkoren för matchen mellan AlphaZero och Elmo. [6] [7]
DeepMind publicerade en artikel i Science [8] i december 2018 . AlphaZero kördes inte på en superdator, utan på 4 TPU:er och en CPU med 44 kärnor.
Stockfish 8-motorn användes på datorkraft liknande AlphaZero. Tidskontroll - 3 timmar plus 15 sekunder per drag. Av 1000 matcher vann AlphaZero 155 matcher, förlorade 6, resten slutade oavgjort. I en serie spel med givna startpositioner vann AlphaZero 95 matcher av 100. [9]
AlphaZero vann 98,2 % av spelen med svart och 91,2 % av alla.
Tidningar kom ut med rubriker att undervisning i schack bara tog fyra timmar: "det gjordes på lite mer än intervallet mellan frukost och lunch" [10] . Wired främjade AlphaZero som "den första artificiella intelligensen som är mästaren i många brädspel " [11] .
"Jag har alltid undrat hur det skulle vara när högre varelser landar på jorden och visar oss hur de spelar schack," sa den danske stormästaren Peter Heine Nielsen till BBC , "nu vet jag det." Den norske stormästaren Jon Ludwig Hammer beskrev AlphaZero som "galet anfallsschack" med djupt positionsspel. Den tidigare världsmästaren Garry Kasparov sa: "det här är en anmärkningsvärd prestation, även om vi redan förväntade oss något liknande efter framgången med AlphaGo" [12] .
Garry Kasparov kallade det här spelet "schack från en annan dimension" som "skakade [spelet] till dess grunder" [13] .
Schack | |
---|---|
Huvudartiklar | |
Schackinventering | |
schackregler | |
Ordlista med termer | |
Schacktaktik | |
Schackstrategi | |
debuterar | |
Slutspel | |
Schackwebbplatser |
|
Schackprogram |