Generative adversarial network ( GAN för kort) är en oövervakad maskininlärningsalgoritm byggd på en kombination av två neurala nätverk , varav det ena (nätverket G) genererar sampel (se Generativ modell ), och det andra (nätverket D) försöker att skilja korrekta ("äkta") prov från felaktiga (se Diskriminerande modell ). Eftersom nätverk G och D har motsatta mål - att skapa prover och förkasta prover - uppstår ett antagonistiskt spel mellan dem . Det generativa motståndsnätverket beskrevs av Ian Goodfellow från Google 2014 [1] .
Användningen av denna teknik gör det särskilt möjligt att generera fotografier som uppfattas av det mänskliga ögat som naturliga bilder. Till exempel finns det ett välkänt försök att syntetisera fotografier av katter, vilket vilseleder experten, som anser att de är naturliga foton [2] . Dessutom kan GAN användas för att förbättra kvaliteten på suddiga eller delvis skadade fotografier.
I GAN-systemet genererar ett av nätverken (G-nätverk, från Generator) samplingar (se Generativ modell ), och det andra (D-nätverket, från Discriminator) försöker särskilja korrekta ("äkta") sampel från felaktiga. (se Diskriminerande modell ) [1] . Med hjälp av en uppsättning latenta rymdvariabler försöker det generativa nätverket forma ett nytt mönster genom att blanda flera av de ursprungliga mönstren. Det diskriminerande nätverket är tränat att skilja mellan äkta och falska prov, och resultaten av distinktionen matas till ingången till det generativa nätverket så att det kan välja den bästa uppsättningen latenta parametrar, och det diskriminerande nätverket skulle inte längre kunna skilja äkta prover från falska. Målet med nätverk G är alltså att öka felfrekvensen för nätverk D, och målet för nätverk D är tvärtom att förbättra igenkänningsnoggrannheten [1] [3] .
Diskrimineringsnätverket D, som analyserar prover från originaldata och från de som skapats av generatorn, uppnår viss diskrimineringsnoggrannhet. I det här fallet börjar generatorn med slumpmässiga kombinationer av latenta rymdparametrar (se multivariat normalfördelning ), och efter att ha utvärderat de erhållna proverna av nätverket D, tillämpas metoden för förökning av felet , vilket förbättrar genereringskvaliteten genom att korrigera ingången uppsättning latenta parametrar. Gradvis blir artificiella bilder vid utgången av det generativa nätverket mer och mer kvalitativa [4] . D-nätverket är implementerat som ett konvolutionellt neuralt nätverk , medan G-nätverket tvärtom vecklar ut bilden baserat på dolda parametrar.
I processen för gemensamt konkurrensutsatt lärande, om systemet är tillräckligt balanserat, uppnås ett minimax- jämviktstillstånd, där båda nätverken har förbättrat sin kvalitet avsevärt, och nu kan de genererade bilderna användas nästan som verkliga.
Idén om kontradiktoriskt lärande lades fram 2013 av Li, Gauci och Gross [5] . Denna metod kallas också för "Turing-inlärning" [6] eftersom den syftar till att klara Turing-testet .
Principen för påstående i ett GAN beskrivs ofta genom metaforer. Till exempel liknas ett generativt nätverk vid en förfalskare eller en förfalskare av målningar, och ett diskriminerande nätverk liknas vid en expert som försöker känna igen en falsk [7] [8] . Ett annat exempel är bilden av två boxare, varav en studerade med mästaren, och den andra tvingas imitera studenten [9] .
I en populär applikation för att generera mänskliga ansikten fungerar riktiga fotografier som autentisk data, och ett generativt nätverk försöker skapa konstgjorda ansikten genom att variera kombinationer av sådana latenta parametrar som hårfärg, ansiktsproportioner, ögonform, näsform, öronstorlek, skägg och mustasch , etc. d [10] [11]
Forskarnas artiklar ger exempel på GAN-implementering baserat på TensorFlow- biblioteket [12] [13] .
GAN används för att erhålla fotorealistiska bilder, till exempel för industriella designelement , inredning , kläder, väskor, portföljer, dataspelscener, etc. GAN används också i Facebook -nätverket [14] . Nyligen har GAN använts för att förbereda film- eller animationsramar [15] . Dessa system hjälper också till att återskapa en tredimensionell modell av ett objekt med hjälp av fragmentariska bilder [16] och förbättra bilder erhållna från astronomiska observationer [17] .
Typer av artificiella neurala nätverk | |
---|---|
|
Maskininlärning och datautvinning | |
---|---|
Uppgifter | |
Att lära sig med en lärare | |
klusteranalys | |
Dimensionalitetsreduktion | |
Strukturell prognos | |
Anomali upptäckt | |
Grafisk probabilistiska modeller | |
Neurala nätverk | |
Förstärkningsinlärning |
|
Teori | |
Tidskrifter och konferenser |
|