Google Neural Machine Translation (GNMT) är ett system för neural maskinöversättning (NMT) som utvecklats av Google och introducerades i november 2016 som använder ett artificiellt neuralt nätverk för att förbättra översättningsförmågan och noggrannheten i Google Translate . [1] [2] [3]
GNMT förbättrar översättningskvaliteten genom att använda exempelbaserad maskinöversättning ( EBMT ), där systemet "lär sig av miljontals exempel". [2] Den föreslagna GNMT-systeminlärningsarkitekturen testades först på över hundra språk som stöds av Google Translate. [2] På grund av den stora end-to-end-strukturen lär sig systemet med tiden att producera bättre och mer naturliga översättningar. [1] GNMT kan översätta hela meningar, inte delar. [1] GNMT-nätverket kan utföra interlingual maskinöversättning genom att koda en menings semantik istället för att memorera översättningar av enskilda fraser. [2] [4]
Google Brain -projektet skapades 2011 i "Google X:s hemliga forskningslabb" [5] av Jeff Dean , en Google-anställd, Greg Corrado, en Google-forskare, och Andrew Ng , en professor i datavetenskap vid Stanford University . [6] [7] [8] Euns arbete var grunden för ett av de största tekniska genombrotten hos Google och Stanford. [5]
I september 2016 tillkännagav Googles forskargrupp utvecklingen av GNMT-översättningssystemet, och i november började Google Translate använda neural maskinöversättning (NMT) istället för de tidigare statistiska metoderna (SMT) [1] [9] [10] [ 11] som hade använts sedan oktober 2007 i vårt eget slutna SMT-system. [12] [13]
NMT-systemet i Google Translate använder ett stort artificiellt neuralt nätverk som är lämpligt för djupinlärning . [1] [2] [3] Genom att undersöka miljontals exempel förbättrar GNMT kvaliteten på översättningen genom att använda ett bredare sammanhang för att sluta sig till den mest lämpliga översättningen. Resultatet arrangeras sedan om och anpassas för att passa det mänskliga språkets grammatik. GNMT skapade inte sitt eget interna universella språk, utan försökte snarare hitta gemensamma drag mellan många språk, vilket borde vara av intresse för psykologer och lingvister mer än för datavetare. [14] En ny översättningsmotor inkluderades i båda riktningarna för nio språk: engelska, franska, tyska, spanska, portugisiska, kinesiska, japanska, koreanska och turkiska 2016. [15] I mars 2017 lades ytterligare tre språk till: ryska, hindi och vietnamesiska. [16] Samma månad lades stöd för hebreiska och arabiska till med hjälp av Google Translate-communityt. [17] Ytterligare stöd lades till i slutet av april 2017 för nio indiska språk, nämligen hindi, bengali, marathi, gujarati, punjabi, tamil, telugu, malayalam och kannada. [arton]
Nedan finns en lista över språkpar som använder Google Neural Machine Translation (NMT)-modellen för översättning. Från och med juli 2017 stöds endast översättning till och från engelska för alla språk: [19]
språkpar | Språkkoder | |
---|---|---|
ett | Afrikaans <-> engelska | af<->en |
2 | Arabiska <-> engelska | ar<->en |
3 | Bulgariska <-> engelska | bg<->en |
fyra | Kinesiska (förenklad) <-> engelska | zh-CN <->en |
5 | Kinesiska (traditionell) <-> engelska | zh-TW<->en |
6 | Kroatiska <-> engelska | hr<->en |
7 | Tjeckiska <-> engelska | cs<->en |
åtta | danska <-> engelska | da<->en |
9 | Holländska <-> engelska | nl<->en |
tio | Franska <-> engelska | fr<->en |
elva | Tyska <-> engelska | de<->en |
12 | Grekiska <-> engelska | el<->en |
13 | Hebreiska <-> engelska | iw<->en |
fjorton | Hindi <-> engelska | hi<->en |
femton | isländska <-> engelska | is<->en |
16 | Indonesiska <-> engelska | id<->en |
17 | Italienska <-> engelska | it<->en |
arton | Japanska <-> engelska | ja<->en |
19 | Koreanska <-> engelska | ko<->en |
tjugo | Norska <-> engelska | no<->en |
21 | Polska <-> engelska | pl<->en |
22 | Portugisiska <-> engelska | pt<->en |
23 | Rumänska <-> engelska | ro<->en |
24 | Ryska <-> engelska | ru<->en |
25 | slovakiska <-> engelska | sk<->en |
26 | Spanska <-> engelska | es<->en |
27 | Svenska <-> engelska | sv<->en |
28 | Thailändsk <-> engelska | th<->en |
29 | Turkiska <-> engelska | tr<->en |
trettio | vietnamesiska <-> engelska | vi<->en |
GNMT-systemet sägs vara överlägset den tidigare versionen av Google Translate genom att det kan utföra "direkt översättning", d.v.s. översätt från ett språk till ett annat direkt (till exempel från japanska till koreanska). [2] Tidigare översatte Google Translate först från källspråket till engelska och sedan från engelska till målspråket istället för att direkt översätta från ett språk till ett annat. [fyra]
maskinöversättning | Tillvägagångssätt för|
---|---|
|
naturlig språkbehandling | |
---|---|
Allmänna definitioner | |
Textanalys |
|
Refererar |
|
Maskinöversätta |
|
Identifiering och datainsamling | |
Tematisk modell | |
Peer review |
|
Naturligt språkgränssnitt |