Google Neural Machine Translation

Google Neural Machine Translation  (GNMT) är ett  system för neural maskinöversättning (NMT) som utvecklats av Google och introducerades i november 2016 som använder ett  artificiellt neuralt nätverk för att förbättra översättningsförmågan och noggrannheten i Google Translate . [1] [2] [3]

GNMT förbättrar översättningskvaliteten genom att använda exempelbaserad maskinöversättning ( EBMT ), där systemet "lär sig av miljontals exempel". [2] Den föreslagna GNMT-systeminlärningsarkitekturen testades först på över hundra språk som stöds av Google Translate. [2] På grund av den stora end-to-end-strukturen lär sig systemet med tiden att producera bättre och mer naturliga översättningar. [1] GNMT kan översätta hela meningar, inte delar. [1] GNMT-nätverket kan utföra interlingual maskinöversättning genom att koda en menings semantik istället för att memorera översättningar av enskilda fraser. [2] [4]

Historik

Google Brain -projektet skapades 2011 i "Google X:s hemliga forskningslabb" [5] av Jeff Dean , en Google-anställd, Greg Corrado, en Google-forskare, och Andrew Ng , en professor i datavetenskap vid Stanford University . [6] [7] [8] Euns arbete var grunden för ett av de största tekniska genombrotten hos Google och Stanford. [5]

I september 2016 tillkännagav Googles forskargrupp utvecklingen av GNMT-översättningssystemet, och i november började Google Translate använda neural maskinöversättning (NMT) istället för de tidigare statistiska metoderna (SMT) [1] [9] [10] [ 11] som hade använts sedan oktober 2007 i vårt eget slutna SMT-system. [12] [13]

NMT-systemet i Google Translate använder ett stort artificiellt neuralt nätverk som är lämpligt för djupinlärning . [1] [2] [3] Genom att undersöka miljontals exempel förbättrar GNMT kvaliteten på översättningen genom att använda ett bredare sammanhang för att sluta sig till den mest lämpliga översättningen. Resultatet arrangeras sedan om och anpassas för att passa det mänskliga språkets grammatik. GNMT skapade inte sitt eget interna universella språk, utan försökte snarare hitta gemensamma drag mellan många språk, vilket borde vara av intresse för psykologer och lingvister mer än för datavetare. [14] En ny översättningsmotor inkluderades i båda riktningarna för nio språk: engelska, franska, tyska, spanska, portugisiska, kinesiska, japanska, koreanska och turkiska 2016. [15] I mars 2017 lades ytterligare tre språk till: ryska, hindi och vietnamesiska. [16] Samma månad lades stöd för hebreiska och arabiska till med hjälp av Google Translate-communityt. [17] Ytterligare stöd lades till i slutet av april 2017 för nio indiska språk, nämligen hindi, bengali, marathi, gujarati, punjabi, tamil, telugu, malayalam och kannada. [arton]

Språk som stöds av GNMT

Nedan finns en lista över språkpar som använder Google Neural Machine Translation (NMT)-modellen för översättning. Från och med juli 2017 stöds endast översättning till och från engelska för alla språk: [19]

språkpar Språkkoder
ett Afrikaans <-> engelska af<->en
2 Arabiska <-> engelska ar<->en
3 Bulgariska <-> engelska bg<->en
fyra Kinesiska (förenklad) <-> engelska zh-CN <->en
5 Kinesiska (traditionell) <-> engelska zh-TW<->en
6 Kroatiska <-> engelska hr<->en
7 Tjeckiska <-> engelska cs<->en
åtta danska <-> engelska da<->en
9 Holländska <-> engelska nl<->en
tio Franska <-> engelska fr<->en
elva Tyska <-> engelska de<->en
12 Grekiska <-> engelska el<->en
13 Hebreiska <-> engelska iw<->en
fjorton Hindi <-> engelska hi<->en
femton isländska <-> engelska is<->en
16 Indonesiska <-> engelska id<->en
17 Italienska <-> engelska it<->en
arton Japanska <-> engelska ja<->en
19 Koreanska <-> engelska ko<->en
tjugo Norska <-> engelska no<->en
21 Polska <-> engelska pl<->en
22 Portugisiska <-> engelska pt<->en
23 Rumänska <-> engelska ro<->en
24 Ryska <-> engelska ru<->en
25 slovakiska <-> engelska sk<->en
26 Spanska <-> engelska es<->en
27 Svenska <-> engelska sv<->en
28 Thailändsk <-> engelska th<->en
29 Turkiska <-> engelska tr<->en
trettio vietnamesiska <-> engelska vi<->en

Direkt översättning

GNMT-systemet sägs vara överlägset den tidigare versionen av Google Translate genom att det kan utföra "direkt översättning", d.v.s. översätt från ett språk till ett annat direkt (till exempel från japanska till koreanska). [2] Tidigare översatte Google Translate först från källspråket till engelska och sedan från engelska till målspråket istället för att direkt översätta från ett språk till ett annat. [fyra]

Se även

Länkar

  1. 1 2 3 4 5 Barak Turovsky (15 november 2016), Hittad i översättning: Mer exakta, flytande meningar i Google Translate , < https://blog.google/products/translate/found-translation-more-accurate-fluent -sentences-google-translate/ > . Hämtad 11 januari 2017. Arkiverad 7 april 2017 på Wayback Machine 
  2. 1 2 3 4 5 6 Mike Schuster, Melvin Johnson och Nikhil Thorat (22 november 2016), Zero-Shot Translation with Googles Multilingual Neural Machine Translation System , < https://research.googleblog.com/2016/11/ zero-shot-translation-with-googles.html > . Hämtad 11 januari 2017. Arkiverad 10 juli 2017 på Wayback Machine 
  3. 1 2 Gil Fewster (5 januari 2017), The mindblowing AI-meddelande från Google som du förmodligen missade , < https://medium.freecodecamp.com/the-mind-blowing-ai-announcement-from-google- att-du-förmodligen-missade-2ffd31334805#.msj1mdvbh > . Hämtad 11 januari 2017. Arkiverad 31 maj 2017 på Wayback Machine 
  4. 12 Boitet , Christian; Blanchon, Herve; Seligman, Mark; Bellynck, Valérie MT på och för webben (PDF)  (länk ej tillgänglig) (2010). Datum för åtkomst: 1 december 2016. Arkiverad från originalet den 29 mars 2017.
  5. 1 2 Robert D. Hof. En kinesisk internetjätte börjar drömma: Baidu är en del av onlinelivet i Kina, men den vill bli en global makt. Kan en av världens ledande artificiell intelligensforskare hjälpa den att utmana Silicon Valleys största företag? . Teknikgranskning (14 augusti 2014). Hämtad 11 januari 2017. Arkiverad från originalet 8 januari 2020.
  6. Använda storskaliga hjärnsimuleringar för maskininlärning och AI . Officiell Google-blogg (26 juni 2012). Hämtad 26 januari 2015. Arkiverad från originalet 23 augusti 2020.
  7. Googles storskaliga Deep Neural Networks-projekt . Hämtad 25 oktober 2015. Arkiverad från originalet 16 februari 2019.
  8. Markoff, John Hur många datorer för att identifiera en katt? 16 000 . New York Times (25 juni 2012). Tillträdesdatum: 11 februari 2014. Arkiverad från originalet den 9 maj 2017.
  9. Katyanna Quach (17 november 2016), Googles neurala nätverk lär sig att översätta språk det inte har tränats på: Första gången maskinöversättning har använt sann överföringsinlärning , < https://www.theregister.co.uk/ 2016/ 11/11/googles_neural_net_translates_languages_not_trained_on > . Hämtad 11 januari 2017. Arkiverad 22 september 2017 på Wayback Machine 
  10. Lewis-Kraus, Gideon . The Great AI Awakening , New York Times  (14 december 2016). Arkiverad från originalet den 5 maj 2017. Hämtad 11 januari 2017.
  11. Le, Quoc; Schuster, Mike Ett neuralt nätverk för maskinöversättning, i produktionsskala . Googles forskningsblogg . Google (27 september 2016). Hämtad 1 december 2016. Arkiverad från originalet 7 maj 2018.
  12. Google byter till sitt eget översättningssystem Arkiverat 29 april 2017 på Wayback Machine 22 oktober 2007
  13. Barry Schwartz. Google Translate släpper SYSTRAN för hembryggd översättning . Sökmotorland (23 oktober 2007). Hämtad 4 maj 2017. Arkiverad från originalet 21 maj 2017.
  14. Chris McDonald (7 januari 2017), kommenterar Gil Fewsters artikel 5 januari i Atlanten , < https://medium.com/@chrismcdonald_94568/ok-slow-down-516f93f83ac8#.l0ti3ct0b > . Hämtad 11 januari 2017. Arkiverad 22 juni 2017 på Wayback Machine 
  15. Turovsky, Barak Hittade i översättning: Mer exakta, flytande meningar i Google Translate . Nyckelordet Google-bloggen . Google (15 november 2016). Hämtad 1 december 2016. Arkiverad från originalet 14 april 2020.
  16. Turovsky, Barak Neurala översättningar av högre kvalitet för en massa fler språk . Nyckelordet Google-bloggen . Google. Hämtad 6 mars 2017. Arkiverad från originalet 7 mars 2017.
  17. Novet, Jordan Google tillhandahåller nu AI-drivna översättningar för arabiska och hebreiska . Venture Beat (30 mars 2017). Arkiverad från originalet den 1 januari 2020.
  18. Turovsky, Barak Att göra internet mer inkluderande i Indien . Nyckelordet (25 april 2017). Arkiverad 11 november 2020.
  19. Språkstöd för översättnings-API . Google Cloud Platform (4 maj 2017). Arkiverad från originalet den 16 september 2017.

Externa länkar