Нейронний машинний переклад Google (GNMT) — це система нейронного машинного перекладу (NMT), розроблена компанією Google і представлена в листопаді 2016 року, яка використовує штучну нейронну мережу для підвищення швидкості і якості перекладу в Google Перекладачі.
GNMT підвищує якість перекладу, застосовуючи метод машинного перекладу що базується на прикладах (EBMT), у якому система «навчається на мільйонах прикладів». Архітектура системного навчання GNMT була вперше випробувана на більш ніж ста мовах, що підтримуються Google Перекладачем. Завдяки потужній внутрішній структурі система з часом вчиться створювати якісніші й природніші переклади. GNMT здатна перекладати речення в цілому, а не частинами. GNMT здатна виконувати , кодуючи семантику речення замість того, щоб запам'ятовувати переклади окремих фраз.
Історія
Проєкт Google Brain був створений у 2011 році в «секретній дослідницькій лабораторії Google X» Джеффом Діном, співробітником Google, Грегом Коррадо, дослідником із Google, та Ендрю Ином, професором комп'ютерних наук Стенфордського університету. Робота Ина лягла в основу одного з найбільших технологічних проривів у Google і Стенфорді.
У вересні 2016 року дослідницька група Google оголосила про розробку системи перекладу GNMT, і до листопада Google Перекладач почав використовувати нейронний машинний переклад (NMT) замість колишніх статистичних методів (SMT), які використовувалися з жовтня 2007 року всередині власної закритої SMT-системи.
Система NMT всередині Google Перекладача використовує велику штучну нейронну мережу, придатну для глибокого навчання. Вивчаючи мільйони прикладів, GNMT покращує якість перекладу, використовуючи ширший контекст для виведення найякіснішого перекладу. Потім результат перебудовується й пристосовується для відповідності граматиці людської мови.
GNMT не створила свою внутрішню універсальну мову, а скоріше прагнула знайти спільне між багатьма мовами, що має бути цікаво більше для психологів і лінгвістів, ніж для фахівців у галузі інформатики. Новий механізм перекладу був включений в обидві сторони для дев'яти мов: англійської, іспанської, китайської, корейської, німецької, португальської, турецької, французької та японської у 2016 році. У березні 2017 року були додані ще три мови: в'єтнамська, російська та хінді. У тому ж місяці за допомогою спільноти Google Перекладача була додана підтримка арабської мови та івриту. Далі наприкінці квітня 2017 року було додано підтримку дев'яти індійських мов, а саме: бенгалі, гуджараті, каннада, малаялам, маратхі, пенджабі, тамільської, телугу та гінді.
Мови, що підтримуються GNMT
Нижче наведено список мовних пар, у яких для перекладу використовується модель нейронного машинного перекладу Google (NMT). Станом на липень 2017 року для всіх мов підтримується тільки переклад на англійську мову і назад:
Мовна пара | Коди мов | |
---|---|---|
1 | Африкаанс ↔ Англійська | af ↔ en |
2 | Арабська ↔ Англійська | ar ↔ en |
3 | Болгарська ↔ Англійська | bg ↔ en |
4 | Китайська (спрощена) ↔ Англійська | zh-CN ↔ en |
5 | Китайська (традиційна) ↔ Англійська | zh-TW ↔ en |
6 | Хорватська ↔ Англійська | hr ↔ en |
7 | Чеська ↔ Англійська | cs ↔ en |
8 | Данська ↔ Англійська | da ↔ en |
9 | Голландська ↔ Англійська | nl ↔ en |
10 | Французька ↔ Англійська | fr ↔ en |
11 | Німецька ↔ Англійська | de ↔ en |
12 | Грецька ↔ Англійська | el ↔ en |
13 | Іврит ↔ Англійська | iw ↔ en |
14 | Хінді ↔ Англійська | hi ↔ en |
15 | Ісландська ↔ Англійська | is ↔ en |
16 | Індонезійська ↔ Англійська | id ↔ en |
17 | Італійська ↔ Англійська | it ↔ en |
18 | Японська ↔ Англійська | ja ↔ en |
19 | Корейська ↔ Англійська | ko ↔ en |
20 | Норвезька ↔ Англійська | no ↔ en |
21 | Польська ↔ Англійська | pl ↔ en |
22 | Португальська ↔ Англійська | pt ↔ en |
23 | Румунська ↔ Англійська | ro ↔ en |
24 | Російська ↔ Англійська | ru ↔ en |
25 | Словацька ↔ Англійська | sk ↔ en |
26 | Іспанська ↔ Англійська | es ↔ en |
27 | Шведська ↔ Англійська | sv ↔ en |
28 | Тайська ↔ Англійська | th ↔ en |
29 | Турецька ↔ Англійська | tr ↔ en |
30 | В'єтнамська ↔ Англійська | vi ↔ en |
Прямий переклад
Стверджується, що система GNMT краще попереднього варіанту Google Перекладача тим, що вона може виконувати «прямий переклад», тобто перекладати з однієї мови на іншу безпосередньо (наприклад, з японської на корейську). Раніше Google Перекладач спочатку перекладав з початкової мови на англійську, а потім з англійської на кінцеву мову замість прямого перекладу з однієї мови на іншу.
Див. також
Примітки
- Barak Turovsky (15 листопада 2016), Found in translation: More accurate, fluent sentences in Google Translate, Google Blog, процитовано 11 січня 2017
- Mike Schuster, Melvin Johnson, and Nikhil Thorat (22 листопада 2016), Zero-Shot Translation with Google’s Multilingual Neural Machine Translation System, Google Research Blog, процитовано 11 січня 2017
- Gil Fewster (5 січня 2017), , freeCodeCamp, архів оригіналу за 31 травня 2017, процитовано 11 січня 2017
- Boitet, Christian; Blanchon, Hervé; Seligman, Mark; Bellynck, Valérie (2010). (PDF). Архів оригіналу (PDF) за 29 березня 2017. Процитовано 1 грудня 2016.
- Jeff Dean and Andrew Ng (26 червня 2012). Using large-scale brain simulations for machine learning and A.I. Official Google Blog. Процитовано 26 січня 2015.
- Google's Large Scale Deep Neural Networks Project. Процитовано 25 жовтня 2015.
- (25 червня 2012). How Many Computers to Identify a Cat? 16,000. New York Times. Процитовано 11 лютого 2014.
- Robert D. Hof (14 серпня 2014). A Chinese Internet Giant Starts to Dream: Baidu is a fixture of online life in China, but it wants to become a global power. Can one of the world’s leading artificial intelligence researchers help it challenge Silicon Valley’s biggest companies?. Technology Review. Процитовано 11 січня 2017.
- Katyanna Quach (17 листопада 2016), Google's neural network learns to translate languages it hasn't been trained on: First time machine translation has used true transfer learning, процитовано 11 січня 2017
- Lewis-Kraus, Gideon (14 грудня 2016). The Great A.I. Awakening. The New York Times. Процитовано 11 січня 2017.
- Le, Quoc; Schuster, Mike (27 вересня 2016). A Neural Network for Machine Translation, at Production Scale. Google Research Blog. Google. Процитовано 1 грудня 2016.
- Google Switches to its Own Translation System, October 22, 2007
- Barry Schwartz (23 жовтня 2007). Google Translate Drops SYSTRAN for Home-Brewed Translation. Search Engine Land.
- Chris McDonald (7 січня 2017), Commenting on Gil Fewster's January 5th article in the Atlantic, процитовано 11 січня 2017
- Turovsky, Barak. Higher quality neural translations for a bunch more languages. The Keyword Google Blog. Google. Процитовано 6 березня 2017.
- Novet, Jordan (30 березня 2017). Google now provides AI-powered translations for Arabic and Hebrew. VentureBeat.
- Turovsky, Barak (25 квітня 2017). Making the internet more inclusive in India. The Keyword.
- Translation API Language Support. Google Cloud Platform. 4 травня 2017.
Посилання
- Переваги та недоліки машинного перекладу
- Статистичний машинний переклад
- Міжнародна асоціація машинного перекладу (IAMT)
- Архів машинного перекладу від Джона Хатчинса. Електронне сховище (і бібліографія) статей, книг і статей в області машинного перекладу і технології комп'ютерного перекладу
- Машинний переклад (автоматичний переклад) — публікації Джона Хатчинса (включають в себе PDF кількох книг про машинний переклад)
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Nejronnij mashinnij pereklad Google GNMT ce sistema nejronnogo mashinnogo perekladu NMT rozroblena kompaniyeyu Google i predstavlena v listopadi 2016 roku yaka vikoristovuye shtuchnu nejronnu merezhu dlya pidvishennya shvidkosti i yakosti perekladu v Google Perekladachi GNMT pidvishuye yakist perekladu zastosovuyuchi metod mashinnogo perekladu sho bazuyetsya na prikladah EBMT u yakomu sistema navchayetsya na miljonah prikladiv Arhitektura sistemnogo navchannya GNMT bula vpershe viprobuvana na bilsh nizh sta movah sho pidtrimuyutsya Google Perekladachem Zavdyaki potuzhnij vnutrishnij strukturi sistema z chasom vchitsya stvoryuvati yakisnishi j prirodnishi perekladi GNMT zdatna perekladati rechennya v cilomu a ne chastinami GNMT zdatna vikonuvati koduyuchi semantiku rechennya zamist togo shob zapam yatovuvati perekladi okremih fraz IstoriyaProyekt Google Brain buv stvorenij u 2011 roci v sekretnij doslidnickij laboratoriyi Google X Dzheffom Dinom spivrobitnikom Google Gregom Korrado doslidnikom iz Google ta Endryu Inom profesorom komp yuternih nauk Stenfordskogo universitetu Robota Ina lyagla v osnovu odnogo z najbilshih tehnologichnih proriviv u Google i Stenfordi U veresni 2016 roku doslidnicka grupa Google ogolosila pro rozrobku sistemi perekladu GNMT i do listopada Google Perekladach pochav vikoristovuvati nejronnij mashinnij pereklad NMT zamist kolishnih statistichnih metodiv SMT yaki vikoristovuvalisya z zhovtnya 2007 roku vseredini vlasnoyi zakritoyi SMT sistemi Sistema NMT vseredini Google Perekladacha vikoristovuye veliku shtuchnu nejronnu merezhu pridatnu dlya glibokogo navchannya Vivchayuchi miljoni prikladiv GNMT pokrashuye yakist perekladu vikoristovuyuchi shirshij kontekst dlya vivedennya najyakisnishogo perekladu Potim rezultat perebudovuyetsya j pristosovuyetsya dlya vidpovidnosti gramatici lyudskoyi movi GNMT ne stvorila svoyu vnutrishnyu universalnu movu a skorishe pragnula znajti spilne mizh bagatma movami sho maye buti cikavo bilshe dlya psihologiv i lingvistiv nizh dlya fahivciv u galuzi informatiki Novij mehanizm perekladu buv vklyuchenij v obidvi storoni dlya dev yati mov anglijskoyi ispanskoyi kitajskoyi korejskoyi nimeckoyi portugalskoyi tureckoyi francuzkoyi ta yaponskoyi u 2016 roci U berezni 2017 roku buli dodani she tri movi v yetnamska rosijska ta hindi U tomu zh misyaci za dopomogoyu spilnoti Google Perekladacha bula dodana pidtrimka arabskoyi movi ta ivritu Dali naprikinci kvitnya 2017 roku bulo dodano pidtrimku dev yati indijskih mov a same bengali gudzharati kannada malayalam marathi pendzhabi tamilskoyi telugu ta gindi Movi sho pidtrimuyutsya GNMTNizhche navedeno spisok movnih par u yakih dlya perekladu vikoristovuyetsya model nejronnogo mashinnogo perekladu Google NMT Stanom na lipen 2017 roku dlya vsih mov pidtrimuyetsya tilki pereklad na anglijsku movu i nazad Movna para Kodi mov 1 Afrikaans Anglijska af en 2 Arabska Anglijska ar en 3 Bolgarska Anglijska bg en 4 Kitajska sproshena Anglijska zh CN en 5 Kitajska tradicijna Anglijska zh TW en 6 Horvatska Anglijska hr en 7 Cheska Anglijska cs en 8 Danska Anglijska da en 9 Gollandska Anglijska nl en 10 Francuzka Anglijska fr en 11 Nimecka Anglijska de en 12 Grecka Anglijska el en 13 Ivrit Anglijska iw en 14 Hindi Anglijska hi en 15 Islandska Anglijska is en 16 Indonezijska Anglijska id en 17 Italijska Anglijska it en 18 Yaponska Anglijska ja en 19 Korejska Anglijska ko en 20 Norvezka Anglijska no en 21 Polska Anglijska pl en 22 Portugalska Anglijska pt en 23 Rumunska Anglijska ro en 24 Rosijska Anglijska ru en 25 Slovacka Anglijska sk en 26 Ispanska Anglijska es en 27 Shvedska Anglijska sv en 28 Tajska Anglijska th en 29 Turecka Anglijska tr en 30 V yetnamska Anglijska vi enPryamij perekladStverdzhuyetsya sho sistema GNMT krashe poperednogo variantu Google Perekladacha tim sho vona mozhe vikonuvati pryamij pereklad tobto perekladati z odniyeyi movi na inshu bezposeredno napriklad z yaponskoyi na korejsku Ranishe Google Perekladach spochatku perekladav z pochatkovoyi movi na anglijsku a potim z anglijskoyi na kincevu movu zamist pryamogo perekladu z odniyeyi movi na inshu Div takozhMashinnij pereklad na osnovi prikladiv en en Statistichnij mashinnij pereklad Shtuchnij intelekt en Obchislyuvalna lingvistika Avtomatizovanij pereklad Istoriya mashinnogo perekladu Spisok perspektivnih tehnologij en Nejronnij mashinnij pereklad Mashinnij pereklad en PrimitkiBarak Turovsky 15 listopada 2016 Found in translation More accurate fluent sentences in Google Translate Google Blog procitovano 11 sichnya 2017 Mike Schuster Melvin Johnson and Nikhil Thorat 22 listopada 2016 Zero Shot Translation with Google s Multilingual Neural Machine Translation System Google Research Blog procitovano 11 sichnya 2017 Gil Fewster 5 sichnya 2017 freeCodeCamp arhiv originalu za 31 travnya 2017 procitovano 11 sichnya 2017 Boitet Christian Blanchon Herve Seligman Mark Bellynck Valerie 2010 PDF Arhiv originalu PDF za 29 bereznya 2017 Procitovano 1 grudnya 2016 Jeff Dean and Andrew Ng 26 chervnya 2012 Using large scale brain simulations for machine learning and A I Official Google Blog Procitovano 26 sichnya 2015 Google s Large Scale Deep Neural Networks Project Procitovano 25 zhovtnya 2015 25 chervnya 2012 How Many Computers to Identify a Cat 16 000 New York Times Procitovano 11 lyutogo 2014 Robert D Hof 14 serpnya 2014 A Chinese Internet Giant Starts to Dream Baidu is a fixture of online life in China but it wants to become a global power Can one of the world s leading artificial intelligence researchers help it challenge Silicon Valley s biggest companies Technology Review Procitovano 11 sichnya 2017 Katyanna Quach 17 listopada 2016 Google s neural network learns to translate languages it hasn t been trained on First time machine translation has used true transfer learning procitovano 11 sichnya 2017 Lewis Kraus Gideon 14 grudnya 2016 The Great A I Awakening The New York Times Procitovano 11 sichnya 2017 Le Quoc Schuster Mike 27 veresnya 2016 A Neural Network for Machine Translation at Production Scale Google Research Blog Google Procitovano 1 grudnya 2016 Google Switches to its Own Translation System October 22 2007 Barry Schwartz 23 zhovtnya 2007 Google Translate Drops SYSTRAN for Home Brewed Translation Search Engine Land Chris McDonald 7 sichnya 2017 Commenting on Gil Fewster s January 5th article in the Atlantic procitovano 11 sichnya 2017 Turovsky Barak Higher quality neural translations for a bunch more languages The Keyword Google Blog Google Procitovano 6 bereznya 2017 Novet Jordan 30 bereznya 2017 Google now provides AI powered translations for Arabic and Hebrew VentureBeat Turovsky Barak 25 kvitnya 2017 Making the internet more inclusive in India The Keyword Translation API Language Support Google Cloud Platform 4 travnya 2017 PosilannyaPerevagi ta nedoliki mashinnogo perekladu Statistichnij mashinnij pereklad Mizhnarodna asociaciya mashinnogo perekladu IAMT Arhiv mashinnogo perekladu vid Dzhona Hatchinsa Elektronne shovishe i bibliografiya statej knig i statej v oblasti mashinnogo perekladu i tehnologiyi komp yuternogo perekladu Mashinnij pereklad avtomatichnij pereklad publikaciyi Dzhona Hatchinsa vklyuchayut v sebe PDF kilkoh knig pro mashinnij pereklad