Машинний переклад – виконувана комп’ютером операція з перетворення тексту однієї природної мови у еквівалентний за змістом текст іншою мовою. Сучасний машинний чи автоматичний переклад втілюється за допомогою людини: передредактора, що тим чи іншим чином виконує попередню обробку тексту, інтерредактора, що бере безпосередню участь у перекладі та постредактора, що виправляє недоліки та помилки в перекладеному тексті.
Початок історії машинного перекладу датується сімнадцятим століттям, коли філософи Лейбніц і Декарт прогнозували створення кодів, що могли б зв’язати слова між мовами. Попри те, ці пропозиції залишились теоретичними і не стали основою створення фактичної машини.
Перші розробки
Вперше можливість машинного перекладу на практиці передбачив Ч. Беббідж, що у першій половині 19 століття працював над проектом цифрової аналітичної машини – механічного прототипу електронних цифрових обчислювальних машин. Процес перекладу він уявляв так: «В мене перед очима текст, написаний російською, але я збираюсь уявити, що насправді він написаний англійською, але за допомогою доволі дивних знаків. Все, що мені потрібно – це зламати код для того, щоб вилучити інформацію, що міститься у тексті.»
Перші патенти на створення перекладацьких машин було видано у середині 30-х років минулого століття. Ідея науковця з Західної Європи полягала у створенні автоматичного двомовного словника на основі перфострічки, але проект росіянина П. Троянського був детальнішим. Винайдений ним пристрій включав двомовний словник, здатний оперувати граматичними особливостями за принципом мови есперанто. Система поділялася на три стадії. Спочатку носій мови мав розподілити слова за їх логічними формами та синтаксичними функціями. Потім машина мала виконати переклад на потрібну мову, а носій – відредагувати висхідний матеріал.
Меморандум Вівера та подальші дослідження
Першу пропозицію машинного перекладу за допомогою комп’ютера було висунуто Уорреном Вівером, дослідником з Фонду Рокфеллера у його меморандумі. Пропозиції базувалися на інформаційній теорії, успіхах у зламуванні кодів протягом другої світової війни та обговореннях універсальних та основних принципів мов. За кілька років після опублікування меморандуму розпочалися серйозні дослідження у багатьох університетах Сполучених Штатів. 7 січня 1954 у Нью-Йорку в головному офісі IBM було вперше проведено публічну демонстрацію системи машинного перекладу (МП). Про демонстрацію повідомили в газетах, тож подія отримала широкий розголос. Попри те, що сама система мала лише 250 слів та 49 перекладених на англійську російськомовних речень (головним чином у області хімії) і була доволі примітивною, вона продемонструвала перспективи машинного перекладу, стимулювавши фінансування цього дослідження не тільки у США, а й у всьому світі. Експеримент було визнано успішним, що сповістило про початок ери вагомих капіталовкладень у дослідження машинного перекладу. Автори стверджували, що за кілька років машинний переклад буде повністю втілено в життя.
У ранніх системах використовувались великі двомовні словники та закодовані вручну правила для визначення порядку слів у висхідному продукті. У результаті цей метод було визнано занадто обмеженим, а завдяки тогочасному розвитку лінгвістики для покращення якості перекладу було запропоновано дослідження генеративної лінгвістики та трансформаційної граматики. Але в цей час операційні системи вже застосовувались. Військово-повітряні сили США використовували систему, розроблену ІВМ і Вашингтонським університетом, в той час як на ВПС Італії працювала розробка Джорджтаунського університету. Попри те, що якість продукції була низькою, це задовольняло клієнтів, в основному з точки зору швидкості.
Наприкінці 1950-х Г. Бар, дослідник, що на замовлення США вивчав можливість створення повністю автоматичного якісного перекладу, наголосив на проблемі семантичної двозначності під час машинного перекладу. Розгляньмо наступний приклад: Little John was looking for his toy box. Finally he found it. The box was in the pen. Слово «pen» має два значення: прилад, що використовується на письмі і певний контейнер. Для людини значення є очевидним, але машина без «універсальної енциклопедії» ніколи не зможе вирішити цю проблему. Сьогодні проблема семантичної двозначності може бути вирішена шляхом написання висхідних текстів контрольованою мовою, тобто застосовуючи словник, у якому для кожного слова є тільки одне значення.
1960-ті, звіт ALPAC
Дослідження 1960-х років у СРСР та Сполучених Штатах сконцентрувались головним чином на російсько-англійській мовній парі. В основному об’єктами перекладу виступали науково-технічні документи, як от статті з наукових журналів. Недбалий переклад був достатнім для розуміння сенсу статей. Якщо стаття стосувалася інтересів безпеки, її надсилали живому перекладачу для повного перекладу, решту ж перекладали автоматично. МП зазнав нищівного удару у 1966 році разом із публікацією звіту ALPAC (дорадчого комітету з автоматичної мовної обробки), що складався з семи вчених, скликаних американським урядом у 1964. Американський уряд був занепокоєний повільним просуванням експерименту попри значні видатки, тож було ухвалено рішення, що машинний переклад був дорожчим, менш точним та повільнішим за людський, і незважаючи на витрати, машинний переклад навряд чи досягне якості людського найближчим часом. Однак, у звіті рекомендували продовжувати дослідження у галузі комп’ютерної лінгвістики та створити автоматичні словники, що допомагали б перекладачам.
Публікація звіту вплинула на дослідження машинного перекладу у Сполучених Штатах, меншою мірою – у Радянському Союзі та Великій Британії. Звіт, принаймні, майже повністю припинив будь-які дослідження у Сполучених Штатах майже на десятиліття. Однак, у Канаді, Франції та Німеччині дослідження продовжувались; у 1970 систему Systran використовували ВПС США, і, як наслідок, Комісією європейської економічної спільноти. Систему МЕТЕО, розроблену в Університеті Монреаля, було застосовано у 1977 року в Канаді для перекладу прогнозів погоди з англійської мови на французьку. Система перекладала близько 80 000 слів в день або 30 млн слів на рік, поки не була замінена системою конкурента 30-го вересня 2001.
1970-ті - сьогодення
В той час як дослідження 1960-х концентрувалися на проблемі обмеження мовних пар та системі вводу інформації, протягом 1970-х років постала потреба в недорогих системах, що змогли б перекладати діапазон технічних та комерційних документів. Ця вимога заохочувалася посиленням глобалізації та потреби перекладів в Канаді, Європі та Японії. До 1980-х років збільшилось різноманіття та число встановлених систем для машинного перекладу. Збільшилась кількість систем, що працювали на основі електронно-обчислювальних машин, як от Systran і Logos. Поширення мікрокомп’ютерів знаменувало створення дешевого ринку систем машинного перекладу, тому багато європейських, американських та японських компаній не втратили шансів цим скористатися. Схожі системи потрапили на ринки Китаю, Східної Європи, Кореї та Радянського Союзу.
Протягом 1980-х жвава діяльність у галузі машинного перекладу розгорнулася в Японії. Завдяки комп’ютеру п’ятого покоління Японія мала намір перестрибнути конкурентів у галузі елементів електронних пристроїв та програмного забезпечення. Багато великих японських компаній було залучено до роботи над створенням англо-японських та японо-англійських штучних перекладачів. У дослідженнях 1980-х років переклад вбачався як певний різновид проміжного лінгвістичного відтворення, що залучає морфологічний аналіз разом з синтаксичним та семантичним. Наприкінці 1980-х відбувся вагомий стрибок у галузі створення нових методів для машинного перекладу. Система, розроблена ІВМ, базувалася на статистичних методах, інші групи застосовували техніку, що базується на великій кількості перекладів як зразків.
Протягом 1990-х років, після успіхів у розпізнанні мови та мовному синтезі, дослідження перейшло у стадію мовного перекладу. Відбувся значний ріст використання машинного перекладу в результаті появи дешевих та потужних комп’ютерів. На початку 1990-х машинний переклад став можливим не тільки на великих базових комп’ютерах, а й на персональних комп’ютерах та автоматизованих робочих місцях.
Посилання
Див. також
Цю статтю треба для відповідності Вікіпедії. (Жовтень 2011) |
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Mashinnij pereklad vikonuvana komp yuterom operaciya z peretvorennya tekstu odniyeyi prirodnoyi movi u ekvivalentnij za zmistom tekst inshoyu movoyu Suchasnij mashinnij chi avtomatichnij pereklad vtilyuyetsya za dopomogoyu lyudini peredredaktora sho tim chi inshim chinom vikonuye poperednyu obrobku tekstu interredaktora sho bere bezposerednyu uchast u perekladi ta postredaktora sho vipravlyaye nedoliki ta pomilki v perekladenomu teksti Pochatok istoriyi mashinnogo perekladu datuyetsya simnadcyatim stolittyam koli filosofi Lejbnic i Dekart prognozuvali stvorennya kodiv sho mogli b zv yazati slova mizh movami Popri te ci propoziciyi zalishilis teoretichnimi i ne stali osnovoyu stvorennya faktichnoyi mashini Pershi rozrobkiVpershe mozhlivist mashinnogo perekladu na praktici peredbachiv Ch Bebbidzh sho u pershij polovini 19 stolittya pracyuvav nad proektom cifrovoyi analitichnoyi mashini mehanichnogo prototipu elektronnih cifrovih obchislyuvalnih mashin Proces perekladu vin uyavlyav tak V mene pered ochima tekst napisanij rosijskoyu ale ya zbirayus uyaviti sho naspravdi vin napisanij anglijskoyu ale za dopomogoyu dovoli divnih znakiv Vse sho meni potribno ce zlamati kod dlya togo shob viluchiti informaciyu sho mistitsya u teksti Pershi patenti na stvorennya perekladackih mashin bulo vidano u seredini 30 h rokiv minulogo stolittya Ideya naukovcya z Zahidnoyi Yevropi polyagala u stvorenni avtomatichnogo dvomovnogo slovnika na osnovi perfostrichki ale proekt rosiyanina P Troyanskogo buv detalnishim Vinajdenij nim pristrij vklyuchav dvomovnij slovnik zdatnij operuvati gramatichnimi osoblivostyami za principom movi esperanto Sistema podilyalasya na tri stadiyi Spochatku nosij movi mav rozpodiliti slova za yih logichnimi formami ta sintaksichnimi funkciyami Potim mashina mala vikonati pereklad na potribnu movu a nosij vidredaguvati vishidnij material Memorandum Vivera ta podalshi doslidzhennyaPershu propoziciyu mashinnogo perekladu za dopomogoyu komp yutera bulo visunuto Uorrenom Viverom doslidnikom z Fondu Rokfellera u jogo memorandumi Propoziciyi bazuvalisya na informacijnij teoriyi uspihah u zlamuvanni kodiv protyagom drugoyi svitovoyi vijni ta obgovorennyah universalnih ta osnovnih principiv mov Za kilka rokiv pislya opublikuvannya memorandumu rozpochalisya serjozni doslidzhennya u bagatoh universitetah Spoluchenih Shtativ 7 sichnya 1954 u Nyu Jorku v golovnomu ofisi IBM bulo vpershe provedeno publichnu demonstraciyu sistemi mashinnogo perekladu MP Pro demonstraciyu povidomili v gazetah tozh podiya otrimala shirokij rozgolos Popri te sho sama sistema mala lishe 250 sliv ta 49 perekladenih na anglijsku rosijskomovnih rechen golovnim chinom u oblasti himiyi i bula dovoli primitivnoyu vona prodemonstruvala perspektivi mashinnogo perekladu stimulyuvavshi finansuvannya cogo doslidzhennya ne tilki u SShA a j u vsomu sviti Eksperiment bulo viznano uspishnim sho spovistilo pro pochatok eri vagomih kapitalovkladen u doslidzhennya mashinnogo perekladu Avtori stverdzhuvali sho za kilka rokiv mashinnij pereklad bude povnistyu vtileno v zhittya U rannih sistemah vikoristovuvalis veliki dvomovni slovniki ta zakodovani vruchnu pravila dlya viznachennya poryadku sliv u vishidnomu produkti U rezultati cej metod bulo viznano zanadto obmezhenim a zavdyaki togochasnomu rozvitku lingvistiki dlya pokrashennya yakosti perekladu bulo zaproponovano doslidzhennya generativnoyi lingvistiki ta transformacijnoyi gramatiki Ale v cej chas operacijni sistemi vzhe zastosovuvalis Vijskovo povitryani sili SShA vikoristovuvali sistemu rozroblenu IVM i Vashingtonskim universitetom v toj chas yak na VPS Italiyi pracyuvala rozrobka Dzhordzhtaunskogo universitetu Popri te sho yakist produkciyi bula nizkoyu ce zadovolnyalo kliyentiv v osnovnomu z tochki zoru shvidkosti Naprikinci 1950 h G Bar doslidnik sho na zamovlennya SShA vivchav mozhlivist stvorennya povnistyu avtomatichnogo yakisnogo perekladu nagolosiv na problemi semantichnoyi dvoznachnosti pid chas mashinnogo perekladu Rozglyanmo nastupnij priklad Little John was looking for his toy box Finally he found it The box was in the pen Slovo pen maye dva znachennya prilad sho vikoristovuyetsya na pismi i pevnij kontejner Dlya lyudini znachennya ye ochevidnim ale mashina bez universalnoyi enciklopediyi nikoli ne zmozhe virishiti cyu problemu Sogodni problema semantichnoyi dvoznachnosti mozhe buti virishena shlyahom napisannya vishidnih tekstiv kontrolovanoyu movoyu tobto zastosovuyuchi slovnik u yakomu dlya kozhnogo slova ye tilki odne znachennya 1960 ti zvit ALPACDoslidzhennya 1960 h rokiv u SRSR ta Spoluchenih Shtatah skoncentruvalis golovnim chinom na rosijsko anglijskij movnij pari V osnovnomu ob yektami perekladu vistupali naukovo tehnichni dokumenti yak ot statti z naukovih zhurnaliv Nedbalij pereklad buv dostatnim dlya rozuminnya sensu statej Yaksho stattya stosuvalasya interesiv bezpeki yiyi nadsilali zhivomu perekladachu dlya povnogo perekladu reshtu zh perekladali avtomatichno MP zaznav nishivnogo udaru u 1966 roci razom iz publikaciyeyu zvitu ALPAC doradchogo komitetu z avtomatichnoyi movnoyi obrobki sho skladavsya z semi vchenih sklikanih amerikanskim uryadom u 1964 Amerikanskij uryad buv zanepokoyenij povilnim prosuvannyam eksperimentu popri znachni vidatki tozh bulo uhvaleno rishennya sho mashinnij pereklad buv dorozhchim mensh tochnim ta povilnishim za lyudskij i nezvazhayuchi na vitrati mashinnij pereklad navryad chi dosyagne yakosti lyudskogo najblizhchim chasom Odnak u zviti rekomenduvali prodovzhuvati doslidzhennya u galuzi komp yuternoyi lingvistiki ta stvoriti avtomatichni slovniki sho dopomagali b perekladacham Publikaciya zvitu vplinula na doslidzhennya mashinnogo perekladu u Spoluchenih Shtatah menshoyu miroyu u Radyanskomu Soyuzi ta Velikij Britaniyi Zvit prinajmni majzhe povnistyu pripiniv bud yaki doslidzhennya u Spoluchenih Shtatah majzhe na desyatilittya Odnak u Kanadi Franciyi ta Nimechchini doslidzhennya prodovzhuvalis u 1970 sistemu Systran vikoristovuvali VPS SShA i yak naslidok Komisiyeyu yevropejskoyi ekonomichnoyi spilnoti Sistemu METEO rozroblenu v Universiteti Monrealya bulo zastosovano u 1977 roku v Kanadi dlya perekladu prognoziv pogodi z anglijskoyi movi na francuzku Sistema perekladala blizko 80 000 sliv v den abo 30 mln sliv na rik poki ne bula zaminena sistemoyu konkurenta 30 go veresnya 2001 1970 ti sogodennyaV toj chas yak doslidzhennya 1960 h koncentruvalisya na problemi obmezhennya movnih par ta sistemi vvodu informaciyi protyagom 1970 h rokiv postala potreba v nedorogih sistemah sho zmogli b perekladati diapazon tehnichnih ta komercijnih dokumentiv Cya vimoga zaohochuvalasya posilennyam globalizaciyi ta potrebi perekladiv v Kanadi Yevropi ta Yaponiyi Do 1980 h rokiv zbilshilos riznomanittya ta chislo vstanovlenih sistem dlya mashinnogo perekladu Zbilshilas kilkist sistem sho pracyuvali na osnovi elektronno obchislyuvalnih mashin yak ot Systran i Logos Poshirennya mikrokomp yuteriv znamenuvalo stvorennya deshevogo rinku sistem mashinnogo perekladu tomu bagato yevropejskih amerikanskih ta yaponskih kompanij ne vtratili shansiv cim skoristatisya Shozhi sistemi potrapili na rinki Kitayu Shidnoyi Yevropi Koreyi ta Radyanskogo Soyuzu Protyagom 1980 h zhvava diyalnist u galuzi mashinnogo perekladu rozgornulasya v Yaponiyi Zavdyaki komp yuteru p yatogo pokolinnya Yaponiya mala namir perestribnuti konkurentiv u galuzi elementiv elektronnih pristroyiv ta programnogo zabezpechennya Bagato velikih yaponskih kompanij bulo zalucheno do roboti nad stvorennyam anglo yaponskih ta yapono anglijskih shtuchnih perekladachiv U doslidzhennyah 1980 h rokiv pereklad vbachavsya yak pevnij riznovid promizhnogo lingvistichnogo vidtvorennya sho zaluchaye morfologichnij analiz razom z sintaksichnim ta semantichnim Naprikinci 1980 h vidbuvsya vagomij stribok u galuzi stvorennya novih metodiv dlya mashinnogo perekladu Sistema rozroblena IVM bazuvalasya na statistichnih metodah inshi grupi zastosovuvali tehniku sho bazuyetsya na velikij kilkosti perekladiv yak zrazkiv Protyagom 1990 h rokiv pislya uspihiv u rozpiznanni movi ta movnomu sintezi doslidzhennya perejshlo u stadiyu movnogo perekladu Vidbuvsya znachnij rist vikoristannya mashinnogo perekladu v rezultati poyavi deshevih ta potuzhnih komp yuteriv Na pochatku 1990 h mashinnij pereklad stav mozhlivim ne tilki na velikih bazovih komp yuterah a j na personalnih komp yuterah ta avtomatizovanih robochih miscyah PosilannyaDiv takozhMashinnij pereklad Cyu stattyu treba vikifikuvati dlya vidpovidnosti standartam yakosti Vikipediyi Bud laska dopomozhit dodavannyam dorechnih vnutrishnih posilan abo vdoskonalennyam rozmitki statti Zhovten 2011