Опорна мова (англ. pivot language), яку іноді також називають мостовою мовою (англ. bridge language) — штучна або природна мова, що використовується як мова-посередниця для перекладу між багатьма різними мовами — для перекладу між будь-якою парою мов A та B, одна перекладає A на опорну мову P, потім від P на B. Використання опорної мови дозволяє уникнути комбінаторного вибуху — наявності перекладачів для кожної комбінації підтримуваних мов, оскільки кількість комбінацій мови є лінійною (), а не квадратичною — потрібно лише знати мову A та опорну мову P (а комусь іншому мову B та опорну P), а не потребувати іншого перекладача для кожної можливої комбінації A та B.
Недоліком опорної мови є те, що кожен крок повторного перекладу вносить можливі помилки та двозначності — використання опорної мови передбачає два кроки, а не один. Наприклад, коли Ернан Кортес спілкувався з індіанцями Месоамерики, він говорив іспанською з Херонімо де Агіляром, той говорив маянською з Малінцином, а той говорив з місцевими жителями мовою науатль.
Приклади
Англійська, французька, російська та арабська мови часто використовуються як опорні. Інтерлінгва була використана як основна мова на міжнародних конференціях і була запропонована як основна мова для Європейського Союзу. Есперанто було запропоновано як основну мову у проєкті «Переклад розподіленою мовою», і таким чином її було використано у Majstro Tradukvortaro на вебсайті есперанто Majstro.com. Універсальна мережева мова — це штучна мова, спеціально розроблена для використання як опорної мови.
В обчислювальній техніці
Опорне кодування також є поширеним методом перекладу даних для комп'ютерних систем. Наприклад, інтернет-протокол, XML і мови високого рівня є опорними кодуваннями комп'ютерних даних, які потім часто перетворюються у внутрішні виконавчі формати для конкретних комп'ютерних систем.
Юнікод був розроблений для використання як опорне кодування між різними основними наявними кодуваннями символів, хоча його широке поширення як самостійного кодування зробило це використання несуттєвим.
У машинному перекладі
Сучасні системи статистичного машинного перекладу (СМП/SMT) для досягнення хороших результатів використовують паралельні тексти для джерельної (s) і цільової (t) мов, але хороші паралельні тексти доступні не для всіх мов. Опорна мова (p) дозволяє встановити міст між двома мовами, для яких повністю або частково ще немає наявних паралельних текстів.
Опорний переклад може бути проблематичним через потенційну відсутність вірності переданих відомостей при використанні різних текстів. При використанні двох двомовних текстів (s-p і p-t) для створення моста s-t лінгвістичні дані неминуче втрачаються. Машинний переклад на основі правил (МПОП/RBMT) допомагає системі відновити ці дані, тож система не покладається повністю на статистику, вона покладається також і на структурні лінгвістичні відомості.
Для використання опорної мови в машинному перекладі використовуються три основні методи: (1) тріангуляція, яка фокусується на паралелізмі фраз між джерельною та опорною мовою (s-p) і між опорною та цільовою (p-t);
(2) перенесення (трансфер), при якому всі пропозиції джерельної мови перекладаються на опорну мову, а потім на мову перекладу;
(3) синтез, при якому створюється власний корпус для навчання системи.
Метод тріангуляції (також званий множенням таблиці фраз) розраховує ймовірність як перекладацьких відповідностей, так і лексичної ваги в s-p і p-t, щоб спробувати скласти нову таблицю фраз s-t. Метод перенесення (також званий стратегією перекладу пропозицій) просто здійснює прямий переклад s в p, а потім інший переклад p в t без використання імовірнісних тестів (як у тріангуляції). Синтетичний метод використовує наявний корпус s і намагається побудувати з нього власний синтетичний корпус, який використовується системою для навчання. Потім синтезується двомовний корпус s-p, щоб забезпечити переклад p-t.
Пряме порівняння між методами тріангуляції та перенесення (трансферу) для систем SMT показало, що тріангуляція досягає набагато кращих результатів, ніж перенесення (трансфер).
Усі три методи опорної мови підвищують продуктивність систем SMT. Однак синтетична техніка не працює добре з RBMT, і продуктивність систем нижче, ніж очікувалося. Гібридні системи SMT/RBMT досягають кращої якості перекладу, ніж системи суворого SMT, які спираються на погані паралельні тексти.
Ключова роль систем RBMT полягає в тому, що вони допомагають заповнити прогалину, залишену в процесі перекладу sp → pt, у тому сенсі, що ці паралелі включені до моделі SMT для s-t.
Примітки
- Breinstrup, Thomas. «Linguaphobos? Non in le UE». [Linguaphobes? Not in the EU]. , 2006, Issue 5.
Посилання
- Hua Wu and Haifeng Wang. 2009. Revisiting Pivot Language Approach for Machine Translation. ACL-09.
- Utiyama, M. & H. Isahara (2006) A comparison of pivot methods for phrase-based statistical machine translation. In Proceedings of NAACL/HLT, 484{491.
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Oporna mova angl pivot language yaku inodi takozh nazivayut mostovoyu movoyu angl bridge language shtuchna abo prirodna mova sho vikoristovuyetsya yak mova poserednicya dlya perekladu mizh bagatma riznimi movami dlya perekladu mizh bud yakoyu paroyu mov A ta B odna perekladaye A na opornu movu P potim vid P na B Vikoristannya opornoyi movi dozvolyaye uniknuti kombinatornogo vibuhu nayavnosti perekladachiv dlya kozhnoyi kombinaciyi pidtrimuvanih mov oskilki kilkist kombinacij movi ye linijnoyu n 1 displaystyle n 1 a ne kvadratichnoyu n 2 n 2 n 2 displaystyle left textstyle binom n 2 frac n 2 n 2 right potribno lishe znati movu A ta opornu movu P a komus inshomu movu B ta opornu P a ne potrebuvati inshogo perekladacha dlya kozhnoyi mozhlivoyi kombinaciyi A ta B Nedolikom opornoyi movi ye te sho kozhen krok povtornogo perekladu vnosit mozhlivi pomilki ta dvoznachnosti vikoristannya opornoyi movi peredbachaye dva kroki a ne odin Napriklad koli Ernan Kortes spilkuvavsya z indiancyami Mesoameriki vin govoriv ispanskoyu z Heronimo de Agilyarom toj govoriv mayanskoyu z Malincinom a toj govoriv z miscevimi zhitelyami movoyu nauatl PrikladiAnglijska francuzka rosijska ta arabska movi chasto vikoristovuyutsya yak oporni Interlingva bula vikoristana yak osnovna mova na mizhnarodnih konferenciyah i bula zaproponovana yak osnovna mova dlya Yevropejskogo Soyuzu Esperanto bulo zaproponovano yak osnovnu movu u proyekti Pereklad rozpodilenoyu movoyu i takim chinom yiyi bulo vikoristano u Majstro Tradukvortaro na vebsajti esperanto Majstro com Universalna merezheva mova ce shtuchna mova specialno rozroblena dlya vikoristannya yak opornoyi movi V obchislyuvalnij tehniciOporne koduvannya takozh ye poshirenim metodom perekladu danih dlya komp yuternih sistem Napriklad internet protokol XML i movi visokogo rivnya ye opornimi koduvannyami komp yuternih danih yaki potim chasto peretvoryuyutsya u vnutrishni vikonavchi formati dlya konkretnih komp yuternih sistem Yunikod buv rozroblenij dlya vikoristannya yak oporne koduvannya mizh riznimi osnovnimi nayavnimi koduvannyami simvoliv hocha jogo shiroke poshirennya yak samostijnogo koduvannya zrobilo ce vikoristannya nesuttyevim U mashinnomu perekladiSuchasni sistemi statistichnogo mashinnogo perekladu SMP SMT dlya dosyagnennya horoshih rezultativ vikoristovuyut paralelni teksti dlya dzherelnoyi s i cilovoyi t mov ale horoshi paralelni teksti dostupni ne dlya vsih mov Oporna mova p dozvolyaye vstanoviti mist mizh dvoma movami dlya yakih povnistyu abo chastkovo she nemaye nayavnih paralelnih tekstiv Opornij pereklad mozhe buti problematichnim cherez potencijnu vidsutnist virnosti peredanih vidomostej pri vikoristanni riznih tekstiv Pri vikoristanni dvoh dvomovnih tekstiv s p i p t dlya stvorennya mosta s t lingvistichni dani neminuche vtrachayutsya Mashinnij pereklad na osnovi pravil MPOP RBMT dopomagaye sistemi vidnoviti ci dani tozh sistema ne pokladayetsya povnistyu na statistiku vona pokladayetsya takozh i na strukturni lingvistichni vidomosti Dlya vikoristannya opornoyi movi v mashinnomu perekladi vikoristovuyutsya tri osnovni metodi 1 triangulyaciya yaka fokusuyetsya na paralelizmi fraz mizh dzherelnoyu ta opornoyu movoyu s p i mizh opornoyu ta cilovoyu p t 2 perenesennya transfer pri yakomu vsi propoziciyi dzherelnoyi movi perekladayutsya na opornu movu a potim na movu perekladu 3 sintez pri yakomu stvoryuyetsya vlasnij korpus dlya navchannya sistemi Metod triangulyaciyi takozh zvanij mnozhennyam tablici fraz rozrahovuye jmovirnist yak perekladackih vidpovidnostej tak i leksichnoyi vagi v s p i p t shob sprobuvati sklasti novu tablicyu fraz s t Metod perenesennya takozh zvanij strategiyeyu perekladu propozicij prosto zdijsnyuye pryamij pereklad s v p a potim inshij pereklad p v t bez vikoristannya imovirnisnih testiv yak u triangulyaciyi Sintetichnij metod vikoristovuye nayavnij korpus s i namagayetsya pobuduvati z nogo vlasnij sintetichnij korpus yakij vikoristovuyetsya sistemoyu dlya navchannya Potim sintezuyetsya dvomovnij korpus s p shob zabezpechiti pereklad p t Pryame porivnyannya mizh metodami triangulyaciyi ta perenesennya transferu dlya sistem SMT pokazalo sho triangulyaciya dosyagaye nabagato krashih rezultativ nizh perenesennya transfer Usi tri metodi opornoyi movi pidvishuyut produktivnist sistem SMT Odnak sintetichna tehnika ne pracyuye dobre z RBMT i produktivnist sistem nizhche nizh ochikuvalosya Gibridni sistemi SMT RBMT dosyagayut krashoyi yakosti perekladu nizh sistemi suvorogo SMT yaki spirayutsya na pogani paralelni teksti Klyuchova rol sistem RBMT polyagaye v tomu sho voni dopomagayut zapovniti progalinu zalishenu v procesi perekladu sp pt u tomu sensi sho ci paraleli vklyucheni do modeli SMT dlya s t PrimitkiBreinstrup Thomas Linguaphobos Non in le UE Linguaphobes Not in the EU 2006 Issue 5 PosilannyaHua Wu and Haifeng Wang 2009 Revisiting Pivot Language Approach for Machine Translation ACL 09 Utiyama M amp H Isahara 2006 A comparison of pivot methods for phrase based statistical machine translation In Proceedings of NAACL HLT 484 491