Математи́чна лінгві́стика (також обчи́слювальна лінгві́стика або комп'ю́терна лінгві́стика) — напрямок штучного інтелекту, який ставить за мету використання математичних моделей для опису природних мов.
Комп'ютерна лінгвістика частково перетинається з обробкою природних мов. Проте останнім часом акцент робиться не на абстрактні моделі, а на прикладні методи опису та обробки мови для комп'ютерних систем.
Розділи математичної лінгвістики
Вони залежать від середовища, в якому використовуються мови, бувають усними та письмовими. А також від дій над мовою (аналіз, створення, переклад)
- Розпізнавання та синтез мови
- Синтаксичний аналіз та генерація - це розділи, які "розберуть і по частинах складуть" будь-яке речення.
- Власне машинний переклад.
- Автоматичне реферування.
Математична лінгвістика - ряд галузей теоретичного і прикладного мовознавства, в яких використовуються поняття і методи математики (теорії імовірностей, математичної статистики, теорії інформації, математичної логіки, теорії алгоритмів тощо). Ще на початку 20 ст. російський математик А. А. Марков (старший) застосував теорію імовірностей до вивчення розподілу літер на позначення голосних і приголосних звуків у друкованих російських текстах («Євгеній Онєгін» О. С. Пушкіна, «Дитячі роки Багрова-онука» С. Т. Аксакова). Такі дослідження починаючи з 1930-х років набули важливого застосування в телеграфії й телефонії. Основне завдання тут полягало в передачі по каналах зв'язку максимальної кількості повідомлень найекономнішим способом. Щоб вирішити це завдання, потрібно знати кількісні закономірності в мовах: розподіл літер (для телеграфії) і розподіл фонем (для телефонії). Застосовуючи поняття теорії інформації, розробляють за допомогою сучасних обчислювальних пристроїв статистики мов (). Одержані результати є важливими не тільки для телефонії і телеграфії, а й для теоретичного мовознавства. З винайденням електронних обчислювальних машин і розвитком кібернетики перед мовознавством постала низка нових завдань: машинний переклад з однієї мови на іншу, подання в автоматичні пристрої програми дії і даних, сформульованих безпосередньо у вигляді друкованих текстів або усної мови (так зване «мовне керування механізмами»). Все це потребує вивчення граматичних і лексичних властивостей мов математичними методами.
Основні поняття, які використовуються в математичній лінгвістиці
- множина вихідних символів (алфавіт);
- відношення між елементами алфавіту, що сприймаються як аксіоми (постулюються);
- правила виводу, тобто обчислення всіх можливих множин символьних ланцюжків;
- ізоморфізм, тобто одно-однозначні відношення між елементами послідовності, при яких кожному елементові однієї послідовності ставиться у відповідність елемент іншої;
- гомоморфізм, одно-багатозначні відношення, послідовності, коли одному елементу першої послідовності відповідає декілька елементів другої і навпаки;
- відмічений ланцюжок, тобто такий, що відповідає правилам виводу;
- входження символу в послідовність, тобто поява його на заданому місці в ланцюжку;
- поділ вихідної множини класу ланцюжків за певними правилами на підкласи.
Використання операцій, які базуються на цих поняттях, дає можливість одержати аналоги граматичних класів і підкласів, категорій, парадигм, синтаксичних одиниць і відношень. Властивості відношення одиниць досліджуваної знакової системи виявляють і вивчають шляхом побудови синтезувальних й аналітичних математичних моделей.
Джерела
- Українська радянська енциклопедія : у 12 т. / гол. ред. М. П. Бажан ; редкол.: О. К. Антонов та ін. — 2-ге вид. — К. : Головна редакція УРЕ, 1974–1985.
- В. С. Перебийніс. Математична лінгвістика // Українська мова : енциклопедія / НАН України, Інститут мовознавства ім. О. О. Потебні, Інститут української мови ; ред. В. М. Русанівський [та ін.]. — К. : Українська енциклопедія, 2000. — .
- Бук С. Основи статистичної лінгвістики: Навчально-методичний посібник. Львів: Видавничий центр ЛНУ імені Івана Франка, 2008. 124 с.
- Бук С. Велика проза Івана Франка: електронний корпус, частотні словники та інші міждисциплінарні контексти : монографія / Львів : ЛНУ імені Івана Франка, 2021. 424 с.
- Бук С. Квантитативна параметризація текстів Івана Франка: проект та його реалізація // Вісник Львівського університету. Серія філологічна. 2013. Вип. 58. С. 290–307
- Дарчук Н. П. Комп'ютерна лінгвістика (автоматичне опрацювання тексту): підручник. К.: Видавничо-поліграфічний центр “Київський університет”, 2008. 351 с.
- Дарчук Н. П. Статистичні характеристики лексики як відображення структури тексту // Мовознавчі студії. К.: Наукова думка, 1976. С. 97–102.
- Карпіловська Є. А. Вступ до комп’ютерної лінгвістики. Донецьк: Юго-Восток, 2003. 184 с.
- Ланде Д. В. Елементи комп’ютерної лінгвістики в правовій інформатиці. К.: НДІІП НАПрН України, 2014. 351 с.
- Математична лінгвістика : навч. посіб. Кн.1 : Квантитативна лінгвістика / В. В. Пасічник, Ю. М. Щербина, В. А. Висоцька, Т. В. Шестакевич ; за ред. В. В. Пасічника ; М-во освіти і науки, молоді та спорту України. Львів. : Новий Світ-2000, 2012. 359 с. : іл., табл. (Серія "Комп'ютинг"). Бібліогр.: с. 351-358 (139 назв).
- Buk S. Quantitative analysis of the novel Ne Spytavšy Brodu by Ivan Franko in the Light of Statistical and Quantitative Linguistics // Speech and context. International Journal of Linguistics, Semiotics, and Literary Science 1(VI) 2014. P. 100-112.
- Buk S. Distinguishing quantitative parameters of author’s language and style (A case of Ivan Franko long prose fiction) // Вісник Львівського університету. Серія філологічна. № 70 (2019). Випуск 70. C. 299–308.
Див. також
Це незавершена стаття з мовознавства. Ви можете проєкту, виправивши або дописавши її. |
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Matemati chna lingvi stika takozh obchi slyuvalna lingvi stika abo komp yu terna lingvi stika napryamok shtuchnogo intelektu yakij stavit za metu vikoristannya matematichnih modelej dlya opisu prirodnih mov Komp yuterna lingvistika chastkovo peretinayetsya z obrobkoyu prirodnih mov Prote ostannim chasom akcent robitsya ne na abstraktni modeli a na prikladni metodi opisu ta obrobki movi dlya komp yuternih sistem Rozdili matematichnoyi lingvistikiVoni zalezhat vid seredovisha v yakomu vikoristovuyutsya movi buvayut usnimi ta pismovimi A takozh vid dij nad movoyu analiz stvorennya pereklad Rozpiznavannya ta sintez movi Sintaksichnij analiz ta generaciya ce rozdili yaki rozberut i po chastinah skladut bud yake rechennya Vlasne mashinnij pereklad Avtomatichne referuvannya Matematichna lingvistika ryad galuzej teoretichnogo i prikladnogo movoznavstva v yakih vikoristovuyutsya ponyattya i metodi matematiki teoriyi imovirnostej matematichnoyi statistiki teoriyi informaciyi matematichnoyi logiki teoriyi algoritmiv tosho She na pochatku 20 st rosijskij matematik A A Markov starshij zastosuvav teoriyu imovirnostej do vivchennya rozpodilu liter na poznachennya golosnih i prigolosnih zvukiv u drukovanih rosijskih tekstah Yevgenij Onyegin O S Pushkina Dityachi roki Bagrova onuka S T Aksakova Taki doslidzhennya pochinayuchi z 1930 h rokiv nabuli vazhlivogo zastosuvannya v telegrafiyi j telefoniyi Osnovne zavdannya tut polyagalo v peredachi po kanalah zv yazku maksimalnoyi kilkosti povidomlen najekonomnishim sposobom Shob virishiti ce zavdannya potribno znati kilkisni zakonomirnosti v movah rozpodil liter dlya telegrafiyi i rozpodil fonem dlya telefoniyi Zastosovuyuchi ponyattya teoriyi informaciyi rozroblyayut za dopomogoyu suchasnih obchislyuvalnih pristroyiv statistiki mov Oderzhani rezultati ye vazhlivimi ne tilki dlya telefoniyi i telegrafiyi a j dlya teoretichnogo movoznavstva Z vinajdennyam elektronnih obchislyuvalnih mashin i rozvitkom kibernetiki pered movoznavstvom postala nizka novih zavdan mashinnij pereklad z odniyeyi movi na inshu podannya v avtomatichni pristroyi programi diyi i danih sformulovanih bezposeredno u viglyadi drukovanih tekstiv abo usnoyi movi tak zvane movne keruvannya mehanizmami Vse ce potrebuye vivchennya gramatichnih i leksichnih vlastivostej mov matematichnimi metodami Osnovni ponyattya yaki vikoristovuyutsya v matematichnij lingvisticimnozhina vihidnih simvoliv alfavit vidnoshennya mizh elementami alfavitu sho sprijmayutsya yak aksiomi postulyuyutsya pravila vivodu tobto obchislennya vsih mozhlivih mnozhin simvolnih lancyuzhkiv izomorfizm tobto odno odnoznachni vidnoshennya mizh elementami poslidovnosti pri yakih kozhnomu elementovi odniyeyi poslidovnosti stavitsya u vidpovidnist element inshoyi gomomorfizm odno bagatoznachni vidnoshennya poslidovnosti koli odnomu elementu pershoyi poslidovnosti vidpovidaye dekilka elementiv drugoyi i navpaki vidmichenij lancyuzhok tobto takij sho vidpovidaye pravilam vivodu vhodzhennya simvolu v poslidovnist tobto poyava jogo na zadanomu misci v lancyuzhku podil vihidnoyi mnozhini klasu lancyuzhkiv za pevnimi pravilami na pidklasi Vikoristannya operacij yaki bazuyutsya na cih ponyattyah daye mozhlivist oderzhati analogi gramatichnih klasiv i pidklasiv kategorij paradigm sintaksichnih odinic i vidnoshen Vlastivosti vidnoshennya odinic doslidzhuvanoyi znakovoyi sistemi viyavlyayut i vivchayut shlyahom pobudovi sintezuvalnih j analitichnih matematichnih modelej DzherelaUkrayinska radyanska enciklopediya u 12 t gol red M P Bazhan redkol O K Antonov ta in 2 ge vid K Golovna redakciya URE 1974 1985 V S Perebijnis Matematichna lingvistika Ukrayinska mova enciklopediya NAN Ukrayini Institut movoznavstva im O O Potebni Institut ukrayinskoyi movi red V M Rusanivskij ta in K Ukrayinska enciklopediya 2000 ISBN 966 7492 07 9 Buk S Osnovi statistichnoyi lingvistiki Navchalno metodichnij posibnik Lviv Vidavnichij centr LNU imeni Ivana Franka 2008 124 s Buk S Velika proza Ivana Franka elektronnij korpus chastotni slovniki ta inshi mizhdisciplinarni konteksti monografiya Lviv LNU imeni Ivana Franka 2021 424 s ISBN 978 617 10 0636 2 Buk S Kvantitativna parametrizaciya tekstiv Ivana Franka proekt ta jogo realizaciya Visnik Lvivskogo universitetu Seriya filologichna 2013 Vip 58 S 290 307 Darchuk N P Komp yuterna lingvistika avtomatichne opracyuvannya tekstu pidruchnik K Vidavnicho poligrafichnij centr Kiyivskij universitet 2008 351 s Darchuk N P Statistichni harakteristiki leksiki yak vidobrazhennya strukturi tekstu Movoznavchi studiyi K Naukova dumka 1976 S 97 102 Karpilovska Ye A Vstup do komp yuternoyi lingvistiki Doneck Yugo Vostok 2003 184 s Lande D V Elementi komp yuternoyi lingvistiki v pravovij informatici K NDIIP NAPrN Ukrayini 2014 351 s ISBN 978 966 2344 33 2 Matematichna lingvistika navch posib Kn 1 Kvantitativna lingvistika V V Pasichnik Yu M Sherbina V A Visocka T V Shestakevich za red V V Pasichnika M vo osviti i nauki molodi ta sportu Ukrayini Lviv Novij Svit 2000 2012 359 s il tabl Seriya Komp yuting Bibliogr s 351 358 139 nazv ISBN 978 966 418 191 1 Buk S Quantitative analysis of the novel Ne Spytavsy Brodu by Ivan Franko in the Light of Statistical and Quantitative Linguistics Speech and context International Journal of Linguistics Semiotics and Literary Science 1 VI 2014 P 100 112 Buk S Distinguishing quantitative parameters of author s language and style A case of Ivan Franko long prose fiction Visnik Lvivskogo universitetu Seriya filologichna 70 2019 Vipusk 70 C 299 308 Div takozhMatematichna model movi Ce nezavershena stattya z movoznavstva Vi mozhete dopomogti proyektu vipravivshi abo dopisavshi yiyi