Ця стаття містить правописні, лексичні, граматичні, стилістичні або інші мовні помилки, які треба виправити. |
Спрощення тексту – це операція, яка використовується в обробці природною мовою для модифікації, вдосконалення, класифікації чи іншої обробки існуючого корпусу зрозумілого тексту таким чином, що граматика та структура прози значно спрощуються, а основне значення та інформація залишаються так само. Спрощення тексту є важливою сферою досліджень, оскільки природні людські мови зазвичай містять великі словникові запаси та складні конструкції, які не легко обробити за допомогою автоматизації . З точки зору зменшення мовної різноманітності може застосовуватися семантична компресія для обмеження та спрощення набору слів, що використовуються в даних текстах.
Приклад
Спрощення тексту показано на прикладі Сіддхартана (2006). Перше речення містить два відносні речення та одне поєднане дієслівне словосполучення. Система спрощення тексту спрямована на спрощення першого речення до другого речення.
Аналітик також зазначив, що зміцненню міді сприяє звіт чиказьких закупівельних агентів, який передує повному звіту закупівельних агентів, який повинен бути представлений сьогодні, і вказує, що може містити повний звіт.
Аналітик також зазначив, що зміцненню міді також сприяє звіт чиказьких закупівельних агентів. Чиказький звіт передує повному звіту закупівельних агентів. Чиказький звіт дає вказівку на те, що може містити повний звіт. Повний звіт має вийти сьогодні. Одним із підходів до спрощення тексту є лексичне спрощення за допомогою лексичної заміни, двоступеневий процес, що складається із виявлення складних слів та заміни їх простішими синонімами. Ключовою проблемою тут є визначення складних слів, яку виконує класифікатор машинного навчання, навчений на маркованих даних. Поліпшення порівняно з класичними методами застосування двійкових міток до простих чи складних слів полягає в тому, щоб попросити науковців коригувати слова в порядку складності; це призводить до вищої узгодженості отриманих міток.
Примітки
- Siddharthan, Advaith (28 березня 2006). Syntactic Simplification and Text Cohesion. Research on Language and Computation. 4 (1): 77—109. doi:10.1007/s11168-006-9011-1. S2CID 14619244.
- Gooding, Sian; Kochmar, Ekaterina; Sarkar, Advait; Blackwell, Alan (August 2019). Comparative judgments are more consistent than binary classification for labelling word complexity. Proceedings of the 13th Linguistic Annotation Workshop (en-us) : 208—214. doi:10.18653/v1/W19-4024. Архів оригіналу за 14 січня 2021. Процитовано 22 листопада 2019.
Джерела
- Wei Xu, Chris Callison-Burch and Courtney Napoles. "Problems in Current Text Simplification Research [Архівовано 24 квітня 2018 у Wayback Machine.]". In Transactions of the Association for Computational Linguistics (TACL), Volume 3, 2015, Pages 283–297. (англ.)
- Advaith Siddharthan. "Syntactic Simplification and Text Cohesion [Архівовано 20 січня 2021 у Wayback Machine.]". In Research on Language and Computation, Volume 4, Issue 1, Jun 2006, Pages 77–109, Springer Science, the Netherlands. (англ.)
- Siddhartha Jonnalagadda, Luis Tari, Joerg Hakenberg, Chitta Baral and Graciela Gonzalez. Towards Effective Sentence Simplification for Automatic Processing of Biomedical Text. In Proc. of the NAACL-HLT 2009, Boulder, USA, June. (англ.)
Посилання
- Automatic Induction of Rules for Text Simplification [Архівовано 22 вересня 2017 у Wayback Machine.] (pdf)
- Text Simplification for Information-Seeking Applications [Архівовано 25 квітня 2021 у Wayback Machine.]
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Cya stattya mistit pravopisni leksichni gramatichni stilistichni abo inshi movni pomilki yaki treba vipraviti Vi mozhete dopomogti vdoskonaliti cyu stattyu pogodivshi yiyi iz chinnimi movnimi standartami Sproshennya tekstu ce operaciya yaka vikoristovuyetsya v obrobci prirodnoyu movoyu dlya modifikaciyi vdoskonalennya klasifikaciyi chi inshoyi obrobki isnuyuchogo korpusu zrozumilogo tekstu takim chinom sho gramatika ta struktura prozi znachno sproshuyutsya a osnovne znachennya ta informaciya zalishayutsya tak samo Sproshennya tekstu ye vazhlivoyu sferoyu doslidzhen oskilki prirodni lyudski movi zazvichaj mistyat veliki slovnikovi zapasi ta skladni konstrukciyi yaki ne legko obrobiti za dopomogoyu avtomatizaciyi Z tochki zoru zmenshennya movnoyi riznomanitnosti mozhe zastosovuvatisya semantichna kompresiya dlya obmezhennya ta sproshennya naboru sliv sho vikoristovuyutsya v danih tekstah PrikladSproshennya tekstu pokazano na prikladi Siddhartana 2006 Pershe rechennya mistit dva vidnosni rechennya ta odne poyednane diyeslivne slovospoluchennya Sistema sproshennya tekstu spryamovana na sproshennya pershogo rechennya do drugogo rechennya Analitik takozh zaznachiv sho zmicnennyu midi spriyaye zvit chikazkih zakupivelnih agentiv yakij pereduye povnomu zvitu zakupivelnih agentiv yakij povinen buti predstavlenij sogodni i vkazuye sho mozhe mistiti povnij zvit Analitik takozh zaznachiv sho zmicnennyu midi takozh spriyaye zvit chikazkih zakupivelnih agentiv Chikazkij zvit pereduye povnomu zvitu zakupivelnih agentiv Chikazkij zvit daye vkazivku na te sho mozhe mistiti povnij zvit Povnij zvit maye vijti sogodni Odnim iz pidhodiv do sproshennya tekstu ye leksichne sproshennya za dopomogoyu leksichnoyi zamini dvostupenevij proces sho skladayetsya iz viyavlennya skladnih sliv ta zamini yih prostishimi sinonimami Klyuchovoyu problemoyu tut ye viznachennya skladnih sliv yaku vikonuye klasifikator mashinnogo navchannya navchenij na markovanih danih Polipshennya porivnyano z klasichnimi metodami zastosuvannya dvijkovih mitok do prostih chi skladnih sliv polyagaye v tomu shob poprositi naukovciv koriguvati slova v poryadku skladnosti ce prizvodit do vishoyi uzgodzhenosti otrimanih mitok PrimitkiSiddharthan Advaith 28 bereznya 2006 Syntactic Simplification and Text Cohesion Research on Language and Computation 4 1 77 109 doi 10 1007 s11168 006 9011 1 S2CID 14619244 Gooding Sian Kochmar Ekaterina Sarkar Advait Blackwell Alan August 2019 Comparative judgments are more consistent than binary classification for labelling word complexity Proceedings of the 13th Linguistic Annotation Workshop en us 208 214 doi 10 18653 v1 W19 4024 Arhiv originalu za 14 sichnya 2021 Procitovano 22 listopada 2019 DzherelaWei Xu Chris Callison Burch and Courtney Napoles Problems in Current Text Simplification Research Arhivovano 24 kvitnya 2018 u Wayback Machine In Transactions of the Association for Computational Linguistics TACL Volume 3 2015 Pages 283 297 angl Advaith Siddharthan Syntactic Simplification and Text Cohesion Arhivovano 20 sichnya 2021 u Wayback Machine In Research on Language and Computation Volume 4 Issue 1 Jun 2006 Pages 77 109 Springer Science the Netherlands angl Siddhartha Jonnalagadda Luis Tari Joerg Hakenberg Chitta Baral and Graciela Gonzalez Towards Effective Sentence Simplification for Automatic Processing of Biomedical Text In Proc of the NAACL HLT 2009 Boulder USA June angl PosilannyaAutomatic Induction of Rules for Text Simplification Arhivovano 22 veresnya 2017 u Wayback Machine pdf Text Simplification for Information Seeking Applications Arhivovano 25 kvitnya 2021 u Wayback Machine