Автоматизоване реферування або квазіреферування — це виявлення в тексті первинного документа фрагментів, що містять заздалегідь заявлені змістові аспекти. Найвищого розвитку формалізація методів реферування набула з автоматизацією цього виду аналітико-синтетичної обробки документів. Необхідність реферування щораз більших обсягів документів і при цьому зменшення суб'єктивізму в наданні інформації зумовили впровадження в реферування електронних технологій.
Автоматизоване реферування | |
Досліджується в | обробка природної мови |
---|
Методи автоматизованого реферування
Методи автоматизованого реферування базуються на можливості виявлення в тексті первинного документа фрагментів, що містять заздалегідь заявлені змістові аспекти, і на формуванні з них рефератів-екстрактів. Фрагменти тексту первинного документа вибирають за формальними ознаками, а саме за частотою вживання слів, обраних як змістові критерії. На жаль, такий підхід не завжди гарантує відбір з тексту найважливіших відомостей, тому такі реферати виконують переважно пошукову і комунікативну функції. Щоб відрізнити автоматичні реферати від інтелектуальних, перші часто називають квазірефератами, а процес автоматизованого реферування квазіреферуванням. Методи автоматизованого реферування поділяються на:
- статистичні.
- позиційні.
- індикативні.
Характеристика методів автоматизованого реферування
Суть статистичних методів, що засновані на статистичному аналізі текстів, — це методики російських вчених В. Аграєва, Б. Бородіна та В. Пурто. Перші двоє запропонували методику, згідно з якою вибрані з тексту речення виявляються пов'язаними між собою. Найбільш зв'язаними, а тому такими, що мають бути включені до реферату, вважаються речення, які містять найбільшу кількість однаково значущих слів. В. Пурто розробив метод оцінки та відбору речень за кількістю інформації, яку вони містять. У цьому випадку тексти підлягають статистичному аналізу для виявлення частоти вживання слів. Словами, що найчастіше вживаються у науково-технічній літературі, є терміни. Дослідник стверджує: чим важливіший термін, тим частіше він зустрічається у тексті, а відібрані речення міститимуть максимальну кількість цих термінів. Обсяг одержаного в такий спосіб реферату складає, як правило, не більше трьох речень, незалежно від обсягу первинного документа — полягає у відборі значущих речень відповідно до частоти вживання слів і розташування їх у реченні. Відбираючи речення до реферату, для кожного з них визначають значущість або змістову вагу. Чим більше слів, що часто трапляються в одному реченні, тим суттєвішу інформацію воно містить і тому має бути включене до реферату. Різні модифікації цього методу відрізняються підходом до відбору слів, що підлягають статистичному аналізу. Обсяг одержаного в такий спосіб реферату становить, як правило, не більше трьох речень, незалежно від обсягу первинного документа. Простота аналізу тексту першоджерела й однорідність отриманих рефератів забезпечили поширення статистичних методів автоматизованого реферування в багатьох країнах і їхню подальшу оптимізацію. Тобто у разі використання статистичного методу реферування обсяг і якість рефератів повністю залежать від статистичних характеристик тексту, тому речення, що містять найважливішу інформацію (наприклад, висновки у наукових статтях) можуть бути взагалі не виділені та не ввійти до реферату. Проте визначені недоліки певною мірою компенсуються завдяки простоті аналізу й однорідності рефератів, які готуються за допомогою ЕОМ.
Позиційні методи вдосконалюють відбір найбільш значущих речень з текстів первинних документів з використанням складного математичного апарату.. Відбір здійснюється на засадах чотирьох взаємопов'язаних методів: натяку, ключових слів, заголовка, локалізації. Сутність методу натяку полягає у використанні під час відбору речень списку слів, в якому заздалегідь виділено слова з позитивною та негативною змістовою вагою, а також «нульові» (нейтральні) слова. При відборі враховуються тільки слова, що передають позитивну й негативну оцінку.
При використанні методу ключових слів розглядаються слова, відібрані за частотним принципом та за цією ознакою визначені ключовими, що є аналогічним до запропонованого Г. Луном підходу.
У методі заголовка головна роль відводиться словнику термінів, відібраних із заголовка та підзаголовків, які мають більшу «вагу», ніж слова з інших речень тексту. До реферату відбираються речення, де трапляються терміни, котрі наявні у словнику. Метод локалізації ґрунтується на припущенні, що найсуттєвіша інформація концентрується на самому початку або наприкінці певного уривка чи параграфа тексту.
Зіставлення всіх чотирьох методів показало, що метод ключових слів забезпечує повноту відбиття змісту первинного документа на 15-40 %, метод заголовка — на 30-40 %, а спільне використання методів натяку, заголовка та локалізації — на 30-60 %. Подальшого розвитку цей підхід набув під час розробки індикативних методів реферування, порівняно з якими статистичні та позиційні методи відіграють допоміжну роль.
Індикативні методи дають змогу на основі синтаксичного аналізу формалізувати виклад основного змісту первинного документа в рефераті телеграфного стилю. Синтаксичному аналізу може підлягати як увесь текст, так і його окремі фрагменти, що містять типові маркери. Показником для виділення значущих елементів правлять розділові знаки в середині речення. Обсяг одержаних рефератів становить у середньому до 35 % обсягу першоджерела [1, с.270-272].
Методика формалізованого реферування
Названі методи автоматизованого реферування постійно розвиваються й удосконалюються, але розробляють й інші. Так, на початку 80-х років було запропоновано методику формалізованого реферування з використанням маркерів для текстів з електроніки. За цією методикою процес автоматичного реферування зведено до двох основних операцій:
- власне екстрагування, тобто розпізнання в тексті первинного документа маркованих речень і подача їх на друкарський пристрій;
- постредагування, під час якого усувають логічні й змістові зв'язки між фразами.
Позитивною рисою цієї методики вважають можливість робити постредагування не лише для фахівців певної галузі знання, а й для інших осіб, що володіють навичками редагування.
Важливо також, що така методика при певному доопрацюванні дає змогу користувачу самостійно визначити потрібні йому аспекти змісту, здійснюючи так зване індивідуальне реферування, та за потреби одержувати відповідні реферативні огляди первинних документів [2].
Система автоматичного реферування
Розробка і перспективи використання методів автоматизованого реферування тісно пов'язані з проблемами оцінювання якості машинних квазірефератів. Якість їх визначають на основі виявлення текстових збігів у рефератах, які підготувала людина, і автоматичних, а також шляхом порівняння результатів пошуку за текстами інтелектуальних і квазірефератів.
Одним з класичних завдань комп'ютерної лінгвістики є побудова систем автоматичного реферування наукових, технічних, політичних, ділових текстів. Актуальність цього завдання значно зростає у зв'язку з появою на інформаційному ринку повнотекстових баз даних. Ці бази містять у вигляді документів не реферати, а тексти наукових статей. Якщо ж ідеться про іншомовні бази, то треба, очевидно, прагнути до побудови систем, які інтегрують 3 основні функції: пошук, переклад і реферування. Розробка системи автоматичного реферування є можливою на основі експериментально-семантичного дослідження міжфразової структури тексту, з наступною реалізацією ІС, що володіють спроможністю гіперсинтаксичного «розуміння» текстів [3, с. 45-50].
Система квазіреферування
Опрацювання системи автоматичного реферування має чималий практичний інтерес. Це викликано не тільки регулярним збільшенням обсягу документальних потоків, але й таким важливим чинником, як запровадження в дію промислово-орієнтованих автоматизованих систем науково-технічної інформації з автоматичним індексуванням і систем машинного перекладу, а також повнотекстових баз даних. При цьому реферування, будучи одним із ключових процесів аналітично-синтетичної переробки текстів, поки що виконується вручну. У той же час, автоматичне реферування, з нашої точки зору, може бути справді ефективним тільки в тому випадку, якщо виконуються такі п'ять вимог:
— система має формувати реферат із речень вхідного тексту (можливо, з деякими скороченнями за рахунок порівняно малоінформативних сегментів;
— цитат, відсилок тощо), а не породжувати його на підставі смислового аналізу текстів. Іншими словами, система повинна повністю наслідувати термінологію та стиль автора, не допускаючи багатозначного тлумачення його думок. Таким чином, йдеться про розробку системи, що має перший рівень «розуміння» тексту;
— системи квазіреферування;
— реферати, що формуються системою, мають містити не тільки «сигнальну» інформацію про документ, але й дозволяти прослідкувати хід думок автора, тобто система повинна породжувати саме реферати, а не анотації;
— міра скорочення тексту, яка називається звичайно коефіцієнтом редукції і під якою розуміють відношення кількості речень у вхідному тексті до кількості їх у рефераті, має бути достатньо високою (не менше 4-5);
— швидкість автоматичного реферування повинна бути значно вищою за швидкість ручного;
— система має легко переналагоджуватися на обробку текстів різних мов [4, с. 90-105].
Принципи реалізації системи квазіреферування
Розглянемо принципи, що розроблені під керівництвом автора системи квазіреферування. Отже, на першому етапі реалізації принцип дії системи полягає у формуванні квазіреферата з автосемантичних речень тексту. Програмне забезпечення системи для ЄС ЕОМ включає головну програму й сім процедур. Головна програма виконує такі функції:
— читання тексту, що реферується;
— розміщення словників в оперативній пам'яті;
— аналіз тексту по реченнях: виділення слів, пошук в Ск і перевірку збігу лексичної одиниці, що аналізується, з одним із конекторів;
— у разі збігу;
— звернення до процедур, обчислення значення логічної функції по результатах роботи процедур, прийняття рішення про істинність конектора і визначення типу речення відповідно до типу конектора;
— прийняття рішення про включення чи невключення речення до квазіреферату;
— друк квазіреферату на принтері. По мірі роботи головної програми формується таблиця речень, що є основним результатом цієї програми. Рядок таблиці відповідає одному реченню. На час звернення до процедури всі рядки, котрі мають відношення до попередніх за порядком слідування реченням, цілком заповнені. Рядок, котрий відноситься до речення, під час аналізу якого сталося звертання до процедури, в момент звернення заповнений частково.
Рядок таблиці має таку структуру: — номер речення;
— кількість символів у реченні;
— тип речення;
— автосемантичне чи синсемантичне;
— номер речення, з яким дане знаходиться в синтаксичному зв'язку;
— номер конектора в Ск. Кожна процедура має доступ до адрес початку тексту, початку речення, аналізованого слова, початку таблиці речень, початку Ск, початку Св, а також до порядкових номерів речення, аналізованого слова в реченні, першого символу слова відносно початку речення, до зміщення початку запису Ск, до значень параметрів, зазначених в описах Ск.
Як бачимо, програмне забезпечення системи не залежить від мови тексту, що обробляється. Для реферування текстів на іншій мові достатньо організувати словник конекторів і допоміжний словник на цій мові. Система реалізована на мові Асемблер під управлінням ДОС і ОС ЄС ЕОМ. Документ надходить до системи у вигляді текстового файлу, в якому допускається виділення за допомогою спеціальних службових символів заголовків документів і окремих його підрозділів, а також елементів бібліографічного опису. Вся виділена таким чином інформація включається системою у квазіреферат [5]. Результатом роботи системи є друкована копія квазіреферату, сформованого з автосемантичних речень тексту з вказівкою їх порядкових номерів у вхідному тексті. Якщо при цьому коефіцієнт редукції вхідного тексту виявляється менше 4, то у квазіреферат не вводяться ізольовані автосемантичні речення: з послідовності автосемантичних речень у квазіреферат вводяться тільки перші. Передбачений також режим, у якому до квазіреферату потрапляють не тільки автосемантичні речення, але й вказівка на тип вилучених синсемантичних. Це дозволить у майбутньому організувати діалог користувача з ЕОМ, запрошуючи у системи субтексти, котрі мають інтерес для абонента.
Джерела
- Информационный процесс. Обработка информации [Електронний ресурс]. — Електронні дані. — Media Limited,2012. — Режим доступу: World Wide Web. — URL http://www.bestreferat.ru/referat-73913.html [ 16 березня 2011 у Wayback Machine.].
- Герд A.C. Терминология -унификация или стандартизация [Текст] / А. С. Герд.— М.: ВИНИТИ.— 1984.
- Берзон В., Брайловский А. Классификация коннекторов и диалоговые системы автоматического реферирования [Текст] / В. Берзон, А.Брайловский.- НТИ.-Сер.2.-№ 2.- 1979.
- Основні методи автоматизованого реферування [Електронний ресурс]. — Електронні дані. — World Wide Web. — URL :http://uadocs.exdat.com/docs/index-140602.html [ 17 грудня 2017 у Wayback Machine.]
- Куделько З. Вісник: Проблеми української термінології. Автоматичне реферування текстів [Текст] / З. Куделько.— Львів: Національний університет «Львівська політехніка».— № 453.— розділ 2.— 2002.- 554 с.
- Инструкция для референтов реферативного журнала ВИНИТИ [Електронний ресурс]. — Електронні дані. — World Wide Web. — URL :http://rudocs.exdat.com/docs/index-255097.html [ 4 березня 2016 у Wayback Machine.].
- Авдеева A. Организация реферата в формат на основе метода поаспектного реферирования [Текст] / А.Авдеева. — НТИ.- Cep.1.- 1974.- № 10.-С.29-34.
- Гиндин С .Семиотика и информатика. Методы автоматического фрагментирования текста, опирающиеся на характеристики внутреннего состава фрагментов [Текст] / С. Гиндин. — М.:ВИНИТИ.— 1977. — вып.9. — С.35-82.
- Берзон В., Зубов A. Романское и германское языкознание. О семантической классификации параметров связности текста [Текст] / В. Берзон, А. Зубов. — вып.1. — Минск : 1977. — С.185-197.
- Совершенствование лингвистических и структурных характеристик информационных документов АИС и РЖ [Електронний ресурс]. — Електронні дані. — Media Limited,2012. — Режим доступу: World Wide Web. — URL http://www.dissercat.com/content/sovershenstvovanie-lingvisticheskikh-i-strukturnykh-kharakteristik-informatsionnykh-dokument [ 3 травня 2012 у Wayback Machine.].
- Кушнаренко Н. Наукова обробка документів [Текст]: Підручник / Наталя Миколаївна Кушнаренко, Валерія Костянтинівна Удалова. — 4-те вид., перероб. і доп. — К.: Знання, 2006. — 334 с. — .
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Avtomatizovane referuvannya abo kvazireferuvannya ce viyavlennya v teksti pervinnogo dokumenta fragmentiv sho mistyat zazdalegid zayavleni zmistovi aspekti Najvishogo rozvitku formalizaciya metodiv referuvannya nabula z avtomatizaciyeyu cogo vidu analitiko sintetichnoyi obrobki dokumentiv Neobhidnist referuvannya shoraz bilshih obsyagiv dokumentiv i pri comu zmenshennya sub yektivizmu v nadanni informaciyi zumovili vprovadzhennya v referuvannya elektronnih tehnologij Avtomatizovane referuvannya Doslidzhuyetsya vobrobka prirodnoyi moviMetodi avtomatizovanogo referuvannyaMetodi avtomatizovanogo referuvannya bazuyutsya na mozhlivosti viyavlennya v teksti pervinnogo dokumenta fragmentiv sho mistyat zazdalegid zayavleni zmistovi aspekti i na formuvanni z nih referativ ekstraktiv Fragmenti tekstu pervinnogo dokumenta vibirayut za formalnimi oznakami a same za chastotoyu vzhivannya sliv obranih yak zmistovi kriteriyi Na zhal takij pidhid ne zavzhdi garantuye vidbir z tekstu najvazhlivishih vidomostej tomu taki referati vikonuyut perevazhno poshukovu i komunikativnu funkciyi Shob vidrizniti avtomatichni referati vid intelektualnih pershi chasto nazivayut kvazireferatami a proces avtomatizovanogo referuvannya kvazireferuvannyam Metodi avtomatizovanogo referuvannya podilyayutsya na statistichni pozicijni indikativni Harakteristika metodiv avtomatizovanogo referuvannya Sut statistichnih metodiv sho zasnovani na statistichnomu analizi tekstiv ce metodiki rosijskih vchenih V Agrayeva B Borodina ta V Purto Pershi dvoye zaproponuvali metodiku zgidno z yakoyu vibrani z tekstu rechennya viyavlyayutsya pov yazanimi mizh soboyu Najbilsh zv yazanimi a tomu takimi sho mayut buti vklyucheni do referatu vvazhayutsya rechennya yaki mistyat najbilshu kilkist odnakovo znachushih sliv V Purto rozrobiv metod ocinki ta vidboru rechen za kilkistyu informaciyi yaku voni mistyat U comu vipadku teksti pidlyagayut statistichnomu analizu dlya viyavlennya chastoti vzhivannya sliv Slovami sho najchastishe vzhivayutsya u naukovo tehnichnij literaturi ye termini Doslidnik stverdzhuye chim vazhlivishij termin tim chastishe vin zustrichayetsya u teksti a vidibrani rechennya mistitimut maksimalnu kilkist cih terminiv Obsyag oderzhanogo v takij sposib referatu skladaye yak pravilo ne bilshe troh rechen nezalezhno vid obsyagu pervinnogo dokumenta polyagaye u vidbori znachushih rechen vidpovidno do chastoti vzhivannya sliv i roztashuvannya yih u rechenni Vidbirayuchi rechennya do referatu dlya kozhnogo z nih viznachayut znachushist abo zmistovu vagu Chim bilshe sliv sho chasto traplyayutsya v odnomu rechenni tim suttyevishu informaciyu vono mistit i tomu maye buti vklyuchene do referatu Rizni modifikaciyi cogo metodu vidriznyayutsya pidhodom do vidboru sliv sho pidlyagayut statistichnomu analizu Obsyag oderzhanogo v takij sposib referatu stanovit yak pravilo ne bilshe troh rechen nezalezhno vid obsyagu pervinnogo dokumenta Prostota analizu tekstu pershodzherela j odnoridnist otrimanih referativ zabezpechili poshirennya statistichnih metodiv avtomatizovanogo referuvannya v bagatoh krayinah i yihnyu podalshu optimizaciyu Tobto u razi vikoristannya statistichnogo metodu referuvannya obsyag i yakist referativ povnistyu zalezhat vid statistichnih harakteristik tekstu tomu rechennya sho mistyat najvazhlivishu informaciyu napriklad visnovki u naukovih stattyah mozhut buti vzagali ne vidileni ta ne vvijti do referatu Prote viznacheni nedoliki pevnoyu miroyu kompensuyutsya zavdyaki prostoti analizu j odnoridnosti referativ yaki gotuyutsya za dopomogoyu EOM Pozicijni metodi vdoskonalyuyut vidbir najbilsh znachushih rechen z tekstiv pervinnih dokumentiv z vikoristannyam skladnogo matematichnogo aparatu Vidbir zdijsnyuyetsya na zasadah chotiroh vzayemopov yazanih metodiv natyaku klyuchovih sliv zagolovka lokalizaciyi Sutnist metodu natyaku polyagaye u vikoristanni pid chas vidboru rechen spisku sliv v yakomu zazdalegid vidileno slova z pozitivnoyu ta negativnoyu zmistovoyu vagoyu a takozh nulovi nejtralni slova Pri vidbori vrahovuyutsya tilki slova sho peredayut pozitivnu j negativnu ocinku Pri vikoristanni metodu klyuchovih sliv rozglyadayutsya slova vidibrani za chastotnim principom ta za ciyeyu oznakoyu viznacheni klyuchovimi sho ye analogichnim do zaproponovanogo G Lunom pidhodu U metodi zagolovka golovna rol vidvoditsya slovniku terminiv vidibranih iz zagolovka ta pidzagolovkiv yaki mayut bilshu vagu nizh slova z inshih rechen tekstu Do referatu vidbirayutsya rechennya de traplyayutsya termini kotri nayavni u slovniku Metod lokalizaciyi gruntuyetsya na pripushenni sho najsuttyevisha informaciya koncentruyetsya na samomu pochatku abo naprikinci pevnogo urivka chi paragrafa tekstu Zistavlennya vsih chotiroh metodiv pokazalo sho metod klyuchovih sliv zabezpechuye povnotu vidbittya zmistu pervinnogo dokumenta na 15 40 metod zagolovka na 30 40 a spilne vikoristannya metodiv natyaku zagolovka ta lokalizaciyi na 30 60 Podalshogo rozvitku cej pidhid nabuv pid chas rozrobki indikativnih metodiv referuvannya porivnyano z yakimi statistichni ta pozicijni metodi vidigrayut dopomizhnu rol Indikativni metodi dayut zmogu na osnovi sintaksichnogo analizu formalizuvati viklad osnovnogo zmistu pervinnogo dokumenta v referati telegrafnogo stilyu Sintaksichnomu analizu mozhe pidlyagati yak uves tekst tak i jogo okremi fragmenti sho mistyat tipovi markeri Pokaznikom dlya vidilennya znachushih elementiv pravlyat rozdilovi znaki v seredini rechennya Obsyag oderzhanih referativ stanovit u serednomu do 35 obsyagu pershodzherela 1 s 270 272 Metodika formalizovanogo referuvannyaNazvani metodi avtomatizovanogo referuvannya postijno rozvivayutsya j udoskonalyuyutsya ale rozroblyayut j inshi Tak na pochatku 80 h rokiv bulo zaproponovano metodiku formalizovanogo referuvannya z vikoristannyam markeriv dlya tekstiv z elektroniki Za ciyeyu metodikoyu proces avtomatichnogo referuvannya zvedeno do dvoh osnovnih operacij vlasne ekstraguvannya tobto rozpiznannya v teksti pervinnogo dokumenta markovanih rechen i podacha yih na drukarskij pristrij postredaguvannya pid chas yakogo usuvayut logichni j zmistovi zv yazki mizh frazami Pozitivnoyu risoyu ciyeyi metodiki vvazhayut mozhlivist robiti postredaguvannya ne lishe dlya fahivciv pevnoyi galuzi znannya a j dlya inshih osib sho volodiyut navichkami redaguvannya Vazhlivo takozh sho taka metodika pri pevnomu doopracyuvanni daye zmogu koristuvachu samostijno viznachiti potribni jomu aspekti zmistu zdijsnyuyuchi tak zvane individualne referuvannya ta za potrebi oderzhuvati vidpovidni referativni oglyadi pervinnih dokumentiv 2 Sistema avtomatichnogo referuvannyaRozrobka i perspektivi vikoristannya metodiv avtomatizovanogo referuvannya tisno pov yazani z problemami ocinyuvannya yakosti mashinnih kvazireferativ Yakist yih viznachayut na osnovi viyavlennya tekstovih zbigiv u referatah yaki pidgotuvala lyudina i avtomatichnih a takozh shlyahom porivnyannya rezultativ poshuku za tekstami intelektualnih i kvazireferativ Odnim z klasichnih zavdan komp yuternoyi lingvistiki ye pobudova sistem avtomatichnogo referuvannya naukovih tehnichnih politichnih dilovih tekstiv Aktualnist cogo zavdannya znachno zrostaye u zv yazku z poyavoyu na informacijnomu rinku povnotekstovih baz danih Ci bazi mistyat u viglyadi dokumentiv ne referati a teksti naukovih statej Yaksho zh idetsya pro inshomovni bazi to treba ochevidno pragnuti do pobudovi sistem yaki integruyut 3 osnovni funkciyi poshuk pereklad i referuvannya Rozrobka sistemi avtomatichnogo referuvannya ye mozhlivoyu na osnovi eksperimentalno semantichnogo doslidzhennya mizhfrazovoyi strukturi tekstu z nastupnoyu realizaciyeyu IS sho volodiyut spromozhnistyu gipersintaksichnogo rozuminnya tekstiv 3 s 45 50 Sistema kvazireferuvannyaOpracyuvannya sistemi avtomatichnogo referuvannya maye chimalij praktichnij interes Ce viklikano ne tilki regulyarnim zbilshennyam obsyagu dokumentalnih potokiv ale j takim vazhlivim chinnikom yak zaprovadzhennya v diyu promislovo oriyentovanih avtomatizovanih sistem naukovo tehnichnoyi informaciyi z avtomatichnim indeksuvannyam i sistem mashinnogo perekladu a takozh povnotekstovih baz danih Pri comu referuvannya buduchi odnim iz klyuchovih procesiv analitichno sintetichnoyi pererobki tekstiv poki sho vikonuyetsya vruchnu U toj zhe chas avtomatichne referuvannya z nashoyi tochki zoru mozhe buti spravdi efektivnim tilki v tomu vipadku yaksho vikonuyutsya taki p yat vimog sistema maye formuvati referat iz rechen vhidnogo tekstu mozhlivo z deyakimi skorochennyami za rahunok porivnyano maloinformativnih segmentiv citat vidsilok tosho a ne porodzhuvati jogo na pidstavi smislovogo analizu tekstiv Inshimi slovami sistema povinna povnistyu nasliduvati terminologiyu ta stil avtora ne dopuskayuchi bagatoznachnogo tlumachennya jogo dumok Takim chinom jdetsya pro rozrobku sistemi sho maye pershij riven rozuminnya tekstu sistemi kvazireferuvannya referati sho formuyutsya sistemoyu mayut mistiti ne tilki signalnu informaciyu pro dokument ale j dozvolyati proslidkuvati hid dumok avtora tobto sistema povinna porodzhuvati same referati a ne anotaciyi mira skorochennya tekstu yaka nazivayetsya zvichajno koeficiyentom redukciyi i pid yakoyu rozumiyut vidnoshennya kilkosti rechen u vhidnomu teksti do kilkosti yih u referati maye buti dostatno visokoyu ne menshe 4 5 shvidkist avtomatichnogo referuvannya povinna buti znachno vishoyu za shvidkist ruchnogo sistema maye legko perenalagodzhuvatisya na obrobku tekstiv riznih mov 4 s 90 105 Principi realizaciyi sistemi kvazireferuvannya Rozglyanemo principi sho rozrobleni pid kerivnictvom avtora sistemi kvazireferuvannya Otzhe na pershomu etapi realizaciyi princip diyi sistemi polyagaye u formuvanni kvazireferata z avtosemantichnih rechen tekstu Programne zabezpechennya sistemi dlya YeS EOM vklyuchaye golovnu programu j sim procedur Golovna programa vikonuye taki funkciyi chitannya tekstu sho referuyetsya rozmishennya slovnikiv v operativnij pam yati analiz tekstu po rechennyah vidilennya sliv poshuk v Sk i perevirku zbigu leksichnoyi odinici sho analizuyetsya z odnim iz konektoriv u razi zbigu zvernennya do procedur obchislennya znachennya logichnoyi funkciyi po rezultatah roboti procedur prijnyattya rishennya pro istinnist konektora i viznachennya tipu rechennya vidpovidno do tipu konektora prijnyattya rishennya pro vklyuchennya chi nevklyuchennya rechennya do kvazireferatu druk kvazireferatu na printeri Po miri roboti golovnoyi programi formuyetsya tablicya rechen sho ye osnovnim rezultatom ciyeyi programi Ryadok tablici vidpovidaye odnomu rechennyu Na chas zvernennya do proceduri vsi ryadki kotri mayut vidnoshennya do poperednih za poryadkom sliduvannya rechennyam cilkom zapovneni Ryadok kotrij vidnositsya do rechennya pid chas analizu yakogo stalosya zvertannya do proceduri v moment zvernennya zapovnenij chastkovo Ryadok tablici maye taku strukturu nomer rechennya kilkist simvoliv u rechenni tip rechennya avtosemantichne chi sinsemantichne nomer rechennya z yakim dane znahoditsya v sintaksichnomu zv yazku nomer konektora v Sk Kozhna procedura maye dostup do adres pochatku tekstu pochatku rechennya analizovanogo slova pochatku tablici rechen pochatku Sk pochatku Sv a takozh do poryadkovih nomeriv rechennya analizovanogo slova v rechenni pershogo simvolu slova vidnosno pochatku rechennya do zmishennya pochatku zapisu Sk do znachen parametriv zaznachenih v opisah Sk Yak bachimo programne zabezpechennya sistemi ne zalezhit vid movi tekstu sho obroblyayetsya Dlya referuvannya tekstiv na inshij movi dostatno organizuvati slovnik konektoriv i dopomizhnij slovnik na cij movi Sistema realizovana na movi Asembler pid upravlinnyam DOS i OS YeS EOM Dokument nadhodit do sistemi u viglyadi tekstovogo fajlu v yakomu dopuskayetsya vidilennya za dopomogoyu specialnih sluzhbovih simvoliv zagolovkiv dokumentiv i okremih jogo pidrozdiliv a takozh elementiv bibliografichnogo opisu Vsya vidilena takim chinom informaciya vklyuchayetsya sistemoyu u kvazireferat 5 Rezultatom roboti sistemi ye drukovana kopiya kvazireferatu sformovanogo z avtosemantichnih rechen tekstu z vkazivkoyu yih poryadkovih nomeriv u vhidnomu teksti Yaksho pri comu koeficiyent redukciyi vhidnogo tekstu viyavlyayetsya menshe 4 to u kvazireferat ne vvodyatsya izolovani avtosemantichni rechennya z poslidovnosti avtosemantichnih rechen u kvazireferat vvodyatsya tilki pershi Peredbachenij takozh rezhim u yakomu do kvazireferatu potraplyayut ne tilki avtosemantichni rechennya ale j vkazivka na tip viluchenih sinsemantichnih Ce dozvolit u majbutnomu organizuvati dialog koristuvacha z EOM zaproshuyuchi u sistemi subteksti kotri mayut interes dlya abonenta DzherelaInformacionnyj process Obrabotka informacii Elektronnij resurs Elektronni dani Media Limited 2012 Rezhim dostupu World Wide Web URL http www bestreferat ru referat 73913 html 16 bereznya 2011 u Wayback Machine Gerd A C Terminologiya unifikaciya ili standartizaciya Tekst A S Gerd M VINITI 1984 Berzon V Brajlovskij A Klassifikaciya konnektorov i dialogovye sistemy avtomaticheskogo referirovaniya Tekst V Berzon A Brajlovskij NTI Ser 2 2 1979 Osnovni metodi avtomatizovanogo referuvannya Elektronnij resurs Elektronni dani World Wide Web URL http uadocs exdat com docs index 140602 html 17 grudnya 2017 u Wayback Machine Kudelko Z Visnik Problemi ukrayinskoyi terminologiyi Avtomatichne referuvannya tekstiv Tekst Z Kudelko Lviv Nacionalnij universitet Lvivska politehnika 453 rozdil 2 2002 554 s Instrukciya dlya referentov referativnogo zhurnala VINITI Elektronnij resurs Elektronni dani World Wide Web URL http rudocs exdat com docs index 255097 html 4 bereznya 2016 u Wayback Machine Avdeeva A Organizaciya referata v format na osnove metoda poaspektnogo referirovaniya Tekst A Avdeeva NTI Cep 1 1974 10 S 29 34 Gindin S Semiotika i informatika Metody avtomaticheskogo fragmentirovaniya teksta opirayushiesya na harakteristiki vnutrennego sostava fragmentov Tekst S Gindin M VINITI 1977 vyp 9 S 35 82 Berzon V Zubov A Romanskoe i germanskoe yazykoznanie O semanticheskoj klassifikacii parametrov svyaznosti teksta Tekst V Berzon A Zubov vyp 1 Minsk 1977 S 185 197 Sovershenstvovanie lingvisticheskih i strukturnyh harakteristik informacionnyh dokumentov AIS i RZh Elektronnij resurs Elektronni dani Media Limited 2012 Rezhim dostupu World Wide Web URL http www dissercat com content sovershenstvovanie lingvisticheskikh i strukturnykh kharakteristik informatsionnykh dokument 3 travnya 2012 u Wayback Machine Kushnarenko N Naukova obrobka dokumentiv Tekst Pidruchnik Natalya Mikolayivna Kushnarenko Valeriya Kostyantinivna Udalova 4 te vid pererob i dop K Znannya 2006 334 s ISBN 966 346 234 5