У витягуванні інформації іменована сутність — це об'єкт реального світу, такий як людина, місцезнаходження, організація, товар тощо, який може бути позначений власною назвою. Він може бути абстрактним або існувати насправді. Прикладами іменованих сутностей є Володимир Зеленський, Київ, Volkswagen Golf або будь-що, чому можна дати власну назву. Іменовані сутності можна розглядати як окремі екземпляри більш загальних сутностей (наприклад, Київ — це екземпляр міста).
Термін «іменована сутність» був введений на конференції [en] і складався з виразів імен сутностей (англ. entity name expressions, ENAMEX) та числових виразів (англ. numerical expression, NUMEX).
Більш формальне визначення може бути отримане з [en] Саула Кріпке. У виразі «іменована сутність» слово «іменована» покликане обмежити можливий набір сутностей лише тими, для яких референтом є один або декілька жорстких десигнаторів. Десигнатор є жорстким, якщо він позначає ту саму річ у всіх можливих світах. Навпаки, [en] можуть означати різні речі у різних можливих світах.
Як приклад розглянемо речення «Зеленський — президент України». І «Зеленський», і «Україна» є іменованими сутностями, оскільки вони посилаються на конкретні об'єкти (Володимир Зеленський та Україна). Однак «президент» не є іменованою сутністю, оскільки може використовуватися для позначення безлічі різних об'єктів у різних світах (різних людей у різних країнах або у різні президентські періоди). Жорсткі десигнатори зазвичай включають власні назви, а також деякі природні терміни, такі як біологічні види і речовини.
У спільноті фахівців із розпізнавання іменованих сутностей також заведено вважати іменованими сутностями вирази часу та числові вирази, такі як суми грошей та інші види одиниць виміру, які можуть порушувати визначення жорсткого десигнатора.
Для іменованих сутностей розрізняють задачу розпізнавання іменованих сутностей і задачу визначення ідентичності іменованих сутностей, наведених у тексті, яку називають зв'язуванням іменованих сутностей. Для вирішення обох завдань потрібні спеціальні алгоритми та ресурси.
Див. також
- Розпізнавання іменованих сутностей (також відоме як ідентифікація об'єктної сутності, фрагментація об'єктної сутності та видобуток об'єктної сутності)
- Зв'язування іменованих сутностей
- Витягування інформації
- Видобування знань
- Інтелектуальний аналіз тексту
- [en]
- Apache OpenNLP
- spaCy
- [en]
- Natural Language Toolkit
Примітки
- Grishman, Ralph; Sundheim, Beth (1996). Design of the MUC-6 evaluation (PDF). TIPSTER '96 Proceedings. Архів оригіналу (PDF) за 12 серпня 2017. Процитовано 18 січня 2022.
- Nadeau, David; Sekine, Satoshi (2007). A survey of named entity recognition and classification (PDF). Lingvisticae Investigationes. Архів оригіналу (PDF) за 12 травня 2019. Процитовано 18 січня 2022.
- Nouvel, Damien; Ehrmann, Maud; Rosset, Sophie (2015). Wiley (ред.). Named Entities for Computational Linguistics. ISBN .
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
U vityaguvanni informaciyi imenovana sutnist ce ob yekt realnogo svitu takij yak lyudina misceznahodzhennya organizaciya tovar tosho yakij mozhe buti poznachenij vlasnoyu nazvoyu Vin mozhe buti abstraktnim abo isnuvati naspravdi Prikladami imenovanih sutnostej ye Volodimir Zelenskij Kiyiv Volkswagen Golf abo bud sho chomu mozhna dati vlasnu nazvu Imenovani sutnosti mozhna rozglyadati yak okremi ekzemplyari bilsh zagalnih sutnostej napriklad Kiyiv ce ekzemplyar mista Termin imenovana sutnist buv vvedenij na konferenciyi MUC 6 en 1 i skladavsya z viraziv imen sutnostej angl entity name expressions ENAMEX ta chislovih viraziv angl numerical expression NUMEX Bilsh formalne viznachennya mozhe buti otrimane z zhorstkogo designatora en Saula Kripke U virazi imenovana sutnist slovo imenovana poklikane obmezhiti mozhlivij nabir sutnostej lishe timi dlya yakih referentom ye odin abo dekilka zhorstkih designatoriv 2 Designator ye zhorstkim yaksho vin poznachaye tu samu rich u vsih mozhlivih svitah Navpaki nezhorstki designatori en mozhut oznachati rizni rechi u riznih mozhlivih svitah Yak priklad rozglyanemo rechennya Zelenskij prezident Ukrayini I Zelenskij i Ukrayina ye imenovanimi sutnostyami oskilki voni posilayutsya na konkretni ob yekti Volodimir Zelenskij ta Ukrayina Odnak prezident ne ye imenovanoyu sutnistyu oskilki mozhe vikoristovuvatisya dlya poznachennya bezlichi riznih ob yektiv u riznih svitah riznih lyudej u riznih krayinah abo u rizni prezidentski periodi Zhorstki designatori zazvichaj vklyuchayut vlasni nazvi a takozh deyaki prirodni termini taki yak biologichni vidi i rechovini U spilnoti fahivciv iz rozpiznavannya imenovanih sutnostej takozh zavedeno vvazhati imenovanimi sutnostyami virazi chasu ta chislovi virazi taki yak sumi groshej ta inshi vidi odinic vimiru yaki mozhut porushuvati viznachennya zhorstkogo designatora Dlya imenovanih sutnostej rozriznyayut zadachu rozpiznavannya imenovanih sutnostej i zadachu viznachennya identichnosti imenovanih sutnostej navedenih u teksti yaku nazivayut zv yazuvannyam imenovanih sutnostej Dlya virishennya oboh zavdan potribni specialni algoritmi ta resursi 3 Div takozhred Rozpiznavannya imenovanih sutnostej takozh vidome yak identifikaciya ob yektnoyi sutnosti fragmentaciya ob yektnoyi sutnosti ta vidobutok ob yektnoyi sutnosti Zv yazuvannya imenovanih sutnostej Vityaguvannya informaciyi Vidobuvannya znan Intelektualnij analiz tekstu Truecasing en Apache OpenNLP spaCy GATE programa en Natural Language ToolkitPrimitkired Grishman Ralph Sundheim Beth 1996 Design of the MUC 6 evaluation PDF TIPSTER 96 Proceedings Arhiv originalu PDF za 12 serpnya 2017 Procitovano 18 sichnya 2022 Nadeau David Sekine Satoshi 2007 A survey of named entity recognition and classification PDF Lingvisticae Investigationes Arhiv originalu PDF za 12 travnya 2019 Procitovano 18 sichnya 2022 Nouvel Damien Ehrmann Maud Rosset Sophie 2015 Wiley red Named Entities for Computational Linguistics ISBN 978 1 84821 838 3 Otrimano z https uk wikipedia org w index php title Imenovana sutnist amp oldid 39105764