Ця стаття є сирим з іншої мови. Можливо, вона створена за допомогою машинного перекладу або перекладачем, який недостатньо володіє обома мовами. (листопад 2016) |
Цю статтю треба для відповідності Вікіпедії. (травень 2016) |
Ця стаття містить текст, що не відповідає . (травень 2016) |
Видобування знань (англ. knowledge extraction, рос. извлечение знаний) є створення знань зі структурованих (реляційних баз даних, XML) і неструктурованих (тексти, документи, зображення) джерел. Отримане знання повинно бути збережене у форматі, придатному для автоматичного читання та інтерпретації. Також знання повинні бути представлені таким чином, щоб полегшити логічний висновок. Попри те, що це методично схоже на видобування інформації (англ. Data Mining, NLP) і ETL (зберігання даних), основними критеріями є те, що результат видобування виходить за рамки створення структурованої інформації або перетворення її в реляційну схему. Це вимагає або повторного використання наявних формальних знань (повторне використання ідентифікаторів або онтологій), або генерацію схеми[] на основі вихідних даних.
Група RDB2RDF W3C в даний час[] стандартизує мову для видобутку RDF (англ. Resource Description Framework) з реляційних баз даних. Ще одним популярним прикладом видобутку знань є перетворення Вікіпедії в структуровані дані, а також відображення до наявних знань (див. DBpedia і Freebase).
Огляд
Після стандартизації мов представлення знань, таких як RDF і OWL, багато досліджень було проведено в області, особливо щодо перетворення реляційних баз даних в RDF, задачі ідентифікації, виявлення знань і навчання онтологій. Загальний процес використовує традиційні методи добування даних, виймання, перетворення і завантаження (ETL), які перетворюють дані з джерел у структуровані формати.
Наступні критерії можуть бути використані для класифікації підходів в цій темі (деякі з них використовуються лише для видобутку з реляційних баз даних):
Джерело | Джерела даних, які використовуються: Текст, реляційні бази даних, XML, CSV |
---|---|
Експозиція | В якому вигляді добуваються дані? (файл онтології, семантична база даних)? Як можна зробити запит? |
Синхронізація | Чи виконується процес видобутку знань один раз для отримання дампа або результат синхронізується з джерелом? Статична або динамічна синхронізація. Чи записуються зміни результатів назад (двонаправлена синхронізація) |
Повторне використання словників | Інструмент здатний повторно використовувати наявні словники при видобутку. Наприклад, стовпчик таблиці 'FirstName' можуть бути зіставленні з foaf:firstName. Деякі автоматичні підходи не здатні зіставляти словники. |
Автоматизація | Ступінь, в якій видобуток вимагає втручання/автоматизований. Допомога оператора, GUI, напівавтоматичний, автоматичний. |
Потрібна онтологія предметної області | Потрібно побудувати відображення у вже задану онтологію. Так чином, що або створюється відображення або отримується схема з джерела ([en]). |
Приклади
Зв'язування об'єктів
- DBpedia Spotlight, [en], Dandelion dataTXT[недоступне посилання], Zemanta API, Extractiv [ 29 березня 2017 у Wayback Machine.] та PoolParty Extractor [ 26 червня 2012 у Wayback Machine.] аналізують вільний текст через розпізнавання іменованих сутностей, а потім усуває неоднозначність кандидатів через [en] та пов'язує знайдені об'єкти зі сховищем знань DBpedia (див. демо Dandelion dataTXT, DBpedia Spotlight або PoolParty Extractor).
Президент Обама [ 12 жовтня 2008 у Wayback Machine.] у середу закликав Конгрес продовжити податкові пільги для студентів, включених до економічних стимулів у минулому році, стверджуючи, що політика забезпечує більш щедру допомогу.
- Як президент Обама пов'язаний з ресурсом DBpedia [en], додаткова інформація може бути отримана автоматично і [en] може, наприклад, зробити висновок, що згадана особа має тип особи (з використанням FOAF (програмне забезпечення)) і президентів типу Сполучених Штатів (за допомогою YAGO). Приклади: Методи, які розпізнають тільки об'єкти або посилання на статті Вікіпедії та інших цілей, які не забезпечують подальше вилучення структурованих даних і формальних знань.
Реляційні бази даних в RDF
- Triplify, D2R сервера, Ultrawrap і Virtuoso RDF Перегляди інструментів, які трансформують реляційні баз даних RDF. В ході цього процесу вони дозволяють повторно використовувати існуючі словники і онтології в процесі перетворення. При перетворенні типових реляційних таблиць з ім'ям користувачів, один стовпець (наприклад «.name») або сукупність стовпців (наприклад «.first_name» і «last_name») повинен надати URI створеного об'єкта. Зазвичай використовується первинний ключ. Кожен другий стовпець може бути залучен як відношення з цією організацією. Потім використовуються властивості з формально визначеною семантикою (і повторно) інтерпретувати інформацію. Наприклад, стовпець в таблиці користувача з ім'ям marriedTo може бути визначена як симетричне відношення і стовпчик homepage може бути перетворений у власність від FOAF Словник називається FOAF: головна сторінка, таким чином, кваліфікує його як функціональна властивість зворотного. Потім кожен запис таблиці користувача може бути екземпляром класу FOAF: Людина (Онтологія населення). Крім знання предметної області (у формі онтології) можуть бути створені з status_id, або створених вручну правил (якщо status_id 2, запис відноситься до класу Вчителі), або (semi) -автоматичні методи (онтологія навчання). Ось приклад перетворення:
Ім'я | одружений | домашня сторінка | статус |
---|---|---|---|
Peter | Mary | http://example.org/Peters_page[недоступне посилання з березня 2019] | 1 |
Claus | Eva | http://example.org/Claus_page[недоступне посилання з березня 2019] | 2 |
:Peter :marriedTo :Mary . :marriedTo a owl:SymmetricProperty . :Peter foaf:homepage <http://example.org/Peters_page> . :Peter a foaf:Person . :Peter a :Student . :Claus a :Teacher .
Витяг з структурованих джерел в RDF
1: 1 Відображення з таблиць БД / Види на RDF Entities / Властивості / Значення
При створенні вистави RDB в проблемній області, відправною точкою часто є сутність-зв'язок діаграма (ERD). Як правило, кожним об'єктом представленому у вигляді таблиці бази даних, кожний атрибут сутності стає стовпець в цій таблиці, і відносини між об'єктами позначаються зовнішніми ключами. Кожна таблиця, як правило, визначає конкретний клас суті, кожен стовпець один з його атрибутів. Кожен рядок в таблиці описує екземпляр сутності, однозначно ідентифікується первинним ключем. Рядки таблиці в сукупності описують набір сутностей. В еквівалентній RDF представлення одного і того ж набору сутностей:
- Кожен стовпець у таблиці є атрибутом (тобто предикат)
- Кожне значення стовпця є значення атрибута (тобто об'єкт)
- Кожна клавіша рядок являє собою ідентифікатор об'єкта (тобто суб'єкт)
- Кожен рядок є екземпляром сутності
- Кожен рядок (екземпляр об'єкта) представлена в RDF колекцією трійок із загальним суб'єктом (ідентифікатор об'єкта)
Таким чином, щоб зробити еквівалентне уявлення на основі RDF семантики, основне відображення алгоритму буде виглядати наступним чином:
- створити RDFS клас для кожної таблиці
- конвертувати всі первинні ключі та зовнішні ключі в IRIs
- призначити предикат IRI для кожного стовпчика
- призначити РДФ: тип предиката для кожного рядка, пов'язуючи його з ІСС класу IRI відповідає таблиці
- для кожного стовпчика, який не є ні частиною первинного або зовнішнього ключа, побудувати потрійний, який містить первинний ключ IRI як суб'єкта, стовпець IRI як предиката і значення стовпця як об'єкт.
Найперша згадка цього основного або прямого відображення можна знайти в порівнянні Тім Бернерс-Лі моделі ER до моделі RDF. .
Складні відображення реляційних баз даних в RDF
1: 1 згадуване вище надає застарілі дані у вигляді RDF прямим шляхом, додаткові уточнення можуть бути використані для підвищення корисності RDF виведення відповідного до Use Cases. Як правило, втрачається інформація в процесі перетворення в сутність-зв'язок діаграми (ERD) для реляційних таблиць (подробиці можна знайти в об'єктно-реляційному імпедансі) і повинна бути зворотня інженерія. З концептуальної точки зору, підходи до видобутку можуть надходити з двох напрямків. Перший напрямок намагається витягти або дізнатися-схему OWL з даної схеми бази даних. Ранні підходи використовували фіксовану кількість створених вручну правил відображення для уточнення відображення 1:1. Більш складні методи з використанням евристики або алгоритмів навчання, щоб викликати схематичну інформацію (методи перекриватися з навчанням онтологій). У той час як деякі підходи намагаються витягти інформацію зі структури, властивої схемою SQL (аналізуючи наприклад, зовнішні ключі), інші аналізують зміст і значення в таблицях для створення концептуальних ієрархій (наприклад, стовпці з декількома значеннями є кандидатами для становлення категорії), Другий напрямок намагається відобразити схему і його вміст вже існуючої онтології предметної області (дивись також: вирівнювання онтології). Часто, однак, відповідна онтологія не існує, і повинен бути створений першим.
XML
Так як XML структурована у вигляді дерева, будь-які дані можуть бути легко представлені в RDF, який структурований у вигляді графіка. XML2RDF є одним із прикладів такого підходу, який використовує RDF порожні вузли і перетворює XML-елементи і атрибути властивостей RDF. Тема, однак, є більш складним, як і в разі реляційних баз даних. У реляційної таблиці первинний ключ є ідеальним кандидатом, щоб стати предметом здобутих трійок. XML-елемент, однак, можуть бути перетворені — в залежності від контексту — як суб'єкт, предикат або об'єкт потрійний. XSLT може бути використаний стандартний мову перетворення вручну перетворити XML в RDF.
Огляд методів / Інструменти
Name | Data Source | Data Exposition | Data Synchronisation | Mapping Language | Vocabulary Reuse | Mapping Automat. | Req. Domain Ontology | Uses GUI |
---|---|---|---|---|---|---|---|---|
A Direct Mapping of Relational Data to RDF [ 9 травня 2016 у Wayback Machine.] | Relational Data | SPARQL/ETL | dynamic | N/A | false | automatic | false | false |
CSV2RDF4LOD [ 22 серпня 2016 у Wayback Machine.] | CSV | ETL | static | RDF | true | manual | false | false |
Convert2RDF [ 22 вересня 2016 у Wayback Machine.] | Delimited text file | ETL | static | RDF/DAML | true | manual | false | true |
D2R Server [ 26 лютого 2012 у Wayback Machine.] | RDB | SPARQL | bi-directional | D2R Map | true | manual | false | false |
RDB | own query language | dynamic | Visual Tool | true | manual | false | true | |
DataMaster [ 21 травня 2016 у Wayback Machine.] | RDB | ETL | static | proprietary | true | manual | true | true |
CSV, XML | ETL | static | none | semi-automatic | false | true | ||
XML | ETL | static | xslt | true | manual | true | false | |
MAPONTO [ 2 червня 2016 у Wayback Machine.] | RDB | ETL | static | proprietary | true | manual | true | false |
METAmorphoses [ 17 квітня 2016 у Wayback Machine.] | RDB | ETL | static | proprietary xml based mapping language | true | manual | false | true |
CSV | ETL | static | MappingMaster | true | GUI | false | true | |
RDB | ETL | static | proprietary | true | manual | true | true | |
CSV | ETL | static | The RDF Data Cube Vocaublary | true | semi-automatic | false | true | |
Poolparty Extraktor (PPX) [ 26 червня 2012 у Wayback Machine.] | XML, Text | LinkedData | dynamic | RDF (SKOS) | true | semi-automatic | true | false |
RDB | ETL | static | none | false | automatic, the user furthermore has the chance to fine-tune results | false | true | |
RDF 123 [ 20 липня 2011 у Wayback Machine.] | CSV | ETL | static | false | false | manual | false | true |
RDOTE | RDB | ETL | static | SQL | true | manual | true | true |
Relational.OWL | RDB | ETL | static | none | false | automatic | false | false |
T2LD [ 20 липня 2011 у Wayback Machine.] | CSV | ETL | static | false | false | automatic | false | false |
Multidimensional statistical data in spreadsheets | Data Cube Vocabulary | true | manual | false | ||||
CSV | ETL | static | SKOS | false | semi-automatic | false | true | |
Triplify [ 6 січня 2009 у Wayback Machine.] | RDB | LinkedData | dynamic | SQL | true | manual | false | false |
RDB | SPARQL/ETL | dynamic | R2RML | true | semi-automatic | false | true | |
Virtuoso RDF Views [ 5 вересня 2014 у Wayback Machine.] | RDB | SPARQL | dynamic | Meta Schema Language | true | semi-automatic | false | true |
Virtuoso Sponger [ 5 вересня 2014 у Wayback Machine.] | structured and semi-structured data sources | SPARQL | dynamic | Virtuoso PL & XSLT | true | semi-automatic | false | false |
RDB | RDQL | dynamic | SQL | true | manual | true | true | |
XLWrap: Spreadsheet to RDF [ 8 травня 2016 у Wayback Machine.] | CSV | ETL | static | TriG Syntax | true | manual | false | false |
XML to RDF [ 11 травня 2016 у Wayback Machine.] | XML | ETL | static | false | false | automatic | false | false |
Витяг з природних джерел мови
Найбільша частина інформації, що міститься в бізнес-документах (близько 80 %) кодується природною мовою і, отже, неструктурована. Оскільки неструктуровані дані є досить складним завданням для вилучення знань, більш складні методи необхідні, які, як правило, поставляють гірші результати в порівнянні з неструктурованими даними. Потенціал для масового придбання здобутих знань, проте, повинні компенсувати підвищену складність і зниження якості видобутку. Надалі, природні джерела мови розуміються як джерела інформації, де дані наведені неструктурованим чином, як звичайний текст. Якщо даний текст додатково вбудований в розмітки документа (е. Г. HTML документ), згадані системи зазвичай видаляють елементи розмітки автоматично.
Традиційне вилучення інформації (IE)
Традиційне вилучення інформації є технологією обробки природної мови, яке витягує інформацію з текстів природною мовою, як правило, і структури даних відповідним чином. Види інформації, що підлягає ідентифікованого повинні бути вказані як модель перед початком процесу, тому весь процес традиційного вилучення інформації залежний. IE розділений на наступні п'ять підзадач.
- визнання Названий об'єкт (ВНО)
- Резолюція кореферентності (РК)
- Шаблон будівельного елементу (ШБ)
- Шаблон ставлення конструкції (ШС)
- Шаблон виробництва сценарій (ШВ)
Завдання названого розпізнавання особи є визнати і класифікувати всі названі об'єкти, що містяться в тексті (присвоєння імені об'єкта до визначеної категорії). Це працює шляхом застосування граматики на основі методів або статистичних моделей.
Дозвіл конферентногсті визначає еквівалентні об'єкти, які були визнані НЕК, в тексті. Існують два види відповідних відносин еквівалентності. Перший з них відноситься до відносин між двома різними представленими суб'єктами (наприклад, IBM Europe і IBM), а другий до відносин між суб'єктом і їх анафорических посилань (наприклад, він і IBM). Обидва види можуть бути визнані відповідно до резолюції кореферентності.
Під час будівництва елемента шаблону система ідентифікує IE описові властивості сутностей, визнаних НЕК і CO. Ці властивості відповідають звичайним якостям, як червоний або великий.
Шаблонна конструкція відношення визначає відносини, які існують між елементами шаблону. Ці відносини можуть бути декількох видів, таких як роботи з питання або знаходження, з обмеженням, що обидва домени і діапазон відповідають суб'єктам.
У шаблоні сценарію здійснюються події, які описані в тексті, вони будуть визначені і структуровані щодо осіб, визнаних Нью-Йорку і СО і відносин, які були визначені TR.
Онтологія на основі вилучення інформації (OBIE)
Онтологія на основі вилучення інформації є полем вилучення інформації, за допомогою якої щонайменше одна онтологія використовується для управління процесом добування інформації з текстів природною мовою. Система OBIE використовує методи традиційної вилучення інформації для ідентифікації понять, екземпляри і відносини використовуваних онтологій в тексті, які будуть структуровані з онтологією після процесу. Таким чином, вхідна онтологія є моделлю інформації, яку необхідно витягти.
Онтологія навчання (ОН)
Вивчення Онтології є автоматичним або напівавтоматичним створення онтологій, включаючи витяг термінів відповідної області від природного тексту мови. Оскільки будівля онтологій вручну є надзвичайно трудомістким і займає багато часу, є велика мотивація для автоматизації процесу.
Семантична анотація (SA)
Під час семантичної анотації, текст природною мовою доповнюється метаданими (часто представлені в RDFa), які повинні складати семантику термінів, що містяться машини зрозумілим. У цьому процесі, який, як правило, напівавтоматична, знання видобувається в тому сенсі, що зв'язок між лексичних термінів і понять, наприклад, з онтологією встановлюється. Таким чином, знання здобувається, що значення терміна в обробленому контексті був призначений і, отже, сенс тексту ґрунтується на машинозчитуваних даних з можливістю зробити висновки. Семантичне анотування як правило, розділені на наступні дві підзадачі.
- екстракція Термінологія
- Об'єкт зв'язування
На рівні вилучення термінології, лексичні терміни з тексту витягуються. Для цієї мети токенізатор визначає спочатку кордони слів і вирішує скорочити. Згодом терміни з тексту, які відповідають концепції, витягуються за допомогою лексикону предметно-орієнтованого щоб зв'язати ці по суті посилання.
По суті пов'язуючи зв'язок між видобутих лексичних термінів з вихідного тексту і понять з онтології або бази знань, таких як встановлено DBpedia. Для цього, кандидати-концепції виявляються відповідно в декількох значеннях терміна за допомогою лексикону. І, нарешті, контекст термінів аналізується з метою визначення найбільш підходящої однозначністі і призначити термін для правильної концепції.
інструменти
Наступні критерії можуть бути використані для класифікації інструментів, які витягують знання з текстів природною мовою.
Джерело | Які формати введення можуть бути оброблені за допомогою інструменту (наприклад, простий текст, HTML або PDF)? |
Доступ до Paradigm | Чи може інструмент запитувати джерела даних або потребує цілого дампа для процесу екстракції? |
Синхронізація даних | Є результатом процесу екстракції синхронізований з джерелом? |
Використання Output Ontology | Чи зв'язані інструмент результат з онтологією? |
Mapping Автоматизація | Як це автоматизований процес екстракції (ручний, напівавтоматичний або автоматичний)? |
вимагає Онтологія | Чи потрібно інструмент онтології для вилучення? |
Використання графічного інтерфейсу користувача | Чи надає інструмент графічний інтерфейс користувача? |
Підхід | Який підхід (IS, OBIE, ПР або SA) використовується інструментом? |
Витягнуті Сутності | Які типи сутностей (наприклад, названі особи, поняття або відношення) можуть бути вилучені за допомогою інструменту? |
Застосовувані методи | Які методи застосовуються (наприклад, NLP, статистичні методи, кластеризація або машинного навчання)? |
Вихід моделі | Яка модель використовується для представлення результату інструменту (е. Г. RDF або OWL)? |
Підтримувані домени | Які домени підтримуються (наприклад, економіка або біологія)? |
Підтримувані Мови | Які мови можуть бути оброблені (наприклад, англійську чи німецьку)? |
У наведеній нижче таблиці характеризується деякі інструменти для здобуття знань з природних джерел мови.
Назва | Джерело | доступ до Paradigm | Data Synchronization | Uses Output Ontology | Mapping Automation | Requires Ontology | Uses GUI | Approach | Extracted Entities | Applied Techniques | Output Model | Supported Domains | Supported Languages |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
plain text, HTML, XML, SGML | dump | no | yes | automatic | yes | yes | IE | named entities, relationships, events | linguistic rules | proprietary | domain-independent | English, Spanish, Arabic, Chinese, indonesian | |
AlchemyAPI [ 1 серпня 2013 у Wayback Machine.] | plain text, HTML | automatic | yes | SA | multilingual | ||||||||
ANNIE [ 15 березня 2016 у Wayback Machine.] [ 15 березня 2016 у Wayback Machine.] | plain text | dump | yes | yes | IE | finite state algorithms | multilingual | ||||||
ASIUM [ 11 червня 2017 у Wayback Machine.] [ 11 червня 2017 у Wayback Machine.] | plain text | dump | semi-automatic | yes | OL | concepts, concept hierarchy | NLP, clustering | ||||||
automatic | IE | named entities, relationships, events | NLP | ||||||||||
Dandelion API [ 28 травня 2016 у Wayback Machine.] | plain text, HTML, URL | REST | no | no | automatic | no | yes | SA | named entities, concepts | statistical methods | JSON | domain-independent | multilingual |
plain text, HTML | dump, SPARQL | yes | yes | automatic | no | yes | SA | annotation to each word, annotation to non-stopwords | NLP, statistical methods, machine learning | RDFa | domain-independent | English | |
EntityClassifier.eu [ 3 березня 2016 у Wayback Machine.] | plain text, HTML | dump | yes | yes | automatic | no | yes | IE, OL, SA | annotation to each word, annotation to non-stopwords | rule-based grammar | XML | domain-independent | English, German, Dutch |
FRED [ 8 травня 2016 у Wayback Machine.] [ 8 травня 2016 у Wayback Machine.] | plain text, PDF and Word via Sheldon [ 20 травня 2016 у Wayback Machine.] | dump, REST | yes | automatic | no | yes | OL+IE+SA | concepts, concept hierarchy, frames, events, relationships, named entities, negation, modality, tense, entity linking, schema alignment, sentiment (via Sentilo [ 18 червня 2016 у Wayback Machine.]) | NLP, SPARQL, heuristical rules, ontology design patterns | RDF-OWL, Turtle, NT, JSON-LD, DAG, diagrams | domain-independent | English, multilingual input | |
plain text, HTML, XML, PDF, MS Office, e-mail | dump, SPARQL | yes | yes | automatic | no | yes | IE, OL, SA | concepts, named entities, instances, concept hierarchy, generic relationships, user-defined relationships, events, modality, tense, entity linking, event linking, sentiment | NLP, machine learning, heuristic rules | RDF, OWL, proprietary XML | domain-independent | English, Spanish | |
iDocument [ 21 червня 2021 у Wayback Machine.] | HTML, PDF, DOC | SPARQL | yes | yes | OBIE | instances, property values | NLP | personal, business | |||||
NetOwl Extractor [ 9 квітня 2016 у Wayback Machine.] [ 9 квітня 2016 у Wayback Machine.] | plain text, HTML, XML, SGML, PDF, MS Office | dump | No | Yes | Automatic | yes | Yes | IE | named entities, relationships, events | NLP | XML, JSON, RDF-OWL, others | multiple domains | English, Arabic Chinese (Simplified and Traditional), French, Korean, Persian (Farsi and Dari), Russian, Spanish |
OntoGen [ 30 березня 2010 у Wayback Machine.] [ 30 березня 2010 у Wayback Machine.] | semi-automatic | yes | OL | concepts, concept hierarchy, non-taxonomic relations, instances | NLP, machine learning, clustering | ||||||||
OntoLearn [ 9 серпня 2017 у Wayback Machine.] [ 9 серпня 2017 у Wayback Machine.] | plain text, HTML | dump | no | yes | automatic | yes | no | OL | concepts, concept hierarchy, instances | NLP, statistical methods | proprietary | domain-independent | English |
OntoLearn Reloaded [ 4 березня 2016 у Wayback Machine.] | plain text, HTML | dump | no | yes | automatic | yes | no | OL | concepts, concept hierarchy, instances | NLP, statistical methods | proprietary | domain-independent | English |
OntoSyphon [ 10 березня 2016 у Wayback Machine.] [ 10 березня 2016 у Wayback Machine.] | HTML, PDF, DOC | dump, search engine queries | no | yes | automatic | yes | no | OBIE | concepts, relations, instances | NLP, statistical methods | RDF | domain-independent | English |
ontoX [ 27 травня 2016 у Wayback Machine.] | plain text | dump | no | yes | semi-automatic | yes | no | OBIE | instances, datatype property values | heuristic-based methods | proprietary | domain-independent | language-independent |
OpenCalais [ 24 жовтня 2008 у Wayback Machine.] | plain text, HTML, XML | dump | no | yes | automatic | yes | no | SA | annotation to entities, annotation to events, annotation to facts | NLP, machine learning | RDF | domain-independent | English, French, Spanish |
PoolParty Extractor [ 17 травня 2016 у Wayback Machine.] [ 17 травня 2016 у Wayback Machine.] | plain text, HTML, DOC, ODT | dump | no | yes | automatic | yes | yes | OBIE | named entities, concepts, relations, concepts that categorize the text, enrichments | NLP, machine learning, statistical methods | RDF, OWL | domain-independent | English, German, Spanish, French |
Rosoka [ 10 травня 2016 у Wayback Machine.] [ 10 травня 2016 у Wayback Machine.] | plain text, HTML, XML, SGML, PDF, MS Office | dump | Yes | Yes | Automatic | no | Yes | IE | named entities, relationships, attributes, concepts | NLP | XML, JSON, RDF, others | multiple domains | Multilingual (230) |
SCOOBIE [ 11 червня 2018 у Wayback Machine.] | plain text, HTML | dump | no | yes | automatic | no | no | OBIE | instances, property values, RDFS types | NLP, machine learning | RDF, RDFa | domain-independent | English, German |
SemTag [ 11 червня 2017 у Wayback Machine.] [ 11 червня 2017 у Wayback Machine.] | HTML | dump | no | yes | automatic | yes | no | SA | machine learning | database record | domain-independent | language-independent | |
smart FIX [ 17 травня 2016 у Wayback Machine.] | plain text, HTML, PDF, DOC, e-Mail | dump | yes | no | automatic | no | yes | OBIE | named entities | NLP, machine learning | proprietary | domain-independent | English, German, French, Dutch, polish |
Text2Onto [ 2 травня 2016 у Wayback Machine.] [ 2 травня 2016 у Wayback Machine.] | plain text, HTML, PDF | dump | yes | no | semi-automatic | yes | yes | OL | concepts, concept hierarchy, non-taxonomic relations, instances, axioms | NLP, statistical methods, machine learning, rule-based methods | OWL | deomain-independent | English, German, Spanish |
Text-To-Onto [ 15 травня 2013 у Wayback Machine.] [ 15 травня 2013 у Wayback Machine.] | plain text, HTML, PDF, PostScript | dump | semi-automatic | yes | yes | OL | concepts, concept hierarchy, non-taxonomic relations, lexical entities referring to concepts, lexical entities referring to relations | NLP, machine learning, clustering, statistical methods | German | ||||
ThatNeedle [ 13 травня 2016 у Wayback Machine.] | Plain Text | dump | automatic | no | concepts, relations, hierarchy | NLP, proprietary | JSON | multiple domains | English | ||||
plain text, HTML, PDF, DOC | dump | no | yes | automatic | yes | yes | SA | annotation to proper nouns, annotation to common nouns | machine learning | RDFa | domain-independent | English, German, Spanish, French, Portuguese, Italian, Russian | |
IE | named entities, relationships, events | multilingual |
Виявлення знань
Виявлення знань описує процес автоматичного пошуку великих обсягів даних для моделей, які можна вважати знання про дані. Він часто описується як вилучення знань з вхідних даних. Виявлення знань розвинулася з області інтелектуального аналізу даних, а також тісно пов'язана з нею як з точки зору методології та термінології.
Найбільш відома гілка інтелектуального аналізу даних є виявлення знань, також відомий як виявлення знань в базах даних (KDD). Так само, як і багато інших форм виявлення знань створює абстракції вхідних даних. Знання, отримані в процесі, можуть стати додаткові дані, які можуть бути використані для подальшого використання і відкриття. Часто результати від виявлення знань не дієві, відкриття знання дієві, також відомий як домен приводом інтелектуального аналізу даних, має на меті виявити та доставити дієві знання та ідеї.
Іншим перспективним застосування виявлення знань в області модернізації програмного забезпечення, виявлення слабкості і дотримання яких передбачає розуміння існуючих програмних артефактів. Цей процес пов'язаний з концепцією зворотної інженерії. Як правило, знання, отримані з існуючого програмного забезпечення представлені у вигляді моделей, в якій конкретні запити можуть бути зроблені при потреби. Відносини суті є найчастішим форматом представлення знань, отриманих з існуючого програмного забезпечення. Об'єкт Management Group (OMG) розробила специфікації знання Discovery Metamodel (KDM), який визначає онтологію для засобів програмного забезпечення та їх відносин з метою виконання виявлення знань всі наявні коди. Виявлення знань з існуючих програмних систем, також відомий як програмне забезпечення видобутку корисних копалин тісно пов'язана з видобутком корисних копалин даних, оскільки існуючі програмні артефакти містять величезне значення для управління ризиками та вартості бізнесу, ключ для оцінки та розвитку програмних систем. Замість того, щоб видобуток окремих наборів даних, гірничодобувної промисловості програмного забезпечення фокусується на метаданих, таких як потоки процесу (наприклад, потоки даних, потоки управління, & назвати карти), архітектура, схеми баз даних і бізнес-правила / умови / процесу.
Вхідні дані
- бази даних
- реляційні дані
- база даних
- складський документ
- Інформаційне сховище
- програмне забезпечення
- вихідні дані
- файли конфігурації
- побудова сценаріїв
- Текст
- концепція гірничодобувної промисловості
- діаграми
- молекула сенс
- послідовності
- видобуток потоку даних
- Навчання від змінюються в часі потоків даних в рамках концепції дрейфу
- Веб
вихідні формати
- Модель даних
- Метадані
- метамоделі
- онтологія
- уявлення знань
- теги знань
- бізнес-правила
- Знання Discovery Metamodel (КДМ)
- Моделювання бізнес-процесів нотація (BPMN)
- проміжне представлення
- Resource Description Framework (RDF)
- метрики програмного забезпечення
Див. також
- кластеризація
- археологія даних
- Видобуток даних
- інтелектуального аналізу даних домену приводом
- Інтелектуального аналізу даних в сільському господарстві
- Витяг, перетворення, завантаження
- інформація Видобуток
- Подання знань і висновок
- Семантична мережа
Примітки
- RDB2RDF Working Group, Website: http://www.w3.org/2001/sw/rdb2rdf/ [ 11 травня 2016 у Wayback Machine.], charter: http://www.w3.org/2009/08/rdb2rdf-charter [ 20 березня 2016 у Wayback Machine.], R2RML: RDB to RDF Mapping Language: http://www.w3.org/TR/r2rml/ [ 10 жовтня 2021 у Wayback Machine.]
- LOD2 EU Deliverable 3.1.1 Knowledge Extraction from Structured Sources http://static.lod2.eu/Deliverables/deliverable-3.1.1.pdf [ 27 серпня 2011 у Wayback Machine.]
- . www.opencalais.com. Архів оригіналу за 24 листопада 2009. Процитовано 10 листопада 2009.
Wikipedia has a Linked Data twin called DBpedia. DBpedia has the same structured information as Wikipedia – but translated into a machine-readable format.
- Tim Berners-Lee (1998), «Relational Databases on the Semantic Web» [ 16 березня 2016 у Wayback Machine.]. Retrieved: February 20, 2011.
- Hu et al. (2007), «Discovering Simple Mappings Between Relational Database Schemas and Ontologies», In Proc. of 6th International Semantic Web Conference (ISWC 2007), 2nd Asian Semantic Web Conference (ASWC 2007), LNCS 4825, pages 225‐238, Busan, Korea, 11‐15 November 2007. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.97.6934&rep=rep1&type=pdf [ 15 жовтня 2012 у Wayback Machine.]
- R. Ghawi and N. Cullot (2007), «Database-to-Ontology Mapping Generation for Semantic Interoperability». In Third International Workshop on Database Interoperability (InterDB 2007). http://le2i.cnrs.fr/IMG/publications/InterDB07-Ghawi.pdf [ 4 березня 2016 у Wayback Machine.]
- Li et al. (2005) «A Semi-automatic Ontology Acquisition Method for the Semantic Web», WAIM, volume 3739 of Lecture Notes in Computer Science, page 209—220. Springer. http://dx.doi.org/10.1007/11563952_19 [ 26 липня 2008 у Wayback Machine.]
- Tirmizi et al. (2008), «Translating SQL Applications to the Semantic Web», Lecture Notes in Computer Science, Volume 5181/2008 (Database and Expert Systems Applications). http://citeseer.ist.psu.edu/viewdoc/download;jsessionid=15E8AB2A37BD06DAE59255A1AC3095F0?doi=10.1.1.140.3169&rep=rep1&type=pdf [ 4 березня 2016 у Wayback Machine.]
- Farid Cerbah (2008). «Learning Highly Structured Semantic Repositories from Relational Databases», The Semantic Web: Research and Applications, volume 5021 of Lecture Notes in Computer Science, Springer, Berlin / Heidelberg http://www.tao-project.eu/resources/publications/cerbah-learning-highly-structured-semantic-repositories-from-relational-databases.pdf [ 20 липня 2011 у Wayback Machine.]
- Wimalasuriya, Daya C.; Dou, Dejing (2010). «Ontology-based information extraction: An introduction and a survey of current approaches», Journal of Information Science, 36(3), p. 306—323, http://ix.cs.uoregon.edu/~dou/research/papers/jis09.pdf [ 11 квітня 2016 у Wayback Machine.] (retrieved: 18.06.2012).
- Cunningham, Hamish (2005). «Information Extraction, Automatic», Encyclopedia of Language and Linguistics, 2, p. 665—677, http://gate.ac.uk/sale/ell2/ie/main.pdf [ 5 березня 2016 у Wayback Machine.] (retrieved: 18.06.2012).
- Erdmann, M.; Maedche, Alexander; Schnurr, H.-P.; Staab, Steffen (2000). «From Manual to Semi-automatic Semantic Annotation: About Ontology-based Text Annotation Tools», Proceedings of the COLING, http://www.ida.liu.se/ext/epa/cis/2001/002/paper.pdf [ 3 березня 2016 у Wayback Machine.] (retrieved: 18.06.2012).
- Rao, Delip; McNamee, Paul; Dredze, Mark (2011). «Entity Linking: Finding Extracted Entities in a Knowledge Base», Multi-source, Multi-lingual Information Extraction and Summarization, http://www.cs.jhu.edu/~delip/entity-linking.pdf[недоступне посилання з березня 2019] (retrieved: 18.06.2012).
- Rocket Software, Inc. (2012). «technology for extracting intelligence from text», http://www.rocketsoftware.com/products/aerotext [ 21 червня 2013 у Wayback Machine.] (retrieved: 18.06.2012).
- Orchestr8 (2012): «AlchemyAPI Overview», http://www.alchemyapi.com/api [ 1 серпня 2013 у Wayback Machine.] (retrieved: 18.06.2012).
- The University of Sheffield (2011). «ANNIE: a Nearly-New Information Extraction System», http://gate.ac.uk/sale/tao/splitch6.html#chap:annie [ 15 березня 2016 у Wayback Machine.] (retrieved: 18.06.2012).
- ILP Network of Excellence. «ASIUM (LRI)», http://www-ai.ijs.si/~ilpnet2/systems/asium.html [ 11 червня 2017 у Wayback Machine.] (retrieved: 18.06.2012).
- Attensity (2012). «Exhaustive Extraction», http://www.attensity.com/products/technology/semantic-server/exhaustive-extraction/ [ 11 липня 2012 у Wayback Machine.] (retrieved: 18.06.2012).
- Mendes, Pablo N.; Jakob, Max; Garcia-Sílva, Andrés; Bizer; Christian (2011). «DBpedia Spotlight: Shedding Light on the Web of Documents», Proceedings of the 7th International Conference on Semantic Systems, p. 1 — 8, http://www.wiwiss.fu-berlin.de/en/institute/pwo/bizer/research/publications/Mendes-Jakob-GarciaSilva-Bizer-DBpediaSpotlight-ISEM2011.pdf [ 5 квітня 2012 у Wayback Machine.] (retrieved: 18.06.2012).
- Presutti, Valentina; Draicchio, Francesco; Gangemi, Aldo (2012). «Knowledge Extraction based on Discourse Representation Theory and Linguistic Frames», «Proceedings of the Conference on Knowledge Engineering and Knowledge Management (EKAW2012), LNCS, Springer», http://www.researchgate.net/profile/Aldo_Gangemi/publication/262175193_Knowledge_extraction_based_on_discourse_representation_theory_and_linguistic_frames/links/5488b1bb0cf268d28f08fde6.pdf (retrieved: 18.01.2015).
- Balakrishna, Mithun; Moldovan, Dan (2013). "Automatic Building of Semantically Rich Domain Models from Unstructured Data", Proceedings of the Twenty-Sixth International Florida Artificial Intelligence Research Society Conference (FLAIRS), p. 22 - 27, http://www.aaai.org/ocs/index.php/FLAIRS/FLAIRS13/paper/view/5909/6036 [ 4 березня 2016 у Wayback Machine.] (retrieved: 11.08.2014)
- 2. Moldovan, Dan; Blanco, Eduardo (2012). «Polaris: Lymba's Semantic Parser», Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC), p. 66 — 72, http://www.lrec-conf.org/proceedings/lrec2012/pdf/176_Paper.pdf [ 12 серпня 2014 у Wayback Machine.] (retrieved: 11.08.2014)
- Adrian, Benjamin; Maus, Heiko; Dengel, Andreas (2009). «iDocument: Using Ontologies for Extracting Information from Text», http://www.dfki.uni-kl.de/~maus/dok/AdrianMausDengel09.pdf [ 4 березня 2016 у Wayback Machine.] (retrieved: 18.06.2012).
- SRA International, Inc. (2012). «NetOwl Extractor», http://www.sra.com/netowl/entity-extraction/ [ 24 вересня 2012 у Wayback Machine.] (retrieved: 18.06.2012).
- Fortuna, Blaz; Grobelnik, Marko; Mladenic, Dunja (2007). «OntoGen: Semi-automatic Ontology Editor», Proceedings of the 2007 conference on Human interface, Part 2, p. 309—318, http://analytics.ijs.si/~blazf/papers/OntoGen2_HCII2007.pdf [ 18 вересня 2013 у Wayback Machine.] (retrieved: 18.06.2012).
- Missikoff, Michele; Navigli, Roberto; Velardi, Paola (2002). «Integrated Approach to Web Ontology Learning and Engineering», Computer, 35(11), p. 60 — 63, http://wwwusers.di.uniroma1.it/~velardi/IEEE_C.pdf [ 19 травня 2017 у Wayback Machine.] (retrieved: 18.06.2012).
- McDowell, Luke K.; Cafarella, Michael (2006). «Ontology-driven Information Extraction with OntoSyphon», Proceedings of the 5th international conference on The Semantic Web, p. 428—444, http://turing.cs.washington.edu/papers/iswc2006McDowell-final.pdf [ 10 березня 2016 у Wayback Machine.] (retrieved: 18.06.2012).
- Yildiz, Burcu; Miksch, Silvia (2007). «ontoX — A Method for Ontology-Driven Information Extraction», Proceedings of the 2007 international conference on Computational science and its applications, 3, p. 660—673, http://publik.tuwien.ac.at/files/pub-inf_4769.pdf [ 5 липня 2017 у Wayback Machine.] (retrieved: 18.06.2012).
- semanticweb.org (2011). «PoolParty Extractor», http://semanticweb.org/wiki/PoolParty_Extractor [ 4 березня 2016 у Wayback Machine.] (retrieved: 18.06.2012).
- IMT Holdings, Corp (2013). «Rosoka», http://www.rosoka.com/content/capabilities [ 10 травня 2016 у Wayback Machine.] (retrieved: 08.08.2013).
- Dill, Stephen; Eiron, Nadav; Gibson, David; Gruhl, Daniel; Guha, R.; Jhingran, Anant; Kanungo, Tapas; Rajagopalan, Sridhar; Tomkins, Andrew; Tomlin, John A.; Zien, Jason Y. (2003). «SemTag and Seeker: Bootstraping the Semantic Web via Automated Semantic Annotation», Proceedings of the 12th international conference on World Wide Web, p. 178—186, http://www2003.org/cdrom/papers/refereed/p831/p831-dill.html [ 11 червня 2017 у Wayback Machine.] (retrieved: 18.06.2012).
- Uren, Victoria; Cimiano, Philipp; Iria, José; Handschuh, Siegfried; Vargas-Vera, Maria; Motta, Enrico; Ciravegna, Fabio (2006). «Semantic annotation for knowledge management: Requirements and a survey of the state of the art», Web Semantics: Science, Services and Agents on the World Wide Web, 4(1), p. 14 — 28, http://staffwww.dcs.shef.ac.uk/people/J.Iria/iria_jws06.pdf[недоступне посилання з травня 2019], (retrieved: 18.06.2012).
- Cimiano, Philipp; Völker, Johanna (2005). «Text2Onto — A Framework for Ontology Learning and Data-Driven Change Discovery», Proceedings of the 10th International Conference of Applications of Natural Language to Information Systems, 3513, p. 227—238, http://www.cimiano.de/Publications/2005/nldb05/nldb05.pdf [ 14 травня 2013 у Wayback Machine.] (retrieved: 18.06.2012).
- Maedche, Alexander; Volz, Raphael (2001). «The Ontology Extraction & Maintenance Framework Text-To-Onto», Proceedings of the IEEE International Conference on Data Mining, http://users.csc.calpoly.edu/~fkurfess/Events/DM-KM-01/Volz.pdf [ 4 березня 2016 у Wayback Machine.] (retrieved: 18.06.2012).
- Machine Linking. «We connect to the Linked Open Data cloud», http://thewikimachine.fbk.eu/html/index.html [ 19 липня 2012 у Wayback Machine.] (retrieved: 18.06.2012).
- Inxight Federal Systems (2008). «Inxight ThingFinder and ThingFinder Professional», http://inxightfedsys.com/products/sdks/tf/ [ 29 червня 2012 у Wayback Machine.] (retrieved: 18.06.2012).
- Frawley William. F. et al. (1992), «Knowledge Discovery in Databases: An Overview», AI Magazine (Vol 13, No 3), 57-70 (online full version: http://www.aaai.org/ojs/index.php/aimagazine/article/viewArticle/1011 [ 4 березня 2016 у Wayback Machine.])
- Fayyad U. et al. (1996), «From Data Mining to Knowledge Discovery in Databases», AI Magazine (Vol 17, No 3), 37-54 (online full version: http://www.aaai.org/ojs/index.php/aimagazine/article/viewArticle/1230 [ 4 травня 2016 у Wayback Machine.]
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Cya stattya ye sirim perekladom z inshoyi movi Mozhlivo vona stvorena za dopomogoyu mashinnogo perekladu abo perekladachem yakij nedostatno volodiye oboma movami Bud laska dopomozhit polipshiti pereklad listopad 2016 Cyu stattyu treba vikifikuvati dlya vidpovidnosti standartam yakosti Vikipediyi Bud laska dopomozhit dodavannyam dorechnih vnutrishnih posilan abo vdoskonalennyam rozmitki statti traven 2016 Cya stattya mistit tekst sho ne vidpovidaye enciklopedichnomu stilyu Bud laska dopomozhit udoskonaliti cyu stattyu pogodivshi stil vikladu zi stilistichnimi pravilami Vikipediyi Mozhlivo storinka obgovorennya mistit zauvazhennya shodo potribnih zmin traven 2016 Vidobuvannya znan angl knowledge extraction ros izvlechenie znanij ye stvorennya znan zi strukturovanih relyacijnih baz danih XML i nestrukturovanih teksti dokumenti zobrazhennya dzherel Otrimane znannya povinno buti zberezhene u formati pridatnomu dlya avtomatichnogo chitannya ta interpretaciyi Takozh znannya povinni buti predstavleni takim chinom shob polegshiti logichnij visnovok Popri te sho ce metodichno shozhe na vidobuvannya informaciyi angl Data Mining NLP i ETL zberigannya danih osnovnimi kriteriyami ye te sho rezultat vidobuvannya vihodit za ramki stvorennya strukturovanoyi informaciyi abo peretvorennya yiyi v relyacijnu shemu Ce vimagaye abo povtornogo vikoristannya nayavnih formalnih znan povtorne vikoristannya identifikatoriv abo ontologij abo generaciyu shemi sho ce na osnovi vihidnih danih Grupa RDB2RDF W3C v danij chas koli standartizuye movu dlya vidobutku RDF angl Resource Description Framework z relyacijnih baz danih She odnim populyarnim prikladom vidobutku znan ye peretvorennya Vikipediyi v strukturovani dani a takozh vidobrazhennya do nayavnih znan div DBpedia i Freebase OglyadPislya standartizaciyi mov predstavlennya znan takih yak RDF i OWL bagato doslidzhen bulo provedeno v oblasti osoblivo shodo peretvorennya relyacijnih baz danih v RDF zadachi identifikaciyi viyavlennya znan i navchannya ontologij Zagalnij proces vikoristovuye tradicijni metodi dobuvannya danih vijmannya peretvorennya i zavantazhennya ETL yaki peretvoryuyut dani z dzherel u strukturovani formati Nastupni kriteriyi mozhut buti vikoristani dlya klasifikaciyi pidhodiv v cij temi deyaki z nih vikoristovuyutsya lishe dlya vidobutku z relyacijnih baz danih Dzherelo Dzherela danih yaki vikoristovuyutsya Tekst relyacijni bazi danih XML CSVEkspoziciya V yakomu viglyadi dobuvayutsya dani fajl ontologiyi semantichna baza danih Yak mozhna zrobiti zapit Sinhronizaciya Chi vikonuyetsya proces vidobutku znan odin raz dlya otrimannya dampa abo rezultat sinhronizuyetsya z dzherelom Statichna abo dinamichna sinhronizaciya Chi zapisuyutsya zmini rezultativ nazad dvonapravlena sinhronizaciya Povtorne vikoristannya slovnikiv Instrument zdatnij povtorno vikoristovuvati nayavni slovniki pri vidobutku Napriklad stovpchik tablici FirstName mozhut buti zistavlenni z foaf firstName Deyaki avtomatichni pidhodi ne zdatni zistavlyati slovniki Avtomatizaciya Stupin v yakij vidobutok vimagaye vtruchannya avtomatizovanij Dopomoga operatora GUI napivavtomatichnij avtomatichnij Potribna ontologiya predmetnoyi oblasti Potribno pobuduvati vidobrazhennya u vzhe zadanu ontologiyu Tak chinom sho abo stvoryuyetsya vidobrazhennya abo otrimuyetsya shema z dzherela en Prikladi Zv yazuvannya ob yektiv DBpedia Spotlight en Dandelion dataTXT nedostupne posilannya Zemanta API Extractiv 29 bereznya 2017 u Wayback Machine ta PoolParty Extractor 26 chervnya 2012 u Wayback Machine analizuyut vilnij tekst cherez rozpiznavannya imenovanih sutnostej a potim usuvaye neodnoznachnist kandidativ cherez en ta pov yazuye znajdeni ob yekti zi shovishem znan DBpedia div demo Dandelion dataTXT DBpedia Spotlight abo PoolParty Extractor Prezident Obama 12 zhovtnya 2008 u Wayback Machine u seredu zaklikav Kongres prodovzhiti podatkovi pilgi dlya studentiv vklyuchenih do ekonomichnih stimuliv u minulomu roci stverdzhuyuchi sho politika zabezpechuye bilsh shedru dopomogu Yak prezident Obama pov yazanij z resursom DBpedia en dodatkova informaciya mozhe buti otrimana avtomatichno i en mozhe napriklad zrobiti visnovok sho zgadana osoba maye tip osobi z vikoristannyam FOAF programne zabezpechennya i prezidentiv tipu Spoluchenih Shtativ za dopomogoyu YAGO Prikladi Metodi yaki rozpiznayut tilki ob yekti abo posilannya na statti Vikipediyi ta inshih cilej yaki ne zabezpechuyut podalshe viluchennya strukturovanih danih i formalnih znan Relyacijni bazi danih v RDF Triplify D2R servera Ultrawrap i Virtuoso RDF Pereglyadi instrumentiv yaki transformuyut relyacijni baz danih RDF V hodi cogo procesu voni dozvolyayut povtorno vikoristovuvati isnuyuchi slovniki i ontologiyi v procesi peretvorennya Pri peretvorenni tipovih relyacijnih tablic z im yam koristuvachiv odin stovpec napriklad name abo sukupnist stovpciv napriklad first name i last name povinen nadati URI stvorenogo ob yekta Zazvichaj vikoristovuyetsya pervinnij klyuch Kozhen drugij stovpec mozhe buti zaluchen yak vidnoshennya z ciyeyu organizaciyeyu Potim vikoristovuyutsya vlastivosti z formalno viznachenoyu semantikoyu i povtorno interpretuvati informaciyu Napriklad stovpec v tablici koristuvacha z im yam marriedTo mozhe buti viznachena yak simetrichne vidnoshennya i stovpchik homepage mozhe buti peretvorenij u vlasnist vid FOAF Slovnik nazivayetsya FOAF golovna storinka takim chinom kvalifikuye jogo yak funkcionalna vlastivist zvorotnogo Potim kozhen zapis tablici koristuvacha mozhe buti ekzemplyarom klasu FOAF Lyudina Ontologiya naselennya Krim znannya predmetnoyi oblasti u formi ontologiyi mozhut buti stvoreni z status id abo stvorenih vruchnu pravil yaksho status id 2 zapis vidnositsya do klasu Vchiteli abo semi avtomatichni metodi ontologiya navchannya Os priklad peretvorennya Im ya odruzhenij domashnya storinka statusPeter Mary http example org Peters page nedostupne posilannya z bereznya 2019 1Claus Eva http example org Claus page nedostupne posilannya z bereznya 2019 2 Peter marriedTo Mary marriedTo a owl SymmetricProperty Peter foaf homepage lt http example org Peters page gt Peter a foaf Person Peter a Student Claus a Teacher Vityag z strukturovanih dzherel v RDF1 1 Vidobrazhennya z tablic BD Vidi na RDF Entities Vlastivosti Znachennya Pri stvorenni vistavi RDB v problemnij oblasti vidpravnoyu tochkoyu chasto ye sutnist zv yazok diagrama ERD Yak pravilo kozhnim ob yektom predstavlenomu u viglyadi tablici bazi danih kozhnij atribut sutnosti staye stovpec v cij tablici i vidnosini mizh ob yektami poznachayutsya zovnishnimi klyuchami Kozhna tablicya yak pravilo viznachaye konkretnij klas suti kozhen stovpec odin z jogo atributiv Kozhen ryadok v tablici opisuye ekzemplyar sutnosti odnoznachno identifikuyetsya pervinnim klyuchem Ryadki tablici v sukupnosti opisuyut nabir sutnostej V ekvivalentnij RDF predstavlennya odnogo i togo zh naboru sutnostej Kozhen stovpec u tablici ye atributom tobto predikat Kozhne znachennya stovpcya ye znachennya atributa tobto ob yekt Kozhna klavisha ryadok yavlyaye soboyu identifikator ob yekta tobto sub yekt Kozhen ryadok ye ekzemplyarom sutnosti Kozhen ryadok ekzemplyar ob yekta predstavlena v RDF kolekciyeyu trijok iz zagalnim sub yektom identifikator ob yekta Takim chinom shob zrobiti ekvivalentne uyavlennya na osnovi RDF semantiki osnovne vidobrazhennya algoritmu bude viglyadati nastupnim chinom stvoriti RDFS klas dlya kozhnoyi tablici konvertuvati vsi pervinni klyuchi ta zovnishni klyuchi v IRIs priznachiti predikat IRI dlya kozhnogo stovpchika priznachiti RDF tip predikata dlya kozhnogo ryadka pov yazuyuchi jogo z ISS klasu IRI vidpovidaye tablici dlya kozhnogo stovpchika yakij ne ye ni chastinoyu pervinnogo abo zovnishnogo klyucha pobuduvati potrijnij yakij mistit pervinnij klyuch IRI yak sub yekta stovpec IRI yak predikata i znachennya stovpcya yak ob yekt Najpersha zgadka cogo osnovnogo abo pryamogo vidobrazhennya mozhna znajti v porivnyanni Tim Berners Li modeli ER do modeli RDF Skladni vidobrazhennya relyacijnih baz danih v RDF 1 1 zgaduvane vishe nadaye zastarili dani u viglyadi RDF pryamim shlyahom dodatkovi utochnennya mozhut buti vikoristani dlya pidvishennya korisnosti RDF vivedennya vidpovidnogo do Use Cases Yak pravilo vtrachayetsya informaciya v procesi peretvorennya v sutnist zv yazok diagrami ERD dlya relyacijnih tablic podrobici mozhna znajti v ob yektno relyacijnomu impedansi i povinna buti zvorotnya inzheneriya Z konceptualnoyi tochki zoru pidhodi do vidobutku mozhut nadhoditi z dvoh napryamkiv Pershij napryamok namagayetsya vityagti abo diznatisya shemu OWL z danoyi shemi bazi danih Ranni pidhodi vikoristovuvali fiksovanu kilkist stvorenih vruchnu pravil vidobrazhennya dlya utochnennya vidobrazhennya 1 1 Bilsh skladni metodi z vikoristannyam evristiki abo algoritmiv navchannya shob viklikati shematichnu informaciyu metodi perekrivatisya z navchannyam ontologij U toj chas yak deyaki pidhodi namagayutsya vityagti informaciyu zi strukturi vlastivoyi shemoyu SQL analizuyuchi napriklad zovnishni klyuchi inshi analizuyut zmist i znachennya v tablicyah dlya stvorennya konceptualnih iyerarhij napriklad stovpci z dekilkoma znachennyami ye kandidatami dlya stanovlennya kategoriyi Drugij napryamok namagayetsya vidobraziti shemu i jogo vmist vzhe isnuyuchoyi ontologiyi predmetnoyi oblasti divis takozh virivnyuvannya ontologiyi Chasto odnak vidpovidna ontologiya ne isnuye i povinen buti stvorenij pershim XML Tak yak XML strukturovana u viglyadi dereva bud yaki dani mozhut buti legko predstavleni v RDF yakij strukturovanij u viglyadi grafika XML2RDF ye odnim iz prikladiv takogo pidhodu yakij vikoristovuye RDF porozhni vuzli i peretvoryuye XML elementi i atributi vlastivostej RDF Tema odnak ye bilsh skladnim yak i v razi relyacijnih baz danih U relyacijnoyi tablici pervinnij klyuch ye idealnim kandidatom shob stati predmetom zdobutih trijok XML element odnak mozhut buti peretvoreni v zalezhnosti vid kontekstu yak sub yekt predikat abo ob yekt potrijnij XSLT mozhe buti vikoristanij standartnij movu peretvorennya vruchnu peretvoriti XML v RDF Oglyad metodiv Instrumenti Name Data Source Data Exposition Data Synchronisation Mapping Language Vocabulary Reuse Mapping Automat Req Domain Ontology Uses GUIA Direct Mapping of Relational Data to RDF 9 travnya 2016 u Wayback Machine Relational Data SPARQL ETL dynamic N A false automatic false falseCSV2RDF4LOD 22 serpnya 2016 u Wayback Machine CSV ETL static RDF true manual false falseConvert2RDF 22 veresnya 2016 u Wayback Machine Delimited text file ETL static RDF DAML true manual false trueD2R Server 26 lyutogo 2012 u Wayback Machine RDB SPARQL bi directional D2R Map true manual false falseRDB own query language dynamic Visual Tool true manual false trueDataMaster 21 travnya 2016 u Wayback Machine RDB ETL static proprietary true manual true trueCSV XML ETL static none semi automatic false trueXML ETL static xslt true manual true falseMAPONTO 2 chervnya 2016 u Wayback Machine RDB ETL static proprietary true manual true falseMETAmorphoses 17 kvitnya 2016 u Wayback Machine RDB ETL static proprietary xml based mapping language true manual false trueCSV ETL static MappingMaster true GUI false trueRDB ETL static proprietary true manual true trueCSV ETL static The RDF Data Cube Vocaublary true semi automatic false truePoolparty Extraktor PPX 26 chervnya 2012 u Wayback Machine XML Text LinkedData dynamic RDF SKOS true semi automatic true falseRDB ETL static none false automatic the user furthermore has the chance to fine tune results false trueRDF 123 20 lipnya 2011 u Wayback Machine CSV ETL static false false manual false trueRDOTE RDB ETL static SQL true manual true trueRelational OWL RDB ETL static none false automatic false falseT2LD 20 lipnya 2011 u Wayback Machine CSV ETL static false false automatic false falseMultidimensional statistical data in spreadsheets Data Cube Vocabulary true manual falseCSV ETL static SKOS false semi automatic false trueTriplify 6 sichnya 2009 u Wayback Machine RDB LinkedData dynamic SQL true manual false falseRDB SPARQL ETL dynamic R2RML true semi automatic false trueVirtuoso RDF Views 5 veresnya 2014 u Wayback Machine RDB SPARQL dynamic Meta Schema Language true semi automatic false trueVirtuoso Sponger 5 veresnya 2014 u Wayback Machine structured and semi structured data sources SPARQL dynamic Virtuoso PL amp XSLT true semi automatic false falseRDB RDQL dynamic SQL true manual true trueXLWrap Spreadsheet to RDF 8 travnya 2016 u Wayback Machine CSV ETL static TriG Syntax true manual false falseXML to RDF 11 travnya 2016 u Wayback Machine XML ETL static false false automatic false falseVityag z prirodnih dzherel moviNajbilsha chastina informaciyi sho mistitsya v biznes dokumentah blizko 80 koduyetsya prirodnoyu movoyu i otzhe nestrukturovana Oskilki nestrukturovani dani ye dosit skladnim zavdannyam dlya viluchennya znan bilsh skladni metodi neobhidni yaki yak pravilo postavlyayut girshi rezultati v porivnyanni z nestrukturovanimi danimi Potencial dlya masovogo pridbannya zdobutih znan prote povinni kompensuvati pidvishenu skladnist i znizhennya yakosti vidobutku Nadali prirodni dzherela movi rozumiyutsya yak dzherela informaciyi de dani navedeni nestrukturovanim chinom yak zvichajnij tekst Yaksho danij tekst dodatkovo vbudovanij v rozmitki dokumenta e G HTML dokument zgadani sistemi zazvichaj vidalyayut elementi rozmitki avtomatichno Tradicijne viluchennya informaciyi IE Tradicijne viluchennya informaciyi ye tehnologiyeyu obrobki prirodnoyi movi yake vityaguye informaciyu z tekstiv prirodnoyu movoyu yak pravilo i strukturi danih vidpovidnim chinom Vidi informaciyi sho pidlyagaye identifikovanogo povinni buti vkazani yak model pered pochatkom procesu tomu ves proces tradicijnogo viluchennya informaciyi zalezhnij IE rozdilenij na nastupni p yat pidzadach viznannya Nazvanij ob yekt VNO Rezolyuciya koreferentnosti RK Shablon budivelnogo elementu ShB Shablon stavlennya konstrukciyi ShS Shablon virobnictva scenarij ShV Zavdannya nazvanogo rozpiznavannya osobi ye viznati i klasifikuvati vsi nazvani ob yekti sho mistyatsya v teksti prisvoyennya imeni ob yekta do viznachenoyi kategoriyi Ce pracyuye shlyahom zastosuvannya gramatiki na osnovi metodiv abo statistichnih modelej Dozvil konferentnogsti viznachaye ekvivalentni ob yekti yaki buli viznani NEK v teksti Isnuyut dva vidi vidpovidnih vidnosin ekvivalentnosti Pershij z nih vidnositsya do vidnosin mizh dvoma riznimi predstavlenimi sub yektami napriklad IBM Europe i IBM a drugij do vidnosin mizh sub yektom i yih anaforicheskih posilan napriklad vin i IBM Obidva vidi mozhut buti viznani vidpovidno do rezolyuciyi koreferentnosti Pid chas budivnictva elementa shablonu sistema identifikuye IE opisovi vlastivosti sutnostej viznanih NEK i CO Ci vlastivosti vidpovidayut zvichajnim yakostyam yak chervonij abo velikij Shablonna konstrukciya vidnoshennya viznachaye vidnosini yaki isnuyut mizh elementami shablonu Ci vidnosini mozhut buti dekilkoh vidiv takih yak roboti z pitannya abo znahodzhennya z obmezhennyam sho obidva domeni i diapazon vidpovidayut sub yektam U shabloni scenariyu zdijsnyuyutsya podiyi yaki opisani v teksti voni budut viznacheni i strukturovani shodo osib viznanih Nyu Jorku i SO i vidnosin yaki buli viznacheni TR Ontologiya na osnovi viluchennya informaciyi OBIE Ontologiya na osnovi viluchennya informaciyi ye polem viluchennya informaciyi za dopomogoyu yakoyi shonajmenshe odna ontologiya vikoristovuyetsya dlya upravlinnya procesom dobuvannya informaciyi z tekstiv prirodnoyu movoyu Sistema OBIE vikoristovuye metodi tradicijnoyi viluchennya informaciyi dlya identifikaciyi ponyat ekzemplyari i vidnosini vikoristovuvanih ontologij v teksti yaki budut strukturovani z ontologiyeyu pislya procesu Takim chinom vhidna ontologiya ye modellyu informaciyi yaku neobhidno vityagti Ontologiya navchannya ON Vivchennya Ontologiyi ye avtomatichnim abo napivavtomatichnim stvorennya ontologij vklyuchayuchi vityag terminiv vidpovidnoyi oblasti vid prirodnogo tekstu movi Oskilki budivlya ontologij vruchnu ye nadzvichajno trudomistkim i zajmaye bagato chasu ye velika motivaciya dlya avtomatizaciyi procesu Semantichna anotaciya SA Pid chas semantichnoyi anotaciyi tekst prirodnoyu movoyu dopovnyuyetsya metadanimi chasto predstavleni v RDFa yaki povinni skladati semantiku terminiv sho mistyatsya mashini zrozumilim U comu procesi yakij yak pravilo napivavtomatichna znannya vidobuvayetsya v tomu sensi sho zv yazok mizh leksichnih terminiv i ponyat napriklad z ontologiyeyu vstanovlyuyetsya Takim chinom znannya zdobuvayetsya sho znachennya termina v obroblenomu konteksti buv priznachenij i otzhe sens tekstu gruntuyetsya na mashinozchituvanih danih z mozhlivistyu zrobiti visnovki Semantichne anotuvannya yak pravilo rozdileni na nastupni dvi pidzadachi ekstrakciya Terminologiya Ob yekt zv yazuvannya Na rivni viluchennya terminologiyi leksichni termini z tekstu vityaguyutsya Dlya ciyeyi meti tokenizator viznachaye spochatku kordoni sliv i virishuye skorochiti Zgodom termini z tekstu yaki vidpovidayut koncepciyi vityaguyutsya za dopomogoyu leksikonu predmetno oriyentovanogo shob zv yazati ci po suti posilannya Po suti pov yazuyuchi zv yazok mizh vidobutih leksichnih terminiv z vihidnogo tekstu i ponyat z ontologiyi abo bazi znan takih yak vstanovleno DBpedia Dlya cogo kandidati koncepciyi viyavlyayutsya vidpovidno v dekilkoh znachennyah termina za dopomogoyu leksikonu I nareshti kontekst terminiv analizuyetsya z metoyu viznachennya najbilsh pidhodyashoyi odnoznachnisti i priznachiti termin dlya pravilnoyi koncepciyi instrumenti Nastupni kriteriyi mozhut buti vikoristani dlya klasifikaciyi instrumentiv yaki vityaguyut znannya z tekstiv prirodnoyu movoyu Dzherelo Yaki formati vvedennya mozhut buti obrobleni za dopomogoyu instrumentu napriklad prostij tekst HTML abo PDF Dostup do Paradigm Chi mozhe instrument zapituvati dzherela danih abo potrebuye cilogo dampa dlya procesu ekstrakciyi Sinhronizaciya danih Ye rezultatom procesu ekstrakciyi sinhronizovanij z dzherelom Vikoristannya Output Ontology Chi zv yazani instrument rezultat z ontologiyeyu Mapping Avtomatizaciya Yak ce avtomatizovanij proces ekstrakciyi ruchnij napivavtomatichnij abo avtomatichnij vimagaye Ontologiya Chi potribno instrument ontologiyi dlya viluchennya Vikoristannya grafichnogo interfejsu koristuvacha Chi nadaye instrument grafichnij interfejs koristuvacha Pidhid Yakij pidhid IS OBIE PR abo SA vikoristovuyetsya instrumentom Vityagnuti Sutnosti Yaki tipi sutnostej napriklad nazvani osobi ponyattya abo vidnoshennya mozhut buti vilucheni za dopomogoyu instrumentu Zastosovuvani metodi Yaki metodi zastosovuyutsya napriklad NLP statistichni metodi klasterizaciya abo mashinnogo navchannya Vihid modeli Yaka model vikoristovuyetsya dlya predstavlennya rezultatu instrumentu e G RDF abo OWL Pidtrimuvani domeni Yaki domeni pidtrimuyutsya napriklad ekonomika abo biologiya Pidtrimuvani Movi Yaki movi mozhut buti obrobleni napriklad anglijsku chi nimecku U navedenij nizhche tablici harakterizuyetsya deyaki instrumenti dlya zdobuttya znan z prirodnih dzherel movi Nazva Dzherelo dostup do Paradigm Data Synchronization Uses Output Ontology Mapping Automation Requires Ontology Uses GUI Approach Extracted Entities Applied Techniques Output Model Supported Domains Supported Languagesplain text HTML XML SGML dump no yes automatic yes yes IE named entities relationships events linguistic rules proprietary domain independent English Spanish Arabic Chinese indonesianAlchemyAPI 1 serpnya 2013 u Wayback Machine plain text HTML automatic yes SA multilingualANNIE 15 bereznya 2016 u Wayback Machine 15 bereznya 2016 u Wayback Machine plain text dump yes yes IE finite state algorithms multilingualASIUM 11 chervnya 2017 u Wayback Machine 11 chervnya 2017 u Wayback Machine plain text dump semi automatic yes OL concepts concept hierarchy NLP clusteringautomatic IE named entities relationships events NLPDandelion API 28 travnya 2016 u Wayback Machine plain text HTML URL REST no no automatic no yes SA named entities concepts statistical methods JSON domain independent multilingualplain text HTML dump SPARQL yes yes automatic no yes SA annotation to each word annotation to non stopwords NLP statistical methods machine learning RDFa domain independent EnglishEntityClassifier eu 3 bereznya 2016 u Wayback Machine plain text HTML dump yes yes automatic no yes IE OL SA annotation to each word annotation to non stopwords rule based grammar XML domain independent English German DutchFRED 8 travnya 2016 u Wayback Machine 8 travnya 2016 u Wayback Machine plain text PDF and Word via Sheldon 20 travnya 2016 u Wayback Machine dump REST yes automatic no yes OL IE SA concepts concept hierarchy frames events relationships named entities negation modality tense entity linking schema alignment sentiment via Sentilo 18 chervnya 2016 u Wayback Machine NLP SPARQL heuristical rules ontology design patterns RDF OWL Turtle NT JSON LD DAG diagrams domain independent English multilingual inputplain text HTML XML PDF MS Office e mail dump SPARQL yes yes automatic no yes IE OL SA concepts named entities instances concept hierarchy generic relationships user defined relationships events modality tense entity linking event linking sentiment NLP machine learning heuristic rules RDF OWL proprietary XML domain independent English SpanishiDocument 21 chervnya 2021 u Wayback Machine HTML PDF DOC SPARQL yes yes OBIE instances property values NLP personal businessNetOwl Extractor 9 kvitnya 2016 u Wayback Machine 9 kvitnya 2016 u Wayback Machine plain text HTML XML SGML PDF MS Office dump No Yes Automatic yes Yes IE named entities relationships events NLP XML JSON RDF OWL others multiple domains English Arabic Chinese Simplified and Traditional French Korean Persian Farsi and Dari Russian SpanishOntoGen 30 bereznya 2010 u Wayback Machine 30 bereznya 2010 u Wayback Machine semi automatic yes OL concepts concept hierarchy non taxonomic relations instances NLP machine learning clusteringOntoLearn 9 serpnya 2017 u Wayback Machine 9 serpnya 2017 u Wayback Machine plain text HTML dump no yes automatic yes no OL concepts concept hierarchy instances NLP statistical methods proprietary domain independent EnglishOntoLearn Reloaded 4 bereznya 2016 u Wayback Machine plain text HTML dump no yes automatic yes no OL concepts concept hierarchy instances NLP statistical methods proprietary domain independent EnglishOntoSyphon 10 bereznya 2016 u Wayback Machine 10 bereznya 2016 u Wayback Machine HTML PDF DOC dump search engine queries no yes automatic yes no OBIE concepts relations instances NLP statistical methods RDF domain independent EnglishontoX 27 travnya 2016 u Wayback Machine plain text dump no yes semi automatic yes no OBIE instances datatype property values heuristic based methods proprietary domain independent language independentOpenCalais 24 zhovtnya 2008 u Wayback Machine plain text HTML XML dump no yes automatic yes no SA annotation to entities annotation to events annotation to facts NLP machine learning RDF domain independent English French SpanishPoolParty Extractor 17 travnya 2016 u Wayback Machine 17 travnya 2016 u Wayback Machine plain text HTML DOC ODT dump no yes automatic yes yes OBIE named entities concepts relations concepts that categorize the text enrichments NLP machine learning statistical methods RDF OWL domain independent English German Spanish FrenchRosoka 10 travnya 2016 u Wayback Machine 10 travnya 2016 u Wayback Machine plain text HTML XML SGML PDF MS Office dump Yes Yes Automatic no Yes IE named entities relationships attributes concepts NLP XML JSON RDF others multiple domains Multilingual 230 SCOOBIE 11 chervnya 2018 u Wayback Machine plain text HTML dump no yes automatic no no OBIE instances property values RDFS types NLP machine learning RDF RDFa domain independent English GermanSemTag 11 chervnya 2017 u Wayback Machine 11 chervnya 2017 u Wayback Machine HTML dump no yes automatic yes no SA machine learning database record domain independent language independentsmart FIX 17 travnya 2016 u Wayback Machine plain text HTML PDF DOC e Mail dump yes no automatic no yes OBIE named entities NLP machine learning proprietary domain independent English German French Dutch polishText2Onto 2 travnya 2016 u Wayback Machine 2 travnya 2016 u Wayback Machine plain text HTML PDF dump yes no semi automatic yes yes OL concepts concept hierarchy non taxonomic relations instances axioms NLP statistical methods machine learning rule based methods OWL deomain independent English German SpanishText To Onto 15 travnya 2013 u Wayback Machine 15 travnya 2013 u Wayback Machine plain text HTML PDF PostScript dump semi automatic yes yes OL concepts concept hierarchy non taxonomic relations lexical entities referring to concepts lexical entities referring to relations NLP machine learning clustering statistical methods GermanThatNeedle 13 travnya 2016 u Wayback Machine Plain Text dump automatic no concepts relations hierarchy NLP proprietary JSON multiple domains Englishplain text HTML PDF DOC dump no yes automatic yes yes SA annotation to proper nouns annotation to common nouns machine learning RDFa domain independent English German Spanish French Portuguese Italian RussianIE named entities relationships events multilingualViyavlennya znanViyavlennya znan opisuye proces avtomatichnogo poshuku velikih obsyagiv danih dlya modelej yaki mozhna vvazhati znannya pro dani Vin chasto opisuyetsya yak viluchennya znan z vhidnih danih Viyavlennya znan rozvinulasya z oblasti intelektualnogo analizu danih a takozh tisno pov yazana z neyu yak z tochki zoru metodologiyi ta terminologiyi Najbilsh vidoma gilka intelektualnogo analizu danih ye viyavlennya znan takozh vidomij yak viyavlennya znan v bazah danih KDD Tak samo yak i bagato inshih form viyavlennya znan stvoryuye abstrakciyi vhidnih danih Znannya otrimani v procesi mozhut stati dodatkovi dani yaki mozhut buti vikoristani dlya podalshogo vikoristannya i vidkrittya Chasto rezultati vid viyavlennya znan ne diyevi vidkrittya znannya diyevi takozh vidomij yak domen privodom intelektualnogo analizu danih maye na meti viyaviti ta dostaviti diyevi znannya ta ideyi Inshim perspektivnim zastosuvannya viyavlennya znan v oblasti modernizaciyi programnogo zabezpechennya viyavlennya slabkosti i dotrimannya yakih peredbachaye rozuminnya isnuyuchih programnih artefaktiv Cej proces pov yazanij z koncepciyeyu zvorotnoyi inzheneriyi Yak pravilo znannya otrimani z isnuyuchogo programnogo zabezpechennya predstavleni u viglyadi modelej v yakij konkretni zapiti mozhut buti zrobleni pri potrebi Vidnosini suti ye najchastishim formatom predstavlennya znan otrimanih z isnuyuchogo programnogo zabezpechennya Ob yekt Management Group OMG rozrobila specifikaciyi znannya Discovery Metamodel KDM yakij viznachaye ontologiyu dlya zasobiv programnogo zabezpechennya ta yih vidnosin z metoyu vikonannya viyavlennya znan vsi nayavni kodi Viyavlennya znan z isnuyuchih programnih sistem takozh vidomij yak programne zabezpechennya vidobutku korisnih kopalin tisno pov yazana z vidobutkom korisnih kopalin danih oskilki isnuyuchi programni artefakti mistyat velichezne znachennya dlya upravlinnya rizikami ta vartosti biznesu klyuch dlya ocinki ta rozvitku programnih sistem Zamist togo shob vidobutok okremih naboriv danih girnichodobuvnoyi promislovosti programnogo zabezpechennya fokusuyetsya na metadanih takih yak potoki procesu napriklad potoki danih potoki upravlinnya amp nazvati karti arhitektura shemi baz danih i biznes pravila umovi procesu Vhidni dani bazi danih relyacijni dani baza danih skladskij dokument Informacijne shovishe programne zabezpechennya vihidni dani fajli konfiguraciyi pobudova scenariyiv Tekst koncepciya girnichodobuvnoyi promislovosti diagrami molekula sens poslidovnosti vidobutok potoku danih Navchannya vid zminyuyutsya v chasi potokiv danih v ramkah koncepciyi drejfu Vebvihidni formati Model danih Metadani metamodeli ontologiya uyavlennya znan tegi znan biznes pravila Znannya Discovery Metamodel KDM Modelyuvannya biznes procesiv notaciya BPMN promizhne predstavlennya Resource Description Framework RDF metriki programnogo zabezpechennyaDiv takozhklasterizaciya arheologiya danih Vidobutok danih intelektualnogo analizu danih domenu privodom Intelektualnogo analizu danih v silskomu gospodarstvi Vityag peretvorennya zavantazhennya informaciya Vidobutok Podannya znan i visnovok Semantichna merezhaPrimitkiRDB2RDF Working Group Website http www w3 org 2001 sw rdb2rdf 11 travnya 2016 u Wayback Machine charter http www w3 org 2009 08 rdb2rdf charter 20 bereznya 2016 u Wayback Machine R2RML RDB to RDF Mapping Language http www w3 org TR r2rml 10 zhovtnya 2021 u Wayback Machine LOD2 EU Deliverable 3 1 1 Knowledge Extraction from Structured Sources http static lod2 eu Deliverables deliverable 3 1 1 pdf 27 serpnya 2011 u Wayback Machine www opencalais com Arhiv originalu za 24 listopada 2009 Procitovano 10 listopada 2009 Wikipedia has a Linked Data twin called DBpedia DBpedia has the same structured information as Wikipedia but translated into a machine readable format Tim Berners Lee 1998 Relational Databases on the Semantic Web 16 bereznya 2016 u Wayback Machine Retrieved February 20 2011 Hu et al 2007 Discovering Simple Mappings Between Relational Database Schemas and Ontologies In Proc of 6th International Semantic Web Conference ISWC 2007 2nd Asian Semantic Web Conference ASWC 2007 LNCS 4825 pages 225 238 Busan Korea 11 15 November 2007 http citeseerx ist psu edu viewdoc download doi 10 1 1 97 6934 amp rep rep1 amp type pdf 15 zhovtnya 2012 u Wayback Machine R Ghawi and N Cullot 2007 Database to Ontology Mapping Generation for Semantic Interoperability In Third International Workshop on Database Interoperability InterDB 2007 http le2i cnrs fr IMG publications InterDB07 Ghawi pdf 4 bereznya 2016 u Wayback Machine Li et al 2005 A Semi automatic Ontology Acquisition Method for the Semantic Web WAIM volume 3739 of Lecture Notes in Computer Science page 209 220 Springer http dx doi org 10 1007 11563952 19 26 lipnya 2008 u Wayback Machine Tirmizi et al 2008 Translating SQL Applications to the Semantic Web Lecture Notes in Computer Science Volume 5181 2008 Database and Expert Systems Applications http citeseer ist psu edu viewdoc download jsessionid 15E8AB2A37BD06DAE59255A1AC3095F0 doi 10 1 1 140 3169 amp rep rep1 amp type pdf 4 bereznya 2016 u Wayback Machine Farid Cerbah 2008 Learning Highly Structured Semantic Repositories from Relational Databases The Semantic Web Research and Applications volume 5021 of Lecture Notes in Computer Science Springer Berlin Heidelberg http www tao project eu resources publications cerbah learning highly structured semantic repositories from relational databases pdf 20 lipnya 2011 u Wayback Machine Wimalasuriya Daya C Dou Dejing 2010 Ontology based information extraction An introduction and a survey of current approaches Journal of Information Science 36 3 p 306 323 http ix cs uoregon edu dou research papers jis09 pdf 11 kvitnya 2016 u Wayback Machine retrieved 18 06 2012 Cunningham Hamish 2005 Information Extraction Automatic Encyclopedia of Language and Linguistics 2 p 665 677 http gate ac uk sale ell2 ie main pdf 5 bereznya 2016 u Wayback Machine retrieved 18 06 2012 Erdmann M Maedche Alexander Schnurr H P Staab Steffen 2000 From Manual to Semi automatic Semantic Annotation About Ontology based Text Annotation Tools Proceedings of the COLING http www ida liu se ext epa cis 2001 002 paper pdf 3 bereznya 2016 u Wayback Machine retrieved 18 06 2012 Rao Delip McNamee Paul Dredze Mark 2011 Entity Linking Finding Extracted Entities in a Knowledge Base Multi source Multi lingual Information Extraction and Summarization http www cs jhu edu delip entity linking pdf nedostupne posilannya z bereznya 2019 retrieved 18 06 2012 Rocket Software Inc 2012 technology for extracting intelligence from text http www rocketsoftware com products aerotext 21 chervnya 2013 u Wayback Machine retrieved 18 06 2012 Orchestr8 2012 AlchemyAPI Overview http www alchemyapi com api 1 serpnya 2013 u Wayback Machine retrieved 18 06 2012 The University of Sheffield 2011 ANNIE a Nearly New Information Extraction System http gate ac uk sale tao splitch6 html chap annie 15 bereznya 2016 u Wayback Machine retrieved 18 06 2012 ILP Network of Excellence ASIUM LRI http www ai ijs si ilpnet2 systems asium html 11 chervnya 2017 u Wayback Machine retrieved 18 06 2012 Attensity 2012 Exhaustive Extraction http www attensity com products technology semantic server exhaustive extraction 11 lipnya 2012 u Wayback Machine retrieved 18 06 2012 Mendes Pablo N Jakob Max Garcia Silva Andres Bizer Christian 2011 DBpedia Spotlight Shedding Light on the Web of Documents Proceedings of the 7th International Conference on Semantic Systems p 1 8 http www wiwiss fu berlin de en institute pwo bizer research publications Mendes Jakob GarciaSilva Bizer DBpediaSpotlight ISEM2011 pdf 5 kvitnya 2012 u Wayback Machine retrieved 18 06 2012 Presutti Valentina Draicchio Francesco Gangemi Aldo 2012 Knowledge Extraction based on Discourse Representation Theory and Linguistic Frames Proceedings of the Conference on Knowledge Engineering and Knowledge Management EKAW2012 LNCS Springer http www researchgate net profile Aldo Gangemi publication 262175193 Knowledge extraction based on discourse representation theory and linguistic frames links 5488b1bb0cf268d28f08fde6 pdf retrieved 18 01 2015 Balakrishna Mithun Moldovan Dan 2013 Automatic Building of Semantically Rich Domain Models from Unstructured Data Proceedings of the Twenty Sixth International Florida Artificial Intelligence Research Society Conference FLAIRS p 22 27 http www aaai org ocs index php FLAIRS FLAIRS13 paper view 5909 6036 4 bereznya 2016 u Wayback Machine retrieved 11 08 2014 2 Moldovan Dan Blanco Eduardo 2012 Polaris Lymba s Semantic Parser Proceedings of the Eight International Conference on Language Resources and Evaluation LREC p 66 72 http www lrec conf org proceedings lrec2012 pdf 176 Paper pdf 12 serpnya 2014 u Wayback Machine retrieved 11 08 2014 Adrian Benjamin Maus Heiko Dengel Andreas 2009 iDocument Using Ontologies for Extracting Information from Text http www dfki uni kl de maus dok AdrianMausDengel09 pdf 4 bereznya 2016 u Wayback Machine retrieved 18 06 2012 SRA International Inc 2012 NetOwl Extractor http www sra com netowl entity extraction 24 veresnya 2012 u Wayback Machine retrieved 18 06 2012 Fortuna Blaz Grobelnik Marko Mladenic Dunja 2007 OntoGen Semi automatic Ontology Editor Proceedings of the 2007 conference on Human interface Part 2 p 309 318 http analytics ijs si blazf papers OntoGen2 HCII2007 pdf 18 veresnya 2013 u Wayback Machine retrieved 18 06 2012 Missikoff Michele Navigli Roberto Velardi Paola 2002 Integrated Approach to Web Ontology Learning and Engineering Computer 35 11 p 60 63 http wwwusers di uniroma1 it velardi IEEE C pdf 19 travnya 2017 u Wayback Machine retrieved 18 06 2012 McDowell Luke K Cafarella Michael 2006 Ontology driven Information Extraction with OntoSyphon Proceedings of the 5th international conference on The Semantic Web p 428 444 http turing cs washington edu papers iswc2006McDowell final pdf 10 bereznya 2016 u Wayback Machine retrieved 18 06 2012 Yildiz Burcu Miksch Silvia 2007 ontoX A Method for Ontology Driven Information Extraction Proceedings of the 2007 international conference on Computational science and its applications 3 p 660 673 http publik tuwien ac at files pub inf 4769 pdf 5 lipnya 2017 u Wayback Machine retrieved 18 06 2012 semanticweb org 2011 PoolParty Extractor http semanticweb org wiki PoolParty Extractor 4 bereznya 2016 u Wayback Machine retrieved 18 06 2012 IMT Holdings Corp 2013 Rosoka http www rosoka com content capabilities 10 travnya 2016 u Wayback Machine retrieved 08 08 2013 Dill Stephen Eiron Nadav Gibson David Gruhl Daniel Guha R Jhingran Anant Kanungo Tapas Rajagopalan Sridhar Tomkins Andrew Tomlin John A Zien Jason Y 2003 SemTag and Seeker Bootstraping the Semantic Web via Automated Semantic Annotation Proceedings of the 12th international conference on World Wide Web p 178 186 http www2003 org cdrom papers refereed p831 p831 dill html 11 chervnya 2017 u Wayback Machine retrieved 18 06 2012 Uren Victoria Cimiano Philipp Iria Jose Handschuh Siegfried Vargas Vera Maria Motta Enrico Ciravegna Fabio 2006 Semantic annotation for knowledge management Requirements and a survey of the state of the art Web Semantics Science Services and Agents on the World Wide Web 4 1 p 14 28 http staffwww dcs shef ac uk people J Iria iria jws06 pdf nedostupne posilannya z travnya 2019 retrieved 18 06 2012 Cimiano Philipp Volker Johanna 2005 Text2Onto A Framework for Ontology Learning and Data Driven Change Discovery Proceedings of the 10th International Conference of Applications of Natural Language to Information Systems 3513 p 227 238 http www cimiano de Publications 2005 nldb05 nldb05 pdf 14 travnya 2013 u Wayback Machine retrieved 18 06 2012 Maedche Alexander Volz Raphael 2001 The Ontology Extraction amp Maintenance Framework Text To Onto Proceedings of the IEEE International Conference on Data Mining http users csc calpoly edu fkurfess Events DM KM 01 Volz pdf 4 bereznya 2016 u Wayback Machine retrieved 18 06 2012 Machine Linking We connect to the Linked Open Data cloud http thewikimachine fbk eu html index html 19 lipnya 2012 u Wayback Machine retrieved 18 06 2012 Inxight Federal Systems 2008 Inxight ThingFinder and ThingFinder Professional http inxightfedsys com products sdks tf 29 chervnya 2012 u Wayback Machine retrieved 18 06 2012 Frawley William F et al 1992 Knowledge Discovery in Databases An Overview AI Magazine Vol 13 No 3 57 70 online full version http www aaai org ojs index php aimagazine article viewArticle 1011 4 bereznya 2016 u Wayback Machine Fayyad U et al 1996 From Data Mining to Knowledge Discovery in Databases AI Magazine Vol 17 No 3 37 54 online full version http www aaai org ojs index php aimagazine article viewArticle 1230 4 travnya 2016 u Wayback Machine