Sketch Engine (англ. Sketch — ескіз; англ. Engine — двигун) — це програмне забезпечення для керування корпусами текстів та для аналізу текстів, розроблене компанією Lexical Computing Limited [ 9 квітня 2022 у Wayback Machine.] з 2003 року. Його мета — надати людям, які вивчають мовну поведінку (лексикографам, дослідникам з корпусної лінгвістики, перекладачам або тим, хто вивчає мову), можливість здійснювати пошук у великих текстових колекціях, роблячи складні та лінгвістично спрямовані пошукові запити. Sketch Engine отримав свою назву на честь однієї з ключових функцій, "нарис слова" ([en]): односторінковий, автоматичний підсумок граматичної та розмовної поведінки слова у даному корпусі текстів. Наразі він підтримує та надає корпуси понад 90 мовами.
Тип | програмне забезпечення |
---|---|
Мова програмування | |
Вебсайт | sketchengine.co.uk |
|
Історія розвитку
Sketch Engine є продуктом компанії Lexical Computing Limited, заснованої в 2003-му році лексикографом і науковцем Адамом Кілгарріффом. Він розпочав співпрацю з Павлом Рихли, вченим-комп'ютерником, який працює в Центрі обробки природних мов при Університеті Масарика і розробником Manatee і Bonito (двох основних частин програмного пакета), і представив концепцію нарисів слова (англ. word sketches).
З того часу Sketch Engine є комерційним програмним забезпеченням, однак усі основні функції Manatee і Bonito, які були розроблені до 2003 року (і відтоді розширені), є вільно доступними за ліцензією GPL у пакеті NoSketch Engine. [ 7 травня 2016 у Wayback Machine.][]
Особливості
- Нарис слова ([en]) – автоматичний підсумок граматичної та розмовної поведінки слова на одній сторінці
- Різниця в word sketch — порівнює та протиставляє два слова, аналізуючи їхнє зіставлення
- Розповсюджуваний Thesaurus — автоматизований тезаурус, який знаходить слова з подібним значенням або з'являються в тому ж/подібному контексті
- Пошук узгодженості — знаходить приклади словоформи, леми, фрази, тегу або складної структури
- Пошук спільної локації — аналіз спільної зустрічальності слів із відображенням найчастіших слів (до пошукового слова), які можна розглядати як кандидатів на збіг
- Списки слів — створює списки частот, які можна фільтрувати за складними критеріями
- n-grams — генерує частотні списки багатослівних виразів
- Термінологія / Вилучення ключових слів (як одномовних, так і двомовних) — автоматичне вилучення ключових слів і термінів із кількох слів із текстів (на основі частоти та лінгвістичних критеріїв)
- Діахронічний аналіз (Trends) — виявлення слів, частота вживання яких змінюється з часом (показати популярні слова)
- Побудова корпусу та керування ним — створюйте корпуси з Інтернету або завантажуйте тексти, включаючи тегування частини мови та лематизація, які можна використовувати як програмне забезпечення для аналізу даних
- Паралельний корпус (двомовний) — пошук прикладів перекладу (корпус EUR-Lex, корпус Europarl, корпус OPUS тощо) або створення паралельного корпусу з власних вирівняних текстів.
Опис
Sketch Engine складається з трьох основних компонентів: базової системи керування базою даних під назвою Manatee, веб-інтерфейсу пошуку під назвою Bonito та веб-інтерфейсу для створення корпусу та керування ним під назвою Corpus Architect.
Примітки
- . Lexical Computing (брит.). Архів оригіналу за 9 квітня 2022. Процитовано 2 травня 2022.
- Adam Kilgarriff. Wikipedia (англ.). 7 квітня 2022. Процитовано 2 травня 2022.
- Masaryk University. Wikipedia (англ.). 13 квітня 2022. Процитовано 2 травня 2022.
Посилання
- Список корпусів, доступних у Sketch Engine [ 31 березня 2022 у Wayback Machine.]
- www.sketchengine.eu — офіційний сайт «Sketch Engine».
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Sketch Engine angl Sketch eskiz angl Engine dvigun ce programne zabezpechennya dlya keruvannya korpusami tekstiv ta dlya analizu tekstiv rozroblene kompaniyeyu Lexical Computing Limited 9 kvitnya 2022 u Wayback Machine z 2003 roku Jogo meta nadati lyudyam yaki vivchayut movnu povedinku leksikografam doslidnikam z korpusnoyi lingvistiki perekladacham abo tim hto vivchaye movu mozhlivist zdijsnyuvati poshuk u velikih tekstovih kolekciyah roblyachi skladni ta lingvistichno spryamovani poshukovi zapiti Sketch Engine otrimav svoyu nazvu na chest odniyeyi z klyuchovih funkcij naris slova en odnostorinkovij avtomatichnij pidsumok gramatichnoyi ta rozmovnoyi povedinki slova u danomu korpusi tekstiv Narazi vin pidtrimuye ta nadaye korpusi ponad 90 movami Sketch EngineTipprogramne zabezpechennyaMova programuvannyaC Vebsajtsketchengine co uk Mediafajli u VikishovishiIstoriya rozvitkuSketch Engine ye produktom kompaniyi Lexical Computing Limited zasnovanoyi v 2003 mu roci leksikografom i naukovcem Adamom Kilgarriffom Vin rozpochav spivpracyu z Pavlom Rihli vchenim komp yuternikom yakij pracyuye v Centri obrobki prirodnih mov pri Universiteti Masarika i rozrobnikom Manatee i Bonito dvoh osnovnih chastin programnogo paketa i predstaviv koncepciyu narisiv slova angl word sketches Z togo chasu Sketch Engine ye komercijnim programnim zabezpechennyam odnak usi osnovni funkciyi Manatee i Bonito yaki buli rozrobleni do 2003 roku i vidtodi rozshireni ye vilno dostupnimi za licenziyeyu GPL u paketi NoSketch Engine 7 travnya 2016 u Wayback Machine gole posilannya OsoblivostiNaris slova en avtomatichnij pidsumok gramatichnoyi ta rozmovnoyi povedinki slova na odnij storinci Riznicya v word sketch porivnyuye ta protistavlyaye dva slova analizuyuchi yihnye zistavlennya Rozpovsyudzhuvanij Thesaurus avtomatizovanij tezaurus yakij znahodit slova z podibnim znachennyam abo z yavlyayutsya v tomu zh podibnomu konteksti Poshuk uzgodzhenosti znahodit prikladi slovoformi lemi frazi tegu abo skladnoyi strukturi Poshuk spilnoyi lokaciyi analiz spilnoyi zustrichalnosti sliv iz vidobrazhennyam najchastishih sliv do poshukovogo slova yaki mozhna rozglyadati yak kandidativ na zbig Spiski sliv stvoryuye spiski chastot yaki mozhna filtruvati za skladnimi kriteriyami n grams generuye chastotni spiski bagatoslivnih viraziv Terminologiya Viluchennya klyuchovih sliv yak odnomovnih tak i dvomovnih avtomatichne viluchennya klyuchovih sliv i terminiv iz kilkoh sliv iz tekstiv na osnovi chastoti ta lingvistichnih kriteriyiv Diahronichnij analiz Trends viyavlennya sliv chastota vzhivannya yakih zminyuyetsya z chasom pokazati populyarni slova Pobudova korpusu ta keruvannya nim stvoryujte korpusi z Internetu abo zavantazhujte teksti vklyuchayuchi teguvannya chastini movi ta lematizaciya yaki mozhna vikoristovuvati yak programne zabezpechennya dlya analizu danih Paralelnij korpus dvomovnij poshuk prikladiv perekladu korpus EUR Lex korpus Europarl korpus OPUS tosho abo stvorennya paralelnogo korpusu z vlasnih virivnyanih tekstiv OpisSketch Engine skladayetsya z troh osnovnih komponentiv bazovoyi sistemi keruvannya bazoyu danih pid nazvoyu Manatee veb interfejsu poshuku pid nazvoyu Bonito ta veb interfejsu dlya stvorennya korpusu ta keruvannya nim pid nazvoyu Corpus Architect Primitki Lexical Computing brit Arhiv originalu za 9 kvitnya 2022 Procitovano 2 travnya 2022 Adam Kilgarriff Wikipedia angl 7 kvitnya 2022 Procitovano 2 travnya 2022 Masaryk University Wikipedia angl 13 kvitnya 2022 Procitovano 2 travnya 2022 PosilannyaSpisok korpusiv dostupnih u Sketch Engine 31 bereznya 2022 u Wayback Machine www sketchengine eu oficijnij sajt Sketch Engine