У машинному навчанні та добуванні даних стрічкове ядро (англ. string kernel) — це [en], яка діє на стрічках, тобто, скінченних послідовностях символів, які не мають бути однакової довжини. Стрічкові ядра можна інтуїтивно розуміти як функції, які вимірюють подібність пар стрічок: що подібнішими є дві стрічки a та b, то вищим буде значення стрічкового ядра K(a, b).
Застосування стрічкових ядер із ядрованими алгоритмами навчання, такими як метод опорних векторів, дозволяє таким алгоритмам працювати зі стрічками без необхідності перетворювати їх на дійснозначні вектори ознак фіксованої довжини. Стрічкові ядра застосовуються в областях, де дані послідовностей підлягають кластеруванню або класифікації, наприклад, в інтелектуальному аналізі текстів та генному аналізі.
Неформальне введення
Припустімо, що потрібно автоматично порівнювати уривки текстів та вказувати їхню відносну подібність. Для багатьох застосувань може бути достатнім знаходити деякі ключові слова, які збігаються точно. Одним із прикладів, де точної відповідності не завжди достатньо, є виявлення спаму. Іншим міг би бути обчислювальний аналіз генів, у якому гомологічні гени мутували, в результаті чого спільні послідовності мають вилучені, вставлені або замінені символи.
Спонукання
Оскільки деякі добре доведені методи кластерування, класифікації та добування інформації (наприклад, метод опорних векторів) розроблено для роботи з векторами (тобто, дані є елементами векторного простору), застосування стрічкових ядер уможливлює поширення цих методів на обробку даних послідовностей.
Стрічково-ядровий протиставляється ранішим підходам до класифікації текстів, де вектори ознак лише вказували на наявність або відсутність певного слова. Він не лише вдосконалює ці підходи, а й є прикладом цілого класу ядер, пристосованих до структур даних, як почали з'являтися на рубежі XXI сторіччя. Огляд цих методів було складено Гертнером.
Визначення
Ядром на області визначення є функція , яка задовольняє деякі умови (є симетричною за аргументами, неперервною та [en] в певному сенсі).
[en] стверджує, що тоді може бути виражено як , де відображує аргументи до [en].
Тепер ми можемо відтворити визначення ядра стрічкових підпослідовностей (англ. string subsequence kernel) на стрічках над абеткою . Відображення визначається покоординатно наступним чином:
є мультиіндексами, а є стрічкою довжини : підпослідовності можуть траплятися не неперервними, але прогалини штрафуються. Мультиіндекс задає положення символів, які збігаються з , в . є різницею між першим та останнім елементами , тобто: наскільки розкиданою в є підпослідовність, що збігається з . Параметр може бути встановлено в будь-яке значення між (прогалини не дозволено, оскільки лише є не , а ) та (навіть широко рознесені «трапляння» зважуються однаково із присутностями як неперервний підрядок, оскільки ).
Для декількох відповідних алгоритмів дані надходять до алгоритму лише у виразах, що включають внутрішній добуток векторів ознак, звідси й назва ядрові методи. Бажаним наслідком цього є відсутність потреби в явному обчисленні перетворення , а лише внутрішніх добутків через ядро, яке може бути набагато швидшим, особливо якщо воно наближене.
Примітки
- Lodhi, Huma; Saunders, Craig; Shawe-Taylor, John; Cristianini, Nello; Watkins, Chris (2002). (PDF). Journal of Machine Learning Research: 419—444. Архів оригіналу (PDF) за 19 листопада 2016. Процитовано 23 жовтня 2016. (англ.)
- Leslie, C.; Eskin, E.; Noble, W.S. (2002), The spectrum kernel: A string kernel for SVM protein classification, т. 7, с. 566—575 (англ.)
- Amayri, O., Improved Online Support Vector Machines Spam Filtering Using String Kernels (англ.)
- Gärtner, T. (2003), A survey of kernels for structured data, ACM SIGKDD Explorations Newsletter, ACM, 5 (1): 58 (англ.)
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
U mashinnomu navchanni ta dobuvanni danih strichkove yadro angl string kernel ce en yaka diye na strichkah tobto skinchennih poslidovnostyah simvoliv yaki ne mayut buti odnakovoyi dovzhini Strichkovi yadra mozhna intuyitivno rozumiti yak funkciyi yaki vimiryuyut podibnist par strichok sho podibnishimi ye dvi strichki a ta b to vishim bude znachennya strichkovogo yadra K a b Zastosuvannya strichkovih yader iz yadrovanimi algoritmami navchannya takimi yak metod opornih vektoriv dozvolyaye takim algoritmam pracyuvati zi strichkami bez neobhidnosti peretvoryuvati yih na dijsnoznachni vektori oznak fiksovanoyi dovzhini Strichkovi yadra zastosovuyutsya v oblastyah de dani poslidovnostej pidlyagayut klasteruvannyu abo klasifikaciyi napriklad v intelektualnomu analizi tekstiv ta gennomu analizi Neformalne vvedennyaPripustimo sho potribno avtomatichno porivnyuvati urivki tekstiv ta vkazuvati yihnyu vidnosnu podibnist Dlya bagatoh zastosuvan mozhe buti dostatnim znahoditi deyaki klyuchovi slova yaki zbigayutsya tochno Odnim iz prikladiv de tochnoyi vidpovidnosti ne zavzhdi dostatno ye viyavlennya spamu Inshim mig bi buti obchislyuvalnij analiz geniv u yakomu gomologichni geni mutuvali v rezultati chogo spilni poslidovnosti mayut vilucheni vstavleni abo zamineni simvoli SponukannyaOskilki deyaki dobre dovedeni metodi klasteruvannya klasifikaciyi ta dobuvannya informaciyi napriklad metod opornih vektoriv rozrobleno dlya roboti z vektorami tobto dani ye elementami vektornogo prostoru zastosuvannya strichkovih yader umozhlivlyuye poshirennya cih metodiv na obrobku danih poslidovnostej Strichkovo yadrovij protistavlyayetsya ranishim pidhodam do klasifikaciyi tekstiv de vektori oznak lishe vkazuvali na nayavnist abo vidsutnist pevnogo slova Vin ne lishe vdoskonalyuye ci pidhodi a j ye prikladom cilogo klasu yader pristosovanih do struktur danih yak pochali z yavlyatisya na rubezhi XXI storichchya Oglyad cih metodiv bulo skladeno Gertnerom ViznachennyaYadrom na oblasti viznachennya D displaystyle D ye funkciya K D D R displaystyle K D times D rightarrow mathbb R yaka zadovolnyaye deyaki umovi ye simetrichnoyu za argumentami neperervnoyu ta en v pevnomu sensi en stverdzhuye sho todi K displaystyle K mozhe buti virazheno yak K x y f x f y displaystyle K x y varphi x cdot varphi y de f displaystyle varphi vidobrazhuye argumenti do en Teper mi mozhemo vidtvoriti viznachennya yadra strichkovih pidposlidovnostej angl string subsequence kernel na strichkah nad abetkoyu S displaystyle Sigma Vidobrazhennya viznachayetsya pokoordinatno nastupnim chinom f u S n R S n s i u s i l l i displaystyle varphi u left begin array l Sigma n rightarrow mathbb R Sigma n s mapsto sum mathbf i u s mathbf i lambda l mathbf i end array right i displaystyle mathbf i ye multiindeksami a u displaystyle u ye strichkoyu dovzhini n displaystyle n pidposlidovnosti mozhut traplyatisya ne neperervnimi ale progalini shtrafuyutsya Multiindeks i displaystyle mathbf i zadaye polozhennya simvoliv yaki zbigayutsya z u displaystyle u v s displaystyle s l i displaystyle l mathbf i ye rizniceyu mizh pershim ta ostannim elementami i displaystyle mathbf i tobto naskilki rozkidanoyu v s displaystyle s ye pidposlidovnist sho zbigayetsya z u displaystyle u Parametr l displaystyle lambda mozhe buti vstanovleno v bud yake znachennya mizh 0 displaystyle 0 progalini ne dozvoleno oskilki lishe 0 0 displaystyle 0 0 ye ne 0 displaystyle 0 a 1 displaystyle 1 ta 1 displaystyle 1 navit shiroko rozneseni traplyannya zvazhuyutsya odnakovo iz prisutnostyami yak neperervnij pidryadok oskilki 1 l i 1 displaystyle 1 l mathbf i 1 Dlya dekilkoh vidpovidnih algoritmiv dani nadhodyat do algoritmu lishe u virazah sho vklyuchayut vnutrishnij dobutok vektoriv oznak zvidsi j nazva yadrovi metodi Bazhanim naslidkom cogo ye vidsutnist potrebi v yavnomu obchislenni peretvorennya ϕ x displaystyle phi x a lishe vnutrishnih dobutkiv cherez yadro yake mozhe buti nabagato shvidshim osoblivo yaksho vono nablizhene PrimitkiLodhi Huma Saunders Craig Shawe Taylor John Cristianini Nello Watkins Chris 2002 PDF Journal of Machine Learning Research 419 444 Arhiv originalu PDF za 19 listopada 2016 Procitovano 23 zhovtnya 2016 angl Leslie C Eskin E Noble W S 2002 The spectrum kernel A string kernel for SVM protein classification t 7 s 566 575 angl Amayri O Improved Online Support Vector Machines Spam Filtering Using String Kernels angl Gartner T 2003 A survey of kernels for structured data ACM SIGKDD Explorations Newsletter ACM 5 1 58 angl