В машинному навчанні та розпізнаванні образів озна́ка (англ. feature) — це окрема властивість або характеристика спостережуваного явища, яку можливо виміряти. Обрання інформативних, розрізнювальних і незалежних ознак є ключовим кроком алгоритмів розпізнавання образів, класифікації та регресії. Ознаки є зазвичай числовими, але в [en] використовують і структуровані ознаки, такі як стрічки та графи. Поняття «ознака» є пов'язаним із поняттям описової змінної, що застосовують у таких статистичних методиках як лінійна регресія.
Класифікація
Набір числових ознак може бути зручно описано вектором ознак. Приклад досягнення двобічної класифікації[] за вектором ознак (пов'язаним з перцептроном) складається з обчислення скалярного добутку вектора ознак та вектора вагових коефіцієнтів, порівняння результатів із порогом, і ухвалення рішення про клас на основі цього порівняння.
До алгоритмів класифікації за вектором ознак належать класифікація найближчих сусідів, нейронні мережі та статистичні методики, такі як баєсові підходи.
Приклади
В розпізнаванні символів до ознак можуть належати гістограми, що підраховують кількість чорних пікселів уздовж горизонтальних та вертикальних напрямків, кількість внутрішніх отворів, напрямок штрихів та багато іншого.
В розпізнаванні мовлення до ознак записів фонем можуть належати рівні шуму, тривалість звуків, відносна потужність, збіг з фільтрами та багато іншого.
В алгоритмах виявлення спаму до ознак можуть належати наявність або відсутність певних заголовків електронного листа, структура електронного листа, мова, частота певних термінів, граматична правильність тексту.
В комп'ютерному баченні існує велика кількість можливих ознак, таких як контури та об'єкти.
Розширення
В розпізнаванні образів та машинному навчанні ве́ктор озна́к (англ. feature vector) — це n-вимірний вектор числових ознак, що представляють певний об'єкт. Багато алгоритмів у машинному навчанні вимагають чисельного представлення об'єктів, оскільки такі представлення полегшують обробку та статистичний аналіз. При представленні зображень значення ознак можуть відповідати пікселям зображення, тоді як при представленні текстів ознаки можуть бути частотами трапляння текстових термінів. Вектори ознак еквівалентні векторам описових змінних, що використовують в статистичних процедурах, таких як лінійна регресія. Вектори ознак часто об'єднують з ваговими коефіцієнтами за допомогою скалярного добутку з метою побудови [en], що застосовують для визначення оцінки для здійснення передбачення.
Векторний простір, пов'язаний із цими векторами, часто називають про́стором озна́к (англ. feature space). Задля зменшення розмірності простору ознак можливо застосовувати ряд методик зниження розмірності.
Із вже наявних ознак можливо отримувати ознаки вищого рівня, і додавати їх до вектора ознак; наприклад, для дослідження хвороб є корисною ознака «Вік», і її визначають як Вік = «Рік смерті» мінус «Рік народження». Цей процес називають побудо́вою озна́к (англ. feature construction). Побудова ознак є застосуванням набору побудовних операторів до набору наявних ознак, що дає в результаті побудову нових ознак. Приклади таких побудовних операторів включають перевірку на умови рівності {=, ≠}, арифметичні оператори {+,−,×, /}, оператори над масивами {max(S), min(S), average(S)}, а також інші складніші оператори, наприклад, count(S,C), що підраховує кількість ознак у векторі ознак S, які задовольняють певну умову C, або, наприклад, відстані до інших класів розпізнавання, узагальнених якимось приймальним пристроєм. Побудову ознак вже давно вважають потужним інструментом для покращення як точності, так і розуміння структури, зокрема, в задачах високих розмірностей. До її застосувань належать дослідження хвороб та розпізнавання емоцій з мовлення.
Обирання та виділяння
Початковий набір сирих ознак може бути надлишковим і занадто великим, щоби впоратися з ним. Тому підготовчий крок багатьох застосувань машинного навчання та розпізнавання образів складається з вибирання підмножини ознак, або з побудови нового зменшеного набору ознак для полегшення навчання і для покращення узагальнення та можливості інтерпретації[].
Виділяння та вибирання ознак є поєднаннями мистецтва та науки; розробка систем, які це роблять, є відомою як конструювання ознак. Воно вимагає експериментування з багатьма можливостями, та поєднання автоматизованих методик з інтуїцією та знаннями [en]. Автоматизація цього процесу є навчанням ознак, коли машина не лише використовує ознаки для навчання, але й навчається самих ознак.
Див. також
Примітки
- Bishop, Christopher (2006). Pattern recognition and machine learning. Berlin: Springer. ISBN . (англ.)
- Liu, H., Motoda H. (1998) Feature Selection for Knowledge Discovery and Data Mining., Kluwer Academic Publishers. Norwell, MA, USA. 1998. (англ.)
- Piramuthu, S., Sikora R. T. Iterative feature construction for improving inductive learning algorithms. In Journal of Expert Systems with Applications. Vol. 36 , Iss. 2 (March 2009), pp. 3401-3406, 2009 (англ.)
- Bloedorn, E., Michalski, R. Data-driven constructive induction: a methodology and its applications. IEEE Intelligent Systems, Special issue on Feature Transformation and Subset Selection, pp. 30-37, March/April, 1998 (англ.)
- Breiman, L. Friedman, T., Olshen, R., Stone, C. (1984) Classification and regression trees, Wadsworth (англ.)
- Sidorova, J., Badia T. Syntactic learning for ESEDA.1, tool for enhanced speech emotion detection and analysis. Internet Technology and Secured Transactions Conference 2009 (ICITST-2009), London, November 9–12. IEEE (англ.)
Ця стаття потребує додаткових для поліпшення її . (січень 2016) |
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Ne plutati z Oznaka komp yuterne bachennya V mashinnomu navchanni ta rozpiznavanni obraziv ozna ka angl feature ce okrema vlastivist abo harakteristika sposterezhuvanogo yavisha yaku mozhlivo vimiryati Obrannya informativnih rozriznyuvalnih i nezalezhnih oznak ye klyuchovim krokom algoritmiv rozpiznavannya obraziv klasifikaciyi ta regresiyi Oznaki ye zazvichaj chislovimi ale v en vikoristovuyut i strukturovani oznaki taki yak strichki ta grafi Ponyattya oznaka ye pov yazanim iz ponyattyam opisovoyi zminnoyi sho zastosovuyut u takih statistichnih metodikah yak linijna regresiya KlasifikaciyaNabir chislovih oznak mozhe buti zruchno opisano vektorom oznak Priklad dosyagnennya dvobichnoyi klasifikaciyi proyasniti za vektorom oznak pov yazanim z perceptronom skladayetsya z obchislennya skalyarnogo dobutku vektora oznak ta vektora vagovih koeficiyentiv porivnyannya rezultativ iz porogom i uhvalennya rishennya pro klas na osnovi cogo porivnyannya Do algoritmiv klasifikaciyi za vektorom oznak nalezhat klasifikaciya najblizhchih susidiv nejronni merezhi ta statistichni metodiki taki yak bayesovi pidhodi PrikladiDiv takozh Oznaka komp yuterne bachennya V rozpiznavanni simvoliv do oznak mozhut nalezhati gistogrami sho pidrahovuyut kilkist chornih pikseliv uzdovzh gorizontalnih ta vertikalnih napryamkiv kilkist vnutrishnih otvoriv napryamok shtrihiv ta bagato inshogo V rozpiznavanni movlennya do oznak zapisiv fonem mozhut nalezhati rivni shumu trivalist zvukiv vidnosna potuzhnist zbig z filtrami ta bagato inshogo V algoritmah viyavlennya spamu do oznak mozhut nalezhati nayavnist abo vidsutnist pevnih zagolovkiv elektronnogo lista struktura elektronnogo lista mova chastota pevnih terminiv gramatichna pravilnist tekstu V komp yuternomu bachenni isnuye velika kilkist mozhlivih oznak takih yak konturi ta ob yekti RozshirennyaZapit Prostir oznak perenapravlyaye syudi pro prostori oznak v yadrovih metodah div yadrovi metodi V rozpiznavanni obraziv ta mashinnomu navchanni ve ktor ozna k angl feature vector ce n vimirnij vektor chislovih oznak sho predstavlyayut pevnij ob yekt Bagato algoritmiv u mashinnomu navchanni vimagayut chiselnogo predstavlennya ob yektiv oskilki taki predstavlennya polegshuyut obrobku ta statistichnij analiz Pri predstavlenni zobrazhen znachennya oznak mozhut vidpovidati pikselyam zobrazhennya todi yak pri predstavlenni tekstiv oznaki mozhut buti chastotami traplyannya tekstovih terminiv Vektori oznak ekvivalentni vektoram opisovih zminnih sho vikoristovuyut v statistichnih procedurah takih yak linijna regresiya Vektori oznak chasto ob yednuyut z vagovimi koeficiyentami za dopomogoyu skalyarnogo dobutku z metoyu pobudovi en sho zastosovuyut dlya viznachennya ocinki dlya zdijsnennya peredbachennya Vektornij prostir pov yazanij iz cimi vektorami chasto nazivayut pro storom ozna k angl feature space Zadlya zmenshennya rozmirnosti prostoru oznak mozhlivo zastosovuvati ryad metodik znizhennya rozmirnosti Iz vzhe nayavnih oznak mozhlivo otrimuvati oznaki vishogo rivnya i dodavati yih do vektora oznak napriklad dlya doslidzhennya hvorob ye korisnoyu oznaka Vik i yiyi viznachayut yak Vik Rik smerti minus Rik narodzhennya Cej proces nazivayut pobudo voyu ozna k angl feature construction Pobudova oznak ye zastosuvannyam naboru pobudovnih operatoriv do naboru nayavnih oznak sho daye v rezultati pobudovu novih oznak Prikladi takih pobudovnih operatoriv vklyuchayut perevirku na umovi rivnosti arifmetichni operatori operatori nad masivami max S min S average S a takozh inshi skladnishi operatori napriklad count S C sho pidrahovuye kilkist oznak u vektori oznak S yaki zadovolnyayut pevnu umovu C abo napriklad vidstani do inshih klasiv rozpiznavannya uzagalnenih yakimos prijmalnim pristroyem Pobudovu oznak vzhe davno vvazhayut potuzhnim instrumentom dlya pokrashennya yak tochnosti tak i rozuminnya strukturi zokrema v zadachah visokih rozmirnostej Do yiyi zastosuvan nalezhat doslidzhennya hvorob ta rozpiznavannya emocij z movlennya Obirannya ta vidilyannyaPochatkovij nabir sirih oznak mozhe buti nadlishkovim i zanadto velikim shobi vporatisya z nim Tomu pidgotovchij krok bagatoh zastosuvan mashinnogo navchannya ta rozpiznavannya obraziv skladayetsya z vibirannya pidmnozhini oznak abo z pobudovi novogo zmenshenogo naboru oznak dlya polegshennya navchannya i dlya pokrashennya uzagalnennya ta mozhlivosti interpretaciyi dzherelo Vidilyannya ta vibirannya oznak ye poyednannyami mistectva ta nauki rozrobka sistem yaki ce roblyat ye vidomoyu yak konstruyuvannya oznak Vono vimagaye eksperimentuvannya z bagatma mozhlivostyami ta poyednannya avtomatizovanih metodik z intuyiciyeyu ta znannyami en Avtomatizaciya cogo procesu ye navchannyam oznak koli mashina ne lishe vikoristovuye oznaki dlya navchannya ale j navchayetsya samih oznak Div takozhKovariata Znizhennya rozmirnosti Konstruyuvannya oznak en Statistichna klasifikaciya Poyasnennij shtuchnij intelektPrimitkiBishop Christopher 2006 Pattern recognition and machine learning Berlin Springer ISBN 0 387 31073 8 angl Liu H Motoda H 1998 Feature Selection for Knowledge Discovery and Data Mining Kluwer Academic Publishers Norwell MA USA 1998 angl Piramuthu S Sikora R T Iterative feature construction for improving inductive learning algorithms In Journal of Expert Systems with Applications Vol 36 Iss 2 March 2009 pp 3401 3406 2009 angl Bloedorn E Michalski R Data driven constructive induction a methodology and its applications IEEE Intelligent Systems Special issue on Feature Transformation and Subset Selection pp 30 37 March April 1998 angl Breiman L Friedman T Olshen R Stone C 1984 Classification and regression trees Wadsworth angl Sidorova J Badia T Syntactic learning for ESEDA 1 tool for enhanced speech emotion detection and analysis Internet Technology and Secured Transactions Conference 2009 ICITST 2009 London November 9 12 IEEE angl Cya stattya potrebuye dodatkovih posilan na dzherela dlya polipshennya yiyi perevirnosti Bud laska dopomozhit udoskonaliti cyu stattyu dodavshi posilannya na nadijni avtoritetni dzherela Zvernitsya na storinku obgovorennya za poyasnennyami ta dopomozhit vipraviti nedoliki Material bez dzherel mozhe buti piddano sumnivu ta vilucheno sichen 2016