В машинному навчанні, розпізнаванні образів та в обробці зображень виділя́ння озна́к (англ. feature extraction) починається з первинного набору даних вимірювань, і будує похідні значення (ознаки), покликані бути інформативними та ненадлишковими, полегшувати наступні кроки навчання та узагальнення, і в деяких випадках вести до кращих тлумачень людьми. Виділяння ознак пов'язане зі зниженням розмірності.
Коли вхідні дані алгоритму є занадто великими, щоби їх можливо було обробити, і підозрюються на надлишковість (наприклад, одні й ті самі вимірювання як у метрах, так і в футах, або повторюваності в зображеннях, представлених пікселями), тоді їх може бути перетворено на скорочений набір ознак (що також називають вектором ознак). Визначення підмножини початкових ознак називають обиранням ознак. Очікується, що обрані ознаки містять доречну інформацію з вхідних даних, так що бажане завдання може бути виконано із застосуванням цього скороченого представлення замість повних первинних даних.
Загальне
Виділяння ознак включає зниження числа ресурсів, необхідних для опису великого набору даних. При виконанні аналізу складних даних одна з головних проблем випливає з кількості залучених змінних. Аналіз із великою кількістю змінних в загальному випадку вимагає великої кількості пам'яті та обчислювальних потужностей, а також він може спричинювати перенавчання алгоритмів класифікації тренувальних зразків, і поганого узагальнювання на нові зразки. Виділяння ознак є загальним терміном для позначення методів побудови таких поєднань змінних, щоби обходити ці проблеми, зберігаючи достатню точність опису даних. Багато практиків машинного навчання вважають, що належно оптимізоване виділяння ознак є запорукою ефективної побудови моделі.
Результати може бути покращено шляхом застосування сконструйованих наборів залежних від конкретного застосування ознак, що зазвичай будує експерт. Один з таких процесів називають конструюванням ознак. Або ж застосовують загальні методики зниження розмірності, такі як:
- [en]
- [en]
- [en]
- Приховано-семантичний аналіз
- [en]
- Метод головних компонент
- [en]
- [en]
- [en]
- [en]
- [en]
- Автокодувальник
Обробка зображень
Однією з дуже важливих областей застосування є обробка зображень, у якій застосовують алгоритми для виявляння та виокремлювання різних бажаних частин або фігур (ознак) оцифрованого зображення або потоку відео. Це особливо важливо в області оптичного розпізнавання символів.
Низькорівнева
- Виявляння контурів
- Виявляння кутів
- Виявляння плям
- Виявляння хребтів
- Масштабоінваріантне ознакове перетворення
Кривина
- Напрямок контурів, зміна яскравості, самокореляція.
Рух зображення
- Виявляння руху. На основі областей, різничний підхід. Оптичний потік.
На основі фігур
- Порогова класифікація
- [en]
- [en]
- Перетворення Гафа
- Прямих
- Кіл/еліпсів
- Довільних форм (узагальнене перетворення Хафа)
- Працює з будь-якою ознакою, яку можливо параметризувати (змінні класу, виявлення кластерів тощо)
- Узагальнене перетворення Гафа
Гнучкі методи
- Параметризовані фігури, що піддаються деформації
- Активні контури (змії)
Виділяння ознак у програмному забезпеченні
Багато [en] забезпечують виявляння ознак та зниження розмірності. Поширені середовища чисельного програмування, такі як MATLAB, SciLab, NumPy та мова програмування R, забезпечують деякі з простіших методик виявляння ознак (наприклад, метод головних компонент) через вбудовані команди. Більш специфічні алгоритми є часто доступними як загальнодоступні сценарії або додатки від третіх сторін. Існують також програмні пакети, націлені на конкретні програмні застосування машинного навчання, що спеціалізуються на виділянні ознак.
Див. також
Примітки
- Alpaydin, Ethem (2010). . London: The MIT Press. с. 110. ISBN . Архів оригіналу за 23 березня 2019. Процитовано 4 лютого 2017. (англ.)
- . Reality AI Blog. Вересень 2017. Архів оригіналу за 18 серпня 2019. Процитовано 18 серпня 2019. (англ.)
- Див., наприклад, https://reality.ai/ [ 25 березня 2021 у Wayback Machine.]
Ця стаття потребує додаткових для поліпшення її . (січень 2016) |
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
V mashinnomu navchanni rozpiznavanni obraziv ta v obrobci zobrazhen vidilya nnya ozna k angl feature extraction pochinayetsya z pervinnogo naboru danih vimiryuvan i buduye pohidni znachennya oznaki poklikani buti informativnimi ta nenadlishkovimi polegshuvati nastupni kroki navchannya ta uzagalnennya i v deyakih vipadkah vesti do krashih tlumachen lyudmi Vidilyannya oznak pov yazane zi znizhennyam rozmirnosti Koli vhidni dani algoritmu ye zanadto velikimi shobi yih mozhlivo bulo obrobiti i pidozryuyutsya na nadlishkovist napriklad odni j ti sami vimiryuvannya yak u metrah tak i v futah abo povtoryuvanosti v zobrazhennyah predstavlenih pikselyami todi yih mozhe buti peretvoreno na skorochenij nabir oznak sho takozh nazivayut vektorom oznak Viznachennya pidmnozhini pochatkovih oznak nazivayut obirannyam oznak Ochikuyetsya sho obrani oznaki mistyat dorechnu informaciyu z vhidnih danih tak sho bazhane zavdannya mozhe buti vikonano iz zastosuvannyam cogo skorochenogo predstavlennya zamist povnih pervinnih danih ZagalneVidilyannya oznak vklyuchaye znizhennya chisla resursiv neobhidnih dlya opisu velikogo naboru danih Pri vikonanni analizu skladnih danih odna z golovnih problem viplivaye z kilkosti zaluchenih zminnih Analiz iz velikoyu kilkistyu zminnih v zagalnomu vipadku vimagaye velikoyi kilkosti pam yati ta obchislyuvalnih potuzhnostej a takozh vin mozhe sprichinyuvati perenavchannya algoritmiv klasifikaciyi trenuvalnih zrazkiv i poganogo uzagalnyuvannya na novi zrazki Vidilyannya oznak ye zagalnim terminom dlya poznachennya metodiv pobudovi takih poyednan zminnih shobi obhoditi ci problemi zberigayuchi dostatnyu tochnist opisu danih Bagato praktikiv mashinnogo navchannya vvazhayut sho nalezhno optimizovane vidilyannya oznak ye zaporukoyu efektivnoyi pobudovi modeli Rezultati mozhe buti pokrasheno shlyahom zastosuvannya skonstrujovanih naboriv zalezhnih vid konkretnogo zastosuvannya oznak sho zazvichaj buduye ekspert Odin z takih procesiv nazivayut konstruyuvannyam oznak Abo zh zastosovuyut zagalni metodiki znizhennya rozmirnosti taki yak en en en Prihovano semantichnij analiz en Metod golovnih komponent en en en en en AvtokoduvalnikObrobka zobrazhenDokladnishe Vidilyannya oznak komp yuterne bachennya Odniyeyu z duzhe vazhlivih oblastej zastosuvannya ye obrobka zobrazhen u yakij zastosovuyut algoritmi dlya viyavlyannya ta viokremlyuvannya riznih bazhanih chastin abo figur oznak ocifrovanogo zobrazhennya abo potoku video Ce osoblivo vazhlivo v oblasti optichnogo rozpiznavannya simvoliv Nizkorivneva Viyavlyannya konturiv Viyavlyannya kutiv Viyavlyannya plyam Viyavlyannya hrebtiv Masshtaboinvariantne oznakove peretvorennya Krivina Napryamok konturiv zmina yaskravosti samokorelyaciya Ruh zobrazhennya Viyavlyannya ruhu Na osnovi oblastej riznichnij pidhid Optichnij potik Na osnovi figur Porogova klasifikaciya en en Peretvorennya Gafa Pryamih Kil elipsiv Dovilnih form uzagalnene peretvorennya Hafa Pracyuye z bud yakoyu oznakoyu yaku mozhlivo parametrizuvati zminni klasu viyavlennya klasteriv tosho Uzagalnene peretvorennya Gafa Gnuchki metodi Parametrizovani figuri sho piddayutsya deformaciyi Aktivni konturi zmiyi Vidilyannya oznak u programnomu zabezpechenniBagato en zabezpechuyut viyavlyannya oznak ta znizhennya rozmirnosti Poshireni seredovisha chiselnogo programuvannya taki yak MATLAB SciLab NumPy ta mova programuvannya R zabezpechuyut deyaki z prostishih metodik viyavlyannya oznak napriklad metod golovnih komponent cherez vbudovani komandi Bilsh specifichni algoritmi ye chasto dostupnimi yak zagalnodostupni scenariyi abo dodatki vid tretih storin Isnuyut takozh programni paketi nacileni na konkretni programni zastosuvannya mashinnogo navchannya sho specializuyutsya na vidilyanni oznak Div takozhKlasternij analiz Znizhennya rozmirnosti Viyavlyannya oznak Vibirannya oznak Dobuvannya danih en Segmentuvannya zobrazhennya en en PrimitkiAlpaydin Ethem 2010 London The MIT Press s 110 ISBN 978 0 262 01243 0 Arhiv originalu za 23 bereznya 2019 Procitovano 4 lyutogo 2017 angl Reality AI Blog Veresen 2017 Arhiv originalu za 18 serpnya 2019 Procitovano 18 serpnya 2019 angl Div napriklad https reality ai 25 bereznya 2021 u Wayback Machine Cya stattya potrebuye dodatkovih posilan na dzherela dlya polipshennya yiyi perevirnosti Bud laska dopomozhit udoskonaliti cyu stattyu dodavshi posilannya na nadijni avtoritetni dzherela Zvernitsya na storinku obgovorennya za poyasnennyami ta dopomozhit vipraviti nedoliki Material bez dzherel mozhe buti piddano sumnivu ta vilucheno sichen 2016