Нейронна мережа з часовою затримкою ( TDNN ) — це архітектура штучної нейронної мережі, основною метою якої є класифікація паттернів незалежно від зсуву, тобто не вимагає явного попереднього визначення початкової та кінцевої точок схеми. TDNN вперше запропонував класифікувати фонеми в мовних сигналах для автоматичного розпізнавання мови, де автоматичне визначення точних сегментів або меж фіч є складним чи неможливим. TDNN розпізнає фонеми та їхні основні акустичні / фонетичні особливості, незалежно від часових зрушень, тобто положення в часі.
Вхідний сигнал доповнюється затриманими копіями як іншими входами, нейронна мережа є інваріантною для часової зміни, оскільки вона не має внутрішнього стану.
У оригінальному документі була представлена мережа з персептронами, ваги якої пройшли навчання за допомогою алгоритму зворотного поширення помилки, це може бути здійснено партійно або в реальному часі. Прикладом є Штутгартський нейромережний симулятор.
Огляд
Нейронні мережі з затримкою часу, як і інші нейронні мережі, працюють з декількома взаємопов'язаними шарами, що складаються з кластерів. Ці кластери призначені для представлення нейронів у мозку, і, як і мозок, кожен кластер повинен зосередити увагу тільки на невеликих регіонах вхідних даних. Прототипний TDNN має три шари кластерів, один для введення, один для виведення, і середній шар, який обробляє вхід через фільтри. Через їх послідовність TDNN реалізуються як Нейронна мережа прямого поширення, а не рекурентна нейронна мережа.
Для досягнення інваріантності зсуву часу, до входу додаються набір затримок (аудіофайл, зображення тощо), так що дані представлені в різні моменти часу. Ці затримки є довільними та специфічними, що, як правило, означає, що вхідні дані налаштованні на певний шаблон затримки. Це і є вся виконана робота по створенню адаптивної часової затримки TDNN, де цю ручну настройку викорінено. Затримки є спробою додати часовий вимір до мережі, який відсутній в рекурентних нейронних мережах або багатошарових персептронах зі змінним вікном. Поєднання попередніх входів із поточними вкладами робить підхід TDNN унікальним.
Ключовою особливістю TDNN є здатність виражати зв'язок між входами у часі. Це співвідношення може бути результатом детектора фіч і використовується в рамках TDNN для розпізнавання шаблонів між затриманими входами. Одним з основних переваг нейронних мереж є відсутність залежності від попередніх знань для встановлення банків фільтрів на кожному шарі. Однак це тягне за собою те, що мережа повинна вивчати оптимальне значення для цих фільтрів шляхом обробки численних входів для навчання. Навчання під керівництвом, як правило, є алгоритмом навчання, пов'язаним з TDNN, завдяки його силі в розпізнаванні образів та наближенні функцій. Кероване навчання зазвичай здійснюється за допомогою алгоритму зворотного поширення помилки.
Програми
Розпізнавання мови
TDNN використовується для вирішення проблем розпізнавання мовлення, які були введені в 1989 році і спочатку зосереджувались на виявленні фонем. Мова чудово підходить для TDNN, оскільки розмовні звуки рідко мають однакову довжину. Вивчаючи звук, який змінюється в минулому та в майбутньому, TDNN здатний побудувати модель для цього звуку, який є незмінним у часі. Це особливо корисно для розпізнавання мови, оскільки різні діалекти та мови вимовляють однакові звуки з різною довжиною. Спектральні коефіцієнти використовуються для опису співвідношення між вхідними зразками.
Аналіз відео
Відео має змінну розмірність, що робить TDNN ідеальним рішенням для аналізу моделей руху. Приклад такого аналізу — це поєднання виявлення транспортних засобів та розпізнавання пішоходів. При аналізі відео, зображення надходять в TDNN як вхід, де кожне зображення є наступним кадром у відео. Перевага TDNN походить від здатності вивчати об'єкти, що змінюються в часі вперед і назад, щоб визначити об'єкт, що виявляється, коли змінюється час. Якщо об'єкт може бути розпізнаний таким чином, програма може планувати той об'єкт, який буде знаходитись у майбутньому, і виконати оптимальну дію.
Загальні бібліотеки
- Matlab: панель інструментів нейронної мережі має функціональні можливості, призначені для створення нейронної мережі з часовою затримкою, передаючи в неї розмір шагу часової затримки та опціональну функцію навчання. Алгоритм навчання за замовчуванням — це алгоритм «Supervised Learning», що оновлює фільтри на основі оптимізації Левенберга-Маркварда. Функція timedelaynet (затримки, hidden_layers, train_fnc) і повертає архітектуру нейронної мережі з затримкою часу, яку користувач може тренувати та надавати вхідні дані.
- Torch: Бібліотека Torch може створювати складні моделі, такі як TDNN, шляхом об'єднання декількох вбудованих модулів Multi-layer Perceptrons (MLP).
- Caffe (програмне забезпечення): Наразі не підтримує TDNN.
Див. також
- Згорткова нейронна мережа — нейронна мережа, де відбувається згортка вздовж осі часу даних, дуже схожа на TDNN.
- Рекурентна нейронна мережа — рекурентна нейронна мережа також обробляє часові дані, хоча й інакше. Замість різноманітного введення, RNN підтримує внутрішні приховані шари, щоб стежити за минулим (і у випадку двонаправлених RNN, майбутніх) входів.
Література
- et al, Phoneme Recognition Using Time-Delay Neural Networks IEEE Transactions on Acoustics, Speech and Signal Processing, Volume 37, No. 3, pp. 328. — 339 March 1989.
- TDNN Fundamentals, Kapitel aus dem Online Handbuch des
- , and . «An adaptable time-delay neural-network algorithm for image sequence analysis.» IEEE Transactions on Neural Networks 10.6 (1999): 1531—1536
- , and . «Real-time object recognition on image sequences with the adaptable time delay neural network algorithm—applications for autonomous vehicles.» Image and Vision Computing 19.9 (2001): 593—618.
- Time Series and Dynamic Systems - MATLAB & Simulink. mathworks.com. Процитовано 21 червня 2016.
- , , and . Torch: a modular machine learning software library. No. EPFL-REPORT-82802. IDIAP, 2002
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Nejronna merezha z chasovoyu zatrimkoyu TDNN ce arhitekturashtuchnoyi nejronnoyi merezhi osnovnoyu metoyu yakoyi ye klasifikaciya patterniv nezalezhno vid zsuvu tobto ne vimagaye yavnogo poperednogo viznachennya pochatkovoyi ta kincevoyi tochok shemi TDNN vpershe zaproponuvav klasifikuvati fonemi v movnih signalah dlya avtomatichnogo rozpiznavannya movi de avtomatichne viznachennya tochnih segmentiv abo mezh fich ye skladnim chi nemozhlivim TDNN rozpiznaye fonemi ta yihni osnovni akustichni fonetichni osoblivosti nezalezhno vid chasovih zrushen tobto polozhennya v chasi diagrama TDNN Vhidnij signal dopovnyuyetsya zatrimanimi kopiyami yak inshimi vhodami nejronna merezha ye invariantnoyu dlya chasovoyi zmini oskilki vona ne maye vnutrishnogo stanu U originalnomu dokumenti bula predstavlena merezha z perseptronami vagi yakoyi projshli navchannya za dopomogoyu algoritmu zvorotnogo poshirennya pomilki ce mozhe buti zdijsneno partijno abo v realnomu chasi Prikladom ye Shtutgartskij nejromerezhnij simulyator OglyadNejronni merezhi z zatrimkoyu chasu yak i inshi nejronni merezhi pracyuyut z dekilkoma vzayemopov yazanimi sharami sho skladayutsya z klasteriv Ci klasteri priznacheni dlya predstavlennya nejroniv u mozku i yak i mozok kozhen klaster povinen zoserediti uvagu tilki na nevelikih regionah vhidnih danih Prototipnij TDNN maye tri shari klasteriv odin dlya vvedennya odin dlya vivedennya i serednij shar yakij obroblyaye vhid cherez filtri Cherez yih poslidovnist TDNN realizuyutsya yak Nejronna merezha pryamogo poshirennya a ne rekurentna nejronna merezha Dlya dosyagnennya invariantnosti zsuvu chasu do vhodu dodayutsya nabir zatrimok audiofajl zobrazhennya tosho tak sho dani predstavleni v rizni momenti chasu Ci zatrimki ye dovilnimi ta specifichnimi sho yak pravilo oznachaye sho vhidni dani nalashtovanni na pevnij shablon zatrimki Ce i ye vsya vikonana robota po stvorennyu adaptivnoyi chasovoyi zatrimki TDNN de cyu ruchnu nastrojku vikorineno Zatrimki ye sproboyu dodati chasovij vimir do merezhi yakij vidsutnij v rekurentnih nejronnih merezhah abo bagatosharovih perseptronah zi zminnim viknom Poyednannya poperednih vhodiv iz potochnimi vkladami robit pidhid TDNN unikalnim Klyuchovoyu osoblivistyu TDNN ye zdatnist virazhati zv yazok mizh vhodami u chasi Ce spivvidnoshennya mozhe buti rezultatom detektora fich i vikoristovuyetsya v ramkah TDNN dlya rozpiznavannya shabloniv mizh zatrimanimi vhodami Odnim z osnovnih perevag nejronnih merezh ye vidsutnist zalezhnosti vid poperednih znan dlya vstanovlennya bankiv filtriv na kozhnomu shari Odnak ce tyagne za soboyu te sho merezha povinna vivchati optimalne znachennya dlya cih filtriv shlyahom obrobki chislennih vhodiv dlya navchannya Navchannya pid kerivnictvom yak pravilo ye algoritmom navchannya pov yazanim z TDNN zavdyaki jogo sili v rozpiznavanni obraziv ta nablizhenni funkcij Kerovane navchannya zazvichaj zdijsnyuyetsya za dopomogoyu algoritmu zvorotnogo poshirennya pomilki ProgramiRozpiznavannya movi TDNN vikoristovuyetsya dlya virishennya problem rozpiznavannya movlennya yaki buli vvedeni v 1989 roci i spochatku zoseredzhuvalis na viyavlenni fonem Mova chudovo pidhodit dlya TDNN oskilki rozmovni zvuki ridko mayut odnakovu dovzhinu Vivchayuchi zvuk yakij zminyuyetsya v minulomu ta v majbutnomu TDNN zdatnij pobuduvati model dlya cogo zvuku yakij ye nezminnim u chasi Ce osoblivo korisno dlya rozpiznavannya movi oskilki rizni dialekti ta movi vimovlyayut odnakovi zvuki z riznoyu dovzhinoyu Spektralni koeficiyenti vikoristovuyutsya dlya opisu spivvidnoshennya mizh vhidnimi zrazkami Analiz video Video maye zminnu rozmirnist sho robit TDNN idealnim rishennyam dlya analizu modelej ruhu Priklad takogo analizu ce poyednannya viyavlennya transportnih zasobiv ta rozpiznavannya pishohodiv Pri analizi video zobrazhennya nadhodyat v TDNN yak vhid de kozhne zobrazhennya ye nastupnim kadrom u video Perevaga TDNN pohodit vid zdatnosti vivchati ob yekti sho zminyuyutsya v chasi vpered i nazad shob viznachiti ob yekt sho viyavlyayetsya koli zminyuyetsya chas Yaksho ob yekt mozhe buti rozpiznanij takim chinom programa mozhe planuvati toj ob yekt yakij bude znahoditis u majbutnomu i vikonati optimalnu diyu Zagalni biblioteki Matlab panel instrumentiv nejronnoyi merezhi maye funkcionalni mozhlivosti priznacheni dlya stvorennya nejronnoyi merezhi z chasovoyu zatrimkoyu peredayuchi v neyi rozmir shagu chasovoyi zatrimki ta opcionalnu funkciyu navchannya Algoritm navchannya za zamovchuvannyam ce algoritm Supervised Learning sho onovlyuye filtri na osnovi optimizaciyi Levenberga Markvarda Funkciya timedelaynet zatrimki hidden layers train fnc i povertaye arhitekturu nejronnoyi merezhi z zatrimkoyu chasu yaku koristuvach mozhe trenuvati ta nadavati vhidni dani Torch Biblioteka Torch mozhe stvoryuvati skladni modeli taki yak TDNN shlyahom ob yednannya dekilkoh vbudovanih moduliv Multi layer Perceptrons MLP Caffe programne zabezpechennya Narazi ne pidtrimuye TDNN Div takozhZgortkova nejronna merezha nejronna merezha de vidbuvayetsya zgortka vzdovzh osi chasu danih duzhe shozha na TDNN Rekurentna nejronna merezha rekurentna nejronna merezha takozh obroblyaye chasovi dani hocha j inakshe Zamist riznomanitnogo vvedennya RNN pidtrimuye vnutrishni prihovani shari shob stezhiti za minulim i u vipadku dvonapravlenih RNN majbutnih vhodiv Literaturaet al Phoneme Recognition Using Time Delay Neural Networks IEEE Transactions on Acoustics Speech and Signal Processing Volume 37 No 3 pp 328 339 March 1989 TDNN Fundamentals Kapitel aus dem Online Handbuch des and An adaptable time delay neural network algorithm for image sequence analysis IEEE Transactions on Neural Networks 10 6 1999 1531 1536 and Real time object recognition on image sequences with the adaptable time delay neural network algorithm applications for autonomous vehicles Image and Vision Computing 19 9 2001 593 618 Time Series and Dynamic Systems MATLAB amp Simulink mathworks com Procitovano 21 chervnya 2016 and Torch a modular machine learning software library No EPFL REPORT 82802 IDIAP 2002