У машиннім навчанні магістра́лева мере́жа (англ. highway network) — це один з підходів до оптимізування мереж та збільшення їхньої глибини. Магістралеві мережі використовують навчені вентильні механізми для регулювання інформаційного потоку, натхненного рекурентними нейронними мережами довгої короткочасної пам'яті (ДКЧП). Ці вентильні механізми дозволяють нейронним мережам мати шляхи для проходження інформації крізь різні шари («інформаційні магістралі», англ. "information highways").
Магістралеві мережі використовують як частину задач [en] та розпізнавання мовлення.
Модель
Ця модель має два вентилі на додачу до вентилю H(WH, x): перетворювальний вентиль (англ. transform gate) T(WT, x) та вентиль перенесення (англ. carry gate) C(WC, x). Ці два останні вентилі є нелінійними передавальними функціями (умовно сигмоїдними функціями). Функція H(WH, x) може бути будь-якою бажаною передавальною функцією.
Вентиль перенесення визначають як C(WC, x) = 1 − T(WT, x). Тоді як перетворювальний вентиль — це просто вентиль із сигмоїдною передавальною функцією.
Структура
Структура прихованого шару відповідає рівнянню:
Перевага магістралевої мережі над звичайними глибинними нейронними мережами полягає в тому, що вона розв'язує або частково запобігає проблемі зникання градієнта, що призводить до спрощення оптимізування нейронних мереж.
Примітки
- Srivastava, Rupesh Kumar; Greff, Klaus; Schmidhuber, Jürgen (2 травня 2015). Highway Networks. arXiv:1505.00387 [cs.LG]. (англ.)
- Srivastava, Rupesh K; Greff, Klaus; Schmidhuber, Juergen (2015). . Advances in Neural Information Processing Systems 28. Curran Associates, Inc.: 2377—2385. Архів оригіналу за 11 серпня 2020. Процитовано 9 серпня 2021. (англ.)
- Liu, Liyuan; Shang, Jingbo; Xu, Frank F.; Ren, Xiang; Gui, Huan; Peng, Jian; Han, Jiawei (12 вересня 2017). Empower Sequence Labeling with Task-Aware Neural Language Model. arXiv:1709.04109 [cs.CL]. (англ.)
- Kurata, Gakuto; Ramabhadran, Bhuvana; Saon, George; Sethy, Abhinav (19 вересня 2017). Language Modeling with Highway LSTM. arXiv:1709.06436 [cs.CL]. (англ.)
Це незавершена стаття зі штучного інтелекту. Ви можете проєкту, виправивши або дописавши її. |
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
U mashinnim navchanni magistra leva mere zha angl highway network ce odin z pidhodiv do optimizuvannya merezh ta zbilshennya yihnoyi glibini Magistralevi merezhi vikoristovuyut navcheni ventilni mehanizmi dlya regulyuvannya informacijnogo potoku nathnennogo rekurentnimi nejronnimi merezhami dovgoyi korotkochasnoyi pam yati DKChP Ci ventilni mehanizmi dozvolyayut nejronnim merezham mati shlyahi dlya prohodzhennya informaciyi kriz rizni shari informacijni magistrali angl information highways Magistralevi merezhi vikoristovuyut yak chastinu zadach en ta rozpiznavannya movlennya ModelCya model maye dva ventili na dodachu do ventilyu H WH x peretvoryuvalnij ventil angl transform gate T WT x ta ventil perenesennya angl carry gate C WC x Ci dva ostanni ventili ye nelinijnimi peredavalnimi funkciyami umovno sigmoyidnimi funkciyami Funkciya H WH x mozhe buti bud yakoyu bazhanoyu peredavalnoyu funkciyeyu Ventil perenesennya viznachayut yak C WC x 1 T WT x Todi yak peretvoryuvalnij ventil ce prosto ventil iz sigmoyidnoyu peredavalnoyu funkciyeyu Struktura Struktura prihovanogo sharu vidpovidaye rivnyannyu y H x WH T x WT x C x WC H x WH T x WT x 1 T x WT displaystyle begin aligned y H x W H centerdot T x W T x centerdot C x W C H x W H centerdot T x W T x centerdot 1 T x W T end aligned Perevaga magistralevoyi merezhi nad zvichajnimi glibinnimi nejronnimi merezhami polyagaye v tomu sho vona rozv yazuye abo chastkovo zapobigaye problemi znikannya gradiyenta sho prizvodit do sproshennya optimizuvannya nejronnih merezh PrimitkiSrivastava Rupesh Kumar Greff Klaus Schmidhuber Jurgen 2 travnya 2015 Highway Networks arXiv 1505 00387 cs LG angl Srivastava Rupesh K Greff Klaus Schmidhuber Juergen 2015 Advances in Neural Information Processing Systems 28 Curran Associates Inc 2377 2385 Arhiv originalu za 11 serpnya 2020 Procitovano 9 serpnya 2021 angl Liu Liyuan Shang Jingbo Xu Frank F Ren Xiang Gui Huan Peng Jian Han Jiawei 12 veresnya 2017 Empower Sequence Labeling with Task Aware Neural Language Model arXiv 1709 04109 cs CL angl Kurata Gakuto Ramabhadran Bhuvana Saon George Sethy Abhinav 19 veresnya 2017 Language Modeling with Highway LSTM arXiv 1709 06436 cs CL angl Ce nezavershena stattya zi shtuchnogo intelektu Vi mozhete dopomogti proyektu vipravivshi abo dopisavshi yiyi