Обме́жена маши́на Бо́льцмана (ОМБ, англ. restricted Boltzmann machine, RBM) — це породжувальна стохастична штучна нейронна мережа, здатна навчатися розподілу ймовірностей над набором її входів.
ОМБ було спочатку винайдено під назвою Гармоніум (англ. Harmonium — фісгармонія) [en] 1986 року, а популярності вони набули після винайдення Джефрі Гінтоном зі співавторами у середині 2000-х років алгоритмів швидкого навчання для них. ОМБ знайшли застосування у зниженні розмірності, класифікації, колаборативній фільтрації, навчанні ознак, тематичному моделюванні та навіть [en]. Їх можна тренувати як керованим, так і некерованим чином, залежно від завдання.
Як випливає з їхньої назви, ОМБ є варіантом машин Больцмана, з тим обмеженням, що їхні нейрони мусять формувати двочастковий граф: пара вузлів з кожної з двох груп вузлів (що, як правило, називають «видимим» та «прихованим» вузлами відповідно) можуть мати симетричне з'єднання між ними, але з'єднань між вузлами в межах групи не існує. На противагу, «необмежені» машини Больцмана можуть мати з'єднання між прихованими вузлами. Це обмеження уможливлює ефективніші алгоритми тренування, ніж доступні для загального класу машин Больцмана, зокрема, алгоритм контра́стового розхо́дження (англ. contrastive divergence) на основі градієнтного спуску.
Обмежені машини Больцмана можливо також застосовувати в мережах глибокого навчання. Зокрема, глибокі мережі переконань можуть утворюватися «складанням» ОМБ та, можливо, тонким настроюванням отримуваної глибокої мережі за допомогою градієнтного спуску та зворотного поширення.
Структура
Стандартний тип ОМБ має бінарновозначні (булеві) приховані та видимі вузли, і складається з матриці вагових коефіцієнтів розміру . Кожен ваговий елемент цієї матриці пов'язано зі з'єднанням між видимим (вхідним) вузлом та прихованим вузлом . Крім того, є вагові коефіцієнти упереджень (зміщення) для та для . З урахуванням цих ваг та упереджень, енергію конфігурації (пари булевих векторів) (v,h) визначають як
або, в матричному записі,
Ця функція енергії аналогічна функції енергії мережі Гопфілда. Як і з загальними машинами Больцмана, спільний розподіл імовірності для видимих та прихованих векторів визначають у термінах функції енергії наступним чином:
де є [en], визначеною як сума над усіма можливими конфігураціями, що можливо інтерпретувати як [en] для забезпечення того, щоби ймовірності давали в сумі 1. Відособлена ймовірність видимого вектора є сумою над усіма можливими конфігураціями прихованого шару,
- ,
і навпаки. Оскільки графова структура в основі ОМБ двочасткова (тобто, без з'єднань усередині шарів), збудження прихованих вузлів є [en] для заданих збуджень видимих вузлів. І навпаки, збудження видимих вузлів є взаємно незалежними для заданих збуджень прихованих вузлів. Тобто, для m видимих вузлів та n прихованих вузлів умовною ймовірністю конфігурації видимих вузлів v для заданої конфігурації прихованих вузлів h є
- .
І навпаки, умовною ймовірністю h для заданої v є
- .
Імовірності окремих збуджень задаються як
- та
де позначає логістичну сигмоїду.
Незважаючи на те, що приховані вузли є бернуллієвими, видимі вузли обмеженої машини Больцмана можуть бути багатозначними.[: ком.] В такому випадку логістична функція для видимих вузлів замінюється нормованою експоненційною функцією (англ. Softmax function)
де K є кількістю дискретних значень, які мають видимі значення. Вони застосовуються в тематичному моделюванні та рекомендаційних системах.
Співвідношення з іншими моделями
Обмежені машини Больцмана є особливим випадком машин Больцмана та марковських випадкових полів. Їхня графова модель відповідає моделі факторного аналізу.
Алгоритм тренування
Обмежені машини Больцмана тренуються максимізувати добуток ймовірностей, призначених певному тренувальному наборові (матриця, кожен рядок якої розглядається як видимий вектор ),
або, рівноцінно, максимізувати математичне сподівання логарифмічної ймовірності тренувального зразка , вибраного випадково з :
Алгоритмом, що найчастіше застосовують для тренування ОМБ, тобто для оптимізації матриці вагових коефіцієнтів , є алгоритм контрастового розходження (КР, англ. contrastive divergence, CD), що належить Гінтонові, первинно розроблений для тренування моделей [en] (англ. product of experts, PoE). Цей алгоритм здійснює [en], і використовується всередині процедури градієнтного спуску (подібного до того, як зворотне поширення використовується всередині такої процедури при тренуванні нейронних мереж прямого поширення) для обчислення уточнення вагових коефіцієнтів.
Елементарну, однокрокову процедуру контрастового розходження (КР-1, англ. CD-1) для єдиного зразка може бути описано таким чином:
- Взяти тренувальний зразок v, обчислити ймовірності прихованих вузлів, та вибрати вектор прихованих збуджень h з цього розподілу ймовірності.
- Обчислити зовнішній добуток v та h, і назвати це позитивним градієнтом.
- Спираючись на h, вибрати відбудову видимих вузлів v', а потім перевибрати з неї приховані збудження h'. (крок вибірки за Ґіббзом)
- Обчислити зовнішній добуток v' та h', і назвати це негативним градієнтом.
- Покласти уточненням вагової матриці різницю позитивного та негативного градієнтів, помножену на певний темп навчання: .
- Уточнити упередження a та b аналогічно: , .
Практичну настанову з тренування ОМБ, написану Гінтоном, можна знайти на його домашній сторінці.
Складена обмежена машина Больцмана
Цей розділ написано занадто професійним зі специфічною термінологією, що може бути незрозумілим для більшості читачів. (серпень 2023) |
Цей розділ потребує додаткових для поліпшення його . (Серпень 2023) |
- Відмінність між складеними обмеженими машинами Больцмана (англ. Stacked Restricted Boltzmann Machines) та ОМБ полягає в тому, що ОМБ має бічні з’єднання всередині шару, які заборонено для того, щоби зробити аналіз піддатливим. З іншого боку, складена больцманова машина складається з поєднання некерованої тришарової мережі з симетричними вагами та керованого тонко настроюваного верхнього шару для розпізнавання трьох класів.
- Використання складеної больцманової машини призначене для розуміння природної мови, [en], створення зображень та класифікування. Ці функції тренуються некерованим попереднім тренуванням та/або керованим тонким настроюванням. На відміну від неорієнтованого симетричного верхнього шару, з двоспрямованим несиметричним шаром для підключення до ОМБ. Обмежені больцманові з'єднання є тришаровим з асиметричними вагами, а дві мережі об'єднано в одну.
- Складена больцманова машина має спільні риси з ОМБ, нейрон для складеної больцманової машини це стохастичний бінарний нейрон Гопфілда, такий же, як і в обмеженій машині Больцмана. Енергію як для складеної больцманової машини, так і для ОМБ, задають ґіббзовою мірою ймовірності . Процес тренування обмежених больцманових машин подібний до ОМБ. Обмежені больцманові машини тренують пошарово та наближують стан рівноваги 3-сегментним проходом, не виконуючи зворотного поширення. Обмежені больцманові машини використовують як кероване, так і некероване тренування на різних ОБМ для попереднього тренування для класифікування та розпізнавання. Тренування використовує контрастове розходження з ґіббзовим вибиранням: Δwij = e*(pij - p'ij)
- Перевага обмеженої больцманової машини полягає у виконанні нелінійного перетворення, тому її легко розширити, що може дати ієрархічний шар ознак. Слабкість полягає у складності обчислень цілочислових та дійснозначних нейронів. Вона не слідує градієнтові будь-якої функції, тож наближення контрастового розходження до максимальної правдоподібності є імпровізованим.
Література
- Fischer, Asja; Igel, Christian (2012), An Introduction to Restricted Boltzmann Machines, Progress in Pattern Recognition, Image Analysis, Computer Vision, and Applications, Lecture Notes in Computer Science (англ.), Berlin, Heidelberg: Springer Berlin Heidelberg, т. 7441, с. 14—36, doi:10.1007/978-3-642-33275-3_2, ISBN
Див. також
- Автокодувальник
- [en]
Примітки
- Smolensky, Paul (1986). (PDF). У Rumelhart, David E.; McLelland, James L. (ред.). Parallel Distributed Processing: Explorations in the Microstructure of Cognition, Volume 1: Foundations. MIT Press. с. 194–281. ISBN . Архів оригіналу (PDF) за 14 липня 2023. Процитовано 13 січня 2016. (англ.)
- Hinton, G. E.; Salakhutdinov, R. R. (2006). (PDF). Science. 313 (5786): 504—507. Bibcode:2006Sci...313..504H. doi:10.1126/science.1127647. PMID 16873662. S2CID 1658773. Архів оригіналу (PDF) за 23 грудня 2015. Процитовано 13 січня 2016. (англ.)
- Larochelle, H.; Bengio, Y. (2008). (PDF). Proceedings of the 25th international conference on Machine learning - ICML '08. с. 536. doi:10.1145/1390156.1390224. ISBN . Архів оригіналу (PDF) за 13 жовтня 2017. Процитовано 13 січня 2016. (англ.)
- Salakhutdinov, R.; Mnih, A.; Hinton, G. (2007). Restricted Boltzmann machines for collaborative filtering. Proceedings of the 24th international conference on Machine learning - ICML '07. с. 791. doi:10.1145/1273496.1273596. ISBN . (англ.)
- Coates, Adam; Lee, Honglak; Ng, Andrew Y. (2011). (PDF). International Conference on Artificial Intelligence and Statistics (AISTATS). Архів оригіналу (PDF) за 20 грудня 2014. Процитовано 13 січня 2016. (англ.)
- Ruslan Salakhutdinov and Geoffrey Hinton (2010). Replicated softmax: an undirected topic model [ 25 травня 2012 у Wayback Machine.]. [en] 23. (англ.)
- Carleo, Giuseppe; Troyer, Matthias (10 лютого 2017). Solving the quantum many-body problem with artificial neural networks. Science (англ.). 355 (6325): 602—606. arXiv:1606.02318. Bibcode:2017Sci...355..602C. doi:10.1126/science.aag2302. ISSN 0036-8075. PMID 28183973. S2CID 206651104.
- Melko, Roger G.; Carleo, Giuseppe; Carrasquilla, Juan; Cirac, J. Ignacio (September 2019). Restricted Boltzmann machines in quantum physics. Nature Physics (англ.). 15 (9): 887—892. Bibcode:2019NatPh..15..887M. doi:10.1038/s41567-019-0545-1. ISSN 1745-2481.
- Miguel Á. Carreira-Perpiñán and Geoffrey Hinton (2005). On contrastive divergence learning. Artificial Intelligence and Statistics. (англ.)
- Hinton, G. (2009). Deep belief networks. Scholarpedia. 4 (5): 5947. Bibcode:2009SchpJ...4.5947H. doi:10.4249/scholarpedia.5947. (англ.)
- Geoffrey Hinton (2010). A Practical Guide to Training Restricted Boltzmann Machines [ 25 вересня 2014 у Wayback Machine.]. UTML TR 2010—003, University of Toronto. (англ.)
- Sutskever, Ilya; Tieleman, Tijmen (2010). (PDF). Proc. 13th Int'l Conf. On AI and Statistics (AISTATS). Архів оригіналу (PDF) за 10 червня 2015. (англ.)
- Asja Fischer and Christian Igel. Training Restricted Boltzmann Machines: An Introduction [ 10 червня 2015 у Wayback Machine.]. Pattern Recognition 47, pp. 25-39, 2014 (англ.)
- María Angélica Cueto; Jason Morton; Bernd Sturmfels (2010). Geometry of the restricted Boltzmann machine. Algebraic Methods in Statistics and Probability. American Mathematical Society. 516. arXiv:0908.4425. Bibcode:2009arXiv0908.4425A. (англ.)
- Geoffrey Hinton (1999). Products of Experts [ 24 вересня 2015 у Wayback Machine.]. ICANN 1999. (англ.)
- Hinton, G. E. (2002). (PDF). Neural Computation. 14 (8): 1771—1800. doi:10.1162/089976602760128018. PMID 12180402. S2CID 207596505. Архів accessdate = 13 січня 2016 оригіналу за 3 березня 2016. (англ.)
Посилання
- Введення до обмежених машин Больцмана [ 29 жовтня 2012 у Wayback Machine.]. Блог Едвіна Чена (англ. Edwin Chen), 18 липня 2011 р. (англ.)
- . Архів оригіналу за 11 лютого 2017. Процитовано 15 листопада 2018.. Документація Deeplearning4j (англ.)
- . Архів оригіналу за 20 вересня 2016. Процитовано 29 грудня 2014.. Документація Deeplearning4j (англ.)
- Втілення ОМБ Бернуллі мовою Python, та посібник (англ.)
- SimpleRBM це дуже мелий код ОМБ (24 кБ), корисний вам для вивчення того, як вчаться та працюють ОМБ.
- Втілення обмежених машин Больцмана мовою Julia: https://github.com/cossio/RestrictedBoltzmannMachines.jl
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Obme zhena mashi na Bo lcmana OMB angl restricted Boltzmann machine RBM ce porodzhuvalna stohastichna shtuchna nejronna merezha zdatna navchatisya rozpodilu jmovirnostej nad naborom yiyi vhodiv Shema obmezhenoyi mashini Bolcmana z troma vidimimi vuzlami ta chotirma prihovanimi vuzlami bez uperedzhenih vuzliv OMB bulo spochatku vinajdeno pid nazvoyu Garmonium angl Harmonium fisgarmoniya en 1986 roku a populyarnosti voni nabuli pislya vinajdennya Dzhefri Gintonom zi spivavtorami u seredini 2000 h rokiv algoritmiv shvidkogo navchannya dlya nih OMB znajshli zastosuvannya u znizhenni rozmirnosti klasifikaciyi kolaborativnij filtraciyi navchanni oznak tematichnomu modelyuvanni ta navit en Yih mozhna trenuvati yak kerovanim tak i nekerovanim chinom zalezhno vid zavdannya Yak viplivaye z yihnoyi nazvi OMB ye variantom mashin Bolcmana z tim obmezhennyam sho yihni nejroni musyat formuvati dvochastkovij graf para vuzliv z kozhnoyi z dvoh grup vuzliv sho yak pravilo nazivayut vidimim ta prihovanim vuzlami vidpovidno mozhut mati simetrichne z yednannya mizh nimi ale z yednan mizh vuzlami v mezhah grupi ne isnuye Na protivagu neobmezheni mashini Bolcmana mozhut mati z yednannya mizh prihovanimi vuzlami Ce obmezhennya umozhlivlyuye efektivnishi algoritmi trenuvannya nizh dostupni dlya zagalnogo klasu mashin Bolcmana zokrema algoritm kontra stovogo rozho dzhennya angl contrastive divergence na osnovi gradiyentnogo spusku Obmezheni mashini Bolcmana mozhlivo takozh zastosovuvati v merezhah glibokogo navchannya Zokrema gliboki merezhi perekonan mozhut utvoryuvatisya skladannyam OMB ta mozhlivo tonkim nastroyuvannyam otrimuvanoyi glibokoyi merezhi za dopomogoyu gradiyentnogo spusku ta zvorotnogo poshirennya StrukturaStandartnij tip OMB maye binarnovoznachni bulevi prihovani ta vidimi vuzli i skladayetsya z matrici vagovih koeficiyentiv W displaystyle W rozmiru m n displaystyle m times n Kozhen vagovij element w i j displaystyle w i j ciyeyi matrici pov yazano zi z yednannyam mizh vidimim vhidnim vuzlom v i displaystyle v i ta prihovanim vuzlom h j displaystyle h j Krim togo ye vagovi koeficiyenti uperedzhen zmishennya a i displaystyle a i dlya v i displaystyle v i ta b j displaystyle b j dlya h j displaystyle h j Z urahuvannyam cih vag ta uperedzhen energiyu konfiguraciyi pari bulevih vektoriv v h viznachayut yak E v h i a i v i j b j h j i j v i w i j h j displaystyle E v h sum i a i v i sum j b j h j sum i sum j v i w i j h j abo v matrichnomu zapisi E v h a T v b T h v T W h displaystyle E v h a mathrm T v b mathrm T h v mathrm T Wh Cya funkciya energiyi analogichna funkciyi energiyi merezhi Gopfilda Yak i z zagalnimi mashinami Bolcmana spilnij rozpodil imovirnosti dlya vidimih ta prihovanih vektoriv viznachayut u terminah funkciyi energiyi nastupnim chinom P v h 1 Z e E v h displaystyle P v h frac 1 Z e E v h de Z displaystyle Z ye en viznachenoyu yak suma e E v h displaystyle e E v h nad usima mozhlivimi konfiguraciyami sho mozhlivo interpretuvati yak en dlya zabezpechennya togo shobi jmovirnosti davali v sumi 1 Vidosoblena jmovirnist vidimogo vektora ye sumoyu P v h displaystyle P v h nad usima mozhlivimi konfiguraciyami prihovanogo sharu P v 1 Z h e E v h displaystyle P v frac 1 Z sum h e E v h i navpaki Oskilki grafova struktura v osnovi OMB dvochastkova tobto bez z yednan useredini shariv zbudzhennya prihovanih vuzliv ye en dlya zadanih zbudzhen vidimih vuzliv I navpaki zbudzhennya vidimih vuzliv ye vzayemno nezalezhnimi dlya zadanih zbudzhen prihovanih vuzliv Tobto dlya m vidimih vuzliv ta n prihovanih vuzliv umovnoyu jmovirnistyu konfiguraciyi vidimih vuzliv v dlya zadanoyi konfiguraciyi prihovanih vuzliv h ye P v h i 1 m P v i h displaystyle P v h prod i 1 m P v i h I navpaki umovnoyu jmovirnistyu h dlya zadanoyi v ye P h v j 1 n P h j v displaystyle P h v prod j 1 n P h j v Imovirnosti okremih zbudzhen zadayutsya yak P h j 1 v s b j i 1 m w i j v i displaystyle P h j 1 v sigma left b j sum i 1 m w i j v i right ta P v i 1 h s a i j 1 n w i j h j displaystyle P v i 1 h sigma left a i sum j 1 n w i j h j right de s displaystyle sigma poznachaye logistichnu sigmoyidu Nezvazhayuchi na te sho prihovani vuzli ye bernulliyevimi vidimi vuzli obmezhenoyi mashini Bolcmana mozhut buti bagatoznachnimi proyasniti kom V takomu vipadku logistichna funkciya dlya vidimih vuzliv zaminyuyetsya normovanoyu eksponencijnoyu funkciyeyu angl Softmax function P v i k 1 h exp a i k S j W i j k h j S k 1 K exp a i k S j W i j k h j displaystyle P v i k 1 h frac exp a i k Sigma j W ij k h j Sigma k 1 K exp a i k Sigma j W ij k h j de K ye kilkistyu diskretnih znachen yaki mayut vidimi znachennya Voni zastosovuyutsya v tematichnomu modelyuvanni ta rekomendacijnih sistemah Spivvidnoshennya z inshimi modelyami Obmezheni mashini Bolcmana ye osoblivim vipadkom mashin Bolcmana ta markovskih vipadkovih poliv Yihnya grafova model vidpovidaye modeli faktornogo analizu Algoritm trenuvannyaObmezheni mashini Bolcmana trenuyutsya maksimizuvati dobutok jmovirnostej priznachenih pevnomu trenuvalnomu naborovi V displaystyle V matricya kozhen ryadok yakoyi rozglyadayetsya yak vidimij vektor v displaystyle v arg max W v V P v displaystyle arg max W prod v in V P v abo rivnocinno maksimizuvati matematichne spodivannya logarifmichnoyi jmovirnosti trenuvalnogo zrazka v displaystyle v vibranogo vipadkovo z V displaystyle V arg max W E log P v displaystyle arg max W mathbb E left log P v right Algoritmom sho najchastishe zastosovuyut dlya trenuvannya OMB tobto dlya optimizaciyi matrici vagovih koeficiyentiv W displaystyle W ye algoritm kontrastovogo rozhodzhennya KR angl contrastive divergence CD sho nalezhit Gintonovi pervinno rozroblenij dlya trenuvannya modelej en angl product of experts PoE Cej algoritm zdijsnyuye en i vikoristovuyetsya vseredini proceduri gradiyentnogo spusku podibnogo do togo yak zvorotne poshirennya vikoristovuyetsya vseredini takoyi proceduri pri trenuvanni nejronnih merezh pryamogo poshirennya dlya obchislennya utochnennya vagovih koeficiyentiv Elementarnu odnokrokovu proceduru kontrastovogo rozhodzhennya KR 1 angl CD 1 dlya yedinogo zrazka mozhe buti opisano takim chinom Vzyati trenuvalnij zrazok v obchisliti jmovirnosti prihovanih vuzliv ta vibrati vektor prihovanih zbudzhen h z cogo rozpodilu jmovirnosti Obchisliti zovnishnij dobutok v ta h i nazvati ce pozitivnim gradiyentom Spirayuchis na h vibrati vidbudovu vidimih vuzliv v a potim perevibrati z neyi prihovani zbudzhennya h krok vibirki za Gibbzom Obchisliti zovnishnij dobutok v ta h i nazvati ce negativnim gradiyentom Poklasti utochnennyam vagovoyi matrici W displaystyle W riznicyu pozitivnogo ta negativnogo gradiyentiv pomnozhenu na pevnij temp navchannya D W ϵ v h T v h T displaystyle Delta W epsilon vh mathsf T v h mathsf T Utochniti uperedzhennya a ta b analogichno D a ϵ v v displaystyle Delta a epsilon v v D b ϵ h h displaystyle Delta b epsilon h h Praktichnu nastanovu z trenuvannya OMB napisanu Gintonom mozhna znajti na jogo domashnij storinci Skladena obmezhena mashina BolcmanaCej rozdil napisano zanadto profesijnim stilem zi specifichnoyu terminologiyeyu sho mozhe buti nezrozumilim dlya bilshosti chitachiv Vi mozhete dopomogti vdoskonaliti cej rozdil zrobivshi jogo zrozumilim dlya nespecialistiv bez vtrat zmistu Mozhlivo storinka obgovorennya mistit zauvazhennya shodo potribnih zmin serpen 2023 Cej rozdil potrebuye dodatkovih posilan na dzherela dlya polipshennya jogo perevirnosti Bud laska dopomozhit udoskonaliti cej rozdil dodavshi posilannya na nadijni avtoritetni dzherela Zvernitsya na storinku obgovorennya za poyasnennyami ta dopomozhit vipraviti nedoliki Material bez dzherel mozhe buti piddano sumnivu ta vilucheno Serpen 2023 Div takozh Gliboka merezha perekonan Vidminnist mizh skladenimi obmezhenimi mashinami Bolcmana angl Stacked Restricted Boltzmann Machines ta OMB polyagaye v tomu sho OMB maye bichni z yednannya vseredini sharu yaki zaboroneno dlya togo shobi zrobiti analiz piddatlivim Z inshogo boku skladena bolcmanova mashina skladayetsya z poyednannya nekerovanoyi trisharovoyi merezhi z simetrichnimi vagami ta kerovanogo tonko nastroyuvanogo verhnogo sharu dlya rozpiznavannya troh klasiv Vikoristannya skladenoyi bolcmanovoyi mashini priznachene dlya rozuminnya prirodnoyi movi en stvorennya zobrazhen ta klasifikuvannya Ci funkciyi trenuyutsya nekerovanim poperednim trenuvannyam ta abo kerovanim tonkim nastroyuvannyam Na vidminu vid neoriyentovanogo simetrichnogo verhnogo sharu z dvospryamovanim nesimetrichnim sharom dlya pidklyuchennya do OMB Obmezheni bolcmanovi z yednannya ye trisharovim z asimetrichnimi vagami a dvi merezhi ob yednano v odnu Skladena bolcmanova mashina maye spilni risi z OMB nejron dlya skladenoyi bolcmanovoyi mashini ce stohastichnij binarnij nejron Gopfilda takij zhe yak i v obmezhenij mashini Bolcmana Energiyu yak dlya skladenoyi bolcmanovoyi mashini tak i dlya OMB zadayut gibbzovoyu miroyu jmovirnosti E 1 2 i j w i j s i s j i 8 i s i displaystyle E frac 1 2 sum i j w ij s i s j sum i theta i s i Proces trenuvannya obmezhenih bolcmanovih mashin podibnij do OMB Obmezheni bolcmanovi mashini trenuyut posharovo ta nablizhuyut stan rivnovagi 3 segmentnim prohodom ne vikonuyuchi zvorotnogo poshirennya Obmezheni bolcmanovi mashini vikoristovuyut yak kerovane tak i nekerovane trenuvannya na riznih OBM dlya poperednogo trenuvannya dlya klasifikuvannya ta rozpiznavannya Trenuvannya vikoristovuye kontrastove rozhodzhennya z gibbzovim vibirannyam Dwij e pij p ij Perevaga obmezhenoyi bolcmanovoyi mashini polyagaye u vikonanni nelinijnogo peretvorennya tomu yiyi legko rozshiriti sho mozhe dati iyerarhichnij shar oznak Slabkist polyagaye u skladnosti obchislen cilochislovih ta dijsnoznachnih nejroniv Vona ne sliduye gradiyentovi bud yakoyi funkciyi tozh nablizhennya kontrastovogo rozhodzhennya do maksimalnoyi pravdopodibnosti ye improvizovanim LiteraturaFischer Asja Igel Christian 2012 An Introduction to Restricted Boltzmann Machines Progress in Pattern Recognition Image Analysis Computer Vision and Applications Lecture Notes in Computer Science angl Berlin Heidelberg Springer Berlin Heidelberg t 7441 s 14 36 doi 10 1007 978 3 642 33275 3 2 ISBN 978 3 642 33274 6Div takozhAvtokoduvalnik en PrimitkiSmolensky Paul 1986 PDF U Rumelhart David E McLelland James L red Parallel Distributed Processing Explorations in the Microstructure of Cognition Volume 1 Foundations MIT Press s 194 281 ISBN 0 262 68053 X Arhiv originalu PDF za 14 lipnya 2023 Procitovano 13 sichnya 2016 angl Hinton G E Salakhutdinov R R 2006 PDF Science 313 5786 504 507 Bibcode 2006Sci 313 504H doi 10 1126 science 1127647 PMID 16873662 S2CID 1658773 Arhiv originalu PDF za 23 grudnya 2015 Procitovano 13 sichnya 2016 angl Larochelle H Bengio Y 2008 PDF Proceedings of the 25th international conference on Machine learning ICML 08 s 536 doi 10 1145 1390156 1390224 ISBN 9781605582054 Arhiv originalu PDF za 13 zhovtnya 2017 Procitovano 13 sichnya 2016 angl Salakhutdinov R Mnih A Hinton G 2007 Restricted Boltzmann machines for collaborative filtering Proceedings of the 24th international conference on Machine learning ICML 07 s 791 doi 10 1145 1273496 1273596 ISBN 9781595937933 angl Coates Adam Lee Honglak Ng Andrew Y 2011 PDF International Conference on Artificial Intelligence and Statistics AISTATS Arhiv originalu PDF za 20 grudnya 2014 Procitovano 13 sichnya 2016 angl Ruslan Salakhutdinov and Geoffrey Hinton 2010 Replicated softmax an undirected topic model 25 travnya 2012 u Wayback Machine en 23 angl Carleo Giuseppe Troyer Matthias 10 lyutogo 2017 Solving the quantum many body problem with artificial neural networks Science angl 355 6325 602 606 arXiv 1606 02318 Bibcode 2017Sci 355 602C doi 10 1126 science aag2302 ISSN 0036 8075 PMID 28183973 S2CID 206651104 Melko Roger G Carleo Giuseppe Carrasquilla Juan Cirac J Ignacio September 2019 Restricted Boltzmann machines in quantum physics Nature Physics angl 15 9 887 892 Bibcode 2019NatPh 15 887M doi 10 1038 s41567 019 0545 1 ISSN 1745 2481 Miguel A Carreira Perpinan and Geoffrey Hinton 2005 On contrastive divergence learning Artificial Intelligence and Statistics angl Hinton G 2009 Deep belief networks Scholarpedia 4 5 5947 Bibcode 2009SchpJ 4 5947H doi 10 4249 scholarpedia 5947 angl Geoffrey Hinton 2010 A Practical Guide to Training Restricted Boltzmann Machines 25 veresnya 2014 u Wayback Machine UTML TR 2010 003 University of Toronto angl Sutskever Ilya Tieleman Tijmen 2010 PDF Proc 13th Int l Conf On AI and Statistics AISTATS Arhiv originalu PDF za 10 chervnya 2015 angl Asja Fischer and Christian Igel Training Restricted Boltzmann Machines An Introduction 10 chervnya 2015 u Wayback Machine Pattern Recognition 47 pp 25 39 2014 angl Maria Angelica Cueto Jason Morton Bernd Sturmfels 2010 Geometry of the restricted Boltzmann machine Algebraic Methods in Statistics and Probability American Mathematical Society 516 arXiv 0908 4425 Bibcode 2009arXiv0908 4425A angl Geoffrey Hinton 1999 Products of Experts 24 veresnya 2015 u Wayback Machine ICANN 1999 angl Hinton G E 2002 PDF Neural Computation 14 8 1771 1800 doi 10 1162 089976602760128018 PMID 12180402 S2CID 207596505 Arhiv accessdate 13 sichnya 2016 originalu za 3 bereznya 2016 angl PosilannyaVvedennya do obmezhenih mashin Bolcmana 29 zhovtnya 2012 u Wayback Machine Blog Edvina Chena angl Edwin Chen 18 lipnya 2011 r angl Arhiv originalu za 11 lyutogo 2017 Procitovano 15 listopada 2018 Dokumentaciya Deeplearning4j angl Arhiv originalu za 20 veresnya 2016 Procitovano 29 grudnya 2014 Dokumentaciya Deeplearning4j angl Vtilennya OMB Bernulli movoyu Python ta posibnik angl SimpleRBM ce duzhe melij kod OMB 24 kB korisnij vam dlya vivchennya togo yak vchatsya ta pracyuyut OMB Vtilennya obmezhenih mashin Bolcmana movoyu Julia https github com cossio RestrictedBoltzmannMachines jl