Ця стаття має кілька недоліків. Будь ласка, допоможіть удосконалити її або обговоріть ці проблеми на .
|
В іншому мовному розділі є повніша стаття Coordinate descent(англ.). Ви можете допомогти, розширивши поточну статтю за допомогою з англійської. (грудень 2019)
|
Координатний спуск — це алгоритм оптимізації, який послідовно мінімізує уздовж координатних напрямків, щоб знайти мінімум функції. При кожній ітерації алгоритм визначає координату або координатний блок за допомогою правила вибору координат, а потім точно або приблизно мінімізує відповідну координатну гіперплощину, фіксуючи всі інші координати або блоки координат. Лінійний пошук по напрямку координат може бути здійснений на поточній ітерації для визначення відповідного розміру кроку. Координатний спуск може застосовуватися як у диференційованому, так і в похідному контексті.
Опис
Координатний спуск заснований на ідеї, що мінімізація багатоваріантної функції може бути досягнута шляхом мінімізації її по одному напрямку за один раз, тобто, вирішення одноманітної (або, принаймні, набагато простішої) проблеми оптимізації в циклі. У найпростішому випадку циклічного координатного спуску, він циклічно повторюється через напрямки, по одному, мінімізуючи цільову функцію щодо кожного напрямку координат одночасно. Тобто, починаючи з початкових значень змінних
крок задає з ітеративно розв'язує проблеми оптимізації єдиної змінної
для кожної змінної з для від 1 до .
Таким чином, починаючи з початкової догадки для локального мінімуму функції , і отримуючи ітеративно послідовність
Використовуючи лінійний пошук кожної ітерації, ми автоматично отримуємо, що
Тут можна побачити що ця послідовність має схожі збіжні властивості як і метод найбільш крутого спуску. Відсутність вдосконалення після одного циклу лінійного пошуку вздовж координатних напрямків вказує на те, що стаціонарна точка досягнута. Цей процес ілюстрований нижче.
Диференційований випадок
У випадку неперервно диференційованої функції , алгоритм координатного спуску може бути представлений як:
- Виберіть початковий параметричний вектор .
- До тих пір, поки не буде досягнута збіжність або для певної кількості ітерацій:
- Виберіть індекс від 1 до .
- Виберіть розмір кроку .
- Оновлюйте до
Розмір кроку може бути вибраний різними способами, наприклад, шляхом вирішення точного мінімізатора (тобто, зі всіма змінними, але фіксованими ), або за традиційними критеріями пошуку рядків.
Обмеження
Координатний спуск має дві проблеми. Одна з них — це відсутність гладкої функції багатьох змінних. На наступному малюнку видно, що ітеративний спуск координатами може застрягнути в нестаціонарній точці, якщо криві рівня функції не є гладкими. Припустимо, що алгоритм знаходиться в точці (-2, -2); Тоді є два напрями, орієнтовані на осі, які можна розглянути для кроку, позначені червоними стрілками. Однак кожен крок уздовж цих двох напрямків збільшуватиме значення цільової функції (припускаючи проблему мінімізації), тому алгоритм не зробить жодного кроку, навіть якщо обидва кроки разом наблизили б алгоритм до оптимального. Хоча цей приклад показує, що спуск координатами не обов'язково збігається з оптимальним, можливо виявити формальне зближення при розумних умовах.
Інша проблема — це складність розпаралелювання даного алгоритму. Оскільки суть координатного спуску полягає у проходженні напрямків та мінімізації цільової функції стосовно кожного координатного напрямку, спуск координат не є тривіальною задачею для паралелізму. Останні дослідницькі роботи показали, що паралелізм застосовується для координатного спуску шляхом послаблення зміни цільової функції стосовно кожного координатного напрямку.
Застосування
Алгоритми координатного спуску користуються популярністю у практикантів завдяки своїй простоті, але та сама властивість змусила дослідників оптимізації значною мірою ігнорувати їх на користь більш цікавих (складних) методів. Раннє застосування оптимізації методом спуску координат було в області комп'ютерної томографії, де було виявлено швидку збіжність, а згодом було використано для клінічної реконструкції багатоклітинної спіральної томографії. Крім того, виявився підвищений інтерес до використання координатного спуску з появою масштабних проблем у машинному навчанні, коли спуск координат виявився конкурентоспроможним для інших методів при застосуванні до таких проблем, як навчання лінійних методу опорних векторів і розкладу невід'ємних матриць. Вони привабливі для проблем, коли обчислення градієнтів недосяжно, можливо, тому, що дані, необхідні для цього, поширюються по комп'ютерних мережах.
Див. також
Примітки
- Wright, Stephen J. (2015-06). Coordinate descent algorithms. Mathematical Programming (англ.). Т. 151, № 1. с. 3—34. doi:10.1007/s10107-015-0892-3. ISSN 0025-5610. Процитовано 23 грудня 2019.
- Spall, James C. (2012-07). Cyclic Seesaw Process for Optimization and Identification. Journal of Optimization Theory and Applications (англ.). Т. 154, № 1. с. 187—208. doi:10.1007/s10957-012-0001-1. ISSN 0022-3239. Процитовано 23 грудня 2019.
- Zheng, J.; Saquib, S.S.; Sauer, K.; Bouman, C.A. (2000). Parallelizable Bayesian tomography algorithms with rapid, guaranteed convergence. IEEE Transactions on Image Processing. Т. 9, № 10. с. 1745—1759. doi:10.1109/83.869186. ISSN 1057-7149. Процитовано 23 грудня 2019.
- Fessler, J.A.; Ficaro, E.P.; Clinthorne, N.H.; Lange, K. (1997-04). Grouped-coordinate ascent algorithms for penalized-likelihood transmission image reconstruction. IEEE Transactions on Medical Imaging. Т. 16, № 2. с. 166—175. doi:10.1109/42.563662. ISSN 0278-0062. Процитовано 23 грудня 2019.
- Sabne, Amit; Wang, Xiao; Kisner, Sherman J.; Bouman, Charles A.; Raghunathan, Anand; Midkiff, Samuel P. (2017). Model-based Iterative CT Image Reconstruction on GPUs. Proceedings of the 22nd ACM SIGPLAN Symposium on Principles and Practice of Parallel Programming - PPoPP '17. ACM Press. doi:10.1145/3018743.3018765. ISBN . Процитовано 23 грудня 2019.
- Sauer, K.; Bouman, C. (1993). A local update strategy for iterative reconstruction from projections. IEEE Transactions on Signal Processing. Т. 41, № 2. с. 534—548. doi:10.1109/78.193196. ISSN 1053-587X. Процитовано 23 грудня 2019.
- Yu, Zhou; Thibault, Jean-Baptiste; Bouman, Charles A.; Sauer, Ken D.; Hsieh, Jiang (2011-01). Fast Model-Based X-Ray CT Reconstruction Using Spatially Nonhomogeneous ICD Optimization. IEEE Transactions on Image Processing. Т. 20, № 1. с. 161—175. doi:10.1109/tip.2010.2058811. ISSN 1057-7149. Процитовано 23 грудня 2019.
- Thibault, Jean-Baptiste; Sauer, Ken D.; Bouman, Charles A.; Hsieh, Jiang (29 жовтня 2007). A three-dimensional statistical approach to improved image quality for multislice helical CT. Medical Physics. Т. 34, № 11. с. 4526—4544. doi:10.1118/1.2789499. ISSN 0094-2405. Процитовано 23 грудня 2019.
- Hsieh, Cho-Jui; Chang, Kai-Wei; Lin, Chih-Jen; Keerthi, S. Sathiya; Sundararajan, S. (2008). A dual coordinate descent method for large-scale linear SVM. Proceedings of the 25th international conference on Machine learning - ICML '08. ACM Press. doi:10.1145/1390156.1390208. ISBN . Процитовано 23 грудня 2019.
- Hsieh, Cho-Jui; Dhillon, Inderjit S. (2011). Fast coordinate descent methods with variable selection for non-negative matrix factorization. Proceedings of the 17th ACM SIGKDD international conference on Knowledge discovery and data mining - KDD '11. ACM Press. doi:10.1145/2020408.2020577. ISBN . Процитовано 23 грудня 2019.
- Nesterov, Yu. (2012-01). Efficiency of Coordinate Descent Methods on Huge-Scale Optimization Problems. SIAM Journal on Optimization. Т. 22, № 2. с. 341—362. doi:10.1137/100802001. ISSN 1052-6234. Процитовано 23 грудня 2019.
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Cya stattya maye kilka nedolikiv Bud laska dopomozhit udoskonaliti yiyi abo obgovorit ci problemi na Cyu stattyu treba vikifikuvati dlya vidpovidnosti standartam yakosti Vikipediyi Bud laska dopomozhit dodavannyam dorechnih vnutrishnih posilan abo vdoskonalennyam rozmitki statti gruden 2019 Cya stattya ne mistit posilan na dzherela Vi mozhete dopomogti polipshiti cyu stattyu dodavshi posilannya na nadijni avtoritetni dzherela Material bez dzherel mozhe buti piddano sumnivu ta vilucheno gruden 2019 V inshomu movnomu rozdili ye povnisha stattya Coordinate descent angl Vi mozhete dopomogti rozshirivshi potochnu stattyu za dopomogoyu perekladu z anglijskoyi gruden 2019 Divitis avtoperekladenu versiyu statti z movi anglijska Perekladach povinen rozumiti sho vidpovidalnist za kincevij vmist statti u Vikipediyi nese same avtor redaguvan Onlajn pereklad nadayetsya lishe yak korisnij instrument pereglyadu vmistu zrozumiloyu movoyu Ne vikoristovujte nevichitanij i nevidkorigovanij mashinnij pereklad u stattyah ukrayinskoyi Vikipediyi Mashinnij pereklad Google ye korisnoyu vidpravnoyu tochkoyu dlya perekladu ale perekladacham neobhidno vipravlyati pomilki ta pidtverdzhuvati tochnist perekladu a ne prosto skopiyuvati mashinnij pereklad do ukrayinskoyi Vikipediyi Ne perekladajte tekst yakij vidayetsya nedostovirnim abo neyakisnim Yaksho mozhlivo perevirte tekst za posilannyami podanimi v inshomovnij statti Dokladni rekomendaciyi div Vikipediya Pereklad Koordinatnij spusk ce algoritm optimizaciyi yakij poslidovno minimizuye uzdovzh koordinatnih napryamkiv shob znajti minimum funkciyi Pri kozhnij iteraciyi algoritm viznachaye koordinatu abo koordinatnij blok za dopomogoyu pravila viboru koordinat a potim tochno abo priblizno minimizuye vidpovidnu koordinatnu giperploshinu fiksuyuchi vsi inshi koordinati abo bloki koordinat Linijnij poshuk po napryamku koordinat mozhe buti zdijsnenij na potochnij iteraciyi dlya viznachennya vidpovidnogo rozmiru kroku Koordinatnij spusk mozhe zastosovuvatisya yak u diferencijovanomu tak i v pohidnomu konteksti OpisKoordinatnij spusk zasnovanij na ideyi sho minimizaciya bagatovariantnoyi funkciyi F x displaystyle F x mozhe buti dosyagnuta shlyahom minimizaciyi yiyi po odnomu napryamku za odin raz tobto virishennya odnomanitnoyi abo prinajmni nabagato prostishoyi problemi optimizaciyi v cikli U najprostishomu vipadku ciklichnogo koordinatnogo spusku vin ciklichno povtoryuyetsya cherez napryamki po odnomu minimizuyuchi cilovu funkciyu shodo kozhnogo napryamku koordinat odnochasno Tobto pochinayuchi z pochatkovih znachen zminnih x0 x10 xn0 displaystyle mathbf x 0 x 1 0 ldots x n 0 krok k 1 displaystyle k 1 zadaye xk 1 displaystyle mathbf x k 1 z xk displaystyle mathbf x k iterativno rozv yazuye problemi optimizaciyi yedinoyi zminnoyi xik 1 argminy Rf x1k 1 xi 1k 1 y xi 1k xnk displaystyle x i k 1 underset y in mathbb R operatorname arg min f x 1 k 1 dots x i 1 k 1 y x i 1 k dots x n k dlya kozhnoyi zminnoyi xi displaystyle x i z x displaystyle mathbf x dlya i displaystyle i vid 1 do n displaystyle n Takim chinom pochinayuchi z pochatkovoyi dogadki x0 displaystyle mathbf x 0 dlya lokalnogo minimumu funkciyi F displaystyle F i otrimuyuchi iterativno poslidovnist x0 x1 x2 displaystyle mathbf x 0 mathbf x 1 mathbf x 2 dots Vikoristovuyuchi linijnij poshuk kozhnoyi iteraciyi mi avtomatichno otrimuyemo sho F x0 F x1 F x2 displaystyle F mathbf x 0 geq F mathbf x 1 geq F mathbf x 2 geq dots Tut mozhna pobachiti sho cya poslidovnist maye shozhi zbizhni vlastivosti yak i metod najbilsh krutogo spusku Vidsutnist vdoskonalennya pislya odnogo ciklu linijnogo poshuku vzdovzh koordinatnih napryamkiv vkazuye na te sho stacionarna tochka dosyagnuta Cej proces ilyustrovanij nizhche Diferencijovanij vipadok U vipadku neperervno diferencijovanoyi funkciyi F displaystyle F algoritm koordinatnogo spusku mozhe buti predstavlenij yak Viberit pochatkovij parametrichnij vektor X displaystyle X Do tih pir poki ne bude dosyagnuta zbizhnist abo dlya pevnoyi kilkosti iteracij Viberit indeks i displaystyle i vid 1 do n displaystyle n Viberit rozmir kroku a displaystyle a Onovlyujte xi displaystyle x i do xi adFdxi X displaystyle x i alpha dfrac dF dx i X Rozmir kroku mozhe buti vibranij riznimi sposobami napriklad shlyahom virishennya tochnogo minimizatora f xi F x displaystyle f x i F x tobto F displaystyle F zi vsima zminnimi ale fiksovanimi xi displaystyle x i abo za tradicijnimi kriteriyami poshuku ryadkiv ObmezhennyaKoordinatnij spusk maye dvi problemi Odna z nih ce vidsutnist gladkoyi funkciyi bagatoh zminnih Na nastupnomu malyunku vidno sho iterativnij spusk koordinatami mozhe zastryagnuti v nestacionarnij tochci yaksho krivi rivnya funkciyi ne ye gladkimi Pripustimo sho algoritm znahoditsya v tochci 2 2 Todi ye dva napryami oriyentovani na osi yaki mozhna rozglyanuti dlya kroku poznacheni chervonimi strilkami Odnak kozhen krok uzdovzh cih dvoh napryamkiv zbilshuvatime znachennya cilovoyi funkciyi pripuskayuchi problemu minimizaciyi tomu algoritm ne zrobit zhodnogo kroku navit yaksho obidva kroki razom nablizili b algoritm do optimalnogo Hocha cej priklad pokazuye sho spusk koordinatami ne obov yazkovo zbigayetsya z optimalnim mozhlivo viyaviti formalne zblizhennya pri rozumnih umovah Insha problema ce skladnist rozparalelyuvannya danogo algoritmu Oskilki sut koordinatnogo spusku polyagaye u prohodzhenni napryamkiv ta minimizaciyi cilovoyi funkciyi stosovno kozhnogo koordinatnogo napryamku spusk koordinat ne ye trivialnoyu zadacheyu dlya paralelizmu Ostanni doslidnicki roboti pokazali sho paralelizm zastosovuyetsya dlya koordinatnogo spusku shlyahom poslablennya zmini cilovoyi funkciyi stosovno kozhnogo koordinatnogo napryamku ZastosuvannyaAlgoritmi koordinatnogo spusku koristuyutsya populyarnistyu u praktikantiv zavdyaki svoyij prostoti ale ta sama vlastivist zmusila doslidnikiv optimizaciyi znachnoyu miroyu ignoruvati yih na korist bilsh cikavih skladnih metodiv Rannye zastosuvannya optimizaciyi metodom spusku koordinat bulo v oblasti komp yuternoyi tomografiyi de bulo viyavleno shvidku zbizhnist a zgodom bulo vikoristano dlya klinichnoyi rekonstrukciyi bagatoklitinnoyi spiralnoyi tomografiyi Krim togo viyavivsya pidvishenij interes do vikoristannya koordinatnogo spusku z poyavoyu masshtabnih problem u mashinnomu navchanni koli spusk koordinat viyavivsya konkurentospromozhnim dlya inshih metodiv pri zastosuvanni do takih problem yak navchannya linijnih metodu opornih vektoriv i rozkladu nevid yemnih matric Voni privablivi dlya problem koli obchislennya gradiyentiv nedosyazhno mozhlivo tomu sho dani neobhidni dlya cogo poshiryuyutsya po komp yuternih merezhah Div takozhGradiyentnij spusk Metod stohastichnogo gradiyenta Optimizaciya matematika PrimitkiWright Stephen J 2015 06 Coordinate descent algorithms Mathematical Programming angl T 151 1 s 3 34 doi 10 1007 s10107 015 0892 3 ISSN 0025 5610 Procitovano 23 grudnya 2019 Spall James C 2012 07 Cyclic Seesaw Process for Optimization and Identification Journal of Optimization Theory and Applications angl T 154 1 s 187 208 doi 10 1007 s10957 012 0001 1 ISSN 0022 3239 Procitovano 23 grudnya 2019 Zheng J Saquib S S Sauer K Bouman C A 2000 Parallelizable Bayesian tomography algorithms with rapid guaranteed convergence IEEE Transactions on Image Processing T 9 10 s 1745 1759 doi 10 1109 83 869186 ISSN 1057 7149 Procitovano 23 grudnya 2019 Fessler J A Ficaro E P Clinthorne N H Lange K 1997 04 Grouped coordinate ascent algorithms for penalized likelihood transmission image reconstruction IEEE Transactions on Medical Imaging T 16 2 s 166 175 doi 10 1109 42 563662 ISSN 0278 0062 Procitovano 23 grudnya 2019 Sabne Amit Wang Xiao Kisner Sherman J Bouman Charles A Raghunathan Anand Midkiff Samuel P 2017 Model based Iterative CT Image Reconstruction on GPUs Proceedings of the 22nd ACM SIGPLAN Symposium on Principles and Practice of Parallel Programming PPoPP 17 ACM Press doi 10 1145 3018743 3018765 ISBN 978 1 4503 4493 7 Procitovano 23 grudnya 2019 Sauer K Bouman C 1993 A local update strategy for iterative reconstruction from projections IEEE Transactions on Signal Processing T 41 2 s 534 548 doi 10 1109 78 193196 ISSN 1053 587X Procitovano 23 grudnya 2019 Yu Zhou Thibault Jean Baptiste Bouman Charles A Sauer Ken D Hsieh Jiang 2011 01 Fast Model Based X Ray CT Reconstruction Using Spatially Nonhomogeneous ICD Optimization IEEE Transactions on Image Processing T 20 1 s 161 175 doi 10 1109 tip 2010 2058811 ISSN 1057 7149 Procitovano 23 grudnya 2019 Thibault Jean Baptiste Sauer Ken D Bouman Charles A Hsieh Jiang 29 zhovtnya 2007 A three dimensional statistical approach to improved image quality for multislice helical CT Medical Physics T 34 11 s 4526 4544 doi 10 1118 1 2789499 ISSN 0094 2405 Procitovano 23 grudnya 2019 Hsieh Cho Jui Chang Kai Wei Lin Chih Jen Keerthi S Sathiya Sundararajan S 2008 A dual coordinate descent method for large scale linear SVM Proceedings of the 25th international conference on Machine learning ICML 08 ACM Press doi 10 1145 1390156 1390208 ISBN 978 1 60558 205 4 Procitovano 23 grudnya 2019 Hsieh Cho Jui Dhillon Inderjit S 2011 Fast coordinate descent methods with variable selection for non negative matrix factorization Proceedings of the 17th ACM SIGKDD international conference on Knowledge discovery and data mining KDD 11 ACM Press doi 10 1145 2020408 2020577 ISBN 978 1 4503 0813 7 Procitovano 23 grudnya 2019 Nesterov Yu 2012 01 Efficiency of Coordinate Descent Methods on Huge Scale Optimization Problems SIAM Journal on Optimization T 22 2 s 341 362 doi 10 1137 100802001 ISSN 1052 6234 Procitovano 23 grudnya 2019