В диференціальному численні метод Ньютона — це ітераційний метод пошуку коренів диференційовної функції , які є розв'язками рівняння . В оптимізації метод Ньютона застосовується до похідної подвійно диференційовної функції для пошуку коренів похідної (розв'язки ), також відомих як стаціонарні точки Ці розв'язки можуть бути мінімумами, максимумами або сідловими точками.
Метод Ньютона
Центральною задачею оптимізації є мінімізація функцій. Розглянемо спочатку випадок одновимірних функцій, тобто функцій однієї змінної. Пізніше ми розглянемо загальніший і корисніший багатовимірний випадок.
Маючи двічі диференційовну функцію , ми прагнемо вирішити оптимізаційну задачу
Метод Ньютона намагається вирішити цю проблему шляхом побудови послідовності з початкової здогадки (відправної точки) , котра збігається до мінімізатора функції , використовуючи послідовність наближень Тейлора другого порядку функції навколо точок послідовності. Розвинення Тейлора другого порядку функції в околі це
Наступна точка визначена таким чином, щоб мінімізувати це квадратичне наближення по і встановити . Якщо друга похідна додатна, то квадратичне наближення є опуклою функцією , і її мінімум можна знайти, прирівнявши похідну до нуля. Тому
мінімум досягається для
Збираючи все разом, метод Ньютона виконує ітерацію
Геометрична інтерпретація
Геометрична інтерпретація методу Ньютона полягає в тому, що при кожній ітерації ми допасовуємо параболоїд до поверхні у пробному значенні , що має ті ж нахил та кривину, що і поверхня в цій точці, а потім переходимо до максимуму або мінімуму цього параболоїда (у більш високих вимірах це також може бути сідлова точка). Зверніть увагу, що якщо це квадратична функція, то точний екстремум буде знайдений за один крок.
Вищі виміри
Наведену вище ітеративну схему можна узагальнити на вимірів за допомогою заміни похідної на градієнт (різні автори використовують різні позначення для градієнта включно з ) і оберненої другої похідної на обернену матрицю Гесе (різні автори використовують різні позначення для матриці Гесе включно з ). Так отримуємо таку ітеративну схему
Часто метод Ньютона змінюють, щоб включити маленький розмір кроку замість :
Це часто роблять, щоб гарантувати, що умови Вольфе задовольняються на кожному кроці методу.
Збіжність
Припустімо, що двічі неперервно диференційовна на відкритому проміжку і існує таке, що За умови, що метод Ньютона визначено як
і припущення, що коли Можна стверджувати, що при достатньо великому
- при
Тобто, збігається до квадратично.
Доведення
Цей розділ не містить . (квітень 2021) |
Нехай тобто Згідно з теоремою Тейлора, поклавши і для певного у проміжку від до маємо
Завдяки тому, що і маємо
Через те, що похідна неперервна з можна сказати, що якщо достатньо близько до Отже ми можемо поділити на
скориставшись означенням методу Ньютона маємо
Отже,
Завдяки неперервності, збігається до і, з того, що гніздиться між і випливає, що збігається до і тому збігається до отже, для достатньо великих
- якщо
Примітки
- . Lamar University. Архів оригіналу за 28 серпня 2019. Процитовано 28 серпня 2019.
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
V diferencialnomu chislenni metod Nyutona ce iteracijnij metod poshuku koreniv diferencijovnoyi funkciyi F displaystyle F yaki ye rozv yazkami rivnyannya F x 0 displaystyle F x 0 V optimizaciyi metod Nyutona zastosovuyetsya do pohidnoyi f displaystyle f podvijno diferencijovnoyi funkciyi f displaystyle f dlya poshuku koreniv pohidnoyi rozv yazki f x 0 displaystyle f x 0 takozh vidomih yak stacionarni tochki f displaystyle f Ci rozv yazki mozhut buti minimumami maksimumami abo sidlovimi tochkami Porivnyannya gradiyentnogo spusku zelenij ta metodu Nyutona chervonij dlya minimizaciyi funkciyi z nevelikimi rozmirami krokiv Metod Nyutona vikoristovuye informaciyu krivini tobto drugu pohidnu shob vzyati bilsh pryamij marshrut Metod NyutonaCentralnoyu zadacheyu optimizaciyi ye minimizaciya funkcij Rozglyanemo spochatku vipadok odnovimirnih funkcij tobto funkcij odniyeyi zminnoyi Piznishe mi rozglyanemo zagalnishij i korisnishij bagatovimirnij vipadok Mayuchi dvichi diferencijovnu funkciyu f R R displaystyle displaystyle f mathbb R to mathbb R mi pragnemo virishiti optimizacijnu zadachu minx Rf x displaystyle displaystyle min x in mathbb R f x Metod Nyutona namagayetsya virishiti cyu problemu shlyahom pobudovi poslidovnosti xk displaystyle x k z pochatkovoyi zdogadki vidpravnoyi tochki x0 R displaystyle x 0 in mathbb R kotra zbigayetsya do minimizatora x displaystyle x funkciyi f displaystyle f vikoristovuyuchi poslidovnist nablizhen Tejlora drugogo poryadku funkciyi f displaystyle f navkolo tochok poslidovnosti Rozvinennya Tejlora drugogo poryadku funkciyi f displaystyle f v okoli xk displaystyle x k ce f xk t f xk f xk t 12f xk t2 displaystyle displaystyle f x k t approx f x k f x k t frac 1 2 f x k t 2 Nastupna tochka xk 1 displaystyle x k 1 viznachena takim chinom shob minimizuvati ce kvadratichne nablizhennya po t displaystyle t i vstanoviti xk 1 xk t displaystyle displaystyle x k 1 x k t Yaksho druga pohidna dodatna to kvadratichne nablizhennya ye opukloyu funkciyeyu t displaystyle t i yiyi minimum mozhna znajti pririvnyavshi pohidnu do nulya Tomu 0 ddt f xk f xk t 12f xk t2 f xk f xk t displaystyle displaystyle displaystyle 0 frac rm d rm d t left f x k f x k t frac 1 2 f x k t 2 right f x k f x k t minimum dosyagayetsya dlya t f xk f xk displaystyle displaystyle t frac f x k f x k Zbirayuchi vse razom metod Nyutona vikonuye iteraciyu xk 1 xk t xk f xk f xk displaystyle displaystyle x k 1 x k t x k frac f x k f x k Geometrichna interpretaciyaGeometrichna interpretaciya metodu Nyutona polyagaye v tomu sho pri kozhnij iteraciyi mi dopasovuyemo paraboloyid do poverhni f x displaystyle f x u probnomu znachenni xk displaystyle x k sho maye ti zh nahil ta krivinu sho i poverhnya v cij tochci a potim perehodimo do maksimumu abo minimumu cogo paraboloyida u bilsh visokih vimirah ce takozh mozhe buti sidlova tochka Zvernit uvagu sho yaksho f displaystyle f ce kvadratichna funkciya to tochnij ekstremum bude znajdenij za odin krok Vishi vimiriNavedenu vishe iterativnu shemu mozhna uzagalniti na d displaystyle d vimiriv za dopomogoyu zamini pohidnoyi na gradiyent rizni avtori vikoristovuyut rizni poznachennya dlya gradiyenta vklyuchno z f x f x gf x Rd displaystyle f x nabla f x g f x in mathbb R d i obernenoyi drugoyi pohidnoyi na obernenu matricyu Gese rizni avtori vikoristovuyut rizni poznachennya dlya matrici Gese vklyuchno z f x 2f x Hf x Rd d displaystyle f x nabla 2 f x H f x in mathbb R d times d Tak otrimuyemo taku iterativnu shemu xk 1 xk f xk 1f xk k 0 displaystyle x k 1 x k f x k 1 f x k qquad k geq 0 Chasto metod Nyutona zminyuyut shob vklyuchiti malenkij rozmir kroku 0 lt g 1 displaystyle 0 lt gamma leq 1 zamist g 1 displaystyle gamma 1 xk 1 xk g f xk 1f xk displaystyle x k 1 x k gamma f x k 1 f x k Ce chasto roblyat shob garantuvati sho umovi Volfe zadovolnyayutsya na kozhnomu kroci metodu ZbizhnistPripustimo sho f displaystyle f dvichi neperervno diferencijovna na vidkritomu promizhku a b displaystyle a b i isnuye x a b displaystyle x in a b take sho f x 0 displaystyle f x neq 0 Za umovi sho metod Nyutona viznacheno yak xk 1 xk f xk f xk displaystyle x k 1 x k frac f x k f x k i pripushennya sho xk x displaystyle x k to x koli k displaystyle k to infty Mozhna stverdzhuvati sho pri dostatno velikomu k displaystyle k xk 1 x M xk x 2 displaystyle x k 1 x leq M x k x 2 pri M gt f x f x displaystyle M gt frac f x f x Tobto xk displaystyle x k zbigayetsya do x displaystyle x kvadratichno Dovedennya Cej rozdil ne mistit posilan na dzherela Vi mozhete dopomogti polipshiti cej rozdil dodavshi posilannya na nadijni avtoritetni dzherela Material bez dzherel mozhe buti piddano sumnivu ta vilucheno kviten 2021 Nehaj ek xk x displaystyle e k x k x tobto xk ek x displaystyle x k e k x Zgidno z teoremoyu Tejlora poklavshi x xk displaystyle x x k i h ek displaystyle h e k dlya pevnogo 3k displaystyle xi k u promizhku vid xk displaystyle x k do x displaystyle x mayemo f xk ek f xk ekf xk ek 22f 3k displaystyle f x k e k f x k e k f x k frac e k 2 2 f xi k Zavdyaki tomu sho xk ek x displaystyle x k e k x i f x 0 displaystyle f x 0 mayemo 0 f xk xk x f xk ek 22f 3k displaystyle 0 f x k x k x f x k frac e k 2 2 f xi k Cherez te sho pohidna f displaystyle f neperervna z f x 0 displaystyle f x neq 0 mozhna skazati sho f xk 0 displaystyle f x k neq 0 yaksho xk displaystyle x k dostatno blizko do x displaystyle x Otzhe mi mozhemo podiliti na f xk displaystyle f x k 0 f xk f xk xk x ek 2f 3k 2f xk displaystyle 0 frac f x k f x k x k x frac e k 2 f xi k 2f x k skoristavshis oznachennyam metodu Nyutona mayemo xk 1 x 2ek 2f 3k 2f xk displaystyle x k 1 x frac 2e k 2 f xi k 2f x k Otzhe xk 1 x f 3k 2f xk xk x 2 displaystyle x k 1 x frac f xi k 2f x k x k x 2 Zavdyaki neperervnosti f xk displaystyle f x k zbigayetsya do f x displaystyle f x i z togo sho 3k displaystyle xi k gnizditsya mizh xk displaystyle x k i x displaystyle x viplivaye sho 3k displaystyle xi k zbigayetsya do x displaystyle x i tomu f 3k displaystyle f xi k zbigayetsya do f x displaystyle f x otzhe dlya dostatno velikih k displaystyle k xk 1 x M xk x 2 displaystyle x k 1 x leq M x k x 2 yaksho M gt f x 2 f x displaystyle M gt frac f x 2 f x Primitki Lamar University Arhiv originalu za 28 serpnya 2019 Procitovano 28 serpnya 2019