AlphaZero — це комп'ютерна програма, розроблена компанією DeepMind, яка використовує узагальнений підхід [en]. 5 грудня 2017 року колектив DeepMind випустив препринтне введення AlphaZero, яке впродовж 24 годин досягнуло надлюдського рівня гри в шахи, Сьоґі, і ґо, перемігши чемпіонів світу серед програм, Stockfish, Elmo і 3-денний варіант AlphaGo Zero в кожному випадку, використовуючи краще комп'ютерне обладнання відносно своїх опонентів. AlphaZero переміг Stockfish 8 (рушій грав без доступу до та ендшпільних таблиць) граючи з кращим комп'ютерним обладнанням виділеним для AlphaZero.
Стосунок до AlphaGo Zero
AlphaZero (AZ) — це більш узагальнений варіант алгоритму AlphaGo Zero (AGZ), який крім ґо вміє також грати в Сьоґі і шахи. Відмінності між AZ і AGZ полягають у тому, що:
- AGZ має жорстко задані правила для встановленого пошуку гіперпараметрів.
- Нейронні мережі тепер оновлюються постійно.
- Ґо (на відміну від шахів) симетрична за певних відбиттів і обертань; AGZ був запрограмований, щоб скористатися цими симетріями, AZ — ні.
- Партія в шахи (на відміну від ґо) може закінчитися внічию, тому AZ може враховувати можливість нічийного результату гри.
AlphaZero проти Stockfish і Elmo
Розглядаючи пошук за допомогою дерева пошуку Монте-Карло, AlphaZero аналізує лише 80,000 позицій на секунду в шахах і 40 000 в сьогах, порівняно з 70 млн для Stockfish і 35 мільйонів для Elmo. AlphaZero компенсує низьку кількість оцінок використанням своїх глибоких нейронних мереж, зосереджуючись набагато більш вибірково на найбільш перспективних варіантах.
Результати
Шахи
У шахових партіях AlphaZero проти Stockfish кожна програма мала по одній хвилині часу на хід. AlphaZero мала краще комп'ютерне обладнання відносно Stockfish. Зі 100 ігор з нормального початкового положення AlphaZero виграв 25 партій білими, виграв 3 чорними і звів унічию решту 72. У серії з дванадцяти 100-ігрових матчів проти Stockfish починаючи з популярних дебютів, AlphaZero виграв 290, звів унічию 886 і програв 24.[] Результати турнірів не свідчать про те, що AlphaZero — це покращений шаховий рушій, адже алгоритм AlphaZero мав краще комп'ютерне обладнання.
Критика
Деякі гросмейстери, такі як Хікару Накамура і творець Комодо , підкреслили, що силу AlphaZero не треба перебільшувати, стверджуючи, що матч мав би інакший результат, якби програма мала доступ до дебютних баз (оскільки Stockfish був оптимізований під цей сценарій).
Сьоги
У сто іграх у сьоги проти Elmo, AlphaZero виграв дев'яносто разів, вісім разів програв і дві партії завершилися внічию.
Критика
Спільнота програмістів комп'ютерної гри в сьоги не повністю задоволена умовами підбору програмного забезпечення для рушія AlphaZero і рушія гри в сьоги Elmo.[]
Го
Після 8 годин самостійного навчання гри в го, у матчах проти попередньої версії AlphaZero, AlphaZero виграв шістдесят ігор і програв сорок.
Реакція
Газети вийшли з заголовками, що навчання шахів зайняло лише чотири години: «це було зроблено за час трохи більший, ніж проміжок між сніданком і обідом.»Wired розкрутили AlphaZero як «перший штучний інтелект, який є чемпіоном з багатьох настільних ігор». Експерт зі штучного інтелекту Джоанна Брайсон зазначила, що «спритність Google до хорошої реклами» ставить його в сильну позицію проти суперників. «Мова йде не лише про те, щоб найняти найкращих програмістів. Це також дуже політична річ, оскільки вона допомагає Google стояти на найсильніших можливих позиціях під час переговорів з урядами і регуляторами, які контролюють сектор штучного інтелекту».
«Мені завжди було цікаво, як це буде, коли вищі істоти приземляться на землю і покажуть нам, як вони грають в шахи», заявив данський гросмейстер в інтерв'ю Бі-бі-сі, «тепер я знаю». Норвезький гросмейстер охарактеризував AlphaZero як «божевільні атакуючі шахи» з глибокою позиційною грою. колишній чемпіон світу Гаррі Каспаров сказав: «це чудове досягнення, навіть попри те, що ми вже чекали на нього після AlphaGo.»
Див. також
Посилання
Примітки
- https://arxiv.org/pdf/1712.01815.pdf [ 8 грудня 2017 у Wayback Machine.] Mastering Chess and Shogi by Sef-Play with a General Reinforcment Learning Algorithm.
- , Thomas Hubert, Julian Schrittwieser, Ioannis Antonoglou, Matthew Lai, Arthur Guez, Marc Lanctot, Laurent Sifre, Dharshan Kumaran, Thore Graepel, Timothy Lillicrap, Karen Simonyan, (5 грудня 2017). Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm. arXiv:1712.01815 [cs.AI].
{{}}
: Cite використовує застарілий параметр|authors=
() - Knapton, Sarah; Watson, Leon (6 грудня 2017). (брит.). Telegraph.co.uk. Архів оригіналу за 7 грудня 2017. Процитовано 6 грудня 2017.
- Vincent, James (6 грудня 2017). . The Verge. Архів оригіналу за 2 грудня 2020. Процитовано 6 грудня 2017.
- . BBC News. 6 грудня 2017. Архів оригіналу за 8 грудня 2017. Процитовано 7 грудня 2017.
- . Chess.com. Архів оригіналу за 7 грудня 2020. Процитовано 7 грудня 2017.
- . Архів оригіналу за 8 грудня 2017. Процитовано 8 грудня 2017.
{{}}
: Обслуговування CS1: Сторінки з текстом «archived copy» як значення параметру title () - Badshah, Nadeem (7 грудня 2017). . . Архів оригіналу за 7 грудня 2020. Процитовано 7 грудня 2017.
- . WIRED. 6 грудня 2017. Архів оригіналу за 7 грудня 2020. Процитовано 7 грудня 2017.
- Gibbs, Samuel (7 грудня 2017). . The Guardian. Архів оригіналу за 7 грудня 2020. Процитовано 8 грудня 2017.
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
AlphaZero ce komp yuterna programa rozroblena kompaniyeyu DeepMind yaka vikoristovuye uzagalnenij pidhid en 5 grudnya 2017 roku kolektiv DeepMind vipustiv preprintne vvedennya AlphaZero yake vprodovzh 24 godin dosyagnulo nadlyudskogo rivnya gri v shahi Sogi i go peremigshi chempioniv svitu sered program Stockfish Elmo i 3 dennij variant AlphaGo Zero v kozhnomu vipadku vikoristovuyuchi krashe komp yuterne obladnannya vidnosno svoyih oponentiv AlphaZero peremig Stockfish 8 rushij grav bez dostupu do ta endshpilnih tablic grayuchi z krashim komp yuternim obladnannyam vidilenim dlya AlphaZero Stosunok do AlphaGo ZeroAlphaZero AZ ce bilsh uzagalnenij variant algoritmu AlphaGo Zero AGZ yakij krim go vmiye takozh grati v Sogi i shahi Vidminnosti mizh AZ i AGZ polyagayut u tomu sho AGZ maye zhorstko zadani pravila dlya vstanovlenogo poshuku giperparametriv Nejronni merezhi teper onovlyuyutsya postijno Go na vidminu vid shahiv simetrichna za pevnih vidbittiv i obertan AGZ buv zaprogramovanij shob skoristatisya cimi simetriyami AZ ni Partiya v shahi na vidminu vid go mozhe zakinchitisya vnichiyu tomu AZ mozhe vrahovuvati mozhlivist nichijnogo rezultatu gri AlphaZero proti Stockfish i ElmoRozglyadayuchi poshuk za dopomogoyu dereva poshuku Monte Karlo AlphaZero analizuye lishe 80 000 pozicij na sekundu v shahah i 40 000 v sogah porivnyano z 70 mln dlya Stockfish i 35 miljoniv dlya Elmo AlphaZero kompensuye nizku kilkist ocinok vikoristannyam svoyih glibokih nejronnih merezh zoseredzhuyuchis nabagato bilsh vibirkovo na najbilsh perspektivnih variantah RezultatiShahi U shahovih partiyah AlphaZero proti Stockfish kozhna programa mala po odnij hvilini chasu na hid AlphaZero mala krashe komp yuterne obladnannya vidnosno Stockfish Zi 100 igor z normalnogo pochatkovogo polozhennya AlphaZero vigrav 25 partij bilimi vigrav 3 chornimi i zviv unichiyu reshtu 72 U seriyi z dvanadcyati 100 igrovih matchiv proti Stockfish pochinayuchi z populyarnih debyutiv AlphaZero vigrav 290 zviv unichiyu 886 i prograv 24 dzherelo Rezultati turniriv ne svidchat pro te sho AlphaZero ce pokrashenij shahovij rushij adzhe algoritm AlphaZero mav krashe komp yuterne obladnannya Kritika Deyaki grosmejsteri taki yak Hikaru Nakamura i tvorec Komodo pidkreslili sho silu AlphaZero ne treba perebilshuvati stverdzhuyuchi sho match mav bi inakshij rezultat yakbi programa mala dostup do debyutnih baz oskilki Stockfish buv optimizovanij pid cej scenarij Sogi U sto igrah u sogi proti Elmo AlphaZero vigrav dev yanosto raziv visim raziv prograv i dvi partiyi zavershilisya vnichiyu KritikaSpilnota programistiv komp yuternoyi gri v sogi ne povnistyu zadovolena umovami pidboru programnogo zabezpechennya dlya rushiya AlphaZero i rushiya gri v sogi Elmo neavtoritetne dzherelo Go Pislya 8 godin samostijnogo navchannya gri v go u matchah proti poperednoyi versiyi AlphaZero AlphaZero vigrav shistdesyat igor i prograv sorok ReakciyaGazeti vijshli z zagolovkami sho navchannya shahiv zajnyalo lishe chotiri godini ce bulo zrobleno za chas trohi bilshij nizh promizhok mizh snidankom i obidom Wired rozkrutili AlphaZero yak pershij shtuchnij intelekt yakij ye chempionom z bagatoh nastilnih igor Ekspert zi shtuchnogo intelektu Dzhoanna Brajson zaznachila sho spritnist Google do horoshoyi reklami stavit jogo v silnu poziciyu proti supernikiv Mova jde ne lishe pro te shob najnyati najkrashih programistiv Ce takozh duzhe politichna rich oskilki vona dopomagaye Google stoyati na najsilnishih mozhlivih poziciyah pid chas peregovoriv z uryadami i regulyatorami yaki kontrolyuyut sektor shtuchnogo intelektu Meni zavzhdi bulo cikavo yak ce bude koli vishi istoti prizemlyatsya na zemlyu i pokazhut nam yak voni grayut v shahi zayaviv danskij grosmejster v interv yu Bi bi si teper ya znayu Norvezkij grosmejster oharakterizuvav AlphaZero yak bozhevilni atakuyuchi shahi z glibokoyu pozicijnoyu groyu kolishnij chempion svitu Garri Kasparov skazav ce chudove dosyagnennya navit popri te sho mi vzhe chekali na nogo pislya AlphaGo Div takozhShtuchna nejronna merezha Komp yuterne goPosilannyahttps medium com ducha aiki alfazero proti vsih c290f69256ca https www imena ua blog alfazero talks 19 veresnya 2020 u Wayback Machine https site ua olexii ignatenko 10956 alpha zero shah i mat 23 grudnya 2017 u Wayback Machine Primitkihttps arxiv org pdf 1712 01815 pdf 8 grudnya 2017 u Wayback Machine Mastering Chess and Shogi by Sef Play with a General Reinforcment Learning Algorithm Thomas Hubert Julian Schrittwieser Ioannis Antonoglou Matthew Lai Arthur Guez Marc Lanctot Laurent Sifre Dharshan Kumaran Thore Graepel Timothy Lillicrap Karen Simonyan 5 grudnya 2017 Mastering Chess and Shogi by Self Play with a General Reinforcement Learning Algorithm arXiv 1712 01815 cs AI a href wiki D0 A8 D0 B0 D0 B1 D0 BB D0 BE D0 BD Cite arXiv title Shablon Cite arXiv cite arXiv a Cite vikoristovuye zastarilij parametr authors dovidka Knapton Sarah Watson Leon 6 grudnya 2017 brit Telegraph co uk Arhiv originalu za 7 grudnya 2017 Procitovano 6 grudnya 2017 Vincent James 6 grudnya 2017 The Verge Arhiv originalu za 2 grudnya 2020 Procitovano 6 grudnya 2017 BBC News 6 grudnya 2017 Arhiv originalu za 8 grudnya 2017 Procitovano 7 grudnya 2017 Chess com Arhiv originalu za 7 grudnya 2020 Procitovano 7 grudnya 2017 Arhiv originalu za 8 grudnya 2017 Procitovano 8 grudnya 2017 a href wiki D0 A8 D0 B0 D0 B1 D0 BB D0 BE D0 BD Cite web title Shablon Cite web cite web a Obslugovuvannya CS1 Storinki z tekstom archived copy yak znachennya parametru title posilannya Badshah Nadeem 7 grudnya 2017 Arhiv originalu za 7 grudnya 2020 Procitovano 7 grudnya 2017 WIRED 6 grudnya 2017 Arhiv originalu za 7 grudnya 2020 Procitovano 7 grudnya 2017 Gibbs Samuel 7 grudnya 2017 The Guardian Arhiv originalu za 7 grudnya 2020 Procitovano 8 grudnya 2017