Оцінювальна функція, також відома як функція евристичної оцінки або функція статичної оцінки — це функція що використовується ігровими комп'ютерними програмами для оцінки цінності або якості позиції (зазвичай у листовому чи термінальному вузлі) у дереві гри. Найчастіше значення є дійсним числом, або квантованим цілим числом, часто це може бути n-та частка вартості ігрової фігури, наприклад, це може бути камінь в ґо або пішак в шахах, де n може бути десятою, сотою або іншою зручною часткою, але іноді цінність представляють у вигляді масиву із трьох чисел в одиничному інтервалі, які відповідають відсотку виграшу, нічиєї та програшу у цій позиції.
Для нерозв'язних задач не існує аналітичних або теоретичних моделей для оцінювальних функцій, як і повністю ситуативних функцій. Склад оцінювальних функцій визначається емпірично, шляхом вставки функції-кандидата в автомат і оцінки її подальшої ефективності. Зараз для декількох ігор, таких як шахи, сьоґі та ґо, існує значна кількість доказів щодо загального складу їх оцінювальних функцій.
Ігри, у яких комп'ютерні програми для гри використовують оцінювальні функції, включають шахи, ґо, сьоґі,отелло, гекс, нарди і шашки. Крім того, з появою таких програм, як [en], комп'ютерні програми використовують функції оцінки гри у відеоіграх, наприклад, від Atari 2600. Деякі ігри, такі як хрестики-нулики, є [en] та не потребують пошуку чи оцінки, тому, що для них доступне дискретне дерево рішень.
Відношення до пошуку
Дерево таких оцінок є частиною алгоритму пошуку, такого як дерево пошуку Монте-Карло або мінімаксний алгоритм, типу альфа-бета-пошуку. Вважається, що значення є відносною ймовірністю виграшу, якщо дерево гри буде розгорнуто від цього вузла до кінця гри. Функція розглядає лише поточну позицію (тобто, на яких місцях знаходяться фігури та який їх взаємозв'язок один з одним) і не бере до уваги історію позиції, не досліджує можливі переміщення вперед від вузла (тому вона статична). Це означає, що для динамічних позицій, де існують тактичні загрози, функція оцінки не буде точною оцінкою. Такі позиції називають неспокійними; вони вимагають, принаймні, обмеженого розширення пошуку, яке називається [en], для усунення загроз перед оцінкою. Деякі значення, що повертаються оцінювальними функціями, є абсолютними, а не евристичними, якщо на вузлі відбувається виграш, поразка чи нічия.
Існує складний взаємозв'язок між пошуком і знанням у оцінювальній функції. При більш глибокому пошуку перевага в оцінці віддається менш близьким тактичним факторам і більш тонким позиційним мотивам довгого горизонту. Існує також компроміс між ефективністю закодованих знань та обчислювальною складністю: обчислення детальних знань може зайняти так багато часу, що продуктивність знижується, тому часто краще отримати наближення до точних знань. Оскільки оцінювальна функція залежить від номінальної глибини пошуку, а також від розширень і скорочень, що використовуються при пошуку, не існує загального чи окремого формулювання для оцінювальної функції. Оцінювальну функцію, яка добре працює для одного додатку, зазвичай потрібно буде значно переналаштувати або перенавчати, щоб вона ефективно працювала в іншому додатку.
У шахах
Цей розділ потребує уваги й турботи фахівця в галузі шахів. Причина — для перевірки термінології. |
У шахах оцінювальна функція зазвичай дає на виході ціле число, а одиниці оцінювальної функції зазвичай називаються пішаками. Термін «пішака» відноситься до значення, коли гравець має на одного пішака більше, ніж у суперника на позиції, як пояснюється в статті [en]». Ціле число 1 зазвичай представляє деяку частку пішака, а в комп'ютерних шахах зазвичай використовуються центи пішака, які складають соту частку пішака. Великі оцінки вказують на матеріальний дисбаланс чи позиційну перевагу або на те, що матеріальний виграш зазвичай неминучий. Дуже великі оцінки можуть свідчити про те, що мат неминучий. Функція оцінки також неявно кодує значення права на хід, яке може змінюватись від невеликої частки пішака до виграшу або програшу.
Ручні оціночні функції
Історично склалося так, що в комп'ютерних шахах складові оцінювальної функції конструюються (тобто створюються вручну) розробником рушія, а не виявляються в процесі навчання нейронних мереж. Загальний підхід до побудови створених вручну оцінювальних функцій полягає в лінійній комбінації різних зважених умов, які впливають на цінність значення позиції. Однак не всі умови у створеній вручну функції оцінки є лінійними, деякі, наприклад, безпека короля та структура пішака, є нелінійними. Кожна умова може вважатися складеною із факторів першого порядку (ті, які залежать лише від простору та будь-якої фігури на ньому), факторів другого порядку (простір по відношенню до інших просторів) і факторів n-го порядку (залежно від історії позиції).
Функція оцінки, створена вручну, зазвичай містить термін матеріального балансу, який зазвичай домінує в оцінці. [en], що використовуються для матеріального балансу: Королева=9, Тури=5; Кінь або Офіцер=3; Пішак=1; королю призначається довільно велике значення, зазвичай більше, ніж загальна вартість решти фігур. Крім того, у функції, як правило, є набір позиційних умов, які зазвичай не перевищують значення пішака, хоча в деяких позиціях позиційні умови можуть бути набагато більшими, наприклад, коли мат неминучий. Створені вручну функції оцінки зазвичай містять від десятків до сотень окремих умов.
Насправді ефективні ручні функції оцінки створюються не шляхом постійного розширення списку оцінюваних параметрів, а шляхом ретельного налаштування або навчання ваг щодо один одного, скромного набору параметрів, таких як описані вище. Для цього використовуються позиції з різних баз даних, наприклад, з ігор майстрів, рушіїв ігор, ігор Lichess або навіть із самостійної гри, як у навчанні з підкріпленням.
Приклад
Приклад створеної вручну функції оцінки для шахів може виглядати так:
- c1 * матеріал + c2 * мобільність + c3 * безпека короля + c4 * контроль центру + c5 * пішакова структура + c6 * тропізм короля + . . .
Кожна з умов є вагою, помноженою на коефіцієнт різниці: значення матеріальних чи позиційних умов білих мінус значення умов чорних.
- Матеріальна умова отримується шляхом присвоєння вартості у пішаках-одиницях кожної з фігур.
- Мобільність — це кількість законних ходів, доступних гравцю, або, альтернативно, сума кількості місць, атакованих або захищених кожною фігурою, включаючи місця, зайняті дружніми чи протилежними фігурами. Також може бути взята до уваги ефективна мобільність або кількість «безпечних» місць, куди може переміститися фігура.
- Безпека короля — це набір бонусів та штрафів, що нараховуються за розташування короля та конфігурації пішаків і фігур, що прилягають до короля або перед ним, а також протилежних фігур, що прилягають на місцях навколо короля.
- Контроль у центрі визначається тим, скільки пішаків і фігур займають або коштують на чотирьох центральних місцях, а іноді й на 12 місцях розширеного центру.
- Пішакова структура — це набір штрафів і бонусів за різні сильні та слабкі сторони пішакової структури, наприклад, штрафи за здвоєні та ізольовані пішаки.
- Тропізм короля — це бонус за близькість (або штраф за відстань) певних фігур, особливо королев і лицарів, до короля супротивника.
Нейронні мережі
Хоча нейронні мережі застосовуються в функціях оцінки шахових рушіїв з кінця 1980-х років, в комп'ютерних шахах вони стали популярними лише наприкінці 2010-х років, оскільки апаратне забезпечення, необхідне для навчання нейронних мереж, на той час було недостатньо потужним, а алгоритми швидкого навчання, топології та архітектури мереж ще не були розроблені. Спочатку функції оцінки на основі нейронної мережі, зазвичай, складалися з однієї нейронної мережі для всієї функції оцінки, з вхідними характеристиками, обраними з дошки, та вихідним результатом є ціле число, [en] на шкалу ста пішаків, так, що значення 100 приблизно еквівалентне матеріальній перевазі в одного пішака. Параметри в нейронних мережах зазвичай навчаються за допомогою навчання з підкріпленням або керованого навчання. Останнім часом у функції оцінювання в комп'ютерних шахах почали використовувати декілька нейронних мереж, причому кожна нейронна мережа для певної частини оцінювання, наприклад, структури пішака або ендшпілю. Це дозволяє застосовувати гібридні підходи, коли функція оцінки складається як із нейронних мереж, так і зі створених власноруч умов.
Глибокі нейронні мережі стали використовуватися, хоч і нечасто, в комп'ютерних шахах після того, як роботи Метью Лая Жирафа у 2015 році та Deepmind AlphaZero у 2017 році продемонстрували можливість застосування глибоких нейронних мереж у функції оцінки. Незабаром після цього був запущений проєкт розподілених обчислень Leela Chess Zero для спроби [en] результати роботи Deepmind AlphaZero. Крім розміру мереж, нейронні мережі, що використовуються в AlphaZero та Leela Chess Zero, також відрізняються від тих, що використовуються у традиційних шахових рушіях, оскільки вони мають два виходи: один для оцінки (заголовок значення) і один для впорядкування ходів (голова політики), а не лише один вихід для оцінки. Хоча в нейронній мережі Leela можна встановити вихід голови значень на дійсне число, щоб наблизити шкалу сотої пішки, яка використовується в традиційних шахових рушіях, за замовчуванням на виході стоїть відсоток перемоги-нічиєї-поразок, вектор із трьох значень з одиничного інтервалу. Оскільки глибокі нейронні мережі дуже великі, рушіям, що використовують глибокі нейронні мережі у своїй функції оцінки, зазвичай вимагають графічного процесора для ефективного обчислення.
Квадратні таблиці
Важливим методом оцінки вартості, принаймні, з початку 1990-х років є використання квадратних таблиць. Кожна таблиця являє собою набір із 64 значень, що відповідають квадратам дошки для шахів. Найбільш базова реалізація штучної квадратної таблиці складається з окремих таблиць для кожного типу фігур для кожного гравця, що в шахах призводить до 12 таблиць. У комп'ютерних шахах використовуються складніші варіанти квадратних таблиць, одним із найвідоміших є таблиця з «король-кусок-квадрат», яка використовується в Stockfish, [en], Ethereal та багатьох інших рушіях, де кожна таблиця враховує позицію кожного типу фігури стосовно короля гравця, а не позицію кожного типу фігури окремо. Значення в таблицях є бонусами/штрафами за розташування кожної фігури на місці та кодують сукупність багатьох тонких факторів, які важко кількісно оцінити аналітично. У створених своїми руками функціях оцінювання, іноді є два набори таблиць: одна для початку/мідлшпілю, а друга для ендшпілю; позиції середньої гри інтерполюються між ними.
Найпоширенішою функцією оцінки створеною власноруч, що використовується в комп'ютерних шахах, є тільки «фігура-квадрат» таблиця, яка є дуже простою функцією оцінки, що складається з матеріальних умов і лише двох наборів таблиць квадратних фігур, один для відкриття (дебюту), а другий для ендшпілю, для позиційних термів. Проте, вона здатна працювати не гірше багатьох інших власноручних функцій оцінки, що використовуються в комп'ютерних шахах. Квадратна таблиця вперше була створена Томашем Міхнєвським у 2003 році під назвою «Спрощена функція оцінки». Поточну назву ввів Рональд Фрідріх, коли він реалізував її у своєму рушії rofChade.
Спочатку розроблена в комп'ютерному сьоґі у 2018 році Ю Насу, найпоширеніша функція оцінки, яка використовується сьогодні в комп'ютерних шахах, є [en], або розріджена і неглибока нейронна мережа, яка має квадратні таблиці як входи в нейронну мережу. Фактично, найпростіша архітектура — це просто описані вище таблиці з 12 квадратів, нейронна мережа лише з одним шаром і без функцій активації. Архітектура нейронної мережі, яка ефективно оновлюється, з використанням таблиць «король-кусок-квадрат» в якості вхідних даних, була вперше перенесена на шахи в похідній Stockfish під назвою Stockfish NNUE, публічно опублікована 30 травня 2020 року і була прийнята багатьма іншими рушіями раніше ніж її було включено в офіційний рушій Stockfish, 6 серпня 2020 року.
Бази таблиць для ендшпілю
Шахові рушії часто використовують базу таблиць ендшпілю у своїй функції оцінки, оскільки це дозволяє рушію ідеально грати в ендшпілі.
В ґо
Історично, оцінювальні функції в ґо враховували як контрольовану територію, вплив каменів, кількість ув'язнених, так і життя та смерть груп на дошці. Однак, сучасні комп'ютерні програми для гри в ігри, такі як AlphaGo, Leela Zero, [en] і , здебільшого використовують глибокі нейронні мережі у своїх оцінювальних функціях і виводять відсоток виграшу/нічиєї/програшу, а не значення кількості каменів.
Див. також
- Комп'ютерні шахи
- Комп'ютерне ґо
- [en]
- [en]
Примітки
- Shannon, Claude (1950), Programming a Computer for Playing Chess (PDF), Ser. 7, т. 41, № 314, Philosophical Magazine, процитовано 12 грудня 2021
- Silver, David; Hubert, Thomas; Schrittwieser, Julian; Antonoglou, Ioannis; Lai, Matthew; Guez, Arthur; Lanctot, Marc; Sifre, Laurent; Kumaran, Dharshan (7 грудня 2018). A general reinforcement learning algorithm that masters chess, shogi, and go through self-play. Science. 362 (6419): 1140—1144. Bibcode:2018Sci...362.1140S. doi:10.1126/science.aar6404. PMID 30523106.
- Tesauro, Gerald (March 1995). Temporal Difference Learning and TD-Gammon. Communications of the ACM. 38 (3): 58—68. doi:10.1145/203330.203343. Процитовано 1 листопада 2013.
- Schaeffer, J.; Burch, N.; Y. Björnsson; Kishimoto, A.; Müller, M.; Lake, R.; Lu, P.; Sutphen, S. (2007). Checkers is Solved (PDF). Science. 317 (5844): 1518—22. doi:10.1126/science.1144079. PMID 17641166.
- Schaeffer, J.; Björnsson, Y.; Burch, N.; Kishimoto, A.; Müller, M.; Lake, R.; Lu, P.; Sutphen, S. Solving Checkers (PDF). Proceedings of the 2005 International Joint Conferences on Artificial Intelligence Organization.
- Schrittwieser, Julian; Antonoglou, Ioannis; Hubert, Thomas; Simonyan, Karen; Sifre, Laurent; Schmitt, Simon; Guez, Arthur; Lockhart, Edward; Hassabis, Demis (2020). Mastering Atari, Go, chess and shogi by planning with a learned model. Nature. 588 (7839): 604—609. arXiv:1911.08265. Bibcode:2020Natur.588..604S. doi:10.1038/s41586-020-03051-4. PMID 33361790.
- Thurn, Sebastian (1995), Learning to Play the Game of Chess (PDF), MIT Press, процитовано 12 грудня 2021
- Levinson, Robert (1989), A Self-Learning, Pattern-Oriented Chess Program, т. 12, № 4, ICCA Journal
- Lai, Matthew (4 вересня 2015), Giraffe: Using Deep Reinforcement Learning to Play Chess, arXiv:1509.01549v1, процитовано 12 грудня 2021
- Neural network topology. lczero.org. Процитовано 12 грудня 2021.
- Beal, Don; Smith, Martin C., Learning Piece-Square Values using Temporal Differences, т. 22, № 4, ICCA Journal
- Jun Nagashima; Masahumi Taketoshi; Yoichiro Kajihara; Tsuyoshi Hashimoto; Hiroyuki Iida (2002), An Efficient Use of Piece-Square Tables in Computer Shogi, Information Processing Society of Japan
- Stockfish Evaluation Guide, процитовано 12 грудня 2021
- Ronald Friederich (4 січня 2020). PeSTO: Piece Square Tables Only. Процитовано 12 грудня 2021.
- Yu Nasu (28 квітня 2018). Efficiently Updatable Neural-Network-based Evaluation Function for computer Shogi (PDF) (Japanese) .
- Yu Nasu (28 квітня 2018). Efficiently Updatable Neural-Network-based Evaluation Function for computer Shogi (Unofficial English Translation) (PDF). GitHub (English) .
- Gary Linscott (30 квітня 2021). NNUE. GitHub. Процитовано 12 грудня 2020.
- Noda, Hisayori (30 травня 2020). Release stockfish-nnue-2020-05-30. Github. Процитовано 12 грудня 2021.
- Introducing NNUE Evaluation. 6 серпня 2020.
- Joost VandeVondele (25 липня 2020). official-stockfish / Stockfish, NNUE merge. GitHub.
Джерела
- Slate, D and Atkin, L., 1983, «Chess 4.5, the Northwestern University Chess Program» у шаховій майстерності в людині та машині, 2-е видання, стор. 93–100. Springer-Verlag, Нью-Йорк, Нью-Йорк.
- Ebeling, Carl, 1987, All the Right Moves: A VLSI Architecture для шахів (ACM Distinguished Dissertation), стор. 56–86. MIT Press, Кембридж, Массачусетс
Посилання
- GameDev.net — Шахове програмування Частина VI: Функції оцінювання
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Ocinyuvalna funkciya takozh vidoma yak funkciya evristichnoyi ocinki abo funkciya statichnoyi ocinki ce funkciya sho vikoristovuyetsya igrovimi komp yuternimi programami dlya ocinki cinnosti abo yakosti poziciyi zazvichaj u listovomu chi terminalnomu vuzli u derevi gri Najchastishe znachennya ye dijsnim chislom abo kvantovanim cilim chislom chasto ce mozhe buti n ta chastka vartosti igrovoyi figuri napriklad ce mozhe buti kamin v go abo pishak v shahah de n mozhe buti desyatoyu sotoyu abo inshoyu zruchnoyu chastkoyu ale inodi cinnist predstavlyayut u viglyadi masivu iz troh chisel v odinichnomu intervali yaki vidpovidayut vidsotku vigrashu nichiyeyi ta prograshu u cij poziciyi Dlya nerozv yaznih zadach ne isnuye analitichnih abo teoretichnih modelej dlya ocinyuvalnih funkcij yak i povnistyu situativnih funkcij Sklad ocinyuvalnih funkcij viznachayetsya empirichno shlyahom vstavki funkciyi kandidata v avtomat i ocinki yiyi podalshoyi efektivnosti Zaraz dlya dekilkoh igor takih yak shahi sogi ta go isnuye znachna kilkist dokaziv shodo zagalnogo skladu yih ocinyuvalnih funkcij Igri u yakih komp yuterni programi dlya gri vikoristovuyut ocinyuvalni funkciyi vklyuchayut shahi go sogi otello geks nardi i shashki Krim togo z poyavoyu takih program yak en komp yuterni programi vikoristovuyut funkciyi ocinki gri u videoigrah napriklad vid Atari 2600 Deyaki igri taki yak hrestiki nuliki ye en ta ne potrebuyut poshuku chi ocinki tomu sho dlya nih dostupne diskretne derevo rishen Vidnoshennya do poshukuDerevo takih ocinok ye chastinoyu algoritmu poshuku takogo yak derevo poshuku Monte Karlo abo minimaksnij algoritm tipu alfa beta poshuku Vvazhayetsya sho znachennya ye vidnosnoyu jmovirnistyu vigrashu yaksho derevo gri bude rozgornuto vid cogo vuzla do kincya gri Funkciya rozglyadaye lishe potochnu poziciyu tobto na yakih miscyah znahodyatsya figuri ta yakij yih vzayemozv yazok odin z odnim i ne bere do uvagi istoriyu poziciyi ne doslidzhuye mozhlivi peremishennya vpered vid vuzla tomu vona statichna Ce oznachaye sho dlya dinamichnih pozicij de isnuyut taktichni zagrozi funkciya ocinki ne bude tochnoyu ocinkoyu Taki poziciyi nazivayut nespokijnimi voni vimagayut prinajmni obmezhenogo rozshirennya poshuku yake nazivayetsya en dlya usunennya zagroz pered ocinkoyu Deyaki znachennya sho povertayutsya ocinyuvalnimi funkciyami ye absolyutnimi a ne evristichnimi yaksho na vuzli vidbuvayetsya vigrash porazka chi nichiya Isnuye skladnij vzayemozv yazok mizh poshukom i znannyam u ocinyuvalnij funkciyi Pri bilsh glibokomu poshuku perevaga v ocinci viddayetsya mensh blizkim taktichnim faktoram i bilsh tonkim pozicijnim motivam dovgogo gorizontu Isnuye takozh kompromis mizh efektivnistyu zakodovanih znan ta obchislyuvalnoyu skladnistyu obchislennya detalnih znan mozhe zajnyati tak bagato chasu sho produktivnist znizhuyetsya tomu chasto krashe otrimati nablizhennya do tochnih znan Oskilki ocinyuvalna funkciya zalezhit vid nominalnoyi glibini poshuku a takozh vid rozshiren i skorochen sho vikoristovuyutsya pri poshuku ne isnuye zagalnogo chi okremogo formulyuvannya dlya ocinyuvalnoyi funkciyi Ocinyuvalnu funkciyu yaka dobre pracyuye dlya odnogo dodatku zazvichaj potribno bude znachno perenalashtuvati abo perenavchati shob vona efektivno pracyuvala v inshomu dodatku U shahahCej rozdil potrebuye uvagi j turboti fahivcya v galuzi shahiv Prichina dlya perevirki terminologiyi Bud laska povidomte pro ce znajomomu vam specialistu abo vipravte jogo sami yaksho vi volodiyete vidpovidnimi znannyami Mozhlivo mistit zauvazhennya shodo potribnih zmin U shahah ocinyuvalna funkciya zazvichaj daye na vihodi cile chislo a odinici ocinyuvalnoyi funkciyi zazvichaj nazivayutsya pishakami Termin pishaka vidnositsya do znachennya koli gravec maye na odnogo pishaka bilshe nizh u supernika na poziciyi yak poyasnyuyetsya v statti en Cile chislo 1 zazvichaj predstavlyaye deyaku chastku pishaka a v komp yuternih shahah zazvichaj vikoristovuyutsya centi pishaka yaki skladayut sotu chastku pishaka Veliki ocinki vkazuyut na materialnij disbalans chi pozicijnu perevagu abo na te sho materialnij vigrash zazvichaj neminuchij Duzhe veliki ocinki mozhut svidchiti pro te sho mat neminuchij Funkciya ocinki takozh neyavno koduye znachennya prava na hid yake mozhe zminyuvatis vid nevelikoyi chastki pishaka do vigrashu abo prograshu Ruchni ocinochni funkciyi Istorichno sklalosya tak sho v komp yuternih shahah skladovi ocinyuvalnoyi funkciyi konstruyuyutsya tobto stvoryuyutsya vruchnu rozrobnikom rushiya a ne viyavlyayutsya v procesi navchannya nejronnih merezh Zagalnij pidhid do pobudovi stvorenih vruchnu ocinyuvalnih funkcij polyagaye v linijnij kombinaciyi riznih zvazhenih umov yaki vplivayut na cinnist znachennya poziciyi Odnak ne vsi umovi u stvorenij vruchnu funkciyi ocinki ye linijnimi deyaki napriklad bezpeka korolya ta struktura pishaka ye nelinijnimi Kozhna umova mozhe vvazhatisya skladenoyu iz faktoriv pershogo poryadku ti yaki zalezhat lishe vid prostoru ta bud yakoyi figuri na nomu faktoriv drugogo poryadku prostir po vidnoshennyu do inshih prostoriv i faktoriv n go poryadku zalezhno vid istoriyi poziciyi Funkciya ocinki stvorena vruchnu zazvichaj mistit termin materialnogo balansu yakij zazvichaj dominuye v ocinci en sho vikoristovuyutsya dlya materialnogo balansu Koroleva 9 Turi 5 Kin abo Oficer 3 Pishak 1 korolyu priznachayetsya dovilno velike znachennya zazvichaj bilshe nizh zagalna vartist reshti figur Krim togo u funkciyi yak pravilo ye nabir pozicijnih umov yaki zazvichaj ne perevishuyut znachennya pishaka hocha v deyakih poziciyah pozicijni umovi mozhut buti nabagato bilshimi napriklad koli mat neminuchij Stvoreni vruchnu funkciyi ocinki zazvichaj mistyat vid desyatkiv do soten okremih umov Naspravdi efektivni ruchni funkciyi ocinki stvoryuyutsya ne shlyahom postijnogo rozshirennya spisku ocinyuvanih parametriv a shlyahom retelnogo nalashtuvannya abo navchannya vag shodo odin odnogo skromnogo naboru parametriv takih yak opisani vishe Dlya cogo vikoristovuyutsya poziciyi z riznih baz danih napriklad z igor majstriv rushiyiv igor igor Lichess abo navit iz samostijnoyi gri yak u navchanni z pidkriplennyam Priklad Priklad stvorenoyi vruchnu funkciyi ocinki dlya shahiv mozhe viglyadati tak c1 material c2 mobilnist c3 bezpeka korolya c4 kontrol centru c5 pishakova struktura c6 tropizm korolya Kozhna z umov ye vagoyu pomnozhenoyu na koeficiyent riznici znachennya materialnih chi pozicijnih umov bilih minus znachennya umov chornih Materialna umova otrimuyetsya shlyahom prisvoyennya vartosti u pishakah odinicyah kozhnoyi z figur Mobilnist ce kilkist zakonnih hodiv dostupnih gravcyu abo alternativno suma kilkosti misc atakovanih abo zahishenih kozhnoyu figuroyu vklyuchayuchi miscya zajnyati druzhnimi chi protilezhnimi figurami Takozh mozhe buti vzyata do uvagi efektivna mobilnist abo kilkist bezpechnih misc kudi mozhe peremistitisya figura Bezpeka korolya ce nabir bonusiv ta shtrafiv sho narahovuyutsya za roztashuvannya korolya ta konfiguraciyi pishakiv i figur sho prilyagayut do korolya abo pered nim a takozh protilezhnih figur sho prilyagayut na miscyah navkolo korolya Kontrol u centri viznachayetsya tim skilki pishakiv i figur zajmayut abo koshtuyut na chotiroh centralnih miscyah a inodi j na 12 miscyah rozshirenogo centru Pishakova struktura ce nabir shtrafiv i bonusiv za rizni silni ta slabki storoni pishakovoyi strukturi napriklad shtrafi za zdvoyeni ta izolovani pishaki Tropizm korolya ce bonus za blizkist abo shtraf za vidstan pevnih figur osoblivo korolev i licariv do korolya suprotivnika Nejronni merezhi Hocha nejronni merezhi zastosovuyutsya v funkciyah ocinki shahovih rushiyiv z kincya 1980 h rokiv v komp yuternih shahah voni stali populyarnimi lishe naprikinci 2010 h rokiv oskilki aparatne zabezpechennya neobhidne dlya navchannya nejronnih merezh na toj chas bulo nedostatno potuzhnim a algoritmi shvidkogo navchannya topologiyi ta arhitekturi merezh she ne buli rozrobleni Spochatku funkciyi ocinki na osnovi nejronnoyi merezhi zazvichaj skladalisya z odniyeyi nejronnoyi merezhi dlya vsiyeyi funkciyi ocinki z vhidnimi harakteristikami obranimi z doshki ta vihidnim rezultatom ye cile chislo en na shkalu sta pishakiv tak sho znachennya 100 priblizno ekvivalentne materialnij perevazi v odnogo pishaka Parametri v nejronnih merezhah zazvichaj navchayutsya za dopomogoyu navchannya z pidkriplennyam abo kerovanogo navchannya Ostannim chasom u funkciyi ocinyuvannya v komp yuternih shahah pochali vikoristovuvati dekilka nejronnih merezh prichomu kozhna nejronna merezha dlya pevnoyi chastini ocinyuvannya napriklad strukturi pishaka abo endshpilyu Ce dozvolyaye zastosovuvati gibridni pidhodi koli funkciya ocinki skladayetsya yak iz nejronnih merezh tak i zi stvorenih vlasnoruch umov Gliboki nejronni merezhi stali vikoristovuvatisya hoch i nechasto v komp yuternih shahah pislya togo yak roboti Metyu Laya Zhirafa u 2015 roci ta Deepmind AlphaZero u 2017 roci prodemonstruvali mozhlivist zastosuvannya glibokih nejronnih merezh u funkciyi ocinki Nezabarom pislya cogo buv zapushenij proyekt rozpodilenih obchislen Leela Chess Zero dlya sprobi en rezultati roboti Deepmind AlphaZero Krim rozmiru merezh nejronni merezhi sho vikoristovuyutsya v AlphaZero ta Leela Chess Zero takozh vidriznyayutsya vid tih sho vikoristovuyutsya u tradicijnih shahovih rushiyah oskilki voni mayut dva vihodi odin dlya ocinki zagolovok znachennya i odin dlya vporyadkuvannya hodiv golova politiki a ne lishe odin vihid dlya ocinki Hocha v nejronnij merezhi Leela mozhna vstanoviti vihid golovi znachen na dijsne chislo shob nabliziti shkalu sotoyi pishki yaka vikoristovuyetsya v tradicijnih shahovih rushiyah za zamovchuvannyam na vihodi stoyit vidsotok peremogi nichiyeyi porazok vektor iz troh znachen z odinichnogo intervalu Oskilki gliboki nejronni merezhi duzhe veliki rushiyam sho vikoristovuyut gliboki nejronni merezhi u svoyij funkciyi ocinki zazvichaj vimagayut grafichnogo procesora dlya efektivnogo obchislennya Kvadratni tablici Vazhlivim metodom ocinki vartosti prinajmni z pochatku 1990 h rokiv ye vikoristannya kvadratnih tablic Kozhna tablicya yavlyaye soboyu nabir iz 64 znachen sho vidpovidayut kvadratam doshki dlya shahiv Najbilsh bazova realizaciya shtuchnoyi kvadratnoyi tablici skladayetsya z okremih tablic dlya kozhnogo tipu figur dlya kozhnogo gravcya sho v shahah prizvodit do 12 tablic U komp yuternih shahah vikoristovuyutsya skladnishi varianti kvadratnih tablic odnim iz najvidomishih ye tablicya z korol kusok kvadrat yaka vikoristovuyetsya v Stockfish en Ethereal ta bagatoh inshih rushiyah de kozhna tablicya vrahovuye poziciyu kozhnogo tipu figuri stosovno korolya gravcya a ne poziciyu kozhnogo tipu figuri okremo Znachennya v tablicyah ye bonusami shtrafami za roztashuvannya kozhnoyi figuri na misci ta koduyut sukupnist bagatoh tonkih faktoriv yaki vazhko kilkisno ociniti analitichno U stvorenih svoyimi rukami funkciyah ocinyuvannya inodi ye dva nabori tablic odna dlya pochatku midlshpilyu a druga dlya endshpilyu poziciyi serednoyi gri interpolyuyutsya mizh nimi Najposhirenishoyu funkciyeyu ocinki stvorenoyu vlasnoruch sho vikoristovuyetsya v komp yuternih shahah ye tilki figura kvadrat tablicya yaka ye duzhe prostoyu funkciyeyu ocinki sho skladayetsya z materialnih umov i lishe dvoh naboriv tablic kvadratnih figur odin dlya vidkrittya debyutu a drugij dlya endshpilyu dlya pozicijnih termiv Prote vona zdatna pracyuvati ne girshe bagatoh inshih vlasnoruchnih funkcij ocinki sho vikoristovuyutsya v komp yuternih shahah Kvadratna tablicya vpershe bula stvorena Tomashem Mihnyevskim u 2003 roci pid nazvoyu Sproshena funkciya ocinki Potochnu nazvu vviv Ronald Fridrih koli vin realizuvav yiyi u svoyemu rushiyi rofChade Spochatku rozroblena v komp yuternomu sogi u 2018 roci Yu Nasu najposhirenisha funkciya ocinki yaka vikoristovuyetsya sogodni v komp yuternih shahah ye en abo rozridzhena i negliboka nejronna merezha yaka maye kvadratni tablici yak vhodi v nejronnu merezhu Faktichno najprostisha arhitektura ce prosto opisani vishe tablici z 12 kvadrativ nejronna merezha lishe z odnim sharom i bez funkcij aktivaciyi Arhitektura nejronnoyi merezhi yaka efektivno onovlyuyetsya z vikoristannyam tablic korol kusok kvadrat v yakosti vhidnih danih bula vpershe perenesena na shahi v pohidnij Stockfish pid nazvoyu Stockfish NNUE publichno opublikovana 30 travnya 2020 roku i bula prijnyata bagatma inshimi rushiyami ranishe nizh yiyi bulo vklyucheno v oficijnij rushij Stockfish 6 serpnya 2020 roku Bazi tablic dlya endshpilyu Shahovi rushiyi chasto vikoristovuyut bazu tablic endshpilyu u svoyij funkciyi ocinki oskilki ce dozvolyaye rushiyu idealno grati v endshpili V goIstorichno ocinyuvalni funkciyi v go vrahovuvali yak kontrolovanu teritoriyu vpliv kameniv kilkist uv yaznenih tak i zhittya ta smert grup na doshci Odnak suchasni komp yuterni programi dlya gri v igri taki yak AlphaGo Leela Zero en i zdebilshogo vikoristovuyut gliboki nejronni merezhi u svoyih ocinyuvalnih funkciyah i vivodyat vidsotok vigrashu nichiyeyi prograshu a ne znachennya kilkosti kameniv Div takozhKomp yuterni shahi Komp yuterne go en en PrimitkiShannon Claude 1950 Programming a Computer for Playing Chess PDF Ser 7 t 41 314 Philosophical Magazine procitovano 12 grudnya 2021 Silver David Hubert Thomas Schrittwieser Julian Antonoglou Ioannis Lai Matthew Guez Arthur Lanctot Marc Sifre Laurent Kumaran Dharshan 7 grudnya 2018 A general reinforcement learning algorithm that masters chess shogi and go through self play Science 362 6419 1140 1144 Bibcode 2018Sci 362 1140S doi 10 1126 science aar6404 PMID 30523106 Tesauro Gerald March 1995 Temporal Difference Learning and TD Gammon Communications of the ACM 38 3 58 68 doi 10 1145 203330 203343 Procitovano 1 listopada 2013 Schaeffer J Burch N Y Bjornsson Kishimoto A Muller M Lake R Lu P Sutphen S 2007 Checkers is Solved PDF Science 317 5844 1518 22 doi 10 1126 science 1144079 PMID 17641166 Schaeffer J Bjornsson Y Burch N Kishimoto A Muller M Lake R Lu P Sutphen S Solving Checkers PDF Proceedings of the 2005 International Joint Conferences on Artificial Intelligence Organization Schrittwieser Julian Antonoglou Ioannis Hubert Thomas Simonyan Karen Sifre Laurent Schmitt Simon Guez Arthur Lockhart Edward Hassabis Demis 2020 Mastering Atari Go chess and shogi by planning with a learned model Nature 588 7839 604 609 arXiv 1911 08265 Bibcode 2020Natur 588 604S doi 10 1038 s41586 020 03051 4 PMID 33361790 Thurn Sebastian 1995 Learning to Play the Game of Chess PDF MIT Press procitovano 12 grudnya 2021 Levinson Robert 1989 A Self Learning Pattern Oriented Chess Program t 12 4 ICCA Journal Lai Matthew 4 veresnya 2015 Giraffe Using Deep Reinforcement Learning to Play Chess arXiv 1509 01549v1 procitovano 12 grudnya 2021 Neural network topology lczero org Procitovano 12 grudnya 2021 Beal Don Smith Martin C Learning Piece Square Values using Temporal Differences t 22 4 ICCA Journal Jun Nagashima Masahumi Taketoshi Yoichiro Kajihara Tsuyoshi Hashimoto Hiroyuki Iida 2002 An Efficient Use of Piece Square Tables in Computer Shogi Information Processing Society of Japan Stockfish Evaluation Guide procitovano 12 grudnya 2021 Ronald Friederich 4 sichnya 2020 PeSTO Piece Square Tables Only Procitovano 12 grudnya 2021 Yu Nasu 28 kvitnya 2018 Efficiently Updatable Neural Network based Evaluation Function for computer Shogi PDF Japanese Yu Nasu 28 kvitnya 2018 Efficiently Updatable Neural Network based Evaluation Function for computer Shogi Unofficial English Translation PDF GitHub English Gary Linscott 30 kvitnya 2021 NNUE GitHub Procitovano 12 grudnya 2020 Noda Hisayori 30 travnya 2020 Release stockfish nnue 2020 05 30 Github Procitovano 12 grudnya 2021 Introducing NNUE Evaluation 6 serpnya 2020 Joost VandeVondele 25 lipnya 2020 official stockfish Stockfish NNUE merge GitHub DzherelaSlate D and Atkin L 1983 Chess 4 5 the Northwestern University Chess Program u shahovij majsternosti v lyudini ta mashini 2 e vidannya stor 93 100 Springer Verlag Nyu Jork Nyu Jork Ebeling Carl 1987 All the Right Moves A VLSI Architecture dlya shahiv ACM Distinguished Dissertation stor 56 86 MIT Press Kembridzh MassachusetsPosilannyaGameDev net Shahove programuvannya Chastina VI Funkciyi ocinyuvannya