Обирання дії — спосіб охарактеризувати найголовнішу проблему інтелектуальних систем: що робити далі. У штучному інтелекті та обчислювальній когнітивній науці «проблема вибору дії» зазвичай асоціюється із інтелектуальними агентами та [en] — штучними системами, які демонструють складну поведінку в середовищі агента. Термін також іноді використовується в етології або поведінці тварин.
Однією з проблем для розуміння вибору дії є визначення рівня абстракції, що використовується для визначення того, що саме є «дією». На самому базовому рівні абстракції атомна дія може бути будь-чим, від скорочення м'язової клітини до провокування війни. Зазвичай для будь-якого механізму вибору дії заздалегідь визначений і зафіксовано набір можливих дій.
Більшість дослідників, які працюють у цій галузі, висувають високі вимоги до своїх агентів:
- Виконавець, як правило, повинен вибирати свою дію в динамічних і непередбачуваних середовищах.
- Агенти зазвичай діють в режимі реального часу; тому вони мають вчасно ухвалювати рішення.
- Агенти зазвичай створюються для виконання кількох різних задач. Ці задачі можуть конфліктувати щодо розподілу ресурсів (наприклад, чи може агент одночасно загасити пожежу та принести чашку кави?)
- Середовище, в якому діють агенти, може передбачати наявність людей, які ускладнюють роботу агента (навмисно або намагаючись допомогти).
- Самі агенти часто призначені для моделювання тварин або людей, чия поведінка може бути досить складною.
З цих причин вибір дій не є тривіальним і привертає увагу багатьох дослідників.
Характеристика задачі вибору дії
Основною проблемою вибору дії є складність. Оскільки всі обчислення потребують часу і простору (у пам'яті), тому агенти, зазвичай, не можуть розглянути всі доступні їм варіанти для кожного моменту часу. Отже, вони повинні бути упереджені, і певним чином обмежувати свій пошук. Для штучного інтелекту (ШІ) питання вибору дій полягає в тому, яким найкращим чином можна обмежити цей пошук? Для біології та етології виникає питання як різні види тварин обмежують свій пошук? Чи всі тварини використовують однакові підходи? Чому вони використовують саме ті, що обрали?
Одне з фундаментальних питань щодо вибору дії полягає в тому, чи це справді проблема для агента, чи це просто опис властивості емерджентної поведінки розумного агента. Однак, якщо ми замислимося, як ми збираємося створити розумного агента, то стане очевидним, що має бути деякий спосіб вибору дій. Цей спосіб може бути дуже поширеним (як у випадку розподілених організмів, таких як колонії соціальних комах або слимаків), або це може бути модуль спеціального призначення.
Метод вибору дії (МВД) визначає не тільки дії агента з точки зору впливу на світ, але й спрямовує його перцептивну увагу та оновлює його пам'ять. Ці егоцентричні дії можуть, у свою чергу, призвести до зміни основних поведінкових здібностей агента, зокрема в тому, що оновлення пам'яті передбачає можливу певну форму машинного навчання. В ідеалі сам вибір дії також має бути здатним навчатися та адаптуватися, але існує багато проблем із комбінаторною складністю та трактуванням обчислень, які можуть вимагати обмеження простору пошуку для навчання.
У ШІ МВД також іноді або називають [en], або вважають його істотною частиною.
Механізми ШІ
Як правило, механізми штучного вибору дій можна розділити на декілька категорій: символьні системи, іноді відомі як системи класичного планування, системи розподіленого планування, і реактивне або [en]. Деякі підходи не підпадають під жодну з цих категорій. В інших насправді більше йдеться мова про надання наукової моделі, ніж практичне керування ШІ; останні описані далі в наступному розділі.
Символьні підходи
На початку історії штучного інтелекту передбачалося, що найкращим способом для агента вибрати, що робити далі, був би пошук оптимального рішення, а потім його виконання. Це призвело до гіпотези системи фізичних символів, що фізичний агент, який може маніпулювати символами, є необхідним і достатнім для створення інтелекту. Багато програмних агентів досі використовують цей підхід для вибору дій. Зазвичай це вимагає опису всіх показань датчиків, оточення, всіх дій і всіх цілей у певній формі логіки предикатів. Критики цього підходу скаржаться, що він є занадто повільним для пошуку рішення в реальному часі і що, незважаючи на докази, він все ще навряд чи зможе знайти оптимальне рішення, оскільки зведення описів реальності до логіки є процесом, схильним до помилок.
Задовільна стратегія — це стратегія прийняття рішень, яка намагається задовольнити критерії адекватності, а не визначати оптимальне рішення. Задовільна стратегія часто насправді може бути майже оптимальною, якщо витрати на сам процес прийняття рішень, такі як вартість отримання повної інформації, враховуються в обчисленні результатів.
Архітектури, орієнтовані на досягнення мети — у цих символьних архітектурах поведінка агента зазвичай описується набором цілей. Кожна мета може бути досягнута за допомогою процесу або діяльності, яка описується встановленим планом. Агент повинен просто вирішити, який процес продовжити для досягнення поставленої мети. Рішення може розширюватися до підцілей, що робить процес рекурсивним. Технічно, більш-менш, плани використовують умовні правила. Ці архітектури бувають [en] або гібридні. Класичними прикладами архітектур, орієнтованих на цілі, є реалізовані вдосконалення архітектури переконань-бажань-та-намірів, як-от JAM або .
Розподілені підходи
На відміну від символьного підходу, розподілені системи вибору дій фактично не мають жодного «ящику» в агенті, який вибирає наступну дію. Принаймні в їх ідеалізованій формі розподілені системи мають багато модулів, що працюють паралельно і вибирають найкращі дії на основі локального досвіду. Очікується, що в цих ідеалізованих системах загальна узгодженість виникне якимось чином, можливо, завдяки ретельній розробці взаємодіючих компонентів. Цей підхід часто надихається дослідженнями штучних нейронних мереж. На практиці майже завжди існує «деяка» централізована система, яка визначає, який модуль є «найактивнішим» або є найбільш помітним. Є докази, що біологічний мозок також має [en], які оцінюють, яка з конкуруючих систем заслуговує найбільше уваги, або, точніше, має більшу [en] при виборі дій.
- ASMO — це attention-архітектура, розроблена Роні Новіанто. Вона організовує різні модульні розподілені процеси, які можуть використовувати власні уявлення та методи для сприйняття навколишнього середовища, обробки інформації, планування дії та вибирати дії для виконання.
- Різні типи архітектур winner-take-all, в яких одна вибрана дія отримує повний контроль над руховою системою
- Поширена активація, включаючи
- Extended Rosenblatt & Payton — це розповсюджена архітектура активації, розроблена Тобі Тиреллом у 1993 році. Поведінка агента зберігається у формі ієрархічної конекціоністської мережі, яку Тирелл назвав ієрархією вільного потоку. Наприклад, de Sevin & Thalmann (2005) або (2001).
- [en], був відповіддю на повільну швидкість роботів із використанням символьних методів вибору дій. У цій формі окремі модулі реагують на різні стимули і генерують власні реакції. У початковій формі, при використанні [en], вони складалися з різних шарів, які могли контролювати та приглушувати вхідні та вихідні дані один одного.
- [en] — це віртуальні домашні тварини з комп'ютерної гри, керовані адаптивною тришаровою нейронною мережею. Механізм їх роботи реактивний, оскільки мережа на кожному кроці часу визначає завдання, яке має виконати істота. Мережа добре описана в статті Grand et al. (1997) та в The Creatures Developer Resources. Див. також Creatures Wiki.
Підходи динамічного планування
Оскільки чисто розподілені системи важко побудувати, багато дослідників звернулися до використання чітко запрограмованих планів для визначення пріоритетів своєї системи.
Динамічні або [en] методи планування обчислюють лише одну наступну дію в кожну мить на основі поточного контексту та заздалегідь прописаних планів. На відміну від класичних методів планування, реактивні або динамічні підходи не страждають від комбінаторного вибуху. З іншого боку, іноді вони вважаються занадто жорсткими, щоб вважати їх сильним ШІ, оскільки плани закодовані заздалегідь. У той же час природний інтелект може бути жорстким в деяких контекстах, хоча він плинний і здатний до адаптації.
Приклади механізмів динамічного планування включають:
- Скінченні автомати. Це [en] архітектури, що використовуються переважно для агентів комп'ютерних ігор, зокрема для шутерів від першої особи, ботів або для віртуальних акторів кіно. Як правило, скінченні автомати є ієрархічними. Для конкретних прикладів ігор дивіться статтю Halo 2 bots Деміена Айсла (2005) або магістерську роботу про ботів Quake III Яна Пола ван Ваверена (2001). Для прикладу фільму див. Softimage.
- Інші структуровані реактивні плани мають тенденцію виглядати трохи більше схожими на звичайні плани, часто із способами представлення ієрархічної та послідовної структури. Деякі, наприклад, дії [en] (ПСМ), використовують [en]. Багато архітектур агентів з середини 1990-х включали такі плани як проміжний шар, що забезпечував організацію низькорівневих [en], одночасно керуючись планувальником вищого рівня в реальному часі. Хоча такий підхід передбачає сумісність з автоматизованими планувальниками, більшість структурованих реактивних планів кодуються вручну (Bryson 2001, ch. 3). Приклади структурованих реактивних планів включають систему Джеймса Фірбі RAP і [en]Teleo-reactive plans. ПСМ, RAP і TRP більше не розробляються та не підтримуються. Ще одним досі діючим (станом на 2006 рік) нащадком цього підходу є паралельна ієрархічна система вибору дій на основі стеку (або POSH), яка є частиною системи Behavior Oriented Design, створеної [en].
Іноді, щоб спробувати позбавитись негнучкості динамічного планування, використовуються гібридні методи. У них більш традиційна система планування ШІ шукає нові плани, коли агент має вільний час, і оновлює бібліотеку динамічних планів, коли знаходить оптимальні рішення. Важливим аспектом будь-якої такої системи є те, що коли агенту потрібно вибрати дію, існує деяке рішення, яке можна застосувати негайно (див. далі [en]).
Інші
- CogniTAO — це механізм прийняття рішень, заснований на переконаннях-бажаннях-та-намірах (belief-desire-intention), він включає в себе вбудовані можливості для командної роботи.
- [en] — це символьна [en]. Вона заснована на правилах умовних дій, відомих як продукції. Програмісти можуть використовувати інструментарій розробки Soar для створення як реактивних агентів, так і агентів планування або будь-якого гібриду.
- Excalibur був дослідницьким проектом, очолюваним Олександром Нареєком, у якому використовувалися anytime-агенти для планування комп'ютерних ігор. Архітектура заснована на структурі [en], що є передовою технікою штучного інтелекту.
- [en] схожий на Soar. Він включає в себе систему баєсового навчання, яка допомагає визначити пріоритети виробництва.
- ABL/Hap
- Нечіткі архітектури. Нечіткий підхід у виборі дій забезпечує більш плавну поведінку, ніж та, яку можуть створити архітектури, що використовують логічні правила умовних дій (наприклад, Soar або POSH). Ці архітектури переважно [en] та символьні.
Теорії вибору дій в природі
Ця стаття потребує уваги й турботи фахівця у своїй галузі. (січень 2022) |
Багато динамічних моделей штучного вибору дій спочатку були натхненні дослідженнями з етології. Зокрема, Конрад Лоренц і Ніколас Тінберген надали ідею [en] для пояснення інстинктивної поведінки ([en]). Під впливом ідей В. Макдугалла, Лоренц розвинув це в модель мотивації поведінки. В етології ці ідеї мали вплив у 1960-х роках, але тепер вони вважаються застарілими через використання в них метафори [en]; нервова система і контроль поведінки зараз зазвичай розглядаються як передача інформації, а не потік енергії. Динамічні плани та нейронні мережі більше схожі на передачу інформації, тоді як розповсюджена активація більше схожа на дифузний контроль емоційних або гормональних систем.
[en] припустив, що вибір дій є правильною точкою зору для розуміння ролі та еволюції розуму. Дивіться його сторінку про .
Моделі ШІ для вибору нейронних дій
Деякі дослідники створюють складні моделі вибору нейронних дій. Дивіться, наприклад:
- The (Університет Колорадо у Боулдері).
- The Adaptive Behaviour Research Group (Університет Шеффілда).
Див. також
Посилання
- Samsonovich, A. V. «Attention in the ASMO cognitive architecture.» Biologically Inspired Cognitive Architectures (2010): 98.[недоступне посилання з 01.01.2021]
- Karen L. Myers. PRS-CL: A Procedural Reasoning System. . SRI International. Процитовано 13 червня 2013.
Література
- Bratman, M.: Intention, plans, and practical reason. Cambridge, Mass: Harvard University Press (1987)
- Brom, C., Lukavský, J., Šerý, O., Poch, T., Šafrata, P.: Affordances and level-of-detail AI for virtual humans. In: Proceedings of Game Set and Match 2, Delft (2006)
- [en]: . PhD thesis, Massachusetts Institute of Technology (2001)
- Champandard, A. J.: AI Game Development: Synthetic Creatures with learning and Reactive Behaviors. New Riders, USA (2003)
- Grand, S., Cliff, D., Malhotra, A.: Creatures: Artificial life autonomous software-agents for home entertainment. In: Johnson, W. L. (eds.): Proceedings of the First International Conference on Autonomous Agents. ACM press (1997) 22-29
- Huber, M. J.: JAM: A BDI-theoretic mobile agent architecture. In: Proceedings of the Third International Conference on Autonomous Agents (Agents'99). Seattle (1999) 236—243
- Isla, D.: Handling complexity in Halo 2. In: Gamastura online, 03/11 (2005) [ 2006-01-08 у Wayback Machine.]
- Maes, P.: The agent network architecture (ANA). In: SIGART Bulletin, 2 (4), pages 115—120 (1991)
- Nareyek, A. Excalibur project
- Reynolds, C. W. Flocks, Herds, and Schools: A Distributed Behavioral Model. In: Computer Graphics, 21(4) (SIGGRAPH '87 Conference Proceedings) (1987) 25-34.
- de Sevin, E. Thalmann, D.:A motivational Model of Action Selection for Virtual Humans. In: Computer Graphics International (CGI), IEEE Computer SocietyPress, New York (2005)
- Tyrrell, T.: Computational Mechanisms for Action Selection. Ph.D. Dissertation. Centre for Cognitive Science, University of Edinburgh (1993)
- van Waveren, J. M. P.: The Quake III Arena Bot. Master thesis. Faculty ITS, University of Technology Delft (2001)
- Wooldridge, M. An Introduction to MultiAgent Systems. John Wiley & Sons (2002)
Посилання
- The University of Memphis: Agents by action selection [ 2006-04-18 у Wayback Machine.]
- Michael Wooldridge:
- Cyril Brom: Slides on a course on action selection of artificial beings
- . University of Michigan.
- Modelling natural action selection, a special issue published by The Royal Society — Philosophical Transactions of the Royal Society
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Obirannya diyi sposib oharakterizuvati najgolovnishu problemu intelektualnih sistem sho robiti dali U shtuchnomu intelekti ta obchislyuvalnij kognitivnij nauci problema viboru diyi zazvichaj asociyuyetsya iz intelektualnimi agentami ta en shtuchnimi sistemami yaki demonstruyut skladnu povedinku v seredovishi agenta Termin takozh inodi vikoristovuyetsya v etologiyi abo povedinci tvarin Odniyeyu z problem dlya rozuminnya viboru diyi ye viznachennya rivnya abstrakciyi sho vikoristovuyetsya dlya viznachennya togo sho same ye diyeyu Na samomu bazovomu rivni abstrakciyi atomna diya mozhe buti bud chim vid skorochennya m yazovoyi klitini do provokuvannya vijni Zazvichaj dlya bud yakogo mehanizmu viboru diyi zazdalegid viznachenij i zafiksovano nabir mozhlivih dij Bilshist doslidnikiv yaki pracyuyut u cij galuzi visuvayut visoki vimogi do svoyih agentiv Vikonavec yak pravilo povinen vibirati svoyu diyu v dinamichnih i neperedbachuvanih seredovishah Agenti zazvichaj diyut v rezhimi realnogo chasu tomu voni mayut vchasno uhvalyuvati rishennya Agenti zazvichaj stvoryuyutsya dlya vikonannya kilkoh riznih zadach Ci zadachi mozhut konfliktuvati shodo rozpodilu resursiv napriklad chi mozhe agent odnochasno zagasiti pozhezhu ta prinesti chashku kavi Seredovishe v yakomu diyut agenti mozhe peredbachati nayavnist lyudej yaki uskladnyuyut robotu agenta navmisno abo namagayuchis dopomogti Sami agenti chasto priznacheni dlya modelyuvannya tvarin abo lyudej chiya povedinka mozhe buti dosit skladnoyu Z cih prichin vibir dij ne ye trivialnim i privertaye uvagu bagatoh doslidnikiv Harakteristika zadachi viboru diyiOsnovnoyu problemoyu viboru diyi ye skladnist Oskilki vsi obchislennya potrebuyut chasu i prostoru u pam yati tomu agenti zazvichaj ne mozhut rozglyanuti vsi dostupni yim varianti dlya kozhnogo momentu chasu Otzhe voni povinni buti uperedzheni i pevnim chinom obmezhuvati svij poshuk Dlya shtuchnogo intelektu ShI pitannya viboru dij polyagaye v tomu yakim najkrashim chinom mozhna obmezhiti cej poshuk Dlya biologiyi ta etologiyi vinikaye pitannya yak rizni vidi tvarin obmezhuyut svij poshuk Chi vsi tvarini vikoristovuyut odnakovi pidhodi Chomu voni vikoristovuyut same ti sho obrali Odne z fundamentalnih pitan shodo viboru diyi polyagaye v tomu chi ce spravdi problema dlya agenta chi ce prosto opis vlastivosti emerdzhentnoyi povedinki rozumnogo agenta Odnak yaksho mi zamislimosya yak mi zbirayemosya stvoriti rozumnogo agenta to stane ochevidnim sho maye buti deyakij sposib viboru dij Cej sposib mozhe buti duzhe poshirenim yak u vipadku rozpodilenih organizmiv takih yak koloniyi socialnih komah abo slimakiv abo ce mozhe buti modul specialnogo priznachennya Metod viboru diyi MVD viznachaye ne tilki diyi agenta z tochki zoru vplivu na svit ale j spryamovuye jogo perceptivnu uvagu ta onovlyuye jogo pam yat Ci egocentrichni diyi mozhut u svoyu chergu prizvesti do zmini osnovnih povedinkovih zdibnostej agenta zokrema v tomu sho onovlennya pam yati peredbachaye mozhlivu pevnu formu mashinnogo navchannya V ideali sam vibir diyi takozh maye buti zdatnim navchatisya ta adaptuvatisya ale isnuye bagato problem iz kombinatornoyu skladnistyu ta traktuvannyam obchislen yaki mozhut vimagati obmezhennya prostoru poshuku dlya navchannya U ShI MVD takozh inodi abo nazivayut en abo vvazhayut jogo istotnoyu chastinoyu Mehanizmi ShIYak pravilo mehanizmi shtuchnogo viboru dij mozhna rozdiliti na dekilka kategorij simvolni sistemi inodi vidomi yak sistemi klasichnogo planuvannya sistemi rozpodilenogo planuvannya i reaktivne abo en Deyaki pidhodi ne pidpadayut pid zhodnu z cih kategorij V inshih naspravdi bilshe jdetsya mova pro nadannya naukovoyi modeli nizh praktichne keruvannya ShI ostanni opisani dali v nastupnomu rozdili Simvolni pidhodi Dokladnishe Avtomatizovane planuvannya ta dispetcherizaciya Na pochatku istoriyi shtuchnogo intelektu peredbachalosya sho najkrashim sposobom dlya agenta vibrati sho robiti dali buv bi poshuk optimalnogo rishennya a potim jogo vikonannya Ce prizvelo do gipotezi sistemi fizichnih simvoliv sho fizichnij agent yakij mozhe manipulyuvati simvolami ye neobhidnim i dostatnim dlya stvorennya intelektu Bagato programnih agentiv dosi vikoristovuyut cej pidhid dlya viboru dij Zazvichaj ce vimagaye opisu vsih pokazan datchikiv otochennya vsih dij i vsih cilej u pevnij formi logiki predikativ Kritiki cogo pidhodu skarzhatsya sho vin ye zanadto povilnim dlya poshuku rishennya v realnomu chasi i sho nezvazhayuchi na dokazi vin vse she navryad chi zmozhe znajti optimalne rishennya oskilki zvedennya opisiv realnosti do logiki ye procesom shilnim do pomilok Zadovilna strategiya ce strategiya prijnyattya rishen yaka namagayetsya zadovolniti kriteriyi adekvatnosti a ne viznachati optimalne rishennya Zadovilna strategiya chasto naspravdi mozhe buti majzhe optimalnoyu yaksho vitrati na sam proces prijnyattya rishen taki yak vartist otrimannya povnoyi informaciyi vrahovuyutsya v obchislenni rezultativ Arhitekturi oriyentovani na dosyagnennya meti u cih simvolnih arhitekturah povedinka agenta zazvichaj opisuyetsya naborom cilej Kozhna meta mozhe buti dosyagnuta za dopomogoyu procesu abo diyalnosti yaka opisuyetsya vstanovlenim planom Agent povinen prosto virishiti yakij proces prodovzhiti dlya dosyagnennya postavlenoyi meti Rishennya mozhe rozshiryuvatisya do pidcilej sho robit proces rekursivnim Tehnichno bilsh mensh plani vikoristovuyut umovni pravila Ci arhitekturi buvayut en abo gibridni Klasichnimi prikladami arhitektur oriyentovanih na cili ye realizovani vdoskonalennya arhitekturi perekonan bazhan ta namiriv yak ot JAM abo Rozpodileni pidhodi Na vidminu vid simvolnogo pidhodu rozpodileni sistemi viboru dij faktichno ne mayut zhodnogo yashiku v agenti yakij vibiraye nastupnu diyu Prinajmni v yih idealizovanij formi rozpodileni sistemi mayut bagato moduliv sho pracyuyut paralelno i vibirayut najkrashi diyi na osnovi lokalnogo dosvidu Ochikuyetsya sho v cih idealizovanih sistemah zagalna uzgodzhenist vinikne yakimos chinom mozhlivo zavdyaki retelnij rozrobci vzayemodiyuchih komponentiv Cej pidhid chasto nadihayetsya doslidzhennyami shtuchnih nejronnih merezh Na praktici majzhe zavzhdi isnuye deyaka centralizovana sistema yaka viznachaye yakij modul ye najaktivnishim abo ye najbilsh pomitnim Ye dokazi sho biologichnij mozok takozh maye en yaki ocinyuyut yaka z konkuruyuchih sistem zaslugovuye najbilshe uvagi abo tochnishe maye bilshu en pri vibori dij ASMO ce attention arhitektura rozroblena Roni Novianto Vona organizovuye rizni modulni rozpodileni procesi yaki mozhut vikoristovuvati vlasni uyavlennya ta metodi dlya sprijnyattya navkolishnogo seredovisha obrobki informaciyi planuvannya diyi ta vibirati diyi dlya vikonannya Rizni tipi arhitektur winner take all v yakih odna vibrana diya otrimuye povnij kontrol nad ruhovoyu sistemoyu Poshirena aktivaciya vklyuchayuchi Extended Rosenblatt amp Payton ce rozpovsyudzhena arhitektura aktivaciyi rozroblena Tobi Tirellom u 1993 roci Povedinka agenta zberigayetsya u formi iyerarhichnoyi konekcionistskoyi merezhi yaku Tirell nazvav iyerarhiyeyu vilnogo potoku Napriklad de Sevin amp Thalmann 2005 abo 2001 en buv vidpoviddyu na povilnu shvidkist robotiv iz vikoristannyam simvolnih metodiv viboru dij U cij formi okremi moduli reaguyut na rizni stimuli i generuyut vlasni reakciyi U pochatkovij formi pri vikoristanni en voni skladalisya z riznih shariv yaki mogli kontrolyuvati ta priglushuvati vhidni ta vihidni dani odin odnogo en ce virtualni domashni tvarini z komp yuternoyi gri kerovani adaptivnoyu trisharovoyu nejronnoyu merezheyu Mehanizm yih roboti reaktivnij oskilki merezha na kozhnomu kroci chasu viznachaye zavdannya yake maye vikonati istota Merezha dobre opisana v statti Grand et al 1997 ta v The Creatures Developer Resources Div takozh Creatures Wiki Pidhodi dinamichnogo planuvannya Oskilki chisto rozpodileni sistemi vazhko pobuduvati bagato doslidnikiv zvernulisya do vikoristannya chitko zaprogramovanih planiv dlya viznachennya prioritetiv svoyeyi sistemi Dinamichni abo en metodi planuvannya obchislyuyut lishe odnu nastupnu diyu v kozhnu mit na osnovi potochnogo kontekstu ta zazdalegid propisanih planiv Na vidminu vid klasichnih metodiv planuvannya reaktivni abo dinamichni pidhodi ne strazhdayut vid kombinatornogo vibuhu Z inshogo boku inodi voni vvazhayutsya zanadto zhorstkimi shob vvazhati yih silnim ShI oskilki plani zakodovani zazdalegid U toj zhe chas prirodnij intelekt mozhe buti zhorstkim v deyakih kontekstah hocha vin plinnij i zdatnij do adaptaciyi Prikladi mehanizmiv dinamichnogo planuvannya vklyuchayut Skinchenni avtomati Ce en arhitekturi sho vikoristovuyutsya perevazhno dlya agentiv komp yuternih igor zokrema dlya shuteriv vid pershoyi osobi botiv abo dlya virtualnih aktoriv kino Yak pravilo skinchenni avtomati ye iyerarhichnimi Dlya konkretnih prikladiv igor divitsya stattyu Halo 2 bots Demiena Ajsla 2005 abo magistersku robotu pro botiv Quake III Yana Pola van Vaverena 2001 Dlya prikladu filmu div Softimage Inshi strukturovani reaktivni plani mayut tendenciyu viglyadati trohi bilshe shozhimi na zvichajni plani chasto iz sposobami predstavlennya iyerarhichnoyi ta poslidovnoyi strukturi Deyaki napriklad diyi en PSM vikoristovuyut en Bagato arhitektur agentiv z seredini 1990 h vklyuchali taki plani yak promizhnij shar sho zabezpechuvav organizaciyu nizkorivnevih en odnochasno keruyuchis planuvalnikom vishogo rivnya v realnomu chasi Hocha takij pidhid peredbachaye sumisnist z avtomatizovanimi planuvalnikami bilshist strukturovanih reaktivnih planiv koduyutsya vruchnu Bryson 2001 ch 3 Prikladi strukturovanih reaktivnih planiv vklyuchayut sistemu Dzhejmsa Firbi RAP i en Teleo reactive plans PSM RAP i TRP bilshe ne rozroblyayutsya ta ne pidtrimuyutsya She odnim dosi diyuchim stanom na 2006 rik nashadkom cogo pidhodu ye paralelna iyerarhichna sistema viboru dij na osnovi steku abo POSH yaka ye chastinoyu sistemi Behavior Oriented Design stvorenoyi en Inodi shob sprobuvati pozbavitis negnuchkosti dinamichnogo planuvannya vikoristovuyutsya gibridni metodi U nih bilsh tradicijna sistema planuvannya ShI shukaye novi plani koli agent maye vilnij chas i onovlyuye biblioteku dinamichnih planiv koli znahodit optimalni rishennya Vazhlivim aspektom bud yakoyi takoyi sistemi ye te sho koli agentu potribno vibrati diyu isnuye deyake rishennya yake mozhna zastosuvati negajno div dali en Inshi CogniTAO ce mehanizm prijnyattya rishen zasnovanij na perekonannyah bazhannyah ta namirah belief desire intention vin vklyuchaye v sebe vbudovani mozhlivosti dlya komandnoyi roboti en ce simvolna en Vona zasnovana na pravilah umovnih dij vidomih yak produkciyi Programisti mozhut vikoristovuvati instrumentarij rozrobki Soar dlya stvorennya yak reaktivnih agentiv tak i agentiv planuvannya abo bud yakogo gibridu Excalibur buv doslidnickim proektom ocholyuvanim Oleksandrom Nareyekom u yakomu vikoristovuvalisya anytime agenti dlya planuvannya komp yuternih igor Arhitektura zasnovana na strukturi en sho ye peredovoyu tehnikoyu shtuchnogo intelektu en shozhij na Soar Vin vklyuchaye v sebe sistemu bayesovogo navchannya yaka dopomagaye viznachiti prioriteti virobnictva ABL Hap Nechitki arhitekturi Nechitkij pidhid u vibori dij zabezpechuye bilsh plavnu povedinku nizh ta yaku mozhut stvoriti arhitekturi sho vikoristovuyut logichni pravila umovnih dij napriklad Soar abo POSH Ci arhitekturi perevazhno en ta simvolni Teoriyi viboru dij v prirodiCya stattya potrebuye uvagi j turboti fahivcya u svoyij galuzi Bud laska povidomte pro ce znajomomu vam specialistu abo vipravte yiyi sami yaksho vi volodiyete vidpovidnimi znannyami Mozhlivo mistit zauvazhennya shodo potribnih zmin sichen 2022 Bagato dinamichnih modelej shtuchnogo viboru dij spochatku buli nathnenni doslidzhennyami z etologiyi Zokrema Konrad Lorenc i Nikolas Tinbergen nadali ideyu en dlya poyasnennya instinktivnoyi povedinki en Pid vplivom idej V Makdugalla Lorenc rozvinuv ce v model motivaciyi povedinki V etologiyi ci ideyi mali vpliv u 1960 h rokah ale teper voni vvazhayutsya zastarilimi cherez vikoristannya v nih metafori en nervova sistema i kontrol povedinki zaraz zazvichaj rozglyadayutsya yak peredacha informaciyi a ne potik energiyi Dinamichni plani ta nejronni merezhi bilshe shozhi na peredachu informaciyi todi yak rozpovsyudzhena aktivaciya bilshe shozha na difuznij kontrol emocijnih abo gormonalnih sistem en pripustiv sho vibir dij ye pravilnoyu tochkoyu zoru dlya rozuminnya roli ta evolyuciyi rozumu Divitsya jogo storinku pro Modeli ShI dlya viboru nejronnih dij Deyaki doslidniki stvoryuyut skladni modeli viboru nejronnih dij Divitsya napriklad The Universitet Kolorado u Boulderi The Adaptive Behaviour Research Group Universitet Sheffilda Div takozh en Shtuchnij intelekt u videoigrah en Ekspertna sistema Mehanizm visnovku Intelektualnij agent en Produkcijna sistema Navchannya z pidkriplennyam en UtilitaPosilannyaSamsonovich A V Attention in the ASMO cognitive architecture Biologically Inspired Cognitive Architectures 2010 98 nedostupne posilannya z 01 01 2021 Karen L Myers PRS CL A Procedural Reasoning System SRI International Procitovano 13 chervnya 2013 LiteraturaBratman M Intention plans and practical reason Cambridge Mass Harvard University Press 1987 Brom C Lukavsky J Sery O Poch T Safrata P Affordances and level of detail AI for virtual humans In Proceedings of Game Set and Match 2 Delft 2006 en PhD thesis Massachusetts Institute of Technology 2001 Champandard A J AI Game Development Synthetic Creatures with learning and Reactive Behaviors New Riders USA 2003 Grand S Cliff D Malhotra A Creatures Artificial life autonomous software agents for home entertainment In Johnson W L eds Proceedings of the First International Conference on Autonomous Agents ACM press 1997 22 29 Huber M J JAM A BDI theoretic mobile agent architecture In Proceedings of the Third International Conference on Autonomous Agents Agents 99 Seattle 1999 236 243 Isla D Handling complexity in Halo 2 In Gamastura online 03 11 2005 2006 01 08 u Wayback Machine Maes P The agent network architecture ANA In SIGART Bulletin 2 4 pages 115 120 1991 Nareyek A Excalibur project Reynolds C W Flocks Herds and Schools A Distributed Behavioral Model In Computer Graphics 21 4 SIGGRAPH 87 Conference Proceedings 1987 25 34 de Sevin E Thalmann D A motivational Model of Action Selection for Virtual Humans In Computer Graphics International CGI IEEE Computer SocietyPress New York 2005 Tyrrell T Computational Mechanisms for Action Selection Ph D Dissertation Centre for Cognitive Science University of Edinburgh 1993 van Waveren J M P The Quake III Arena Bot Master thesis Faculty ITS University of Technology Delft 2001 Wooldridge M An Introduction to MultiAgent Systems John Wiley amp Sons 2002 PosilannyaThe University of Memphis Agents by action selection 2006 04 18 u Wayback Machine Michael Wooldridge Cyril Brom Slides on a course on action selection of artificial beings University of Michigan Modelling natural action selection a special issue published by The Royal Society Philosophical Transactions of the Royal Society