Пробле́мне середо́вище являє собою «проблему», для якої раціональний агент є «розв'язком».
Визначення
Проблемне середовище, в штучному інтелекті для раціонального агента, є об'єднанням факторів:
- Показники продуктивності (Performance measure), які визначають критерії успіху
- Середовище (Environment) — знання агента про середовище, які були отримані раніше
- Виконавчі механізми (Actuators), які можуть бути виконані агентом
- Сенсори (Sensors) — послідовність актів сприйняття, які відбулись дотепер
За своїми факторами проблемне середовище може позначатись скорочено PEAS.
Класифікація проблемних середовищ
Спостерігаються повністю або частково
- Якщо сенсори агента надають йому доступ до повної інформації середовища в кожний момент часу → повністю спостерігається. Агент не потребує збереження інформації про навколишній світ;
- Середовище може спостерігатись частково через сенсорний шум або відсутність певних її характеристик в інформації, яка отримується від сенсорів.
Детерміновані або стохастичні
- Якщо наступний стан середовища повністю визначається поточним станом та дією, яку виконує агент, → детерміноване середовище; в іншому випадку → стохастичне;
- Якщо середовище є детермінованим в усіх відношеннях, окрім дій інших агентів, то таке середовище називається стратегічним.
Епізодичне або послідовне
- В епізодичному середовищі досвід агента складається з нерозривних епізодів, де кожний епізод включає в себе сприйняття середовища агентом, а потім виконання певної дії. Кожний епізод не залежить від дій на попередніх;
- У послідовних середовищах кожна дія може вплинути на майбутні дії.
Статичне або динамічне
- Якщо середовище може змінюватись під час того, як агент обирає наступну дію, то це динамічне для даного агента середовище; інакше середовище є статичним;
- Якщо з плином часу саме середовище не змінюється, а змінюються показники продуктивності агента, то це напівдинамічне середовище.
Дискретне або неперервне
- Різниця між дискретним та неперервним варіантами середовища може відноситись до станів середовища, способу ліку часу, а також сприйняття та діям агента.
Одноагентне або мультиагентне
- Для мультиагентних: конкурентне або кооперативне.
Приклад середовища
Автономне управління. Світ автоматичного водія таксі
Система комп'ютерного зору Alvinn була навчена водінню автомобіля, дотримуючись певної смуги руху. В університеті CMU ця система була розміщена в мікроавтобусі, керованому комп'ютером NavLab, та використовувалася для проїзду по Сполученим Штатам; протягом 4586,6 км система забезпечувала рульове управління автомобілем протягом 98 % часу. Людина брала на себе управління лише протягом останніх 2 %, головним чином на виїзних пандусах. Комп'ютер NavLab був обладнаний відеокамерами, які передавали зображення дороги в систему Alvinn, а потім ця система обчислювала найкращий напрямок руху, ґрунтуючись на досвіді, отриманому в попередніх навчальних пробігах.
Елементи середовища
- Показники продуктивності
- Безпечна, швидка, комфортна їзда в рамках правил дорожнього руху, максимізація прибутку
- Середовище
- Дороги, інші транспортні засоби, пішоходи, клієнти
- Виконавчі механізми
- Рульове управління, акселератор, гальмо, світлові сигнали, клаксон, дисплей
- Сенсори
- Відеокамери, ультразвукової далекомір, спідометр, глобальна система навігації і визначення положення, одометр, акселерометр, датчики, двигуна, клавіатура
Основні елементи PEAS для ряду інших типів агентів
Тип агента | Показники продуктивності | Середовище | Виконавчі механізми | Датчики |
---|---|---|---|---|
Медична діагностична система | Вдале завершення лікування пацієнта, мінімізація витрат, відсутність приводів для суддівських процесів | Пацієнт, лікарня, персонал | Вивід питань, тестів, діагнозів, рекомендацій, направлень | Введення з клавіатури симптомів, результатів лабораторних експериментів, відповідей пацієнта |
Система аналізу зображень, отриманих із супутника | Правильна класифікація зображення | Канал передачі даних від приладу орбітального супутника | Вивід на дисплей результатів класифікації окремого фрагменту зображення | Масиви пікселів із інформацією про колір |
Робот-сортувальник деталей | Відсоткові показники безпомилкового сортування по лоткам | Стрічковий конвеєр, з деталями, що рухаються на ньому; лотки | Шарнірний маніпулятор та захоплення | Відеокамера, датчики кутів повороту шарнірів |
Контролер очищувальної системи | Максимізація ступеню очистки, продуктивності, безпеки | Очищувальний прилад, оператори | Клапани, насоси, нагрівачі, дисплеї | Температура, тиск, датчики хімічного складу |
Інтерактивна програма навчання англійській мові | Максимізація оцінок студентів на екзаменах | Множина студентів, екзаменаційне агентство | Вивід на дисплей вправ, рекомендацій, виправлень | Введення з клавіатури |
Тип середовища для системи водія Alvinn
- Спостерігаються повністю або частково
- Автоматизований водій не має відомостей про те, які маневри мають намір виконати інші водії. Тому середовище є таким, що частково спостерігається.
- Детерміновані або стохастичні
- Середовище керування автомобілем є стохастичним, оскільки ніхто не може точно передбачити поведінку всіх інших транспортних засобів, більше того, в будь-якому автомобілі абсолютно несподівано може статися прокол шини або зупинка двигуна.
- Епізодичне або послідовне
- Дане середовище є послідовним, короткочасні дії можуть мати довготривалі наслідки.
- Статичне або динамічне
- Середовище керування автомобілем є динамічним, оскільки інші автомобілі продовжують рух і в ході того, як алгоритм водіння визначає, що робити далі.
- Дискретне або неперервне
- Керування автомобілем — це проблема з безперервно мінливим станом і безперервно поточним часом, оскільки швидкість та місцезнаходження самого таксі та інших транспортних засобів змінюються в певному діапазоні безперервних значень, до речі ці зміни відбуваються в часі плавно. Дії з керування автомобілем також є безперервними (постійне регулювання кута повороту керма тощо). Вхідні дані від цифрових камер надходять дискретно, але зазвичай розглядаються так що представляють безперервно мінливі швидкості та місцезнаходження.
- Одноагентне або мультиагентне
- Дане середовище є мультиагентне.
Властивості інших варіантів середовища та їх характеристики
Проблемне середовище | Частково чи повністю спостерігається | Детермінована, стратегічна, стохастична | Епізодична, послідовна | Статистична, динамічна, полудинамічна | Дискретна чи неперервна | Одноагентна чи мультиагентна |
---|---|---|---|---|---|---|
Див. також
Джерела
- Stuart J. Russel and Peter Norvig, Artifical Intelligence: A Modern Approach, 2 edition, 2006.
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Proble mne seredo vishe yavlyaye soboyu problemu dlya yakoyi racionalnij agent ye rozv yazkom ViznachennyaProblemne seredovishe v shtuchnomu intelekti dlya racionalnogo agenta ye ob yednannyam faktoriv Pokazniki produktivnosti Performance measure yaki viznachayut kriteriyi uspihu Seredovishe Environment znannya agenta pro seredovishe yaki buli otrimani ranishe Vikonavchi mehanizmi Actuators yaki mozhut buti vikonani agentom Sensori Sensors poslidovnist aktiv sprijnyattya yaki vidbulis doteper Za svoyimi faktorami problemne seredovishe mozhe poznachatis skorocheno PEAS Klasifikaciya problemnih seredovishSposterigayutsya povnistyu abo chastkovo Yaksho sensori agenta nadayut jomu dostup do povnoyi informaciyi seredovisha v kozhnij moment chasu povnistyu sposterigayetsya Agent ne potrebuye zberezhennya informaciyi pro navkolishnij svit Seredovishe mozhe sposterigatis chastkovo cherez sensornij shum abo vidsutnist pevnih yiyi harakteristik v informaciyi yaka otrimuyetsya vid sensoriv Determinovani abo stohastichni Yaksho nastupnij stan seredovisha povnistyu viznachayetsya potochnim stanom ta diyeyu yaku vikonuye agent determinovane seredovishe v inshomu vipadku stohastichne Yaksho seredovishe ye determinovanim v usih vidnoshennyah okrim dij inshih agentiv to take seredovishe nazivayetsya strategichnim Epizodichne abo poslidovne V epizodichnomu seredovishi dosvid agenta skladayetsya z nerozrivnih epizodiv de kozhnij epizod vklyuchaye v sebe sprijnyattya seredovisha agentom a potim vikonannya pevnoyi diyi Kozhnij epizod ne zalezhit vid dij na poperednih U poslidovnih seredovishah kozhna diya mozhe vplinuti na majbutni diyi Statichne abo dinamichne Yaksho seredovishe mozhe zminyuvatis pid chas togo yak agent obiraye nastupnu diyu to ce dinamichne dlya danogo agenta seredovishe inakshe seredovishe ye statichnim Yaksho z plinom chasu same seredovishe ne zminyuyetsya a zminyuyutsya pokazniki produktivnosti agenta to ce napivdinamichne seredovishe Diskretne abo neperervne Riznicya mizh diskretnim ta neperervnim variantami seredovisha mozhe vidnositis do staniv seredovisha sposobu liku chasu a takozh sprijnyattya ta diyam agenta Odnoagentne abo multiagentne Dlya multiagentnih konkurentne abo kooperativne Priklad seredovishaAvtonomne upravlinnya Svit avtomatichnogo vodiya taksi Sistema komp yuternogo zoru Alvinn bula navchena vodinnyu avtomobilya dotrimuyuchis pevnoyi smugi ruhu V universiteti CMU cya sistema bula rozmishena v mikroavtobusi kerovanomu komp yuterom NavLab ta vikoristovuvalasya dlya proyizdu po Spoluchenim Shtatam protyagom 4586 6 km sistema zabezpechuvala rulove upravlinnya avtomobilem protyagom 98 chasu Lyudina brala na sebe upravlinnya lishe protyagom ostannih 2 golovnim chinom na viyiznih pandusah Komp yuter NavLab buv obladnanij videokamerami yaki peredavali zobrazhennya dorogi v sistemu Alvinn a potim cya sistema obchislyuvala najkrashij napryamok ruhu gruntuyuchis na dosvidi otrimanomu v poperednih navchalnih probigah Elementi seredovisha Pokazniki produktivnosti Bezpechna shvidka komfortna yizda v ramkah pravil dorozhnogo ruhu maksimizaciya pributku Seredovishe Dorogi inshi transportni zasobi pishohodi kliyenti Vikonavchi mehanizmi Rulove upravlinnya akselerator galmo svitlovi signali klakson displej Sensori Videokameri ultrazvukovoyi dalekomir spidometr globalna sistema navigaciyi i viznachennya polozhennya odometr akselerometr datchiki dviguna klaviatura Osnovni elementi PEAS dlya ryadu inshih tipiv agentiv Tip agenta Pokazniki produktivnosti Seredovishe Vikonavchi mehanizmi Datchiki Medichna diagnostichna sistema Vdale zavershennya likuvannya paciyenta minimizaciya vitrat vidsutnist privodiv dlya suddivskih procesiv Paciyent likarnya personal Vivid pitan testiv diagnoziv rekomendacij napravlen Vvedennya z klaviaturi simptomiv rezultativ laboratornih eksperimentiv vidpovidej paciyenta Sistema analizu zobrazhen otrimanih iz suputnika Pravilna klasifikaciya zobrazhennya Kanal peredachi danih vid priladu orbitalnogo suputnika Vivid na displej rezultativ klasifikaciyi okremogo fragmentu zobrazhennya Masivi pikseliv iz informaciyeyu pro kolir Robot sortuvalnik detalej Vidsotkovi pokazniki bezpomilkovogo sortuvannya po lotkam Strichkovij konveyer z detalyami sho ruhayutsya na nomu lotki Sharnirnij manipulyator ta zahoplennya Videokamera datchiki kutiv povorotu sharniriv Kontroler ochishuvalnoyi sistemi Maksimizaciya stupenyu ochistki produktivnosti bezpeki Ochishuvalnij prilad operatori Klapani nasosi nagrivachi displeyi Temperatura tisk datchiki himichnogo skladu Interaktivna programa navchannya anglijskij movi Maksimizaciya ocinok studentiv na ekzamenah Mnozhina studentiv ekzamenacijne agentstvo Vivid na displej vprav rekomendacij vipravlen Vvedennya z klaviaturi Tip seredovisha dlya sistemi vodiya Alvinn Sposterigayutsya povnistyu abo chastkovo Avtomatizovanij vodij ne maye vidomostej pro te yaki manevri mayut namir vikonati inshi vodiyi Tomu seredovishe ye takim sho chastkovo sposterigayetsya Determinovani abo stohastichni Seredovishe keruvannya avtomobilem ye stohastichnim oskilki nihto ne mozhe tochno peredbachiti povedinku vsih inshih transportnih zasobiv bilshe togo v bud yakomu avtomobili absolyutno nespodivano mozhe statisya prokol shini abo zupinka dviguna Epizodichne abo poslidovne Dane seredovishe ye poslidovnim korotkochasni diyi mozhut mati dovgotrivali naslidki Statichne abo dinamichne Seredovishe keruvannya avtomobilem ye dinamichnim oskilki inshi avtomobili prodovzhuyut ruh i v hodi togo yak algoritm vodinnya viznachaye sho robiti dali Diskretne abo neperervne Keruvannya avtomobilem ce problema z bezperervno minlivim stanom i bezperervno potochnim chasom oskilki shvidkist ta misceznahodzhennya samogo taksi ta inshih transportnih zasobiv zminyuyutsya v pevnomu diapazoni bezperervnih znachen do rechi ci zmini vidbuvayutsya v chasi plavno Diyi z keruvannya avtomobilem takozh ye bezperervnimi postijne regulyuvannya kuta povorotu kerma tosho Vhidni dani vid cifrovih kamer nadhodyat diskretno ale zazvichaj rozglyadayutsya tak sho predstavlyayut bezperervno minlivi shvidkosti ta misceznahodzhennya Odnoagentne abo multiagentne Dane seredovishe ye multiagentne Vlastivosti inshih variantiv seredovisha ta yih harakteristiki Problemne seredovishe Chastkovo chi povnistyu sposterigayetsya Determinovana strategichna stohastichna Epizodichna poslidovna Statistichna dinamichna poludinamichna Diskretna chi neperervna Odnoagentna chi multiagentna Virishennya krosvordiv Povnistyu Determinovana Poslidovna Statichna Diskretna Odnoagentna Gra v shahi z kontrolem chasu Povnistyu Stohastichna Poslidovna Poludinamichna Diskretna Multiagentna Gra v poker Chastkovo Stohastichna Poslidovna Statichna Diskretna Multiagentna Gra v nardi Povnistyu Stohastichna Poslidovna Statichna Diskretna Multiagentna Medichna diagnostika Chastkovo Stohastichna Poslidovna Dinamichna Neperervna Odnoagentna Analiz zobrazhennya Povnistyu Determinovana Epizodichna Poludinamichna Neperervna Odnoagentna Robot sortuvalnik detalej Chastkovo Stohastichna Epizodichna Dinamichna Neperervna Odnoagentna Kontroler ochisnoyi stanciyi Chastkovo Stohastichna Poslidovna Dinamichna Neperervna Odnoagentna Interaktivna programa dlya navchannya anglijskoyi movi Chastkovo Stohastichna Poslidovna Dinamichna Diskretna MultiagentnaDiv takozhShtuchnij intelekt Racionalnij agent Cifrovij organizmDzherelaStuart J Russel and Peter Norvig Artifical Intelligence A Modern Approach 2 edition 2006