Індукція назад, індукція з кінця або обернена індукція — це процес міркування обернений у часі, від кінця задачі або ситуації, щоб визначити послідовність найсприятливіших дій. Він рухається розглядаючи останню точку, в якій треба ухвалювати рішення і тоді з'ясовує яка дія буде найоптимальнішою в цю мить. Послуговуючись цими даними, ви можете визначити, що робити під час ухвалення другого з кінця рішення. Цей процес триває назад в часі допоки не буде визначено найліпші дії для всіх можливих становищ (наприклад, для кожної можливої [en]) у кожну точку в часі. Індукцію назад вперше в 1875 році ужив Артур Кейлі, який відкрив метод намагаючись розв'язати горезвісну задачу про перебірливу наречену.
У математичній оптимізації оптимізації в методі динамічного програмування індукція назад це один з головних підходів для розв'язання рівняння Беллмана. У теорії ігор, індукція назад це метод використовуваний для обчислення [en] у послідовних іграх. Єдина різниця це те, що оптимізація залучає лише одного ухвалювача рішень, який обирає, що робити кожної миті, тоді як теорія ігор аналізує як взаємодіють рішення кількох гравців. Тобто передбачаючи, що останній гравець робитиме в кожній ситуації, ми можемо визначити, що робитиме другий з кінця гравець і так далі. У пов'язаних галузях автоматизованого планування та диспетчеризації й автоматизованого доведення теорем, метод називається пошуком назад або зворотним виводом. У шахах він відомий як ретроспективний аналіз.
Індукцію назад використовували для розв'язання ігор так довго як довго існувала теорія ігор. Джон фон Нейман і Оскар Морґенштерн запропонували розв'язувати ігри з нульовою сумою і двома гравцями за допомогою індукції назад у їхній книжці Теорія ігор і економічної поведінки (1944), ця книжка вводила теорію ігор як напрямок для дослідження.
Індукція назад в ухвалені рішень: задача оптимальної зупинки
Розгляньмо безробітну людину, яка зможе працювати ще десять років t = 1,2,…,10. Припустімо, що кожен рік, протягом якого вона залишається безробітною, їй можуть запропонувати «хорошу» роботу з оплатою 100 доларів або «погану» роботу з оплатою 44 долари з рівною ймовірністю (50/50). Щойно вона погодиться на роботу, вона залишатиметься на цій роботі протягом решти десяти років. (Для простоти припустимо, що вона дбає лише про свої грошові доходи, і що вона оцінює доходи в різний час однаково, тобто ставка дисконту дорівнює одиниці.)
Чи повинна ця людина погоджуватися на погану роботу? Щоб відповісти на це запитання, ми можемо міркувати в зворотному напрямку від часу t = 10.
- У момент часу 10 цінність прийняття хорошої роботи становить 100 доларів США; цінність погодження на погану роботу становить 44 долари; цінність відмови від доступної роботи рівне нулю. Тому, якщо вона все ще залишається безробітною впродовж останнього періоду, вона повинна прийняти будь-яку роботу, яку їй пропонують на той час.
- У момент часу 9 цінність прийняття хорошої роботи становить 200 доларів (бо ця робота триватиме два роки); цінність погодження на погану роботу рівна 2*44$ = 88$. Цінність відхилення пропозиції про роботу зараз становить 0 доларів США плюс вартість очікування наступної пропозиції про роботу, яка становитиме або 44 долари США з імовірністю 50 %, або 100 доларів США з імовірністю 50 %, для середнього («очікуваного») значення 0,5*(100$+44$)=72$. Тому, незалежно від того, хороша чи погана вакансія, доступна в момент часу 9, краще прийняти цю пропозицію, ніж чекати кращої.
- У момент часу 8 цінність прийняття хорошої роботи становить 300 доларів (вона триватиме три роки); цінність погодження на погану роботу становить 3*$44 = $132. Цінність відхилення пропозиції роботи зараз становить 0 доларів США плюс вартість очікування пропозиції роботи в момент 9. Оскільки ми вже дійшли висновку, що пропозиції в момент 9 повинні бути прийняті, очікувана вартість очікування пропозиції роботи в момент 9 дорівнює 0,5*(200$+88$) = 144$. Тому в момент 8 цінніше чекати наступної пропозиції, ніж погоджуватися на погану роботу.
- Продовжуючи роботу у зворотному напрямку, можна переконатися, що погані пропозиції слід приймати, лише якщо людина все ще безробітна в 9 або 10 моментів; їх слід відхиляти в будь-який час до t = 8. Інтуїція полягає в тому, що якщо хтось очікує працювати на роботі протягом тривалого часу, це робить більш цінним бути вибагливим щодо того, яку роботу прийняти.
Задача динамічної оптимізації такого типу називається задачею оптимальної зупинки, бо питання полягає в тому, коли припинити очікування кращої пропозиції. [en] — це галузь мікроекономіки, яка застосовує задачі такого типу до таких контекстів, як покупки, пошук роботи та шлюб.
Індукція назад в теорії ігор
У теорії ігор обернена індукція є концепцією рішення. Це уточнення концепції раціональності, яка чутлива до окремих [en] в екстенсивному представленні гри. Ідея оберненої індукції використовує послідовну раціональність шляхом визначення оптимальної дії для кожної інформації в даному дереві гри.
У «Стратегії: Вступ до теорії ігор» Джоела Уотсона процедура зворотної індукції визначається як: «Процес аналізу гри від кінця до початку. На кожному вузлі прийняття рішень вилучаються з розгляду будь-які дії, які є домінуючими, враховуючи термінальні вузли, які можуть бути досягнуті через гру дій, визначених на наступних вузлах».
Одним із недоліків процедури зворотної індукції є те, що її можна застосовувати лише до обмежених класів ігор. Процедура чітко визначена для будь-якої гри з досконалою інформацією без прив'язки до користі. Вона також чітко визначена й значуща для ігор ідеальної інформації зі зв'язками. Однак це призводить до понад одного профілю стратегії. Процедуру можна застосувати до деяких ігор з нетривіальними інформаційними множинами, але в цілому вона ненадійна. Процедура найкраще підходить для розв'язування ігор з ідеальною інформацією. Тому, якщо всі гравці не усвідомлюють дії інших гравців і виграші на кожному вузлі від прийняття рішень, тоді обернену індукцію не так легко застосувати. (Ватсон с. 188)
Процедуру зворотної індукції можна продемонструвати на простому прикладі.
Багатоетапна гра
Розгляньмо [en], в якій беруть участь 2 гравці. Гравці планують піти в кіно. Зараз є 2 фільми, які дуже популярні, Джокер і Термінатор. Гравець 1 хоче дивитися Термінатора, а Гравець 2 хоче дивитися Джокера. Гравець 1 першим купить квиток і повідомить Гравцю 2 про свій вибір. Тоді Гравець 2 купить свій квиток. Після того як вони обидва спостерігатимуть за вибором, вони вирішать, піти їм у кіно чи залишитися вдома. Як і на першому етапі, гравець 1 обирає першим. Потім гравець 2 робить свій вибір після спостереження за вибором гравця 1.
У цьому прикладі ми припускаємо, що виграш додається на різних етапах. Гра є грою з повною інформацією.
Матриця нормальної форми:
Гравець 2 Гравець 1 | Джокер | Термінатор |
---|---|---|
Джокер | 3, 5 | 0, 0 |
Термінатор | 1, 1 | 5, 3 |
Гравець 2 Гравець 1 | Піти в кіно | Залишитись вдома |
---|---|---|
Піти в кіно | 6, 6 | 4, -2 |
Залишитись вдома | -2, 4 | -2, -2 |
[en] гри Джокер/Термінатор: Кроки для розв'язання цієї багатоетапної гри з великою формою, як показано праворуч:
- Зворотна індукція починає розв'язувати гру з останніх вузлів.
- Гравець 2 спостерігатиме за 8 [en] з останніх вузлів, щоб вибрати «Піти на фільм» або «Залишитися вдома».
- Гравець 2 загалом зробить 4 порівняння. Він обере варіант з більшим виграшем.
- Наприклад, якщо розглядати першу підгру, виграш 11 більший, ніж 7. Тому Гравець 2 обирає «Піти на фільм».
- Метод продовжується для кожної підгри.
- Коли Гравець 2 завершить свій вибір, Гравець 1 зробить свій вибір на основі вибраних підігор.
- Процес подібний до кроку 2. Гравець 1 порівнює свої виграші, щоб зробити свій вибір.
- Підігри, не обрані Гравцем 2 на попередньому кроці, більше не розглядаються обома гравцями, оскільки вони не є оптимальними
- Наприклад, вибір «Піти в кіно» пропонує виграш 9 (9,11), а вибір «Залишитися вдома» пропонує виграш 1 (1, 9). Гравець 1 обере «Піти на фільм».
- Процес повторюється для кожного гравця, доки не буде досягнуто початковий вузол.
- Наприклад, Гравець 2 обере «Джокера», оскільки виграш 11 (9, 11) більший, ніж «Термінатор» з виграшем 6 (6, 6).
- Наприклад, гравець 1 у початковому вузлі обере «Термінатор», оскільки він пропонує вищу винагороду 11. Термінатор: (11, 9) > Джокер: (9, 11)
- Щоб визначити [en], нам потрібно визначити маршрут, який обирає оптимальну підгру для кожної інформаційної множини.
- У цьому прикладі Гравець 1 обирає «Термінатор», а Гравець 2 також обирає «Термінатор». Потім обидва обирають «Піти на фільм».
- Ця досконала за підіграми рівновага призводить до виграшу (11,9)
Гра в ультиматум
Індукція назад — це «процес аналізу гри від кінця до початку». Як і при розв'язуванні інших рівноваг Неша, передбачається раціональність гравців і повне знання. Концепція оберненої індукції відповідає цьому припущенню, бо загальновідомо, що кожен гравець діятиме раціонально з кожним вузлом ухвалення рішень, коли він обирає варіант — навіть якщо його раціональність означатиме, що такий вузол не буде досягнутий». Отже, за умови взаємного припущення раціональності, індукція назад дозволяє кожному гравцеві точно передбачити, що буде робити його суперник на кожному етапі гри.
Щоб розв'язати [en] за допомогою оберненою індукції, гру слід записати в розгорнутій формі, а потім розділити на підігри. Починаючи з підгри найдальшої від початкового вузла або початкової точки, очікувані виграші, зазначені для цієї підгри, зважуються, і раціональний гравець вибере для себе варіант із вищою віддачею. Вибирається та позначається вектор найбільшого виграшу. Знайдіть ідеальну рівновагу в підгрі, постійно працюючи назад від підгри до підгри, поки не досягнете початкової точки. У міру того, як цей процес просувається, ваша початкова гра в екстенсивній формі ставатиме все коротшою. Цей позначений шлях векторів є ідеальною рівновагою підгри.
Індукція назад, застосована до гри в ультиматум
Подумайте про гру між двома гравцями, де гравець 1 пропонує розділити один долар з гравцем 2. Це відома асиметрична гра, у яку грають послідовно і називають [en]. Перший гравець діє першим, розділяючи долар так, як вважає за потрібне. Тепер другий гравець може прийняти частину, яку йому роздав перший гравець, або відмовитися від розподілу. Якщо гравець 2 приймає розподіл, то гравець 1 і гравець 2 отримують виграш відповідно до цього розподілу. Якщо другий гравець вирішить відхилити пропозицію гравця 1, обидва гравці нічого не отримають. Іншими словами, гравець 2 має право вето на запропонований розподіл гравця 1, але застосування вето усуває будь-яку винагороду для обох гравців. Таким чином, профіль стратегії для цієї гри можна записати у вигляді пар (x, f(x)) для всіх x від 0 до 1, де f(x)) є двозначною функцією, яка виражає, приймається x чи ні.
Розгляньмо вибір і відповідь гравця 2 на будь-яку довільну пропозицію гравця 1, припускаючи, що пропозиція перевищує 0 доларів. Використовуючи обернену індукцію, безсумнівно, ми очікуємо, що гравець 2 прийме будь-яку виграш, що перевищує або дорівнює 0 доларів. Відповідно, гравець 1 повинен запропонувати дати гравцеві 2 якомога менше, щоб отримати найбільшу частину розподілу. Якщо гравець 1 дає гравцеві 2 найменшу грошову одиницю, а решту залишає собі, це унікальна ідеальна рівновага в підгрі. Гра «Ультиматум» має кілька інших рівноваг Неша, які не є ідеальними підіграми і тому не потребують індукції назад.
Гра в ультиматум це ілюстрація корисності оберненої індукції при розгляді нескінченних ігор; однак теоретично передбачені результати гри піддаються критиці. Емпіричні експериментальні дані показали, що пропонент дуже рідко пропонує 0 доларів, а гравець 2 іноді навіть відхиляє пропозиції, що перевищують 0 доларів, мабуть, з міркувань справедливості. Те, що гравець 2 вважає справедливим, залежить від контексту, і тиск або присутність інших гравців може означати, що теоретична модель ігор не обов'язково може передбачити, що виберуть реальні люди.
На практиці ідеальна рівновага в підгрі не завжди досягається. За словами Камерера, американського поведінкового економіста, гравець 2 «відхиляє пропозиції менш ніж на 20 відсотків від X приблизно в половині випадків, навіть якщо в кінцевому підсумку він не отримує нічого». Хоча індукція назад передбачила б, що респондент приймає будь-яку пропозицію рівну або більшу нуля, респонденти насправді не раціональні гравці і тому, здається, більше піклуються про «справедливість» пропозиції, а не про потенційні грошові вигоди.
Дивіться також гру [en]».
Обернена індукція в економіці: ухвалення рішення про вхід на ринок
Розгляньмо динамічну гру, в якій гравцями є фірма, що посідає усталену позицію в галузі, й потенційний новий учасник цієї галузі. У поточному стані усталений оператор має монополію на галузь і не хоче втрачати частину своєї частки ринку на користь нового. Якщо учасник вирішує не вступати, виграш для чинного учасника є високим (він зберігає свою монополію), і учасник не втрачає і не отримує (його виграш дорівнює нулю). Якщо новачок вступає, то усталений може «воювати» або «примиритись» з новачком. Він може боротися, знижуючи свою ціну, виводячи конкурента з бізнесу (і несучи витрати на виході — від'ємний виграш) і завдаючи шкоди власним прибуткам. Якщо він піде назустріч учаснику, він втратить частину своїх продажів, але висока ціна збережеться, і він отримає більший прибуток, ніж від зниження ціни (але нижчий, ніж прибуток монополії).
Подумайте, чи найкращою відповіддю посадової особи є примирення, якщо вступає новачок. Якщо чинний оператор погоджується, найкраща відповідь учасника — увійти (і отримати прибуток). Таким чином, стратегічний профіль, до якого вступає новачок, і усталений оператор примиряється, якщо новий вступає, є рівновагою Неша, що відповідає оберненій індукції. Проте, якщо усталений учасник збирається битися, найкраща відповідь учасника — не вступати, і якщо учасник не вступає, не має значення, що він вирішить робити в гіпотетичному випадку, коли учасник все ж вступить. Таким чином, стратегічний профіль, у якому усталений учасник бореться, якщо вступає учасник, але учасник не вступає, також є рівновагою Неша. Однак, якщо учасник відхилиться і увійде, найкращою реакцією усталеного учасника буде примирення — загроза бійки не викликає довіри. Тому цю другу рівновагу Неша можна усунути за допомогою оберненої індукції.
Знаходження рівноваги Неша в кожному процесі ухвалення рішень (підгрі) є ідеальною підігровою рівновагою. Таким чином, ці профілі стратегії, які зображують ідеальну рівновагу підігор, виключають можливість таких дій, як неймовірні загрози, які використовуються, щоб «відлякати» нового учасника. Якщо діючий оператор погрожує розпочати війну цін з новим учасником, він погрожує знизити свої ціни з монопольної ціни до трохи нижчої, ніж у нового учасника, що було б непрактично та неймовірно, якби учасник знав, що цінової війни насправді не буде, бо це призведе до втрат для обох сторін. На відміну від оптимізації за допомогою одного агента, яка включає в себе рівноваги, які є нездійсненними або оптимальними, ідеальна рівновага підгри враховує дії іншого гравця, таким чином гарантуючи, що жоден гравець не досягне підгри помилково. У цьому випадку обернена індукція, яка дає ідеальну рівновагу підігор, гарантує, що учасник не буде переконаний у загрозі чинного гравця, знаючи, що це була не найкраща відповідь у профілі стратегії.
Парадокс індукції назад: раптова страта
Парадокс раптової страти — це парадокс, пов'язаний з оберненою індукцією. Припустімо, що ув'язненій сказали, що її повісять десь між понеділком і п'ятницею наступного тижня. Однак точний день не відомий (тобто, вона не знатиме напередодні ввечері, що наступного дня її стратять). Ув'язнена, зацікавлена в тому, щоб перехитрити свого ката, намагається визначити, в який день відбудеться страта.
Вона вважає, що це не може відбутися в п'ятницю, бо якби це не відбулося до кінця четверга, вона б знала, що страта буде в п'ятницю. Тому вона може виключити п'ятницю як можливість. Коли п'ятницю вилучено, вона вирішує, що це не може відбутися в четвер, бо якби це не відбулося в середу, вона знала б, що це мало бути в четвер. Тому вона може усунути четвер. Це міркування триває, доки вона не усуне всі можливості. Вона робить висновок, що наступного тижня її не повісять.
На її подив, у середу її вішають. Вона зробила помилку, припустивши, що вона точно знала, чи невідомий майбутній чинник, який спричинить її страту, є тим, про який вона може міркувати.
Тут ув'язнена міркує за оберненою індукцією, але, здається, доходить до помилкового висновку. Зауважте, однак, що опис задачі передбачає можливість здивувати когось, хто виконує індукцію назад. Математична теорія оберненої індукції не робить цього припущення, тому парадокс не ставить під сумнів висліди цієї теорії. Тим не менш, цей парадокс викликав серйозні дискусії серед філософів.
Обернена індукція та загальні знання про раціональність
Зворотна індукція працює, лише якщо обидва гравці раціональні, тобто завжди обирають дію, яка максимізує їхній виграш. Однак раціональності недостатньо: кожен гравець також повинен вірити, що всі інші гравці є раціональними. Навіть цього недостатньо: кожен гравець повинен вірити, що всі інші гравці знають, що всі інші гравці раціональні. І так до нескінченності. Іншими словами, раціональність має бути загальновідомою.
Обмежена індукція назад
Досліди показали, що в іграх із послідовним торгом, таких як гра [en]», суб'єкти відхиляються від теоретичних прогнозів і замість цього беруть участь у обмеженій оберненій індукції. Це відхилення виникає як наслідок обмеженої раціональності, коли гравці можуть чітко бачити лише на кілька етапів вперед. Це допускає непередбачуваність у рішеннях і недієвість у пошуку та досягненні [en].
Існує три широкі гіпотези цього явища;
- Наявність соціальних чинників (наприклад, справедливість)
- Наявність несоціальних чинників (наприклад, обмежена обернена індукція)
- Культурна відмінність
Порушення оберненої індукції переважно пояснюється наявністю соціальних чинників. Однак прогнози моделі на основі даних для послідовних ігор з угодою (з використанням [en]) підкреслили, що в деяких іграх присутність обмеженої оберненої індукції може відігравати панівну роль.
У рамках повторюваних ігор суспільних благ на поведінку команди впливає обмежена обернена індукція; де очевидно, що початкові внески членів команди вищі, ніж внески ближче до кінця. Обмежена обернена індукція також впливає на те, наскільки регулярно відбувається безкоштовне користування в грі суспільних благ команди. На початку, коли вплив обмеженої зворотної індукції низький, безквитковий проїзд зустрічається рідше, тоді як ближче до кінця, коли ефект значний, безквитковий проїзд стає частішим.
Обмежена зворотна індукція також була перевірена на наявність у варіанті перегонової гри. У грі гравці послідовно вибирають цілі числа в діапазоні та підсумовують свій вибір, доки не буде досягнуто цільове число. Влучання в ціль приносить цьому гравцеві приз; інший програє. Під час серії ігор було введено невеликий проміжний приз. Тоді більшість гравців виконали обмежену індукцію назад, бо вони вирішили отримати невеликий приз, а не початковий приз. Лише невелика частина гравців розглядала обидва призи на початку.
Більшість випробувань індукції назад відбулось на дослідах, в яких учасники не заохочуються або лише незначною мірою заохочуються виконати завдання якісно. Однак порушення оберненої індукції також поширене в середовищах з високими ставками. Широкомасштабний аналіз американського телешоу «The Price Is Right», наприклад, надає докази обмеженого передбачення. У кожному епізоді учасники грають у «Showcase Showdown», послідовну гру з досконалою інформацією, для якої оптимальну стратегію можна знайти за допомогою оберненої індукції. Часті й систематичні відхилення від оптимальної поведінки свідчать про те, що значній частині учасників не вдається належним чином індукувати назад і вони короткозоро розглядають лише наступний етап гри.
Примітки
- Rust, John (9 вересня 2016). Dynamic Programming. The New Palgrave Dictionary of Economics: Palgrave Macmillan. ISBN .
- Jerome Adda and Russell Cooper, «Dynamic Economics: Quantitative Methods and Applications», Section 3.2.1, page 28. MIT Press, 2003.
- Mario Miranda and Paul Fackler, «Applied Computational Economics and Finance», Підрозділ 7.3.1, сторінка 164. МІТ Прес, 2002.
- Drew Fudenberg and Jean Tirole, «Game Theory», Підрозіл 3.5, сторінка 92. МІТ Прес, 1991.
- Mathematics of Chess [Архівовано 2017-11-12 у Wayback Machine.], webpage by John MacQuarrie.
- Джон фон Нейман і Оскар Морґенштерн, «Theory of Games and Economic Behavior», Підрозділ 15.3.1. Princeton University Press. Третє видання, 1953. (Перше видання, 1944.)
- Watson, Joel (2002). Strategy: an introduction to game theory (вид. 3). New York: W.W. Norton & Company. с. 63.
- Watson, Joel (2002). Strategy: an introduction to game theory (вид. 3). New York: W.W. Norton & Company. с. 186–187.
- Watson, Joel (2002). Strategy: an introduction to game theory (вид. 3). New York: W.W. Norton & Company. с. 188.
- Лекція 4. Ігри в розширеній формі. Досконала за підіграми рівновага Неша. Приклади на YouTube
- Yildiz, Muhamet. 14.12 Game Theory Lecture Notes - Lectures 7-9 (PDF). web.mit.edu (амер.). Архів (PDF) оригіналу за 12 вересня 2022. Процитовано 3 листопада 2022.
- Kamiński, Marek M. (2017). Backward Induction: Merits And Flaws. Studies in Logic, Grammar and Rhetoric. 50 (1): 9—24. doi:10.1515/slgr-2017-0016.
- Camerer, Colin F (1 листопада 1997). Progress in Behavioral Game Theory. Journal of Economic Perspectives. 11 (4): 167—188. doi:10.1257/jep.11.4.167. JSTOR 2138470. Архів оригіналу за 14 грудня 2022. Процитовано 14 грудня 2022.
- Rust J. (2008) Dynamic Programming. In: Palgrave Macmillan (eds) The New Palgrave Dictionary of Economics. Palgrave Macmillan, London
- Aumann, Robert J. (January 1995). Backward induction and common knowledge of rationality. Games and Economic Behavior. 8 (1): 6—19. doi:10.1016/S0899-8256(05)80015-6.
- Ke, Shaowei (2019). Boundedly rational backward induction. Theoretical Economics. 14 (1): 103—134. doi:10.3982/TE2402. S2CID 9053484.
- Qu, Xia; Doshi, Prashant (1 березня 2017). On the role of fairness and limited backward induction in sequential bargaining games. Annals of Mathematics and Artificial Intelligence. 79 (1): 205—227. doi:10.1007/s10472-015-9481-7. S2CID 23565130.
- Cox, Caleb A.; Stoddard, Brock (May 2018). Strategic thinking in public goods games with teams. Journal of Public Economics. 161: 31—43. doi:10.1016/j.jpubeco.2018.03.007.
- Mantovani, Marco (2013). Limited backward induction. CiteSeerX 10.1.1.399.8991.
- Klein Teeselink, Bouke; van Dolder, Dennie; van den Assem, Martijn; Dana, Jason (2022). High-Stakes Failures of Backward Induction: Evidence from "The Price Is Right".
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Indukciya nazad indukciya z kincya abo obernena indukciya ce proces mirkuvannya obernenij u chasi vid kincya zadachi abo situaciyi shob viznachiti poslidovnist najspriyatlivishih dij Vin ruhayetsya rozglyadayuchi ostannyu tochku v yakij treba uhvalyuvati rishennya i todi z yasovuye yaka diya bude najoptimalnishoyu v cyu mit Poslugovuyuchis cimi danimi vi mozhete viznachiti sho robiti pid chas uhvalennya drugogo z kincya rishennya Cej proces trivaye nazad v chasi dopoki ne bude viznacheno najlipshi diyi dlya vsih mozhlivih stanovish napriklad dlya kozhnoyi mozhlivoyi informacijnoyi mnozhini en u kozhnu tochku v chasi Indukciyu nazad vpershe v 1875 roci uzhiv Artur Kejli yakij vidkriv metod namagayuchis rozv yazati gorezvisnu zadachu pro perebirlivu narechenu 1 U matematichnij optimizaciyi optimizaciyi v metodi dinamichnogo programuvannya indukciya nazad ce odin z golovnih pidhodiv dlya rozv yazannya rivnyannya Bellmana 2 3 U teoriyi igor indukciya nazad ce metod vikoristovuvanij dlya obchislennya doskonaloyi rivnovagi pidigor en u poslidovnih igrah 4 Yedina riznicya ce te sho optimizaciya zaluchaye lishe odnogo uhvalyuvacha rishen yakij obiraye sho robiti kozhnoyi miti todi yak teoriya igor analizuye yak vzayemodiyut rishennya kilkoh gravciv Tobto peredbachayuchi sho ostannij gravec robitime v kozhnij situaciyi mi mozhemo viznachiti sho robitime drugij z kincya gravec i tak dali U pov yazanih galuzyah avtomatizovanogo planuvannya ta dispetcherizaciyi j avtomatizovanogo dovedennya teorem metod nazivayetsya poshukom nazad abo zvorotnim vivodom U shahah vin vidomij yak retrospektivnij analiz Indukciyu nazad vikoristovuvali dlya rozv yazannya igor tak dovgo yak dovgo isnuvala teoriya igor Dzhon fon Nejman i Oskar Morgenshtern zaproponuvali rozv yazuvati igri z nulovoyu sumoyu i dvoma gravcyami za dopomogoyu indukciyi nazad u yihnij knizhci Teoriya igor i ekonomichnoyi povedinki 1944 cya knizhka vvodila teoriyu igor yak napryamok dlya doslidzhennya 5 6 Zmist 1 Indukciya nazad v uhvaleni rishen zadacha optimalnoyi zupinki 2 Indukciya nazad v teoriyi igor 2 1 Bagatoetapna gra 2 2 Gra v ultimatum 2 2 1 Indukciya nazad zastosovana do gri v ultimatum 3 Obernena indukciya v ekonomici uhvalennya rishennya pro vhid na rinok 4 Paradoks indukciyi nazad raptova strata 5 Obernena indukciya ta zagalni znannya pro racionalnist 6 Obmezhena indukciya nazad 7 PrimitkiIndukciya nazad v uhvaleni rishen zadacha optimalnoyi zupinkired Rozglyanmo bezrobitnu lyudinu yaka zmozhe pracyuvati she desyat rokiv t 1 2 10 Pripustimo sho kozhen rik protyagom yakogo vona zalishayetsya bezrobitnoyu yij mozhut zaproponuvati horoshu robotu z oplatoyu 100 dolariv abo poganu robotu z oplatoyu 44 dolari z rivnoyu jmovirnistyu 50 50 Shojno vona pogoditsya na robotu vona zalishatimetsya na cij roboti protyagom reshti desyati rokiv Dlya prostoti pripustimo sho vona dbaye lishe pro svoyi groshovi dohodi i sho vona ocinyuye dohodi v riznij chas odnakovo tobto stavka diskontu dorivnyuye odinici Chi povinna cya lyudina pogodzhuvatisya na poganu robotu Shob vidpovisti na ce zapitannya mi mozhemo mirkuvati v zvorotnomu napryamku vid chasu t 10 U moment chasu 10 cinnist prijnyattya horoshoyi roboti stanovit 100 dolariv SShA cinnist pogodzhennya na poganu robotu stanovit 44 dolari cinnist vidmovi vid dostupnoyi roboti rivne nulyu Tomu yaksho vona vse she zalishayetsya bezrobitnoyu vprodovzh ostannogo periodu vona povinna prijnyati bud yaku robotu yaku yij proponuyut na toj chas U moment chasu 9 cinnist prijnyattya horoshoyi roboti stanovit 200 dolariv bo cya robota trivatime dva roki cinnist pogodzhennya na poganu robotu rivna 2 44 88 Cinnist vidhilennya propoziciyi pro robotu zaraz stanovit 0 dolariv SShA plyus vartist ochikuvannya nastupnoyi propoziciyi pro robotu yaka stanovitime abo 44 dolari SShA z imovirnistyu 50 abo 100 dolariv SShA z imovirnistyu 50 dlya serednogo ochikuvanogo znachennya 0 5 100 44 72 Tomu nezalezhno vid togo horosha chi pogana vakansiya dostupna v moment chasu 9 krashe prijnyati cyu propoziciyu nizh chekati krashoyi U moment chasu 8 cinnist prijnyattya horoshoyi roboti stanovit 300 dolariv vona trivatime tri roki cinnist pogodzhennya na poganu robotu stanovit 3 44 132 Cinnist vidhilennya propoziciyi roboti zaraz stanovit 0 dolariv SShA plyus vartist ochikuvannya propoziciyi roboti v moment 9 Oskilki mi vzhe dijshli visnovku sho propoziciyi v moment 9 povinni buti prijnyati ochikuvana vartist ochikuvannya propoziciyi roboti v moment 9 dorivnyuye 0 5 200 88 144 Tomu v moment 8 cinnishe chekati nastupnoyi propoziciyi nizh pogodzhuvatisya na poganu robotu Prodovzhuyuchi robotu u zvorotnomu napryamku mozhna perekonatisya sho pogani propoziciyi slid prijmati lishe yaksho lyudina vse she bezrobitna v 9 abo 10 momentiv yih slid vidhilyati v bud yakij chas do t 8 Intuyiciya polyagaye v tomu sho yaksho htos ochikuye pracyuvati na roboti protyagom trivalogo chasu ce robit bilsh cinnim buti vibaglivim shodo togo yaku robotu prijnyati Zadacha dinamichnoyi optimizaciyi takogo tipu nazivayetsya zadacheyu optimalnoyi zupinki bo pitannya polyagaye v tomu koli pripiniti ochikuvannya krashoyi propoziciyi Teoriya poshuku en ce galuz mikroekonomiki yaka zastosovuye zadachi takogo tipu do takih kontekstiv yak pokupki poshuk roboti ta shlyub Indukciya nazad v teoriyi igorred U teoriyi igor obernena indukciya ye koncepciyeyu rishennya Ce utochnennya koncepciyi racionalnosti yaka chutliva do okremih informacijnih mnozhin en v ekstensivnomu predstavlenni gri 7 Ideya obernenoyi indukciyi vikoristovuye poslidovnu racionalnist shlyahom viznachennya optimalnoyi diyi dlya kozhnoyi informaciyi v danomu derevi gri U Strategiyi Vstup do teoriyi igor Dzhoela Uotsona procedura zvorotnoyi indukciyi viznachayetsya yak Proces analizu gri vid kincya do pochatku Na kozhnomu vuzli prijnyattya rishen viluchayutsya z rozglyadu bud yaki diyi yaki ye dominuyuchimi vrahovuyuchi terminalni vuzli yaki mozhut buti dosyagnuti cherez gru dij viznachenih na nastupnih vuzlah 8 Odnim iz nedolikiv proceduri zvorotnoyi indukciyi ye te sho yiyi mozhna zastosovuvati lishe do obmezhenih klasiv igor Procedura chitko viznachena dlya bud yakoyi gri z doskonaloyu informaciyeyu bez priv yazki do koristi Vona takozh chitko viznachena j znachusha dlya igor idealnoyi informaciyi zi zv yazkami Odnak ce prizvodit do ponad odnogo profilyu strategiyi Proceduru mozhna zastosuvati do deyakih igor z netrivialnimi informacijnimi mnozhinami ale v cilomu vona nenadijna Procedura najkrashe pidhodit dlya rozv yazuvannya igor z idealnoyu informaciyeyu Tomu yaksho vsi gravci ne usvidomlyuyut diyi inshih gravciv i vigrashi na kozhnomu vuzli vid prijnyattya rishen todi obernenu indukciyu ne tak legko zastosuvati Vatson s 188 9 Proceduru zvorotnoyi indukciyi mozhna prodemonstruvati na prostomu prikladi Bagatoetapna grared Rozglyanmo bagatoetapnu gru en v yakij berut uchast 2 gravci Gravci planuyut piti v kino Zaraz ye 2 filmi yaki duzhe populyarni Dzhoker i Terminator Gravec 1 hoche divitisya Terminatora a Gravec 2 hoche divitisya Dzhokera Gravec 1 pershim kupit kvitok i povidomit Gravcyu 2 pro svij vibir Todi Gravec 2 kupit svij kvitok Pislya togo yak voni obidva sposterigatimut za viborom voni virishat piti yim u kino chi zalishitisya vdoma Yak i na pershomu etapi gravec 1 obiraye pershim Potim gravec 2 robit svij vibir pislya sposterezhennya za viborom gravcya 1 U comu prikladi mi pripuskayemo sho vigrash dodayetsya na riznih etapah Gra ye groyu z povnoyu informaciyeyu Matricya normalnoyi formi Stadiya 1 Gravec 2Gravec 1 Dzhoker Terminator Dzhoker 3 5 0 0 Terminator 1 1 5 3 Stadiya 2 Gravec 2Gravec 1 Piti v kino Zalishitis vdoma Piti v kino 6 6 4 2 Zalishitis vdoma 2 4 2 2 Rozgornuta forma en gri Dzhoker Terminator Kroki dlya rozv yazannya ciyeyi bagatoetapnoyi gri z velikoyu formoyu yak pokazano pravoruch nbsp Rozgornuta forma gri Dzhoker Terminator Zvorotna indukciya pochinaye rozv yazuvati gru z ostannih vuzliv Gravec 2 sposterigatime za 8 pidigrami en z ostannih vuzliv shob vibrati Piti na film abo Zalishitisya vdoma Gravec 2 zagalom zrobit 4 porivnyannya Vin obere variant z bilshim vigrashem Napriklad yaksho rozglyadati pershu pidgru vigrash 11 bilshij nizh 7 Tomu Gravec 2 obiraye Piti na film Metod prodovzhuyetsya dlya kozhnoyi pidgri Koli Gravec 2 zavershit svij vibir Gravec 1 zrobit svij vibir na osnovi vibranih pidigor Proces podibnij do kroku 2 Gravec 1 porivnyuye svoyi vigrashi shob zrobiti svij vibir Pidigri ne obrani Gravcem 2 na poperednomu kroci bilshe ne rozglyadayutsya oboma gravcyami oskilki voni ne ye optimalnimi Napriklad vibir Piti v kino proponuye vigrash 9 9 11 a vibir Zalishitisya vdoma proponuye vigrash 1 1 9 Gravec 1 obere Piti na film Proces povtoryuyetsya dlya kozhnogo gravcya doki ne bude dosyagnuto pochatkovij vuzol Napriklad Gravec 2 obere Dzhokera oskilki vigrash 11 9 11 bilshij nizh Terminator z vigrashem 6 6 6 Napriklad gravec 1 u pochatkovomu vuzli obere Terminator oskilki vin proponuye vishu vinagorodu 11 Terminator 11 9 gt Dzhoker 9 11 Shob viznachiti doskonalu za pidigrami rivnovagu en 10 nam potribno viznachiti marshrut yakij obiraye optimalnu pidgru dlya kozhnoyi informacijnoyi mnozhini U comu prikladi Gravec 1 obiraye Terminator a Gravec 2 takozh obiraye Terminator Potim obidva obirayut Piti na film Cya doskonala za pidigrami rivnovaga prizvodit do vigrashu 11 9 Gra v ultimatumred Indukciya nazad ce proces analizu gri vid kincya do pochatku Yak i pri rozv yazuvanni inshih rivnovag Nesha peredbachayetsya racionalnist gravciv i povne znannya Koncepciya obernenoyi indukciyi vidpovidaye comu pripushennyu bo zagalnovidomo sho kozhen gravec diyatime racionalno z kozhnim vuzlom uhvalennya rishen koli vin obiraye variant navit yaksho jogo racionalnist oznachatime sho takij vuzol ne bude dosyagnutij 11 Otzhe za umovi vzayemnogo pripushennya racionalnosti indukciya nazad dozvolyaye kozhnomu gravcevi tochno peredbachiti sho bude robiti jogo supernik na kozhnomu etapi gri Shob rozv yazati doskonalu za pidigrami rivnovagu en za dopomogoyu obernenoyu indukciyi gru slid zapisati v rozgornutij formi a potim rozdiliti na pidigri Pochinayuchi z pidgri najdalshoyi vid pochatkovogo vuzla abo pochatkovoyi tochki ochikuvani vigrashi zaznacheni dlya ciyeyi pidgri zvazhuyutsya i racionalnij gravec vibere dlya sebe variant iz vishoyu viddacheyu Vibirayetsya ta poznachayetsya vektor najbilshogo vigrashu Znajdit idealnu rivnovagu v pidgri postijno pracyuyuchi nazad vid pidgri do pidgri poki ne dosyagnete pochatkovoyi tochki U miru togo yak cej proces prosuvayetsya vasha pochatkova gra v ekstensivnij formi stavatime vse korotshoyu Cej poznachenij shlyah vektoriv ye idealnoyu rivnovagoyu pidgri 1 Indukciya nazad zastosovana do gri v ultimatumred Podumajte pro gru mizh dvoma gravcyami de gravec 1 proponuye rozdiliti odin dolar z gravcem 2 Ce vidoma asimetrichna gra u yaku grayut poslidovno i nazivayut groyu ultimatum en Pershij gravec diye pershim rozdilyayuchi dolar tak yak vvazhaye za potribne Teper drugij gravec mozhe prijnyati chastinu yaku jomu rozdav pershij gravec abo vidmovitisya vid rozpodilu Yaksho gravec 2 prijmaye rozpodil to gravec 1 i gravec 2 otrimuyut vigrash vidpovidno do cogo rozpodilu Yaksho drugij gravec virishit vidhiliti propoziciyu gravcya 1 obidva gravci nichogo ne otrimayut Inshimi slovami gravec 2 maye pravo veto na zaproponovanij rozpodil gravcya 1 ale zastosuvannya veto usuvaye bud yaku vinagorodu dlya oboh gravciv 12 Takim chinom profil strategiyi dlya ciyeyi gri mozhna zapisati u viglyadi par x f x dlya vsih x vid 0 do 1 de f x ye dvoznachnoyu funkciyeyu yaka virazhaye prijmayetsya x chi ni Rozglyanmo vibir i vidpovid gravcya 2 na bud yaku dovilnu propoziciyu gravcya 1 pripuskayuchi sho propoziciya perevishuye 0 dolariv Vikoristovuyuchi obernenu indukciyu bezsumnivno mi ochikuyemo sho gravec 2 prijme bud yaku vigrash sho perevishuye abo dorivnyuye 0 dolariv Vidpovidno gravec 1 povinen zaproponuvati dati gravcevi 2 yakomoga menshe shob otrimati najbilshu chastinu rozpodilu Yaksho gravec 1 daye gravcevi 2 najmenshu groshovu odinicyu a reshtu zalishaye sobi ce unikalna idealna rivnovaga v pidgri Gra Ultimatum maye kilka inshih rivnovag Nesha yaki ne ye idealnimi pidigrami i tomu ne potrebuyut indukciyi nazad Gra v ultimatum ce ilyustraciya korisnosti obernenoyi indukciyi pri rozglyadi neskinchennih igor odnak teoretichno peredbacheni rezultati gri piddayutsya kritici Empirichni eksperimentalni dani pokazali sho proponent duzhe ridko proponuye 0 dolariv a gravec 2 inodi navit vidhilyaye propoziciyi sho perevishuyut 0 dolariv mabut z mirkuvan spravedlivosti Te sho gravec 2 vvazhaye spravedlivim zalezhit vid kontekstu i tisk abo prisutnist inshih gravciv mozhe oznachati sho teoretichna model igor ne obov yazkovo mozhe peredbachiti sho viberut realni lyudi Na praktici idealna rivnovaga v pidgri ne zavzhdi dosyagayetsya Za slovami Kamerera amerikanskogo povedinkovogo ekonomista gravec 2 vidhilyaye propoziciyi mensh nizh na 20 vidsotkiv vid X priblizno v polovini vipadkiv navit yaksho v kincevomu pidsumku vin ne otrimuye nichogo 13 Hocha indukciya nazad peredbachila b sho respondent prijmaye bud yaku propoziciyu rivnu abo bilshu nulya respondenti naspravdi ne racionalni gravci i tomu zdayetsya bilshe pikluyutsya pro spravedlivist propoziciyi a ne pro potencijni groshovi vigodi Divitsya takozh gru stonoga en Obernena indukciya v ekonomici uhvalennya rishennya pro vhid na rinokred Rozglyanmo dinamichnu gru v yakij gravcyami ye firma sho posidaye ustalenu poziciyu v galuzi j potencijnij novij uchasnik ciyeyi galuzi U potochnomu stani ustalenij operator maye monopoliyu na galuz i ne hoche vtrachati chastinu svoyeyi chastki rinku na korist novogo Yaksho uchasnik virishuye ne vstupati vigrash dlya chinnogo uchasnika ye visokim vin zberigaye svoyu monopoliyu i uchasnik ne vtrachaye i ne otrimuye jogo vigrash dorivnyuye nulyu Yaksho novachok vstupaye to ustalenij mozhe voyuvati abo primiritis z novachkom Vin mozhe borotisya znizhuyuchi svoyu cinu vivodyachi konkurenta z biznesu i nesuchi vitrati na vihodi vid yemnij vigrash i zavdayuchi shkodi vlasnim pributkam Yaksho vin pide nazustrich uchasniku vin vtratit chastinu svoyih prodazhiv ale visoka cina zberezhetsya i vin otrimaye bilshij pributok nizh vid znizhennya cini ale nizhchij nizh pributok monopoliyi Podumajte chi najkrashoyu vidpoviddyu posadovoyi osobi ye primirennya yaksho vstupaye novachok Yaksho chinnij operator pogodzhuyetsya najkrasha vidpovid uchasnika uvijti i otrimati pributok Takim chinom strategichnij profil do yakogo vstupaye novachok i ustalenij operator primiryayetsya yaksho novij vstupaye ye rivnovagoyu Nesha sho vidpovidaye obernenij indukciyi Prote yaksho ustalenij uchasnik zbirayetsya bitisya najkrasha vidpovid uchasnika ne vstupati i yaksho uchasnik ne vstupaye ne maye znachennya sho vin virishit robiti v gipotetichnomu vipadku koli uchasnik vse zh vstupit Takim chinom strategichnij profil u yakomu ustalenij uchasnik boretsya yaksho vstupaye uchasnik ale uchasnik ne vstupaye takozh ye rivnovagoyu Nesha Odnak yaksho uchasnik vidhilitsya i uvijde najkrashoyu reakciyeyu ustalenogo uchasnika bude primirennya zagroza bijki ne viklikaye doviri Tomu cyu drugu rivnovagu Nesha mozhna usunuti za dopomogoyu obernenoyi indukciyi Znahodzhennya rivnovagi Nesha v kozhnomu procesi uhvalennya rishen pidgri ye idealnoyu pidigrovoyu rivnovagoyu Takim chinom ci profili strategiyi yaki zobrazhuyut idealnu rivnovagu pidigor viklyuchayut mozhlivist takih dij yak nejmovirni zagrozi yaki vikoristovuyutsya shob vidlyakati novogo uchasnika Yaksho diyuchij operator pogrozhuye rozpochati vijnu cin z novim uchasnikom vin pogrozhuye zniziti svoyi cini z monopolnoyi cini do trohi nizhchoyi nizh u novogo uchasnika sho bulo b nepraktichno ta nejmovirno yakbi uchasnik znav sho cinovoyi vijni naspravdi ne bude bo ce prizvede do vtrat dlya oboh storin Na vidminu vid optimizaciyi za dopomogoyu odnogo agenta yaka vklyuchaye v sebe rivnovagi yaki ye nezdijsnennimi abo optimalnimi idealna rivnovaga pidgri vrahovuye diyi inshogo gravcya takim chinom garantuyuchi sho zhoden gravec ne dosyagne pidgri pomilkovo U comu vipadku obernena indukciya yaka daye idealnu rivnovagu pidigor garantuye sho uchasnik ne bude perekonanij u zagrozi chinnogo gravcya znayuchi sho ce bula ne najkrasha vidpovid u profili strategiyi 14 Paradoks indukciyi nazad raptova stratared Paradoks raptovoyi strati ce paradoks pov yazanij z obernenoyu indukciyeyu Pripustimo sho uv yaznenij skazali sho yiyi povisyat des mizh ponedilkom i p yatniceyu nastupnogo tizhnya Odnak tochnij den ne vidomij tobto vona ne znatime naperedodni vvecheri sho nastupnogo dnya yiyi stratyat Uv yaznena zacikavlena v tomu shob perehitriti svogo kata namagayetsya viznachiti v yakij den vidbudetsya strata Vona vvazhaye sho ce ne mozhe vidbutisya v p yatnicyu bo yakbi ce ne vidbulosya do kincya chetverga vona b znala sho strata bude v p yatnicyu Tomu vona mozhe viklyuchiti p yatnicyu yak mozhlivist Koli p yatnicyu vilucheno vona virishuye sho ce ne mozhe vidbutisya v chetver bo yakbi ce ne vidbulosya v seredu vona znala b sho ce malo buti v chetver Tomu vona mozhe usunuti chetver Ce mirkuvannya trivaye doki vona ne usune vsi mozhlivosti Vona robit visnovok sho nastupnogo tizhnya yiyi ne povisyat Na yiyi podiv u seredu yiyi vishayut Vona zrobila pomilku pripustivshi sho vona tochno znala chi nevidomij majbutnij chinnik yakij sprichinit yiyi stratu ye tim pro yakij vona mozhe mirkuvati Tut uv yaznena mirkuye za obernenoyu indukciyeyu ale zdayetsya dohodit do pomilkovogo visnovku Zauvazhte odnak sho opis zadachi peredbachaye mozhlivist zdivuvati kogos hto vikonuye indukciyu nazad Matematichna teoriya obernenoyi indukciyi ne robit cogo pripushennya tomu paradoks ne stavit pid sumniv vislidi ciyeyi teoriyi Tim ne mensh cej paradoks viklikav serjozni diskusiyi sered filosofiv Obernena indukciya ta zagalni znannya pro racionalnistred Zvorotna indukciya pracyuye lishe yaksho obidva gravci racionalni tobto zavzhdi obirayut diyu yaka maksimizuye yihnij vigrash Odnak racionalnosti nedostatno kozhen gravec takozh povinen viriti sho vsi inshi gravci ye racionalnimi Navit cogo nedostatno kozhen gravec povinen viriti sho vsi inshi gravci znayut sho vsi inshi gravci racionalni I tak do neskinchennosti Inshimi slovami racionalnist maye buti zagalnovidomoyu 15 Obmezhena indukciya nazadred Doslidi pokazali sho v igrah iz poslidovnim torgom takih yak gra Stonoga en sub yekti vidhilyayutsya vid teoretichnih prognoziv i zamist cogo berut uchast u obmezhenij obernenij indukciyi Ce vidhilennya vinikaye yak naslidok obmezhenoyi racionalnosti koli gravci mozhut chitko bachiti lishe na kilka etapiv vpered 16 Ce dopuskaye neperedbachuvanist u rishennyah i nediyevist u poshuku ta dosyagnenni pidigrovoyi idealnoyi rivnovagi Nesha en nbsp Chotirohetapna poslidovna gra z obmezhennim bachennyam etapiv Isnuye tri shiroki gipotezi cogo yavisha Nayavnist socialnih chinnikiv napriklad spravedlivist Nayavnist nesocialnih chinnikiv napriklad obmezhena obernena indukciya Kulturna vidminnist Porushennya obernenoyi indukciyi perevazhno poyasnyuyetsya nayavnistyu socialnih chinnikiv Odnak prognozi modeli na osnovi danih dlya poslidovnih igor z ugodoyu z vikoristannyam modeli kognitivnoyi iyerarhiyi en pidkreslili sho v deyakih igrah prisutnist obmezhenoyi obernenoyi indukciyi mozhe vidigravati panivnu rol 17 U ramkah povtoryuvanih igor suspilnih blag na povedinku komandi vplivaye obmezhena obernena indukciya de ochevidno sho pochatkovi vneski chleniv komandi vishi nizh vneski blizhche do kincya Obmezhena obernena indukciya takozh vplivaye na te naskilki regulyarno vidbuvayetsya bezkoshtovne koristuvannya v gri suspilnih blag komandi Na pochatku koli vpliv obmezhenoyi zvorotnoyi indukciyi nizkij bezkvitkovij proyizd zustrichayetsya ridshe todi yak blizhche do kincya koli efekt znachnij bezkvitkovij proyizd staye chastishim 18 Obmezhena zvorotna indukciya takozh bula perevirena na nayavnist u varianti peregonovoyi gri U gri gravci poslidovno vibirayut cili chisla v diapazoni ta pidsumovuyut svij vibir doki ne bude dosyagnuto cilove chislo Vluchannya v cil prinosit comu gravcevi priz inshij prograye Pid chas seriyi igor bulo vvedeno nevelikij promizhnij priz Todi bilshist gravciv vikonali obmezhenu indukciyu nazad bo voni virishili otrimati nevelikij priz a ne pochatkovij priz Lishe nevelika chastina gravciv rozglyadala obidva prizi na pochatku 19 Bilshist viprobuvan indukciyi nazad vidbulos na doslidah v yakih uchasniki ne zaohochuyutsya abo lishe neznachnoyu miroyu zaohochuyutsya vikonati zavdannya yakisno Odnak porushennya obernenoyi indukciyi takozh poshirene v seredovishah z visokimi stavkami Shirokomasshtabnij analiz amerikanskogo teleshou The Price Is Right napriklad nadaye dokazi obmezhenogo peredbachennya U kozhnomu epizodi uchasniki grayut u Showcase Showdown poslidovnu gru z doskonaloyu informaciyeyu dlya yakoyi optimalnu strategiyu mozhna znajti za dopomogoyu obernenoyi indukciyi Chasti j sistematichni vidhilennya vid optimalnoyi povedinki svidchat pro te sho znachnij chastini uchasnikiv ne vdayetsya nalezhnim chinom indukuvati nazad i voni korotkozoro rozglyadayut lishe nastupnij etap gri 20 Primitkired a b Rust John 9 veresnya 2016 Dynamic Programming The New Palgrave Dictionary of Economics Palgrave Macmillan ISBN 978 1 349 95121 5 Jerome Adda and Russell Cooper Dynamic Economics Quantitative Methods and Applications Section 3 2 1 page 28 MIT Press 2003 Mario Miranda and Paul Fackler Applied Computational Economics and Finance Pidrozdil 7 3 1 storinka 164 MIT Pres 2002 Drew Fudenberg and Jean Tirole Game Theory Pidrozil 3 5 storinka 92 MIT Pres 1991 Mathematics of Chess Arhivovano 2017 11 12 u Wayback Machine webpage by John MacQuarrie Dzhon fon Nejman i Oskar Morgenshtern Theory of Games and Economic Behavior Pidrozdil 15 3 1 Princeton University Press Tretye vidannya 1953 Pershe vidannya 1944 Watson Joel 2002 Strategy an introduction to game theory vid 3 New York W W Norton amp Company s 63 Watson Joel 2002 Strategy an introduction to game theory vid 3 New York W W Norton amp Company s 186 187 Watson Joel 2002 Strategy an introduction to game theory vid 3 New York W W Norton amp Company s 188 Lekciya 4 Igri v rozshirenij formi Doskonala za pidigrami rivnovaga Nesha Prikladi na YouTube Yildiz Muhamet 14 12 Game Theory Lecture Notes Lectures 7 9 PDF web mit edu amer Arhiv PDF originalu za 12 veresnya 2022 Procitovano 3 listopada 2022 Kaminski Marek M 2017 Backward Induction Merits And Flaws Studies in Logic Grammar and Rhetoric 50 1 9 24 doi 10 1515 slgr 2017 0016 Camerer Colin F 1 listopada 1997 Progress in Behavioral Game Theory Journal of Economic Perspectives 11 4 167 188 doi 10 1257 jep 11 4 167 JSTOR 2138470 Arhiv originalu za 14 grudnya 2022 Procitovano 14 grudnya 2022 Rust J 2008 Dynamic Programming In Palgrave Macmillan eds The New Palgrave Dictionary of Economics Palgrave Macmillan London Aumann Robert J January 1995 Backward induction and common knowledge of rationality Games and Economic Behavior 8 1 6 19 doi 10 1016 S0899 8256 05 80015 6 Ke Shaowei 2019 Boundedly rational backward induction Theoretical Economics 14 1 103 134 doi 10 3982 TE2402 S2CID 9053484 Qu Xia Doshi Prashant 1 bereznya 2017 On the role of fairness and limited backward induction in sequential bargaining games Annals of Mathematics and Artificial Intelligence 79 1 205 227 doi 10 1007 s10472 015 9481 7 S2CID 23565130 Cox Caleb A Stoddard Brock May 2018 Strategic thinking in public goods games with teams Journal of Public Economics 161 31 43 doi 10 1016 j jpubeco 2018 03 007 Mantovani Marco 2013 Limited backward induction CiteSeerX 10 1 1 399 8991 Klein Teeselink Bouke van Dolder Dennie van den Assem Martijn Dana Jason 2022 High Stakes Failures of Backward Induction Evidence from The Price Is Right Otrimano z https uk wikipedia org w index php title Indukciya nazad amp oldid 43903550