У теорії ігор дилема в'язня (ДВ) — гра з , в якій гравці прагнуть одержати вигоду, співпрацюючи один з одним або зраджуючи. Як у всій теорії ігор, передбачається, що гравець («в'язень») максимізує свій власний виграш, не піклуючись про вигоду інших.
У дилемі в'язня зрада строго домінує над співпрацею, тому єдина можлива рівновага — зрада обох учасників. Простіше кажучи, не важливо, що зробить інший гравець, кожен виграє більше, якщо зрадить. Оскільки в будь-якій ситуації зрадити вигідніше, ніж співпрацювати, всі раціональні гравці виберуть зраду.
Поводячись окремо раціонально, разом учасники приходять до нераціонального рішення: якщо обидва зрадять, вони одержать в сумі менший виграш, ніж якби співпрацювали (єдина рівновага в цій грі не веде до Парето-оптимального рішення). У цьому і полягає дилема.
У дилемі в'язня, що повторюється, гра відбувається періодично, і кожен гравець може «покарати» іншого за неспівпрацю раніше. У такій грі співпраця може стати рівновагою, а стимул зрадити може переважуватися загрозою покарання (із зростанням числа ітерацій рівновага Неша прагне до Парето-оптимуму).
Класична дилема в'язня
Класична дилема ув'язненого така:
- Двоє підозрюваних, А і Б, арештовані. У поліції немає достатніх доказів для звинувачення, і ізолювавши їх один від одного, вони пропонують їм одну і ту ж операцію: якщо один свідчить проти іншого, а той зберігає мовчання, то перший звільняється, а другий одержує 10 років в'язниці. Якщо обидва мовчать, у поліції мало доказів, і вони засуджуються до 6 місяців. Якщо обидва свідчать проти один одного, вони одержують по 2 роки. Кожен ув'язнений вибирає, мовчати або свідчити проти іншого. Проте жоден з них не знає точно, що зробить інший. Що відбудеться?
Гру можна представити у вигляді такої таблиці:
В'язень Б зберігає мовчання | В'язень Б надає свідчення | |
---|---|---|
В'язень А зберігає мовчання | Обидва одержують півроку. | А одержує 10 років Б звільняється |
В'язень А надає свідчення | А звільняється Б одержує 10 років в'язниці | Обидва одержують 2 роки в'язниці |
Дилема з'являється, якщо припустити, що обидва піклуються тільки про мінімізацію власного терміну ув'язнення.
Уявимо міркування кожного з ув'язнених. Якщо партнер мовчить, то найкраще його зрадити і вийти на свободу (інакше — півроку в'язниці). Якщо партнер свідчить, то найкраще теж свідчити проти нього, щоб одержати 2 роки (інакше — 10 років). Стратегія «свідчити» строго домінує над стратегією «мовчати». Аналогічно, інший ув'язнений приходить до того ж висновку.
З погляду групи (цих двох в'язнів) найкраще співпрацювати один з одним, зберігати мовчання і одержати по півроку, оскільки це зменшить сумарний термін ув'язнення. Будь-яке інше рішення буде менш вигідним. Це дуже наочно демонструє, що в грі з ненульовою сумою Парето-оптимум може бути протилежним рівновазі Неша.
Узагальнена форма
Можна розкрити скелет гри далі, абстрагувавшись від підтексту ув'язнених. Узагальнена форма гри часто використовується в експериментальній економіці. Ось правила, які дають типову реалізацію гри.
У грі — два гравці і банкір. Кожен гравець тримає 2 карти: на одній написано «співпрацювати», на іншій — «зрадити» (це стандартна термінологія гри). Кожен гравець кладе одну карту перед банкіром написом вниз (тобто ніхто не знає чужого рішення, хоча знання чужого рішення не впливає на аналіз домінування). Банкір відкриває карти і видає виграш.
Якщо обидва вибрали «співпрацювати», обидва одержують C. Якщо один вибрав «зрадити», іншій «співпрацювати» — перший одержує D, другий с. Якщо обидва вибрали «зрадити» — обидва одержують d.
Значення змінних C, D, с, d можуть бути будь-якого знаку (у прикладі вище все менше або рівні 0). Обов'язково повинна дотримуватися нерівність D > C > d > c, щоб гра була ДВ.
Співпрацювати | Зрадити | |
---|---|---|
Співпрацювати | C, C | c, D |
Зрадити | D, c | d, d |
Якщо гра повторюється, тобто грається більше 1 разу поспіль, загальний виграш від співпраці повинен бути більшим сумарного виграшу за ситуації, коли один зраджує, а інший — ні (пояснення — нижче):
- 2C > D + c
Ці правила були встановлені Дугласом Гофштадтером і утворюють канонічний опис типової дилеми в'язня.
Схожа, але інша гра
Гофштадтер припустив, що люди простіше розуміють завдання, як завдання ДВ, якщо вона представлена у вигляді окремої гри або процесу торгівлі. Один з прикладів — «обмін закритими сумками»: Дві людини зустрічаються і обмінюються закритими сумками, розуміючи, що одна з них містить гроші, інша — товар. Кожен гравець може поважати операцію і покласти в сумку те, про що домовилися, або обдурити партнера, давши порожню сумку.
У цій грі обман завжди буде якнайкращим рішенням, означаючи також, що раціональні агенти ніколи не гратимуть в неї, і що ринок обміну закритими сумками буде відсутній.
У варіації, популярній у програмістів і хакерів кожен агент цієї гри пам'ятає попередні результати (або має доступ до громадської думки, «колективної пам'яті»), і безліч обмінів повторюються тривалий час.
Як зазначено вище, без пам'яті ця гра має мало сенсу, вона мало що пояснює в поведінці систем і груп людей, окрім опису взаємодій, які не відбуватимуться. Складнощів вводиться більше, ніж можна чекати. Програміст (особливо який спеціалізується на функціональному програмуванні) відразу зрозуміє значущість часу і стану (пам'яті). Але і без написання програм можна припустити, як поведуться агенти. Наскільки велика пам'ять кожного агента? Яка стратегія кожного з них? Як агенти з різними стратегіями розподілені і що визначає, хто з ким взаємодіє і в якому порядку?
Складність створення якоїсь багатозначної моделі може бентежити, але вона піднімає деякі цікаві і цінні технічні і філософські питання.
Виконана деяка робота з моделюванню цього. Різні програмісти і математики стверджують, що стратегія «око за око» (див. нижче) — якнайкраща загальна стратегія, проте не було зроблено серйозних академічних зусиль, щоб класифікувати різні типи і розподіли агентів, що навчаються, з різними стратегіями.
Про потенціал цього завдання свідчить той факт, що в цій дискусії ще не згадувалися можливість формувати коаліції і виряджатися колективно. А як щодо агентів, які б за платню організовували переговори? Або агентів, які б накопичували інформацію про самі операції?
Приклади з реального життя
Приклади з в'язнями, картковою грою і обміном закритими сумками можуть здаватися надуманими, але насправді є безліч прикладів взаємодії людей і тварин, що мають таку ж матрицю виграшів. Тому ДВ представляє інтерес соціальним наукам, таким як економіка, політологія і соціологія, а також розділам біології — етології і еволюційної біології. Багато природних процесів були узагальнені в моделі, в яких живі істоти беруть участь в нескінченних іграх типу дилеми ув'язненого. Така широка застосовність ДВ додає цій грі значну важливість.
У політології, наприклад, сценарій ДВ часто використовується для ілюстрації проблеми двох країн, залучених в перегони озброєнь. Обидві заявлятимуть, що у них є дві можливості: або збільшити витрати на військові потреби, або скорочувати озброєння. Жодна із сторін не може бути впевнена, що інша дотримуватиме домовленість, отже обидві прагнутимуть до військової експансії. Це можна вважати теоретичним поясненням політики залякування.
В автоспорті яскравий приклад дилеми ув'язненого — Формула-1, де останні 20 років відбуваються перегони бюджетів команд, через яку кількість машин учасників скоротилася з 36 в 1990 до 20 в 2003.
Випадок дилеми в'язня може бути знайдений в бізнесі. Дві конкуруючі фірми повинні визначитися, скільки коштів витрачати на рекламу. і прибуток кожної фірми зменшується із зростанням у конкурента. Обидві фірми ухвалюють рішення збільшити витрати на рекламу, при цьому їх частки ринку і, можливо, залишаються незмінними, а прибуток скорочується. Межа перегонів — прибуток, втім, вони можуть намагатися якийсь час працювати і в збиток. Фірми можуть піти на угоду про скорочення витрат на рекламу, але завжди є стимул його порушити.
У олігополістичних ринках цінова політика — це повторення ДВ. Звичайно олігополісти співрацюють один з одним і не доводять ситуацію до .
Вільям Паундстоун в книзі про дилему в'язня описує ситуацію в Новій Зеландії, де поштові скриньки залишають відкритими. Газету можна узяти, не заплативши за неї, але мало хто так робить, тому що більшість усвідомлює шкоду, яка була б якби всі крали газети. Оскільки ДВ в чистому вигляді одночасна для всіх гравців (ніхто не може вплинути на рішення інших), ця поширена лінія міркувань називається «магічне мислення».
Теоретичний висновок ДВ — одна з причин, чому в багатьох країнах операція про визнання провини заборонена. Часто сценарій ДВ повторюється дуже точно: на користь обох підозрюваних зізнатися і свідчити проти іншого підозрюваного, навіть якщо обидва невинні. Можливо, якнайгірший випадок — коли тільки один винен, в цьому випадку невинний навряд чи зізнається в чомусь, а винний піде на це і дасть свідчення проти невинного.
Багато дилем в реальному житті включають безліч гравців. Хоч і метафорично, «трагедію общин» Ардена можна розглядати як узагальнення ДВ для безлічі гравців. Кожен житель общини вибирає — чи пасти худобу на загальному пасовищі і одержати вигоду, виснажуючи його ресурси, або обмежити свій дохід. Колективний результат від загального (або частого) максимального використання пасовища — низький дохід (що веде до руйнування общини). Проте така гра не є формальною, оскільки може бути розбита на послідовність класичних ігор з 2 учасниками.
Дилема в'язня, що повторюється
У книзі «Еволюція кооперації» (1984) Роберт Акселрод досліджував розширення сценарію ДВ, яке він назвав дилема в'язня, що повторюється (ПДВ). У ній учасники роблять вибір знову раз у раз і пам'ятають попередні результати. Акселрод запросив академічних колег зі всього світу, щоб розробити , щоб змагатися в чемпіонаті з ПДВ. Програми, що увійшли до нього розрізнялися за алгоритмічною складністю, початковою ворожістю, здатністю до прощення і так далі.
Акселрод відкрив, що якщо гра повторювалася довго серед безлічі гравців, кожен з різними стратегіями, «жадібні» стратегії давали погані результати в довгостроковому періоді, тоді як більш «альтруїстичні» стратегії працювали краще, з погляду власного інтересу. Він використовував це, щоб показати можливий механізм еволюції альтруїстичної поведінки з механізмів, які спочатку чисто егоїстичні, через природний відбір.
Найкращою детерміністською стратегією виявилася «Око за око» (англ. Tit for Tat), яку розробив і виставив на чемпіонат Анатолій Рапопорт. Вона була найпростішою зі всіх програм, що брали участь, складалася всього з 4 рядків коду на мові Бейсік. Стратегія проста: співпрацювати на першій ітерації гри, після цього гравець робить те ж саме, що робив опонент на попередньому кроці. Трохи краще працює стратегія «Око за око з прощенням». Коли опонент зраджує, на наступному кроці гравець іноді у будь-якому випадку співпрацює з невеликою ймовірністю (1 — 5 %). Це дозволяє випадковим чином вийти з циклу взаємної зради. Вона найкраще працює, коли у гру вводиться нерозуміння — коли рішення одного гравця повідомляється іншому з помилкою.
Аналізуючи стратегії, що набрали найкращі результати, Акселрод назвав декілька умов, необхідних, щоб стратегія отримала високий результат.
Добра
- Найважливіша умова — стратегія повинна бути «доброю», тобто не зраджувати, поки цього не зробить опонент. Майже всі стратегії-лідери були добрими. Тому чисто егоїстична стратегія з чисто егоїстичних причин не буде першою «бити» суперника.
Мстива
- Проте успішна стратегія не повинна бути сліпим оптимістом. Вона повинна завжди мстити. Приклад немстивої стратегії — завжди співпрацювати. Це дуже поганий вибір, оскільки «підлі» стратегії скористаються цим.
Прощаюча
- Інша важлива якість успішних стратегій — уміти прощати. Помстившись, вони повинні повернутися до співпраці, якщо опонент не продовжує зраджувати. Це запобігає нескінченній помсті один одному і максимізував виграш.
Не заздрісна
- Остання якість — не бути заздрісним, тобто не намагатися набрати більше очок, ніж опонент (що у принципі неможливо для «доброї» стратегії, тобто добра стратегія ніколи не може набрати більше очок, ніж опонент).
Отже, Акселрод дійшов утопічно звучного висновку, що егоїстичні індивіди в ім'я їх же егоїстичного блага прагнутимуть бути добрими і прощаючими і не заздрісними.
Розглянемо знову модель перегонів озброєнь. Був даний висновок, що єдина раціональна стратегія — озброюватися, навіть якщо обидві країни хотіли б витрачати ВВП на масло, а не гармати. Цікаво, що спроби продемонструвати, що виведення ДВ працює на практиці (роблячи аналіз «високих» і «низьких» військових витрат між періодами, на основі припущень ПДВ), часто показують, що такої поведінки не відбувається. Наприклад, грецькі і турецькі військові витрати міняються не відповідно до стратегії «око за око», а найімовірніше слідують внутрішній політиці). Це може бути прикладом раціональної поведінки, що відрізняється від одноразових і багатоходових ігор.
Якщо в одноходовій грі у будь-якому випадку домінує стратегія зрадити, то в багатоходовій оптимальна стратегія залежить від поведінки інших учасників. Наприклад, якщо серед населення всі один одного одурюють, а один поводиться за принципом «око за око», він опиняється в невеликому програші через втрату на першому ході. У такій популяції оптимальна стратегія — завжди зраджувати. Якщо ж число тих, що сповідують принцип «око за око» більше, то результат уже залежить від їх частки в суспільстві.
Визначити оптимальну стратегію можна двома шляхами:
- Рівновага Байеса-Неша: якщо визначено статистичний розподіл поведінки (наприклад, 33 % «око за око», 33 % завжди одурюють і 33 % завжди співпрацюють), що зустрічається, то стратегію можна обчислити математично. Цим детально займається .
- За методом Монте-Карло робилися популяцій, де індивіди з низькими результатами вимирали, а з високими відтворювалися (використовувався генетичний алгоритм ). Структура поведінки в кінцевій популяції залежить від структури на початку.
Хоча стратегія «око за око» вважалася найвдалішою простою стратегією, команда Університету Саутгемптона з Англії (під керівництвом професора Ніколаса Дженнінгса [1]) представила нову стратегію на 20-ту річницю Чемпіонату з ПДВ. Ця стратегія виявилася успішнішою, ніж «око за око». Вона ґрунтувалася на взаємодії між програмами, щоб одержати максимальний рахунок для однієї з них. Університет виставив на чемпіонат 60 програм, які розпізнавали одна одну за рядом дій на перших 5-10 ходах. Розпізнавши іншу, одна програма завжди співпрацювала, а інша зраджувала, що давало максимум очок зраднику. Якщо програма розуміла, що опонент — не саутгемптонській, вона далі весь час зраджувала його, щоб мінімізувати результат суперника. В результаті ця стратегія зайняла перші три місця в змаганні, як і декілька місць підряд нижче.
Хоча ця стратегія виявилася ефективнішою в змаганні, це було досягнуто за рахунок того, що в цьому конкретному змаганні команда могла брати участь декількома агентами. Якщо гравець може контролювати тільки одного агента, «око за око» виявляється найкращим. Вона також дотримується правила заборони на комунікації між гравцями. Те, що саутгемптонські програми виконували «ритуальний танець» в перші 10 ходів, щоб впізнати один одного, тільки підтверджує, наскільки важлива комунікація в зрушенні балансу гри.
Якщо ПДВ грається рівно N раз (якась відома константа N), є ще один цікавий факт. Рівновага Неша — завжди зраджувати. Доводимо за індукцією: якщо обидва співпрацюють, на останньому ході вигідно зрадити, тоді у суперника не буде можливості помститися. Тому обидва зрадять один одного на останньому ході. Раз суперник зрадить на останньому ході у будь-якому випадку, будь-який гравець захоче зрадити на передостанньому ході, і так далі. Щоб співпраця залишалася вигідною, необхідно, щоб майбутнє було невизначеним для обох гравців. Одне з рішень — робити число N випадковим і підраховувати результати за середнім виграшем за хід.
Дилема ув'язненого — фундаментальна для деяких теорій про взаємодію людей і довіру. З припущення моделі ДВ, що транзакція між двома людьми вимагає довіри, довірча поведінка в популяціях може бути змодельована за допомогою багато-гравцевої версії гри, що повторюється. Це роками надихало багатьох вчених. У 1975 році Грофман і Пул оцінювали число робіт, присвячених цій темі, їх близько 2000.
Якщо гравці можуть оцінювати можливість зради з боку інших гравців, на їх поведінку впливає досвід. Проста статистика показує, що недосвідчені гравці звичайно поводяться надмірно добре або погано. Якщо вони весь час діятимуть так, то програють через свою зайву агресивність або зайву доброту. З отриманням більшого досвіду вони реальніше оцінюють імовірність зради і добиваються найкращих результатів. Ранні розіграші сильніше впливають на недосвідчених гравців, ніж пізніші на досвідчених. Це приклад, чому ранній досвід має такий вплив на молодих, і чому вони особливо уразливі до невмотивованої агресії, іноді самі стаючи такими.
Можна зменшити ймовірність зради в популяції за допомогою співпраці в ранніх іграх, дозволивши укріпити довіру. Отже самопожертвування може в деяких ситуаціях підсилити моральний дух групи. Якщо група маленька, на позитивну поведінку з більшою ймовірністю відповідять взаємністю, що заохотить індивідів на подальшу співпрацю. Це пов'язано з ще однією дилемою, що хороше ставлення без причини — це потурання, яке може погіршити моральні якості.
Ці процеси — головне поле інтересу взаємного альтруїзму, групового відбору, сімейного відбору і етики.
Східна філософія
У бойових мистецтвах вивчається даоське прислів'я, яке говорить, що:
- Відповідати добром на добро — дає добро
- Відповідати злом на зло — дає добро
- Відповідати злом на добро — дає зло
- Відповідати добром на зло — дає зло
Друге і четверте твердження здаються сумнівними, особливо з позицій християнства, але дилема ув'язненого пояснює їх. У стародавньому Китаї «добро» і «зло» вважалися непорушними істинами (наприклад, їх не можна поміняти місцями), таким чином, це прислів'я можна прочитати ще і як «плюс на мінус дає мінус». Є посилений варіант цього прислів'я, де в двох останніх рядках виходить «подвійне зло».
Бібліографія
- Axelrod, Robert and Hamilton, William D. (1981). «The Evolution of Cooperation». Science, 211 : 1390—1396.
- Axelrod, Robert (1984). . New York: Basic Books. ISBN .
- Axelrod, Robert (1997). The Complexity of Cooperation. Princeton University Press. .
- Dawkins, Richard (1989). The selfish gene. Oxford New York: Oxford University Press. ISBN ., друге видання — включає два розділи про еволюцію співпраці
- Grofman and Pool (1975). «Bayesian Models for Iterated Prisoner's Dilemma Games». General Systems 20 : 185–94.
- Hardin, Garrett (1968). «The Tragedy of the Commons» [ 1 вересня 2005 у Wayback Machine.]. Science, 162 : 1243—1248.
- Kreps, David, Robert Wilson, Paul Milgrom, and John Roberts (1982). «Rational Cooperation in the Finitely Repeated Prisoners' Dilemma.» Journal of Economic Theory 27(2) : 245–52.
- Milgrom, Paul (1984). «Axelrod's The Evolution of Cooperation.» Rand Journal of Economics 15(2) : 30–59.
- Poundstone, William (1992). Prisoner's Dilemma: John von Neumann, Game Theory, and the Puzzle of the Bomb. Doubleday. . Розлогий популярний вступ, як відзначено в заголовку.
- Rapoport, Anatol and Chammah, Albert M. (1965). Prisoner's Dilemma. University of Michigan Press. Розрахунок множини експериментів, в яких гралася ДВ.
- Verhoeff, Tom (1998). «The Trader's Dilemma: A Continuous Version of the Prisoner's Dilemma» [ 21 травня 2005 у Wayback Machine.]. Computing Science Notes 93/02, Кафедра математики і обчислювальних систем, Технічний Університет Ейндховена, Нідерланди.
- New Tack Wins Prisoner's Dilemma [ 8 лютого 2007 у Wayback Machine.] (з Wired.com [ 14 червня 2022 у Wayback Machine.])
Див. також
Посилання
- Еволюція довіри [ 28 червня 2018 у Wayback Machine.] — симуляція повторюваної гри в дилему в'язня, на основі роботи Роберта Аксельрода
- Дилема в'язня, що повторюється в онлайні [ 29 грудня 2005 у Wayback Machine.]
- Ще одна дилема в'язня, що повторюється [ 20 березня 2012 у Wayback Machine.]
- про дилему в'язня (англ.)
- Критика [ 11 лютого 2007 у Wayback Machine.] економістів, включаючи школу контракту, які використовували деякі теоретичні результати ДВ, щоб виправдати необхідність втручання держави, щоб «поліпшити» результат. (англ.)
- Симуляція дилеми ув'язненого в просторі [ 19 липня 2006 у Wayback Machine.]
Примітки
- Гофштадтер Дуглас, Метаматичні питання: у пошуку суті свідомості і шаблону (Metamagical Themas: questing for the essence of mind and pattern). 1985. Bantam Dell Pub Group. , глава 29.
- Будучи поясненням відсутності дрібної крадіжки, магічне мислення пояснює добровільне голосування на виборах (коли не голосує вважається . Як альтернатива, ця поведінка може пояснюватися сподіванням майбутніх дій (і не вимагати зв'язку з «магічним мисленням»). Моделювання майбутніх дій вимагає додавання вимірювання часу, що робиться повторюваній ДВ (див. відповідний підрозділ цієї статті).
- Наприклад див. дослідження 2003 року «Равновесие Байеса-Нэша; статистический тест гипотезы» [ 2 жовтня 2005 у Wayback Machine.]
- Результати турніру з Дилеми в'язня 2004 [ 29 серпня 2006 у Wayback Machine.] (англ.) показують, що команда Університету Саутгемптона зайняла перші три місця, хоча мала менше виграшів, ніж стратегія GRIM (зверніть увагу, в турнірі потрібно було вигравати не окремі матчі. Це досяжно і простою частою зрадою). Слід відмітити, що і без змови, що мається на увазі, між стратегіями, яким зловжила саутгемптонськая команда, «око за око» не завжди є абсолютним переможцем будь-якого змагання. Точніше сказати, в довгостроковому періоді у ряді різних чемпіонатів вона покаже кращі результати, ніж суперники. А в окремо взятому чемпіонаті стратегію можна трохи краще підлаштувати до змагання, чим «око за око». Те ж саме відноситься і до ОЗО з прощенням: у окремо взятому змаганні вона може програти спеціально заточеним стратегіям. Альтернативою є використання симуляції еволюції. У ній ОЗО дійде домінування, а злі стратегії будуть від випадку до випадку з'являтися і зникати з популяції. Річард Доукинс показав, що немає статичної комбінації стратегій, яка була б стабільною рівновагою, і система коливатиметься між межами.
- Аргумент про розвиток співпраці через довіру приводиться в книзі «Мудрість натовпу» , де стверджується, що в довгостроковому періоді капіталізм зміг організуватися навколо ядра квакерів, які завжди працювали чесно з своїми партнерами (замість того, щоб одурювати і порушувати обіцянки — явище, яке зупиняло раніші довгострокові добровільних міжнародних контактів). Стверджується, що операції з надійними купцями дозволили культурі чесної поведінки (співпраці) розповсюдитися серед інших торговців, які поширювали її далі, поки не стало вигідно взагалі бути чесним.
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
U teoriyi igor dilema v yaznya DV gra z v yakij gravci pragnut oderzhati vigodu spivpracyuyuchi odin z odnim abo zradzhuyuchi Yak u vsij teoriyi igor peredbachayetsya sho gravec v yazen maksimizuye svij vlasnij vigrash ne pikluyuchis pro vigodu inshih U dilemi v yaznya zrada strogo dominuye nad spivpraceyu tomu yedina mozhliva rivnovaga zrada oboh uchasnikiv Prostishe kazhuchi ne vazhlivo sho zrobit inshij gravec kozhen vigraye bilshe yaksho zradit Oskilki v bud yakij situaciyi zraditi vigidnishe nizh spivpracyuvati vsi racionalni gravci viberut zradu Povodyachis okremo racionalno razom uchasniki prihodyat do neracionalnogo rishennya yaksho obidva zradyat voni oderzhat v sumi menshij vigrash nizh yakbi spivpracyuvali yedina rivnovaga v cij gri ne vede do Pareto optimalnogo rishennya U comu i polyagaye dilema U dilemi v yaznya sho povtoryuyetsya gra vidbuvayetsya periodichno i kozhen gravec mozhe pokarati inshogo za nespivpracyu ranishe U takij gri spivpracya mozhe stati rivnovagoyu a stimul zraditi mozhe perevazhuvatisya zagrozoyu pokarannya iz zrostannyam chisla iteracij rivnovaga Nesha pragne do Pareto optimumu Klasichna dilema v yaznyaKlasichna dilema uv yaznenogo taka Dvoye pidozryuvanih A i B areshtovani U policiyi nemaye dostatnih dokaziv dlya zvinuvachennya i izolyuvavshi yih odin vid odnogo voni proponuyut yim odnu i tu zh operaciyu yaksho odin svidchit proti inshogo a toj zberigaye movchannya to pershij zvilnyayetsya a drugij oderzhuye 10 rokiv v yaznici Yaksho obidva movchat u policiyi malo dokaziv i voni zasudzhuyutsya do 6 misyaciv Yaksho obidva svidchat proti odin odnogo voni oderzhuyut po 2 roki Kozhen uv yaznenij vibiraye movchati abo svidchiti proti inshogo Prote zhoden z nih ne znaye tochno sho zrobit inshij Sho vidbudetsya Gru mozhna predstaviti u viglyadi takoyi tablici V yazen B zberigaye movchannya V yazen B nadaye svidchennya V yazen A zberigaye movchannya Obidva oderzhuyut pivroku A oderzhuye 10 rokiv B zvilnyayetsya V yazen A nadaye svidchennya A zvilnyayetsya B oderzhuye 10 rokiv v yaznici Obidva oderzhuyut 2 roki v yaznici Dilema z yavlyayetsya yaksho pripustiti sho obidva pikluyutsya tilki pro minimizaciyu vlasnogo terminu uv yaznennya Uyavimo mirkuvannya kozhnogo z uv yaznenih Yaksho partner movchit to najkrashe jogo zraditi i vijti na svobodu inakshe pivroku v yaznici Yaksho partner svidchit to najkrashe tezh svidchiti proti nogo shob oderzhati 2 roki inakshe 10 rokiv Strategiya svidchiti strogo dominuye nad strategiyeyu movchati Analogichno inshij uv yaznenij prihodit do togo zh visnovku Z poglyadu grupi cih dvoh v yazniv najkrashe spivpracyuvati odin z odnim zberigati movchannya i oderzhati po pivroku oskilki ce zmenshit sumarnij termin uv yaznennya Bud yake inshe rishennya bude mensh vigidnim Ce duzhe naochno demonstruye sho v gri z nenulovoyu sumoyu Pareto optimum mozhe buti protilezhnim rivnovazi Nesha Uzagalnena formaMozhna rozkriti skelet gri dali abstraguvavshis vid pidtekstu uv yaznenih Uzagalnena forma gri chasto vikoristovuyetsya v eksperimentalnij ekonomici Os pravila yaki dayut tipovu realizaciyu gri U gri dva gravci i bankir Kozhen gravec trimaye 2 karti na odnij napisano spivpracyuvati na inshij zraditi ce standartna terminologiya gri Kozhen gravec klade odnu kartu pered bankirom napisom vniz tobto nihto ne znaye chuzhogo rishennya hocha znannya chuzhogo rishennya ne vplivaye na analiz dominuvannya Bankir vidkrivaye karti i vidaye vigrash Yaksho obidva vibrali spivpracyuvati obidva oderzhuyut C Yaksho odin vibrav zraditi inshij spivpracyuvati pershij oderzhuye D drugij s Yaksho obidva vibrali zraditi obidva oderzhuyut d Znachennya zminnih C D s d mozhut buti bud yakogo znaku u prikladi vishe vse menshe abo rivni 0 Obov yazkovo povinna dotrimuvatisya nerivnist D gt C gt d gt c shob gra bula DV Kanonichna matricya vigrashiv DV Spivpracyuvati Zraditi Spivpracyuvati C C c D Zraditi D c d d Yaksho gra povtoryuyetsya tobto grayetsya bilshe 1 razu pospil zagalnij vigrash vid spivpraci povinen buti bilshim sumarnogo vigrashu za situaciyi koli odin zradzhuye a inshij ni poyasnennya nizhche 2C gt D c Ci pravila buli vstanovleni Duglasom Gofshtadterom i utvoryuyut kanonichnij opis tipovoyi dilemi v yaznya Shozha ale insha graGofshtadter pripustiv sho lyudi prostishe rozumiyut zavdannya yak zavdannya DV yaksho vona predstavlena u viglyadi okremoyi gri abo procesu torgivli Odin z prikladiv obmin zakritimi sumkami Dvi lyudini zustrichayutsya i obminyuyutsya zakritimi sumkami rozumiyuchi sho odna z nih mistit groshi insha tovar Kozhen gravec mozhe povazhati operaciyu i poklasti v sumku te pro sho domovilisya abo obduriti partnera davshi porozhnyu sumku U cij gri obman zavzhdi bude yaknajkrashim rishennyam oznachayuchi takozh sho racionalni agenti nikoli ne gratimut v neyi i sho rinok obminu zakritimi sumkami bude vidsutnij U variaciyi populyarnij u programistiv i hakeriv kozhen agent ciyeyi gri pam yataye poperedni rezultati abo maye dostup do gromadskoyi dumki kolektivnoyi pam yati i bezlich obminiv povtoryuyutsya trivalij chas Yak zaznacheno vishe bez pam yati cya gra maye malo sensu vona malo sho poyasnyuye v povedinci sistem i grup lyudej okrim opisu vzayemodij yaki ne vidbuvatimutsya Skladnoshiv vvoditsya bilshe nizh mozhna chekati Programist osoblivo yakij specializuyetsya na funkcionalnomu programuvanni vidrazu zrozumiye znachushist chasu i stanu pam yati Ale i bez napisannya program mozhna pripustiti yak povedutsya agenti Naskilki velika pam yat kozhnogo agenta Yaka strategiya kozhnogo z nih Yak agenti z riznimi strategiyami rozpodileni i sho viznachaye hto z kim vzayemodiye i v yakomu poryadku Skladnist stvorennya yakoyis bagatoznachnoyi modeli mozhe bentezhiti ale vona pidnimaye deyaki cikavi i cinni tehnichni i filosofski pitannya Vikonana deyaka robota z modelyuvannyu cogo Rizni programisti i matematiki stverdzhuyut sho strategiya oko za oko div nizhche yaknajkrasha zagalna strategiya prote ne bulo zrobleno serjoznih akademichnih zusil shob klasifikuvati rizni tipi i rozpodili agentiv sho navchayutsya z riznimi strategiyami Pro potencial cogo zavdannya svidchit toj fakt sho v cij diskusiyi she ne zgaduvalisya mozhlivist formuvati koaliciyi i viryadzhatisya kolektivno A yak shodo agentiv yaki b za platnyu organizovuvali peregovori Abo agentiv yaki b nakopichuvali informaciyu pro sami operaciyi Prikladi z realnogo zhittyaPrikladi z v yaznyami kartkovoyu groyu i obminom zakritimi sumkami mozhut zdavatisya nadumanimi ale naspravdi ye bezlich prikladiv vzayemodiyi lyudej i tvarin sho mayut taku zh matricyu vigrashiv Tomu DV predstavlyaye interes socialnim naukam takim yak ekonomika politologiya i sociologiya a takozh rozdilam biologiyi etologiyi i evolyucijnoyi biologiyi Bagato prirodnih procesiv buli uzagalneni v modeli v yakih zhivi istoti berut uchast v neskinchennih igrah tipu dilemi uv yaznenogo Taka shiroka zastosovnist DV dodaye cij gri znachnu vazhlivist U politologiyi napriklad scenarij DV chasto vikoristovuyetsya dlya ilyustraciyi problemi dvoh krayin zaluchenih v peregoni ozbroyen Obidvi zayavlyatimut sho u nih ye dvi mozhlivosti abo zbilshiti vitrati na vijskovi potrebi abo skorochuvati ozbroyennya Zhodna iz storin ne mozhe buti vpevnena sho insha dotrimuvatime domovlenist otzhe obidvi pragnutimut do vijskovoyi ekspansiyi Ce mozhna vvazhati teoretichnim poyasnennyam politiki zalyakuvannya V avtosporti yaskravij priklad dilemi uv yaznenogo Formula 1 de ostanni 20 rokiv vidbuvayutsya peregoni byudzhetiv komand cherez yaku kilkist mashin uchasnikiv skorotilasya z 36 v 1990 do 20 v 2003 Vipadok dilemi v yaznya mozhe buti znajdenij v biznesi Dvi konkuruyuchi firmi povinni viznachitisya skilki koshtiv vitrachati na reklamu i pributok kozhnoyi firmi zmenshuyetsya iz zrostannyam u konkurenta Obidvi firmi uhvalyuyut rishennya zbilshiti vitrati na reklamu pri comu yih chastki rinku i mozhlivo zalishayutsya nezminnimi a pributok skorochuyetsya Mezha peregoniv pributok vtim voni mozhut namagatisya yakijs chas pracyuvati i v zbitok Firmi mozhut piti na ugodu pro skorochennya vitrat na reklamu ale zavzhdi ye stimul jogo porushiti U oligopolistichnih rinkah cinova politika ce povtorennya DV Zvichajno oligopolisti spivracyuyut odin z odnim i ne dovodyat situaciyu do Vilyam Paundstoun v knizi pro dilemu v yaznya opisuye situaciyu v Novij Zelandiyi de poshtovi skrinki zalishayut vidkritimi Gazetu mozhna uzyati ne zaplativshi za neyi ale malo hto tak robit tomu sho bilshist usvidomlyuye shkodu yaka bula b yakbi vsi krali gazeti Oskilki DV v chistomu viglyadi odnochasna dlya vsih gravciv nihto ne mozhe vplinuti na rishennya inshih cya poshirena liniya mirkuvan nazivayetsya magichne mislennya Teoretichnij visnovok DV odna z prichin chomu v bagatoh krayinah operaciya pro viznannya provini zaboronena Chasto scenarij DV povtoryuyetsya duzhe tochno na korist oboh pidozryuvanih ziznatisya i svidchiti proti inshogo pidozryuvanogo navit yaksho obidva nevinni Mozhlivo yaknajgirshij vipadok koli tilki odin vinen v comu vipadku nevinnij navryad chi ziznayetsya v chomus a vinnij pide na ce i dast svidchennya proti nevinnogo Bagato dilem v realnomu zhitti vklyuchayut bezlich gravciv Hoch i metaforichno tragediyu obshin Ardena mozhna rozglyadati yak uzagalnennya DV dlya bezlichi gravciv Kozhen zhitel obshini vibiraye chi pasti hudobu na zagalnomu pasovishi i oderzhati vigodu visnazhuyuchi jogo resursi abo obmezhiti svij dohid Kolektivnij rezultat vid zagalnogo abo chastogo maksimalnogo vikoristannya pasovisha nizkij dohid sho vede do rujnuvannya obshini Prote taka gra ne ye formalnoyu oskilki mozhe buti rozbita na poslidovnist klasichnih igor z 2 uchasnikami Dilema v yaznya sho povtoryuyetsyaU knizi Evolyuciya kooperaciyi 1984 Robert Akselrod doslidzhuvav rozshirennya scenariyu DV yake vin nazvav dilema v yaznya sho povtoryuyetsya PDV U nij uchasniki roblyat vibir znovu raz u raz i pam yatayut poperedni rezultati Akselrod zaprosiv akademichnih koleg zi vsogo svitu shob rozrobiti shob zmagatisya v chempionati z PDV Programi sho uvijshli do nogo rozriznyalisya za algoritmichnoyu skladnistyu pochatkovoyu vorozhistyu zdatnistyu do proshennya i tak dali Akselrod vidkriv sho yaksho gra povtoryuvalasya dovgo sered bezlichi gravciv kozhen z riznimi strategiyami zhadibni strategiyi davali pogani rezultati v dovgostrokovomu periodi todi yak bilsh altruyistichni strategiyi pracyuvali krashe z poglyadu vlasnogo interesu Vin vikoristovuvav ce shob pokazati mozhlivij mehanizm evolyuciyi altruyistichnoyi povedinki z mehanizmiv yaki spochatku chisto egoyistichni cherez prirodnij vidbir Najkrashoyu deterministskoyu strategiyeyu viyavilasya Oko za oko angl Tit for Tat yaku rozrobiv i vistaviv na chempionat Anatolij Rapoport Vona bula najprostishoyu zi vsih program sho brali uchast skladalasya vsogo z 4 ryadkiv kodu na movi Bejsik Strategiya prosta spivpracyuvati na pershij iteraciyi gri pislya cogo gravec robit te zh same sho robiv oponent na poperednomu kroci Trohi krashe pracyuye strategiya Oko za oko z proshennyam Koli oponent zradzhuye na nastupnomu kroci gravec inodi u bud yakomu vipadku spivpracyuye z nevelikoyu jmovirnistyu 1 5 Ce dozvolyaye vipadkovim chinom vijti z ciklu vzayemnoyi zradi Vona najkrashe pracyuye koli u gru vvoditsya nerozuminnya koli rishennya odnogo gravcya povidomlyayetsya inshomu z pomilkoyu Analizuyuchi strategiyi sho nabrali najkrashi rezultati Akselrod nazvav dekilka umov neobhidnih shob strategiya otrimala visokij rezultat Dobra Najvazhlivisha umova strategiya povinna buti dobroyu tobto ne zradzhuvati poki cogo ne zrobit oponent Majzhe vsi strategiyi lideri buli dobrimi Tomu chisto egoyistichna strategiya z chisto egoyistichnih prichin ne bude pershoyu biti supernika Mstiva Prote uspishna strategiya ne povinna buti slipim optimistom Vona povinna zavzhdi mstiti Priklad nemstivoyi strategiyi zavzhdi spivpracyuvati Ce duzhe poganij vibir oskilki pidli strategiyi skoristayutsya cim Proshayucha Insha vazhliva yakist uspishnih strategij umiti proshati Pomstivshis voni povinni povernutisya do spivpraci yaksho oponent ne prodovzhuye zradzhuvati Ce zapobigaye neskinchennij pomsti odin odnomu i maksimizuvav vigrash Ne zazdrisna Ostannya yakist ne buti zazdrisnim tobto ne namagatisya nabrati bilshe ochok nizh oponent sho u principi nemozhlivo dlya dobroyi strategiyi tobto dobra strategiya nikoli ne mozhe nabrati bilshe ochok nizh oponent Otzhe Akselrod dijshov utopichno zvuchnogo visnovku sho egoyistichni individi v im ya yih zhe egoyistichnogo blaga pragnutimut buti dobrimi i proshayuchimi i ne zazdrisnimi Rozglyanemo znovu model peregoniv ozbroyen Buv danij visnovok sho yedina racionalna strategiya ozbroyuvatisya navit yaksho obidvi krayini hotili b vitrachati VVP na maslo a ne garmati Cikavo sho sprobi prodemonstruvati sho vivedennya DV pracyuye na praktici roblyachi analiz visokih i nizkih vijskovih vitrat mizh periodami na osnovi pripushen PDV chasto pokazuyut sho takoyi povedinki ne vidbuvayetsya Napriklad grecki i turecki vijskovi vitrati minyayutsya ne vidpovidno do strategiyi oko za oko a najimovirnishe sliduyut vnutrishnij politici Ce mozhe buti prikladom racionalnoyi povedinki sho vidriznyayetsya vid odnorazovih i bagatohodovih igor Yaksho v odnohodovij gri u bud yakomu vipadku dominuye strategiya zraditi to v bagatohodovij optimalna strategiya zalezhit vid povedinki inshih uchasnikiv Napriklad yaksho sered naselennya vsi odin odnogo oduryuyut a odin povoditsya za principom oko za oko vin opinyayetsya v nevelikomu prograshi cherez vtratu na pershomu hodi U takij populyaciyi optimalna strategiya zavzhdi zradzhuvati Yaksho zh chislo tih sho spoviduyut princip oko za oko bilshe to rezultat uzhe zalezhit vid yih chastki v suspilstvi Viznachiti optimalnu strategiyu mozhna dvoma shlyahami Rivnovaga Bajesa Nesha yaksho viznacheno statistichnij rozpodil povedinki napriklad 33 oko za oko 33 zavzhdi oduryuyut i 33 zavzhdi spivpracyuyut sho zustrichayetsya to strategiyu mozhna obchisliti matematichno Cim detalno zajmayetsya Za metodom Monte Karlo robilisya populyacij de individi z nizkimi rezultatami vimirali a z visokimi vidtvoryuvalisya vikoristovuvavsya genetichnij algoritm Struktura povedinki v kincevij populyaciyi zalezhit vid strukturi na pochatku Hocha strategiya oko za oko vvazhalasya najvdalishoyu prostoyu strategiyeyu komanda Universitetu Sautgemptona z Angliyi pid kerivnictvom profesora Nikolasa Dzhenningsa 1 predstavila novu strategiyu na 20 tu richnicyu Chempionatu z PDV Cya strategiya viyavilasya uspishnishoyu nizh oko za oko Vona gruntuvalasya na vzayemodiyi mizh programami shob oderzhati maksimalnij rahunok dlya odniyeyi z nih Universitet vistaviv na chempionat 60 program yaki rozpiznavali odna odnu za ryadom dij na pershih 5 10 hodah Rozpiznavshi inshu odna programa zavzhdi spivpracyuvala a insha zradzhuvala sho davalo maksimum ochok zradniku Yaksho programa rozumila sho oponent ne sautgemptonskij vona dali ves chas zradzhuvala jogo shob minimizuvati rezultat supernika V rezultati cya strategiya zajnyala pershi tri miscya v zmaganni yak i dekilka misc pidryad nizhche Hocha cya strategiya viyavilasya efektivnishoyu v zmaganni ce bulo dosyagnuto za rahunok togo sho v comu konkretnomu zmaganni komanda mogla brati uchast dekilkoma agentami Yaksho gravec mozhe kontrolyuvati tilki odnogo agenta oko za oko viyavlyayetsya najkrashim Vona takozh dotrimuyetsya pravila zaboroni na komunikaciyi mizh gravcyami Te sho sautgemptonski programi vikonuvali ritualnij tanec v pershi 10 hodiv shob vpiznati odin odnogo tilki pidtverdzhuye naskilki vazhliva komunikaciya v zrushenni balansu gri Yaksho PDV grayetsya rivno N raz yakas vidoma konstanta N ye she odin cikavij fakt Rivnovaga Nesha zavzhdi zradzhuvati Dovodimo za indukciyeyu yaksho obidva spivpracyuyut na ostannomu hodi vigidno zraditi todi u supernika ne bude mozhlivosti pomstitisya Tomu obidva zradyat odin odnogo na ostannomu hodi Raz supernik zradit na ostannomu hodi u bud yakomu vipadku bud yakij gravec zahoche zraditi na peredostannomu hodi i tak dali Shob spivpracya zalishalasya vigidnoyu neobhidno shob majbutnye bulo neviznachenim dlya oboh gravciv Odne z rishen robiti chislo N vipadkovim i pidrahovuvati rezultati za serednim vigrashem za hid Dilema uv yaznenogo fundamentalna dlya deyakih teorij pro vzayemodiyu lyudej i doviru Z pripushennya modeli DV sho tranzakciya mizh dvoma lyudmi vimagaye doviri dovircha povedinka v populyaciyah mozhe buti zmodelovana za dopomogoyu bagato gravcevoyi versiyi gri sho povtoryuyetsya Ce rokami nadihalo bagatoh vchenih U 1975 roci Grofman i Pul ocinyuvali chislo robit prisvyachenih cij temi yih blizko 2000 Psihologiya navchannya i teoriya igorYaksho gravci mozhut ocinyuvati mozhlivist zradi z boku inshih gravciv na yih povedinku vplivaye dosvid Prosta statistika pokazuye sho nedosvidcheni gravci zvichajno povodyatsya nadmirno dobre abo pogano Yaksho voni ves chas diyatimut tak to prograyut cherez svoyu zajvu agresivnist abo zajvu dobrotu Z otrimannyam bilshogo dosvidu voni realnishe ocinyuyut imovirnist zradi i dobivayutsya najkrashih rezultativ Ranni rozigrashi silnishe vplivayut na nedosvidchenih gravciv nizh piznishi na dosvidchenih Ce priklad chomu rannij dosvid maye takij vpliv na molodih i chomu voni osoblivo urazlivi do nevmotivovanoyi agresiyi inodi sami stayuchi takimi Mozhna zmenshiti jmovirnist zradi v populyaciyi za dopomogoyu spivpraci v rannih igrah dozvolivshi ukripiti doviru Otzhe samopozhertvuvannya mozhe v deyakih situaciyah pidsiliti moralnij duh grupi Yaksho grupa malenka na pozitivnu povedinku z bilshoyu jmovirnistyu vidpovidyat vzayemnistyu sho zaohotit individiv na podalshu spivpracyu Ce pov yazano z she odniyeyu dilemoyu sho horoshe stavlennya bez prichini ce poturannya yake mozhe pogirshiti moralni yakosti Ci procesi golovne pole interesu vzayemnogo altruyizmu grupovogo vidboru simejnogo vidboru i etiki Shidna filosofiyaU bojovih mistectvah vivchayetsya daoske prisliv ya yake govorit sho Vidpovidati dobrom na dobro daye dobro Vidpovidati zlom na zlo daye dobro Vidpovidati zlom na dobro daye zlo Vidpovidati dobrom na zlo daye zlo Druge i chetverte tverdzhennya zdayutsya sumnivnimi osoblivo z pozicij hristiyanstva ale dilema uv yaznenogo poyasnyuye yih U starodavnomu Kitayi dobro i zlo vvazhalisya neporushnimi istinami napriklad yih ne mozhna pominyati miscyami takim chinom ce prisliv ya mozhna prochitati she i yak plyus na minus daye minus Ye posilenij variant cogo prisliv ya de v dvoh ostannih ryadkah vihodit podvijne zlo BibliografiyaAxelrod Robert and Hamilton William D 1981 The Evolution of Cooperation Science 211 1390 1396 Axelrod Robert 1984 New York Basic Books ISBN 0 465 02121 2 Axelrod Robert 1997 The Complexity of Cooperation Princeton University Press ISBN 0 691 01567 8 Dawkins Richard 1989 The selfish gene Oxford New York Oxford University Press ISBN 0 19 286092 5 druge vidannya vklyuchaye dva rozdili pro evolyuciyu spivpraci Grofman and Pool 1975 Bayesian Models for Iterated Prisoner s Dilemma Games General Systems 20 185 94 Hardin Garrett 1968 The Tragedy of the Commons 1 veresnya 2005 u Wayback Machine Science 162 1243 1248 Kreps David Robert Wilson Paul Milgrom and John Roberts 1982 Rational Cooperation in the Finitely Repeated Prisoners Dilemma Journal of Economic Theory 27 2 245 52 Milgrom Paul 1984 Axelrod s The Evolution of Cooperation Rand Journal of Economics 15 2 30 59 Poundstone William 1992 Prisoner s Dilemma John von Neumann Game Theory and the Puzzle of the Bomb Doubleday ISBN 0 385 41567 2 Rozlogij populyarnij vstup yak vidznacheno v zagolovku Rapoport Anatol and Chammah Albert M 1965 Prisoner s Dilemma University of Michigan Press Rozrahunok mnozhini eksperimentiv v yakih gralasya DV Verhoeff Tom 1998 The Trader s Dilemma A Continuous Version of the Prisoner s Dilemma 21 travnya 2005 u Wayback Machine Computing Science Notes 93 02 Kafedra matematiki i obchislyuvalnih sistem Tehnichnij Universitet Ejndhovena Niderlandi New Tack Wins Prisoner s Dilemma 8 lyutogo 2007 u Wayback Machine z Wired com 14 chervnya 2022 u Wayback Machine Div takozhRivnovaga Nesha Tragediya spilnot Paradoks Bresa DoviraPosilannyaEvolyuciya doviri 28 chervnya 2018 u Wayback Machine simulyaciya povtoryuvanoyi gri v dilemu v yaznya na osnovi roboti Roberta Akselroda Dilema v yaznya sho povtoryuyetsya v onlajni 29 grudnya 2005 u Wayback Machine She odna dilema v yaznya sho povtoryuyetsya 20 bereznya 2012 u Wayback Machine pro dilemu v yaznya angl Kritika 11 lyutogo 2007 u Wayback Machine ekonomistiv vklyuchayuchi shkolu kontraktu yaki vikoristovuvali deyaki teoretichni rezultati DV shob vipravdati neobhidnist vtruchannya derzhavi shob polipshiti rezultat angl Simulyaciya dilemi uv yaznenogo v prostori 19 lipnya 2006 u Wayback Machine PrimitkiGofshtadter Duglas Metamatichni pitannya u poshuku suti svidomosti i shablonu Metamagical Themas questing for the essence of mind and pattern 1985 Bantam Dell Pub Group ISBN 0 465 04566 9 glava 29 Buduchi poyasnennyam vidsutnosti dribnoyi kradizhki magichne mislennya poyasnyuye dobrovilne golosuvannya na viborah koli ne golosuye vvazhayetsya Yak alternativa cya povedinka mozhe poyasnyuvatisya spodivannyam majbutnih dij i ne vimagati zv yazku z magichnim mislennyam Modelyuvannya majbutnih dij vimagaye dodavannya vimiryuvannya chasu sho robitsya povtoryuvanij DV div vidpovidnij pidrozdil ciyeyi statti Napriklad div doslidzhennya 2003 roku Ravnovesie Bajesa Nesha statisticheskij test gipotezy 2 zhovtnya 2005 u Wayback Machine Rezultati turniru z Dilemi v yaznya 2004 29 serpnya 2006 u Wayback Machine angl pokazuyut sho komanda Universitetu Sautgemptona zajnyala pershi tri miscya hocha mala menshe vigrashiv nizh strategiya GRIM zvernit uvagu v turniri potribno bulo vigravati ne okremi matchi Ce dosyazhno i prostoyu chastoyu zradoyu Slid vidmititi sho i bez zmovi sho mayetsya na uvazi mizh strategiyami yakim zlovzhila sautgemptonskaya komanda oko za oko ne zavzhdi ye absolyutnim peremozhcem bud yakogo zmagannya Tochnishe skazati v dovgostrokovomu periodi u ryadi riznih chempionativ vona pokazhe krashi rezultati nizh superniki A v okremo vzyatomu chempionati strategiyu mozhna trohi krashe pidlashtuvati do zmagannya chim oko za oko Te zh same vidnositsya i do OZO z proshennyam u okremo vzyatomu zmaganni vona mozhe prograti specialno zatochenim strategiyam Alternativoyu ye vikoristannya simulyaciyi evolyuciyi U nij OZO dijde dominuvannya a zli strategiyi budut vid vipadku do vipadku z yavlyatisya i znikati z populyaciyi Richard Doukins pokazav sho nemaye statichnoyi kombinaciyi strategij yaka bula b stabilnoyu rivnovagoyu i sistema kolivatimetsya mizh mezhami Argument pro rozvitok spivpraci cherez doviru privoditsya v knizi Mudrist natovpu de stverdzhuyetsya sho v dovgostrokovomu periodi kapitalizm zmig organizuvatisya navkolo yadra kvakeriv yaki zavzhdi pracyuvali chesno z svoyimi partnerami zamist togo shob oduryuvati i porushuvati obicyanki yavishe yake zupinyalo ranishi dovgostrokovi dobrovilnih mizhnarodnih kontaktiv Stverdzhuyetsya sho operaciyi z nadijnimi kupcyami dozvolili kulturi chesnoyi povedinki spivpraci rozpovsyuditisya sered inshih torgovciv yaki poshiryuvali yiyi dali poki ne stalo vigidno vzagali buti chesnim