Що таке дилема в'язня?
Дилема в'язня - це парадокс в аналізі рішень, в якому дві особи, які діють у власних власних інтересах, не дають оптимального результату. Типова дилема ув'язненого встановлюється таким чином, що обидві сторони вирішують захистити себе за рахунок іншого учасника. В результаті обидва учасники опиняються в гіршому стані, ніж якби вони співпрацювали один з одним у процесі прийняття рішень. Дилема в'язня - одна з найвідоміших концепцій сучасної теорії ігор.
Ключові вивезення
- Дилема ув'язненого - це ситуація, коли особи, які приймають рішення, завжди мають стимул вибирати таким чином, що створює менш оптимальний результат для людей як групи. Дилеми присільника виникають у багатьох аспектах економіки. Люди розробили багато методів подолання дилеми ув'язнених щодо вибору кращих колективних результатів, незважаючи на несприятливі індивідуальні стимули.
Дилема в'язня
Розуміння дилеми в'язня
Дилема ув'язненого представляє ситуацію, коли дві сторони, розділені і не в змозі спілкуватися, повинні обирати, чи співпрацювати з іншою, чи ні. Найвища винагорода для кожної сторони виникає, коли обидві сторони вирішили співпрацювати.
Класична дилема ув'язненого виглядає так: двох членів банди грабіжників банків, Дейва та Генрі, заарештовано та допитують в окремих кімнатах. У влади немає інших свідків, і вони можуть довести справу проти них лише в тому випадку, якщо вони зможуть переконати хоча б одного з розбійників зрадити свого спільника і дати свідчення про злочин. Кожен бандитський грабіжник стикається з вибором співпрацювати зі своїм співучасником і мовчати, або відмовлятися від банди і давати свідчення щодо обвинувачення. Якщо вони обидва співпрацюють і мовчать, то влада зможе засудити їх лише за меншу плату за грабіж, що означатиме один рік у в'язниці кожен (1 рік для Дейва + 1 рік для Генрі = 2 роки загальної в'язниці час). Якщо один свідчить, а другий - ні, то той, хто свідчить, піде на волю, а інший отримає три роки (0 років для того, хто перешкоджає + 3 для одного засудженого = 3 роки загалом). Однак якщо обидва свідчать проти інших, кожен отримає два роки в'язниці за те, що частково несе відповідальність за пограбування (2 роки для Дейва + 2 роки для Генрі = 4 роки загального часу в'язниці).
У цьому випадку кожен грабіжник завжди має стимул до дефекту, незалежно від вибору, який робить інший. З точки зору Дейва, якщо Генрі залишається мовчазним, то Дейв може або співпрацювати з Генрі, і провести рік у в'язниці, або дефектувати та звільнитися. Очевидно, що в цьому випадку йому було б краще зрадити Генрі та решту банди. З іншого боку, якщо Генрі заперечує і свідчить проти Дейва, то вибір Дейва стає або мовчати і три роки тримати, або розмовляти і робити два роки у в'язниці. Знову ж, очевидно, він вважає за краще робити два роки понад три.
В обох випадках, незалежно від того, чи Генрі співпрацює з Дейвом, чи дефекти обвинувачення, Дейву буде краще, якщо він сам себе виправдає та дасть свідчення. Тепер, оскільки Генрі стоїть перед тим самим набором варіантів, йому також завжди буде зручніше перемогти. Парадокс дилеми ув'язненого полягає в наступному: обидва грабіжники можуть мінімізувати загальний час ув'язнення, яке вони будуть робити двоє, лише якщо вони обидва будуть співпрацювати (загалом 2 роки), але стимули, з якими кожен стикається окремо, завжди будуть керувати ними кожен дефектувати і в кінцевому підсумку робити максимальний загальний час ув'язнення між ними (загалом 4 роки).
Приклади дилеми в'язня
Економіка рясніє прикладами дилеми ув'язнених, які можуть мати корисні чи шкідливі наслідки для економіки та суспільства в цілому. Загальна нитка - це ситуації, коли стимули, з якими стикається кожен особа, яка приймає рішення, яка отримує вибір, спонукають їх поводитись так, щоб вони все погіршувались разом, одночасно уникаючи вибору, який би змусив їх усіх збільшити краще, якби всі могли деякі якось спільно обирають.
Одним із таких прикладів є трагедія общини. Кожній перевазі кожного може бути збереження та інвестування в розповсюдження загального басейну природного ресурсу для того, щоб мати можливість продовжувати його споживання, але у кожної людини завжди є стимул замість цього споживати якомога швидше, що можливо потім виснажує ресурс. Якщо знайти якийсь спосіб співпраці, це очевидно полегшило б тут всіх.
З іншого боку, поведінку картелів також можна вважати дилемою в'язня. Усі члени картелю можуть колективно збагачуватися, обмежуючи виробництво, щоб утримати ціну, яку кожен отримує досить високу, щоб стягнути економічну ренту від споживачів, але кожен член картелю окремо має стимул обдурити картель і збільшити обсяг випуску, а також взяти оренду від інші члени картелю. З точки зору добробуту всього суспільства, в якому діє картель, це приклад того, як дилема в'язня, яка розбиває картель, іноді може насправді покращити суспільство в цілому.
Втеча від дилеми в'язня
З часом люди розробили різноманітні рішення дилеми ув'язнених, щоб подолати індивідуальні стимули на користь загального блага.
По-перше, у реальному світі більшість економічних та інших людських взаємодій повторюються не раз. Справжня дилема в'язня зазвичай грається лише один раз, інакше вона класифікується як повторена дилема в'язня. У ітераційній дилемі ув'язнених гравці можуть вибирати стратегії, які винагороджують співпрацю або карають дефект у часі. Неодноразово взаємодіючи з тими ж особами, ми навіть можемо навмисно переходити від одноразової дилеми в'язня до повторної дилеми в'язня.
По-друге, люди розробили формальні інституційні стратегії для зміни стимулів, з якими стикаються окремі особи, які приймають рішення. Колективні дії щодо забезпечення поведінки спільноти за допомогою репутації, правил, законів, демократичного чи іншого колективного прийняття рішень та явного соціального покарання за дефекти перетворюють багато дилеми ув'язнених у бік більш спільних результатів спільного співробітництва.
Нарешті, деякі люди та групи людей з часом розвивали психологічні та поведінкові упередження, такі як вища довіра один до одного, довгострокова майбутня орієнтація у повторних взаємодіях та схильність до позитивної взаємності поведінки спільної діяльності чи негативної взаємності дефектних поведінок. Ці тенденції можуть розвиватися через певний природний відбір у суспільстві з часом або груповий відбір у різних конкуруючих суспільствах. Фактично вони призводять групи людей до «нераціонального» вибору результатів, які насправді є найбільш вигідними для всіх разом.
У сукупності ці три фактори (неодноразові дилеми ув'язненого, формальні інститути, що руйнують дилеми ув'язнених, та поведінкові упередження, які підривають "раціональний" індивідуальний вибір у дилемах ув'язненого) допомагають вирішити численні дилеми ув'язнених, з якими ми все б стикалися.
