Дилема в’язня

Що таке дилема в’язня?

Дилема ув’язненого є парадоксальним в аналізі рішень, коли дві особи, які діють у власних інтересах, не дають оптимального результату. Типова дилема ув’язненого сформульована таким чином, що обидві сторони вирішили захистити себе за рахунок іншого учасника. Як результат, обидва учасники опиняються у гіршому стані, ніж якби вони співпрацювали між собою в процесі прийняття рішень. Дилема ув’язненого – одне з найбільш відомих понять сучасної теорії ігор.

Ключові винос

  • Дилема ув’язненого – це ситуація, коли особи, які приймають рішення, завжди мають стимул вибирати таким чином, що створює менш оптимальний результат для окремих осіб як групи.
  • Дилеми ув’язнених виникають у багатьох аспектах економіки.
  • Люди розробили багато методів подолання дилем ув’язнених щодо вибору кращих колективних результатів, незважаючи на, очевидно, несприятливі індивідуальні стимули.

Розуміння дилеми в’язня

Дилема ув’язненого представляє ситуацію, коли дві сторони, розділені та не в змозі спілкуватися, повинні обирати, співпрацювати з іншою чи ні. Найвища винагорода для кожної сторони припадає, коли обидві сторони вирішили співпрацювати. 

Класична дилема в’язня виглядає так: двох членів банди грабіжників банків, Дейва та Генрі, заарештували та допитують в окремих кімнатах. Влада не має інших свідків, і може довести справу проти них лише в тому випадку, якщо зможе переконати хоча б одного з грабіжників зрадити свого співучасника та засвідчити злочин. Кожен грабіжник банку постає перед вибором співпрацювати зі своїм співучасником і мовчати, або переходити з банди та давати свідчення для обвинувачення. Якщо вони обоє співпрацюватимуть і будуть мовчати, то влада зможе засудити їх лише за меншим звинуваченням у бездіяльності, що означатиме один рік тюрми кожен (1 рік для Дейва + 1 рік для Генрі = 2 роки загальної тюрми час). Якщо один дасть свідчення, а інший – ні, тоді той, хто дасть свідчення, вийде вільним, а інший отримає три роки (0 років для того, хто дефектує + 3 для засудженого = 3 роки). Однак, якщо обидва дадуть показання проти іншого, кожен отримає два роки в’язниці за те, що частково відповідає за пограбування (2 роки для Дейва + 2 роки для Генрі = 4 роки загального арешту).

У цьому випадку кожен грабіжник завжди має стимул до дефекту, незалежно від вибору, який робить інший. З точки зору Дейва, якщо Генрі мовчить, тоді Дейв може або співпрацювати з Генрі, і провести рік у в’язниці, або дефектувати і вийти на волю. Очевидно, що в цьому випадку йому було б краще зрадити Генрі та решту банди. З іншого боку, якщо Генрі дефектує і дає свідчення проти Дейва, тоді Дейвом стає вибір або мовчати і протримати три роки, або поговорити і відсидіти два роки у в’язниці. Знову ж таки, очевидно, він волів би робити два роки за три.

В обох випадках, незалежно від того, співпрацює Генрі з Дейвом чи дефектує сторона обвинувачення, Дейву буде краще, якщо він сам зробить дефект і дасть свідчення. Тепер, оскільки Генрі стикається з точно таким же вибором, йому також завжди буде краще також дефектувати. Парадокс дилеми ув’язненого полягає в наступному: обидва грабіжники можуть мінімізувати загальний час ув’язнення, який вони обоє відбуватимуть, лише якщо вони обоє співпрацюватимуть (загалом 2 роки), але заохочення, з якими вони стикаються кожен окремо, завжди стимулюватимуть їх дефектувати і в кінцевому підсумку зробити максимальний загальний час ув’язнення між ними двома (загалом 4 роки).

Приклади дилеми в’язня

Економіка рясніє прикладами дилем для в’язнів, оскільки результати можуть бути як вигідними, так і шкідливими для економіки та суспільства в цілому. Червоною ниткою є ситуації, коли стимули, з якими стикається кожен особа, що приймає рішення, яка обирає, спонукатимуть кожного з них поводитись таким чином, щоб зробити їх колективно гіршими, одночасно уникаючи індивідуального вибору, який змусив би їх усіх узагальнити, якби всі могли деякі якось кооперативно вибирають. 

Одним з таких прикладів є трагедія спільного життя. Збереження та реінвестування коштів у розповсюдження спільного басейну природних ресурсів, щоб мати можливість продовжувати його споживання, може бути в колективній перевазі кожного, але кожна людина завжди має стимул споживати якомога більше якнайшвидше, що потім виснажує ресурс. Якщо знайти якийсь спосіб співпраці, це, очевидно, зробило б тут усе вищим.

З іншого боку, поведінку картелів також можна вважати дилемою ув’язненого. Усі члени картеля можуть колективно збагачуватися, обмежуючи випуск, щоб утримувати ціну, яку отримує кожен, достатньо високу, щоб отримати економічну ренту від споживачів, але кожен член картелю окремо має стимул обдурити картель і збільшити випуск, щоб також захопити ренту далеко від інші члени картеля. З точки зору добробуту всього суспільства, в якому діє картель, це приклад того, як дилема ув’язненого, яка розбиває картель, іноді може насправді покращити суспільство в цілому. 

Втеча з дилеми в’язня

З часом люди виробили різноманітні шляхи вирішення дилем в’язнів, щоб подолати індивідуальні стимули на користь загального блага.

По-перше, у реальному світі більшість економічних та інших взаємодій людей повторюються не раз. Справжню дилему ув’язненого, як правило, розігрують лише один раз, інакше вона класифікується як повторна дилема в’язня. У повторюваній дилемі в’язня гравці можуть вибирати стратегії, які винагороджують співпрацю або карають перебіг з часом. Багаторазово взаємодіючи з тими самими людьми, ми навіть можемо навмисно перейти від одноразової дилеми ув’язненого до дилеми повторного в’язня.

По-друге, люди розробили офіційні інституційні стратегії, щоб змінити стимули, з якими стикаються особи, які приймають рішення. Колективні дії задля забезпечення поведінки в кооперативі шляхом репутації, норм, законів, прийняття демократичних чи інших колективних рішень та чітке соціальне покарання за перебіг трансформує багато дилем ув’язнених до більш вигідних для колективу результатів співпраці.  

Нарешті, у деяких людей та груп людей з часом виникають психологічні та поведінкові упередження, такі як підвищення довіри один до одного, довгострокова орієнтація на майбутнє у багаторазових взаємодіях та схильність до позитивної взаємності поведінки у співпраці чи негативної взаємності дефектної поведінки. Ці тенденції можуть еволюціонувати шляхом свого роду природного відбору в суспільстві з часом або групового відбору в різних конкуруючих суспільствах. Фактично вони змушують групи людей «ірраціонально» вибирати результати, які насправді є найбільш корисними для всіх них разом.

У сукупності ці три фактори (неодноразові дилеми ув’язненого, офіційні інституції, що розбивають дилеми ув’язненого, та поведінкові упередження, що підривають “раціональний” індивідуальний вибір у дилемах ув’язненого), допомагають вирішити численні дилеми в’язня, з якими ми б інакше стикалися.