Як стратегія теорії ігор покращує процес прийняття рішень

Теорія ігор, вивчення стратегічного прийняття рішень, об’єднує різні дисципліни, такі як математика, психологія та філософія. Теорію ігор винайшли Джон фон Нейман і Оскар Моргенштерн в 1944 році і з тих пір пройшов довгий шлях. Важливість теорії ігор для сучасного аналізу та прийняття рішень можна оцінити тим фактом, що з 1970 р. Близько 12 провідних економістів та науковців отримували Нобелівську премію з економічних наук за внесок у теорію ігор.

Теорія ігор застосовується в ряді галузей, включаючи бізнес, фінанси, економіку, політологію та психологію. Розуміння стратегій теорії ігор – як популярних, так і деяких відносно менш відомих стратегій – важливо для вдосконалення аргументації та навичок прийняття рішень у складному світі.

Ключові винос

  • Теорія ігор – це основа для розуміння вибору ситуацій серед конкуруючих гравців.
  • Теорія ігор може допомогти гравцям досягти оптимального рішення, коли в стратегічній обстановці протистоять незалежним та конкуруючим акторам.
  • Поширеною “ігровою” формою, яка виникає в економічних та ділових ситуаціях, є дилема ув’язненого, коли особи, які приймають рішення, завжди мають стимул вибирати таким чином, що створює менш оптимальний результат для окремих людей як групи.
  • Існує кілька інших форм гри. Практичне застосування цих ігор може бути цінним інструментом для аналізу галузей, секторів, ринків та будь-якої стратегічної взаємодії двох або більше суб’єктів.

Дилема в’язня

Однією з найпопулярніших і основних стратегій теорії ігор є дилема ув’язненого. Ця концепція досліджує стратегію прийняття рішень, прийняту двома особами, які, діючи в власних інтересах, в кінцевому підсумку мають гірші результати, ніж якщо б вони взагалі співпрацювали між собою.

У дилемі в’язня двоє підозрюваних, затриманих за злочин, утримуються в окремих кімнатах і не можуть спілкуватися між собою. Прокурор повідомляє і підозрюваному 1, і підозрюваному 2 окремо, що якщо він зізнається і дасть свідчення проти іншого, він може вийти на волю, але якщо він не співпрацює, а інший підозрюваний робить це, він буде засуджений до трьох років позбавлення волі. Якщо обидва зізнаються, їм буде призначено дворічне покарання, а якщо жоден зізнається, їх засудять до одного року в’язниці.

Хоча співпраця є найкращою стратегією для двох підозрюваних, коли стикаються з такою дилемою, дослідження показують, що найбільш раціональні люди воліють зізнатися і давати свідчення проти іншої людини, ніж мовчати і ризикувати, зізнається інша сторона.

Короткий огляд

Передбачається, що гравці в грі раціональні і будуть прагнути максимізувати свої виграші в грі.

Дилема в’язня закладає основу для передових стратегій теорії ігор, серед яких популярні:

Відповідні копійки

Ця гра з нульовою сумою, в якій беруть участь два гравці (назвіть їх гравцем А та гравцем В), які одночасно кладуть на стіл копійку з виплатою в залежності від того, чи відповідають копійки. Якщо обидві копійки – це голови чи хвости, гравець А виграє та утримує копійки гравця В. Якщо вони не збігаються, гравець В виграє та утримує копійки гравця А.

Тупик

Це сценарій соціальної дилеми, такий як дилема ув’язненого, оскільки два гравці можуть або співпрацювати, або дефектувати (тобто не співпрацювати). У глухий кут, якщо гравець A і гравець B обидва співпрацюють, вони отримують виграш 1, а якщо обоє дефектують, то отримують виграш 2. Але якщо гравець A співпрацює, а гравець B дефектує, то A отримує виграш 0 і B отримує виграш 3. На діаграмі виплат нижче, перша цифра в клітинках (а) – (d) відображає виграш гравця А, а друга цифра гравця В:

Тупикова ситуація відрізняється від дилеми ув’язненого тим, що дія найбільшої взаємної вигоди (тобто обох дефектів) також є домінуючою стратегією. Домінуюча стратегія для гравця визначається як та, що приносить найбільший виграш серед усіх доступних стратегій, незалежно від стратегій, що застосовуються іншими гравцями.

Типовим прикладом тупикової ситуації є випадки двох ядерних держав, які намагаються домовитись про ліквідацію своїх арсеналів ядерних бомб. У цьому випадку співпраця передбачає дотримання угоди, тоді як дезертирство означає таємне відмова від угоди та збереження ядерного арсеналу. На жаль, найкращим результатом для будь-якої нації є відмова від угоди та збереження ядерного варіанту, тоді як інша країна ліквідує свій арсенал, оскільки це дасть першій надзвичайно приховану перевагу над другою, якщо між ними коли-небудь розпочнеться війна. Другий найкращий варіант – як дефектувати, так і не співпрацювати, оскільки це зберігає статус ядерних держав.

Конкурс Курно

Ця модель також концептуально схожа на дилему в’язня і названа на честь французького математика Огюстена Курно, який ввів її в 1838 році. Найбільш поширеним застосуванням моделі Курно є опис дуополії або двох основних виробників на ринку.

Наприклад, припустимо, що компанії А і В виробляють однаковий продукт і можуть виробляти великі або низькі кількості. Якщо вони обидва співпрацюють і погоджуються виробляти на низькому рівні, то обмежена пропозиція призведе до високої ціни на товар на ринку та значного прибутку для обох компаній. З іншого боку, якщо вони дефектують і виробляють продукцію на високому рівні, ринок буде завалений, що призведе до низької ціни на продукт і, як наслідок, до нижчого прибутку обох. Але якщо один співпрацює (тобто виробляє на низькому рівні), а інший дефектує (тобто таємно виробляє на високому рівні), то перший просто ламається, тоді як другий отримує більший прибуток, ніж якщо вони обидва співпрацюють. 

Показана матриця виплат для компаній А і В (цифри представляють прибуток у мільйонах доларів). Таким чином, якщо А співпрацює і виробляє на низьких рівнях, тоді як Б дефектує і виробляє на високих рівнях, виграш такий, як показано в клітинці (b) – беззбитковість для компанії А і 7 мільйонів доларів прибутку для компанії В.

Гра координації

За погодженням гравці отримують вищі виграші, коли обирають однаковий курс дій.

Як приклад, розглянемо двох технологічних гігантів, які вирішують питання про впровадження радикально нової технології в мікросхемах пам’яті, яка може принести їм сотні мільйонів прибутку, або переглянуту версію старої технології, яка принесе їм набагато менше. Якби лише одна компанія вирішила продовжувати використовувати нову технологію, рівень прийняття споживачами був би значно нижчим, і, як результат, вона заробляла б менше, ніж якби обидві компанії вирішили однаковий курс дій. Матриця виплат наведена нижче (цифри представляють прибуток у мільйонах доларів).

Таким чином, якщо обидві компанії вирішать впровадити нову технологію, вони зароблятимуть 600 мільйонів доларів за штуку, тоді як впровадження переглянутої версії старої технології заробляло б по 300 мільйонів доларів кожна, як показано в клітинці (d). Але якщо компанія А сама вирішить запровадити нову технологію, вона заробить лише 150 мільйонів доларів, хоча компанія В заробить 0 доларів (мабуть, тому, що споживачі можуть бути не готові платити за її застарілу технологію). У цьому випадку має сенс для обох компаній працювати разом, а не самостійно. 

Гра сороконіжка 

Це обширна гра, в якій два гравці по черзі отримують шанс взяти більшу частку повільно зростаючого грошового накопичувача. Гра в сороконіжку є послідовною, оскільки гравці роблять свої ходи один за одним, а не одночасно; кожен гравець також знає стратегії, обрані гравцями, які грали до них. Гра закінчується, як тільки гравець бере схованку, при цьому гравець отримує більшу частину, а інший гравець отримує меншу частину.

Як приклад, припустимо, що гравець А йде першим і повинен вирішити, чи повинен він «взяти» чи «передати» схованку, яка наразі становить 2 долари. Якщо він бере, тоді А і В отримують по 1 долару, але якщо А проходить, рішення взяти або здати зараз повинен прийняти Гравець В. Якщо Б візьме, вона отримує 3 долари (тобто попередній запас 2 $ + 1 долар) і А отримує 0 доларів. Але якщо B проходить, A тепер вирішує, брати чи проходити тощо. Якщо обидва гравці завжди вирішили пройти, кожен з них отримує виграш у розмірі 100 доларів в кінці гри.

Сенс гри полягає в тому, що як А, так і В співпрацюють і продовжують проходити до кінця гри, вони отримують максимальну виплату в розмірі 100 доларів за кожну. Але якщо вони не довіряють іншому гравцеві і очікують, що вони “приймуть” при першій нагоді,  рівновага Неша прогнозує, що гравці приймуть найнижчу можливу вимогу (1 долар у цьому випадку). Експериментальні дослідження показали, однак, ця “раціональна” поведінка (як передбачає теорія ігор) рідко проявляється в реальному житті. Це не інтуїтивно дивно, враховуючи незначний розмір початкової виплати стосовно остаточної. Подібна поведінка експериментальних суб’єктів також виявлялася в дилемі мандрівника.

Дилема мандрівника 

Цю гру з ненульовою сумою, в якій обидва гравці намагаються максимізувати власну виплату, не враховуючи іншого, було розроблено економістом Каушиком Басу в 1994 році. Наприклад, у дилемі мандрівника авіакомпанія погоджується виплатити двом подорожуючим компенсацію за пошкодження однакових предметів. Однак двоє мандрівників повинні окремо оцінити вартість товару, мінімум 2 долари та максимум 100 доларів. Якщо обидва запишуть однакову вартість, авіакомпанія відшкодує кожному з них цю суму. Але якщо значення різняться, авіакомпанія виплатить їм нижчу вартість із бонусом 2 долари для подорожуючого, який записав цю нижчу вартість, та штрафом 2 долари для мандрівника, який записав вищу вартість.

Рівень рівноваги Неша, заснований на зворотній індукції, становить 2 долари за цим сценарієм. Але, як і в грі з сороконіжкою, лабораторні експерименти постійно демонструють, що більшість учасників, наївно чи іншим чином, вибирають число набагато вище 2 доларів.

Дилему мандрівника можна застосувати для аналізу різноманітних ситуацій у реальному житті. Наприклад, процес зворотної індукції може допомогти пояснити, як дві компанії, які беруть участь у жорсткій конкуренції, можуть стабільно збільшувати ціни на продукти, намагаючись отримати частку ринку, що може спричинити за собою все більші втрати в процесі.

Битва підлог

Це ще одна форма координаційної гри, описана раніше, але з деякими асиметріями виплат. По суті, це стосується пари, яка намагається узгодити свій вечір. Хоча вони домовились зустрітися або у грі з м’ячем (переваги чоловіка), або під час гри (уподобання жінки), вони забули, що вирішили, і, склавши проблему, не можуть спілкуватися між собою. Куди їм їхати? Матриця виплат наведена нижче із цифрами в клітинках, що представляють відносний ступінь насолоди від події для жінки та чоловіка відповідно. Наприклад, клітинка (а) представляє виграш (з точки зору рівня задоволення) для жінки та чоловіка під час вистави (вона насолоджується цим набагато більше, ніж він). Cell (d) – це виграш, якщо обидва потрапляють у гру з м’ячем (він насолоджується цим більше, ніж вона). Осередок (c) відображає невдоволення, якщо обидва переходять не тільки до неправильного місця, але й до події, яка їм найбільше подобається – жінки на гру в м’яч, а чоловіка на гру.

Гра-диктатор 

Це проста гра, в якій гравець A повинен вирішити, як розділити грошовий приз з гравцем B, який не бере участі у рішенні гравця A. Хоча це не стратегія теорії ігор сама по собі, вона дає кілька цікавих уявлень про поведінку людей. Експерименти показують, що близько 50% тримають усі гроші в собі, 5% розподіляють їх порівну, а інші 45% дають іншому учаснику меншу частку. Гра диктатора тісно пов’язана з грою ультиматуму, в якій гравцеві А дається встановлена ​​сума грошей, частина якої повинна бути віддана гравцеві В, який може прийняти або відхилити надану суму. Суть полягає в тому, що якщо другий гравець відхиляє запропоновану суму, і А, і В нічого не отримують. Ігри диктатора та ультиматуму проводять важливі уроки з таких питань, як благодійність та благодійність.

Мирна війна 

Це різновид дилеми ув’язненого, в якій рішення про “співпрацю чи недолік” замінюються на “мир або війна”. Аналогією можуть бути дві компанії, які цінова війна різко зменшить виграш (клітина г). Однак, якщо A бере участь у зниженні цін (тобто “війна”), але B цього не робить, A матиме більший виграш у 4, оскільки він зможе захопити значну частку ринку, і цей більший обсяг компенсуватиме нижчі ціни на продукцію.

Дилема волонтера

У дилемі волонтера хтось повинен взятися за роботу чи роботу задля загального блага. Найгірший можливий результат буде реалізований, якщо ніхто не буде добровольцем. Наприклад, розглянемо компанію, де шахрайство з бухгалтерським обліком поширене, але керівництво про це не знає. Деякі молодші співробітники бухгалтерії знають про шахрайство, але соромляться повідомити про це керівництву, оскільки це призведе до звільнення працівників, причетних до шахрайства, і скоріше за все до кримінальної відповідальності.

Позначення викривача  може також мати певні наслідки. Але якщо ніхто не буде добровольцем, масштабне шахрайство може призвести до можливого банкрутства компанії та втрати всіх робочих місць.

Питання що часто задаються

Які „ігри” проводяться в теорії ігор?

Це називається теорією ігор, оскільки теорія намагається зрозуміти стратегічні дії двох або більше “гравців” у тій чи іншій ситуації, що містить задані правила та результати. Попри те, що теорія ігор використовується в ряді дисциплін, найбільш помітно використовується як інструмент для вивчення бізнесу та економіки. Таким чином, “ігри” можуть передбачати, як дві фірми-конкуренти будуть реагувати на зниження цін іншою, якщо фірма повинна придбати іншу, або як торговці на фондовому ринку можуть реагувати на зміни ціни. Теоретично, ці  ігри можна класифікувати  як подібні до дилем ув’язненого, гри диктатора, яструба-голуба та битви статей, серед кількох інших варіантів.

Чого нас вчить дилема ув’язненого?

Дилема ув’язненого показує, що проста співпраця не завжди відповідає вищим інтересам. Насправді, під час покупок таких великих квитків, як автомобіль, торг є кращим напрямком дій з точки зору споживачів. В іншому випадку автосалон може застосувати політику гнучкості в переговорах про ціни, максимізуючи свій прибуток, але в результаті споживачі переплачують за свої транспортні засоби. Розуміння відносної вигоди співпраці та дефекту може стимулювати вас до значних  цінових переговорів,  перш ніж робити велику покупку.

Що таке рівновага Неша в теорії ігор?

Рівновага Неша в теорії ігор – це ситуація, коли гравець буде продовжувати обрану стратегію, не маючи стимулу відхилятися від неї, взявши до уваги стратегію суперника.

Як підприємства можуть використовувати теорію ігор, коли вони конкурують між собою?

Наприклад, конкуренція Курно – це економічна модель, що описує галузеву структуру, в якій конкуруючі компанії, що пропонують однаковий товар, конкурують за обсягом виробленої ними продукції, незалежно і одночасно. Це фактично гра дилеми ув’язненого.

Суть

Теорію ігор можна дуже ефективно використовувати як інструмент для прийняття рішень у змагальних, ділових чи особистих умовах.