Що таке відстала індукція?
Індукція відсталого в теорії ігор - це ітеративний процес аргументування відсталого у часі, починаючи з кінця проблеми чи ситуації, до вирішення обмеженої обширної форми та послідовних ігор та виводить послідовність оптимальних дій.
Пояснення індукції назад
Відстала індукція використовується для вирішення ігор, оскільки Джон фон Нойман та Оскар Моргенстерн встановили теорію ігор як академічний предмет, коли вони опублікували свою книгу « Теорія ігор та економічна поведінка» у 1944 році.
На кожному етапі гри назад індукція визначає оптимальну стратегію гравця, який робить останній крок у грі. Потім визначається оптимальна дія гравця, який рухається від останнього до останнього, приймаючи дії останнього гравця як задані. Цей процес триває назад, поки не буде визначено найкращу дію для кожного моменту часу. Ефективно одним є визначення рівноваги Неша кожної підгрупи оригінальної гри.
Однак результати, отримані за допомогою зворотної індукції, часто не можуть передбачити реальну гру людини. Експериментальні дослідження показали, що "раціональна" поведінка (як це передбачає теорія ігор) рідко виявляється в реальному житті. Ірраціональні гравці можуть насправді отримати вищі виплати, ніж передбачувалося зворотною індукцією, як це показано в грі зі сороконічкою.
У грі зі стоножкою два гравці по черзі отримують шанс зайняти більшу частку зростаючого кошика грошей або передати банк іншому гравцеві. Виграші влаштовуються так, що якщо горщик передається противнику, а опонент приймає горщик у наступному раунді, він отримує трохи менше, ніж якби той взяв горщик у цьому раунді. Гра завершується, як тільки гравець займає сховище, при цьому гравець отримує більшу частину, а інший гравець отримує меншу частину.
Приклад зворотної індукції
Як приклад, припустимо, що гравець А виходить першим і повинен вирішити, чи варто йому "брати" чи "передавати" сховище, яке наразі становить 2 долари. Якщо він візьме, то A і B отримують по 1 долар кожен, але якщо A проходить, рішення про прийняття або пропуск зараз повинен приймати гравець B. Якщо B приймає, вона отримує 3 долари (тобто попередній прихват $ 2 + 1 $) і A отримує $ 0. Але якщо B проходить, А тепер вирішує, чи приймати чи проходити тощо. Якщо обидва гравці завжди вирішили пройти, кожен отримає виграш у розмірі 100 доларів наприкінці гри.
Сенс гри полягає в тому, що якщо A і B обидва співпрацюють і продовжують проходити до кінця гри, вони отримують максимальну виплату в розмірі 100 доларів кожна. Але якщо вони не довіряють іншому гравцеві і очікують, що вони "приймуть" при першій нагоді, рівновага Неша прогнозує, що гравці візьмуть найменшу претензію (у цьому випадку $ 1).
Рівновага Неша в цій грі, де жоден гравець не має стимулу відхилятися від обраної стратегії після розгляду вибору суперника, пропонує перший гравець взяти банк у самому першому раунді гри. Однак насправді так мало гравців. Як результат, вони отримують вищу вигоду, ніж виплата, передбачена аналізом рівноваги.
Розв’язування послідовних ігор за допомогою зворотної індукції
Нижче наведена проста послідовна гра між двома гравцями. Мітки з програвачем 1 та програвачем 2 є інформаційними наборами для гравців один або два відповідно. Числа в дужках у нижній частині дерева є виплатами у кожній відповідній точці. Гра також є послідовною, тому Гравець 1 приймає перше рішення (зліва або справа), а Гравець 2 приймає рішення після гравця 1 (вгору або вниз).
Фігура 1
Зворотна індукція, як і вся теорія ігор, використовує припущення про раціональність та максимізацію, що означає, що Player 2 максимізує свою виплату в будь-якій ситуації. В будь-якому інформаційному наборі у нас є два варіанти, всього чотири. Усуваючи вибір, який програвач 2 не обиратиме, ми можемо звузити наше дерево. Таким чином, ми будемо жирними лініями, які максимально розплачуються гравцеві за заданим набором інформації.
Малюнок 2
Після цього зменшення програвач Player 1 може збільшити свої виплати тепер, коли вибір гравця 2 стане відомим. Результатом є рівновага, виявлена за допомогою зворотної індукції гравця 1, який вибирає "правильний", а гравця 2 вибирає "вгору". Нижче наводиться розв’язання гри з виділеним жиром рівноважним шляхом.
Малюнок 3
Наприклад, можна легко створити гру, подібну до описаної вище, використовуючи компанії як гравців. Ця гра може включати сценарії випуску продукту. Якщо компанія 1 хотіла випустити продукт, що може зробити компанія 2 у відповідь? Чи випустить компанія 2 подібний конкуруючий продукт? Прогнозуючи продажі цього нового продукту за різними сценаріями, ми можемо створити гру, щоб передбачити, як можуть розгортатися події. Нижче наводиться приклад того, як можна моделювати таку гру.
Малюнок 4
