Что такое обратная индукция?
Обратная индукция в теории игр - это итеративный процесс рассуждения назад во времени, от конца проблемы или ситуации, для решения конечной расширенной формы и последовательных игр, и выведения последовательности оптимальных действий.
Объяснение обратной индукции
Обратная индукция использовалась для решения игр, так как Джон фон Нейман и Оскар Моргенштерн установили теорию игр как академический предмет, когда они опубликовали свою книгу « Теория игр и экономическое поведение» в 1944 году.
На каждом этапе игры обратная индукция определяет оптимальную стратегию игрока, который делает последний ход в игре. Затем определяется оптимальное действие ближайшего к нему движущегося игрока с учетом действия последнего игрока, как указано. Этот процесс продолжается в обратном направлении до тех пор, пока не будет определено наилучшее действие для каждого момента времени. По сути, каждый определяет равновесие Нэша каждой подигры в оригинальной игре.
Однако результаты, полученные из обратной индукции, часто не могут предсказать реальную человеческую игру. Экспериментальные исследования показали, что «рациональное» поведение (как предсказывает теория игр) редко проявляется в реальной жизни. Нерациональные игроки могут на самом деле получить более высокие выплаты, чем предсказывало обратная индукция, как показано в игре сороконожки.
В игре сороконожки два игрока поочередно получают шанс получить большую долю растущего банка денег или передать банк другому игроку. Выплаты распределяются так, что если банк передается противнику, а противник забирает банк в следующем раунде, он получает немного меньше, чем если бы он взял банк в этом раунде. Игра заканчивается, как только игрок берет тайник, причем этот игрок получает большую часть, а другой игрок получает меньшую часть.
Пример обратной индукции
Например, предположим, что игрок А идет первым и должен решить, должен ли он «взять» или «сдать» тайник, который в настоящее время составляет 2 доллара. Если он берет, то A и B получают по 1 $ каждый, но если A сдает, решение принять или сдать теперь должен принять Игрок B. Если B принимает, она получает 3 $ (то есть, предыдущий тайник $ 2 + $ 1) и А получает 0 долларов. Но если B проходит, A теперь решает, брать или сдавать, и так далее. Если оба игрока всегда выбирают пас, каждый из них получает выплату в размере 100 долларов в конце игры.
Смысл игры в том, что если A и B оба сотрудничают и продолжают проходить до конца игры, они получают максимальную выплату в размере 100 долларов каждая. Но если они не доверяют другому игроку и ожидают, что они «возьмут» при первой возможности, равновесие Нэша предсказывает, что игроки возьмут наименьшее возможное требование ($ 1 в этом случае).
Равновесие по Нэшу в этой игре, где ни один игрок не имеет стимула отклоняться от выбранной им стратегии после рассмотрения выбора противника, предполагает, что первый игрок получит банк в самом первом раунде игры. Однако на самом деле, сравнительно немного игроков делают это. В результате они получают более высокую выплату, чем выплата, предсказанная анализом равновесия.
Решение последовательных игр с использованием обратной индукции
Ниже приведена простая последовательная игра между двумя игроками. Метки с Игроком 1 и Игроком 2 внутри них являются информационными наборами для игроков одного или двух, соответственно. Числа в скобках внизу дерева являются выплатами в каждой соответствующей точке. Игра также последовательная, поэтому Игрок 1 принимает первое решение (слева или справа), а Игрок 2 принимает решение после Игрока 1 (вверх или вниз).
фигура 1
Обратная индукция, как и вся теория игр, использует допущения рациональности и максимизации, означающие, что Игрок 2 максимизирует свою отдачу в любой конкретной ситуации. В любом наборе информации у нас есть два варианта, всего четыре. Исключив варианты, которые не выберет Игрок 2, мы можем сузить наше дерево. Таким образом, мы выделим линии, которые максимизируют выигрыш игрока при данном наборе информации.
фигура 2
После этого сокращения Игрок 1 может максимизировать свои выплаты теперь, когда выборы Игрока 2 стали известны. Результатом является равновесие, найденное обратной индукцией игрока 1, выбравшего «право», а игрока 2, выбравшего «вверх». Ниже приведено решение игры с жирным путем равновесия.
Рисунок 3
Например, можно легко настроить игру, аналогичную той, что описана выше, используя компании в качестве игроков. Эта игра может включать в себя сценарии выпуска продукта. Если Компания 1 хочет выпустить продукт, что может сделать Компания 2 в ответ? Выпустит ли компания 2 аналогичный конкурирующий продукт? Прогнозируя продажи этого нового продукта в различных сценариях, мы можем настроить игру, чтобы предсказать, как могут разворачиваться события. Ниже приведен пример того, как можно смоделировать такую игру.
Рисунок 4