Что такое дилемма заключенного?
Дилемма заключенного является парадоксом в анализе решений, в котором два человека, действующие в своих собственных интересах, не дают оптимального результата. Типичная дилемма заключенного устроена таким образом, что обе стороны решают защитить себя за счет другого участника. В результате оба участника оказываются в худшем состоянии, чем если бы они сотрудничали друг с другом в процессе принятия решений. Дилемма заключенного является одним из самых известных понятий в современной теории игр.
Ключевые вынос
- Дилемма заключенного - это ситуация, когда у отдельных лиц, принимающих решения, всегда есть стимул выбирать таким образом, который создает менее чем оптимальный результат для отдельных лиц как группы. Дилеммы заключенного возникают во многих аспектах экономики. Люди разработали много методов преодоления дилеммы заключенных, чтобы выбрать лучшие коллективные результаты, несмотря на явно неблагоприятные индивидуальные стимулы.
Дилемма заключенного
Понимание Дилеммы Заключенного
Дилемма заключенного представляет собой ситуацию, когда две стороны, разлученные и неспособные общаться, должны выбирать, сотрудничать друг с другом или нет. Наибольшая награда для каждой стороны происходит, когда обе стороны решают сотрудничать.
Дилемма классического заключенного выглядит следующим образом: два члена банды грабителей банков, Дейв и Генри, были арестованы и допрашиваются в отдельных комнатах. У властей нет других свидетелей, и они могут доказать дело против них только в том случае, если они смогут убедить хотя бы одного из грабителей предать своего сообщника и дать показания о преступлении. Каждый грабитель банка сталкивается с выбором сотрудничать со своим сообщником и хранить молчание или отстраниться от банды и дать показания для преследования. Если они оба будут сотрудничать и хранить молчание, то власти смогут осудить их только за меньшее обвинение в шалости, что будет означать один год в тюрьме каждый (1 год для Дейва + 1 год для Генри = 2 года общей тюрьмы). время). Если один из них даст показания, а другой - нет, то тот, кто дает показания, выйдет на свободу, а другой получит три года (0 лет для того, кто имеет дефекты + 3, для одного осужденного = всего 3 года). Однако, если оба будут свидетельствовать против другого, каждый получит два года тюрьмы за частичную ответственность за ограбление (2 года для Дэйва + 2 года для Генри = 4 года общего срока тюремного заключения).
В этом случае у каждого грабителя всегда есть стимул к дефекту, независимо от выбора, который делает другой. С точки зрения Дейва, если Генри хранит молчание, Дейв может либо сотрудничать с Генри и провести год в тюрьме, либо выйти из строя и выйти на свободу. Очевидно, что в этом случае ему было бы лучше предать Генри и остальных членов банды. С другой стороны, если Генри искажает и дает показания против Дейва, то выбор Дейва становится либо молчать и делать три года, либо говорить и два года сидеть в тюрьме. Опять же, очевидно, он предпочел бы сделать два года за три.
В обоих случаях, независимо от того, сотрудничает ли Генри с Дейвом или нет ли у него обвинения, Дейву будет лучше, если он сам испортит и даст показания. Теперь, поскольку Генри сталкивается с точно таким же набором вариантов, ему также всегда будет лучше выходить из строя. Парадокс дилеммы заключенного заключается в следующем: оба грабителя могут свести к минимуму общее время тюремного заключения, которое они оба сделают, только если они оба будут сотрудничать (всего 2 года), но стимулы, с которыми каждый из них сталкивается по отдельности, всегда будут стимулировать их каждого Дефект и в итоге сделать максимальное общее время тюремного заключения между ними (всего 4 года).
Примеры дилеммы заключенного
Экономика изобилует примерами дилемм заключенных, которые могут иметь положительные или вредные последствия для экономики и общества в целом. Общая нить - это ситуации, когда стимулы, с которыми сталкивается каждый отдельный принимающий решение человек, который выбирает, побуждают каждого из них вести себя таким образом, что все они в совокупности ухудшаются, при этом индивидуально избегая выбора, который сделает их всех вместе лучше, если все могут некоторые как-то кооперативно выбирают.
Одним из таких примеров является трагедия общего достояния. Для всех может быть выгодно сохранять и реинвестировать в распространение общего пула природный ресурс, чтобы иметь возможность продолжать его потреблять, но у каждого человека всегда есть стимул вместо этого потреблять как можно больше как можно быстрее, что затем истощает ресурс. Поиск какого-либо способа сотрудничества явно помог бы всем здесь.
С другой стороны, поведение картелей также можно рассматривать как дилемму заключенного. Все участники картеля могут коллективно обогащаться, ограничивая объем производства, чтобы удерживать цену, которую каждый получает, достаточно высоко, чтобы получать экономическую ренту от потребителей, но каждый член картеля в отдельности имеет стимул обманывать картель и увеличивать производство, чтобы также получать ренту от другие члены картеля. С точки зрения благосостояния всего общества, в котором действует картель, это пример того, как дилемма заключенного, которая разрушает картель, иногда может фактически сделать общество лучше в целом.
Побег из дилеммы заключенного
Со временем люди разработали множество решений дилемм заключенных, чтобы преодолеть индивидуальные стимулы в пользу общего блага.
Во-первых, в реальном мире большинство экономических и других взаимодействий между людьми повторяются более одного раза. Дилемма настоящего заключенного, как правило, играется только один раз, или же она классифицируется как дилемма повторного заключенного. В дилемме повторного заключенного игроки могут выбирать стратегии, которые поощряют сотрудничество или наказывают дезертирство с течением времени. Постоянно взаимодействуя с одними и теми же людьми, мы можем даже сознательно перейти от дилеммы бывшего заключенного к дилемме повторного заключенного.
Во-вторых, люди разработали формальные институциональные стратегии для изменения стимулов, с которыми сталкиваются отдельные лица, принимающие решения. Коллективные действия по принуждению к совместному поведению посредством репутации, правил, законов, демократических или иных коллективных решений и явного социального наказания за дезертирство превращают многие дилеммы заключенных в более коллективно выгодные результаты сотрудничества.
Наконец, у некоторых людей и групп людей со временем развились психологические и поведенческие предрассудки, такие как повышенное доверие друг к другу, долгосрочная ориентация на будущее в повторяющихся взаимодействиях и склонности к положительной взаимности кооперативного поведения или отрицательной взаимности дефектного поведения. Эти тенденции могут развиваться через своего рода естественный отбор в обществе с течением времени или групповой отбор между различными конкурирующими обществами. По сути, они побуждают группы людей «иррационально» выбирать результаты, которые на самом деле являются наиболее выгодными для всех вместе взятых.
Взятые вместе, эти три фактора (постоянные дилеммы заключенных, формальные институты, которые ломают дилеммы заключенных, и поведенческие предубеждения, которые подрывают «рациональный» индивидуальный выбор в дилеммах заключенных), помогают решить многие дилеммы заключенного, с которыми мы все столкнулись бы в противном случае.
