<< Предыдущая

стр. 156
(из 163 стр.)

ОГЛАВЛЕНИЕ

Следующая >>

L1 v1 0
Игрок 1
0 1
R1 2 1
Множество равновесий Нэша в редуцированной игре первого этапа зависит от того, какое
из двух равновесий может реализоваться на втором этапе. Если игроки считают, что на
втором этапе они оба заберут деньги, то им выгоднее забрать деньги на первом этапе, по-
скольку v1, v2 = 1 < 2. Если же игроки считают, что на втором этапе они оба оставят деньги
в банке, то на первом этапе может реализоваться одно из двух равновесий Нэша, посколь-
668
669
ку v1, v2 = 3 > 2: либо оба игрока забирают деньги, либо оба оставляют. Таким образом,
обратная индукция дает три решения. В двух из этих решений происходит «набег на банк»
на первом и втором этапе соответственно. Третье решение соответствует случаю, когда
оба вкладчика дожидаются получения максимального выигрыша (3, 3).


Использование обратной индукции в играх с почти совершенной информацией можно
дополнительно обосновать тем, что для них выполнен вариант Теоремы 6.


Теорема 6?.
В игре с почти совершенной информацией (и конечным числом ходов) множество реше-
ний, получаемых обратной индукцией, совпадает с множеством совершенных в поды-
грах равновесий.


В отличие от игр с совершенной информацией, в играх с почти совершенной информаци-
ей решения в чистых стратегиях может не существовать (как, например в игре на Рис.
169). Выход из положения состоит в том, чтобы ввести в поведение игроков элемент ран-
домизации, по аналогии со смешанными стратегиями, которые мы рассмотрели в случае
статических игр.
Конечно, мы можем прямо перенести понятие смешанной стра- 1-й
тегии на динамические игры, воспользовавшись представлением
этих игр в нормальной форме. Согласно такой интерпретации, 1-й
? –1 ?
? –1 ?
смешанная стратегия игрока — это вероятности, с которыми
игрок выбирает свои чистые стратегии. В этом случае игроки 2-й
рандомизируют стратегии. Однако более предпочтительной ка-
жется другая концепция: игроки рандомизируют действия. Эта
?1? ?0??0? ?1?
концепция лучше соответствует идеологии динамических игр. ?0? ?1??1? ?0?
Стратегию с рандомизацией действий принято называть пове-
?enoiie 169. Ea?a, a
денческой стратегией. Поведенческая стратегия должна указывать
eioi?ie iao
для каждого информационного множества, в котором ход при- ?aaiiaaney a ?enouo
надлежит игроку, некоторое распределение вероятностей на no?aoaaeyo
множестве действий, из которых он выбирает в данном инфор-
мационном множестве. При этом предполагается, что распределения вероятностей в раз-
ных информационных множествах статистически независимы.
Фундаментальный результат, принадлежащий Куну, состоит в том, что в играх с идеаль-
ной памятью использование поведенческих стратегий эквивалентно использованию сме-
шанных стратегий (со случайным выбором чистых стратегий). Мы понимаем под эквива-
лентностью двух наборов стратегий то, что они порождают одно и то же распределение
вероятностей на множестве конечных вершин (или, что то же самое, на множестве всех
траекторий игры, начинающихся в начальной вершине). Несложно понять, что каждый
набор смешанных стратегий однозначно порождает набор поведенческих стратегий, при
этом оба они порождают одно и то же распределение на множестве конечных вершин.
Обратное утверждение состоит в том, что для любого набора поведенческих стратегий
найдется хотя бы один набор смешанных стратегий, который его порождает. В дальней-
шем мы везде будем говорить о смешанных стратегиях, имея в виду поведенческие страте-
гии.
Алгоритм обратной индукции можно естественных образом распространить на случай
случайного выбора игроками своих действий. Заметим, что в играх с совершенной ин-
формацией с различными выигрышами такая обратная индукция даст то же самое единст-
669
670
венное решение, что и обычная обратная индукция. Смешанные стратегии в этом решении
будут вырожденными: каждый игрок будет выбирать одно из действий с единичной веро-
ятностью. По-видимому, смешанные стратегии имеет смысл рассматривать только в играх
с несовершенной информацией.
Рассмотрим в качестве примера Игру 9 «Набеги на банки» (стр. 668). Как мы уже видели,
в этой игре существует три равновесия в чистых стратегиях. Мы сейчас увидим, что в игре
кроме того существуют равновесия в смешанных стратеги- 1-й
ях. L1 R1
Обозначим через µ1 вероятность того, что первый вкладчик 2-й
не забирает деньги на первом этапе (вероятность выбора R2 L2 R2
L2
L1), а через ?1 — вероятность того, что второй вкладчик не ?0?
? –1 ? ? 0 ? ? 0 ?
забирает деньги на первом этапе (вероятность выбора L2).
? 0 ? ? –1 ?
1-й
Соответствующие вероятности на втором этапе обозначим
L3 R3
µ2 и ?2 (вероятности выбора L3 и L4 соответственно).
2-й
В игре второго этапа существуют три равновесия Нэша в
R4 L 4
L4 R4
смешанных стратегиях (см. Рис. 170). Два из этих равнове-
сий — равновесия в вырожденных смешанных стратегиях. ? –10 ? ? –1 ?
? –10 ? ? 1 ? ? –1 ? ? –1 ?
? –1 ? ? 1 ?
Есть также равновесие в невырожденных смешанных стра-
тегиях: µ2 = 1/2 и ?2 = 1/2. Ожидаемые выигрыши вкладчи-
ков составят при этом по 3/2. Структура равновесий в ре- ?enoiie 171
дуцированной игре 1-го этапа зависит от того, какое из
трех возможных равновесий второго этапа ожидают игроки. Равновесия в вырожденных
смешанных стратегиях аналогичны рассмотренным выше равновесиям в игре с чистыми
стратегиями. Кроме того, в редуцированной игре при v1, v2 = 3 (когда на втором этапе оба
оставляют деньги в банке) существует равновесие в невырожденных смешанных страте-
гиях: µ1 = 1/2 и ?1 = 1/2.


?2
?2(µ2)
Задачи 1


35. «Раз-два-три» 1
2
Каждый из двух игроков одновременно называет одно из трех µ2(?2)
чисел: 1, 2 или 3. При совпадении второй игрок дает первому
µ2
названное и совпавшее число (при несовпадении никто не
платит). Дополнительно игроки получают удовольствие от 1 1
участия в игре, которые они оценивают в 1/2. Какую сумму z 2
первый игрок должен заплатить второму до начала игры, что-
бы тот согласился играть? Нарисуйте дерево, описывающее ?enoiie 170. ?aaiiaaney
a niaoaiiuo no?aoaaeyo
данную ситуацию. aoi?iai yoaia ea?u
«Iaaaae ia aaiee»

36. В игре участвуют 2 игрока. Игра состоит из двух этапов. На первом этапе игроки од-
новременно решают, хотят ли они участвовать во втором этапе. Если игрок говорит, что
хочет участвовать во втором этапе то он платит $1. Второй этап начинается, только если
оба решают участвовать во втором этапе, в противном случае игра заканчивается, и день-
ги забирает организатор игры. В игре второго этапа игроки одновременно заявляют, хотят
ли они забрать имеющиеся $2. В случае их отказа, деньги достаются организатору этой
игры. Если же на эти деньги претендуют оба, то между ними происходит ссора, потери от
которой обо игрока оценивают выше, чем достающаяся им доля, так что выигрыш обоих
670
671
— отрицательный. Полностью эта игра с указанием всех выигрышей изображена на Рис.
171. На первом этапе L обозначает «дать доллар», R — «не давать доллар». На втором
этапе L обозначает «попытаться забрать доллары», R — «отказаться от долларов».
Проанализируйте эту игру и найдите в ней все совершенные в подыграх равновесия как в
чистых, так и в смешанных стратегиях.


37. Найдите равновесие в смешанных стратегиях для игры, изображенной на Рис. 169 (стр.
669).


38. 50 пиратов делят добычу в 100 дукатов. Правило дележа следующее. В порядке стар-
шинства каждый пират предлагает свою схему дележа. Если большинство пиратов (не
менее половины, включая пирата, который предлагает дележ) принимает предложение, то
оно выполняется и процедура дележа заканчивается. Пираты голосуют одновременно.
Если предложение отвергается, то пират, который его сделал, исключается из числа уча-
ствующих в дележе, и тогда настает очередь следующего по старшинству пирата предло-
жить схему дележа между оставшимися пиратами.
Объясните, почему описанная игра является игрой с почти совершенной информацией.
Как будет поделена добыча? Будет ли равновесие единственным?

Статические игры с неполной информацией
Рассматривая статические игры, мы предполагали, что игроки в равной степени информи-
рованы о структуре игры, так что каждый из игроков знает множества возможных дейст-
вий и целевые функции других игроков (более того, мы предполагали, что все это обще-
известно). На самом деле экономические субъекты всегда бывают в разной степени ин-
формированы или, другими словами, асимметрично информированы, поэтому многие
экономические явления невозможно адекватно описать, не отказавшись от этого упро-
щающего предположения.
Мы рассмотрим здесь разновидность игр, в которых игроки могут не знать точно пред-
почтения других игроков. Предпочтения игроков в этих играх зависят от случайных собы-
тий, при этом игроки в разной степени владеют информацией о том, какое именно собы-
тие произошло. Формально это учитывается с помощью введения понятия типа игрока:
каждый из игроков может быть нескольких типов. При этом считается, что каждый из иг-
роков знает только свой собственный тип. Можно считать, что первый ход делает приро-
да, выбирая типы всех игроков. Такого рода игры называют играми с неполной информаци-
ей (байесовскими играми).

Концепция игр с неполной информацией оказывается очень плодотворной, и позволяет
моделировать различные ситуации, содержащие элемент случайности, которые невоз-
можно смоделировать в рамках игр с полной информацией, которые были рассмотрены
нами выше. Например, характеристики игрока могут зависеть от некоторых случайных
параметров. Стратегия игрока при этом должна описывать, какие действия он выберет при
каждом возможном значении параметра.
В этом параграфе мы разберем статические игры с неполной информацией. Динамиче-
ским играм с неполной информацией посвящен следующий параграф.
Опишем структуру статической игры с неполной информацией (статической байесовской
игры).
Как и раньше, I = {1,...,m} — множество игроков. В байесовских играх каждый игрок
имеет несколько типов, ?i ? ?i, где ?i — множество типов i-го игрока (не обязательно
671
672
конечное или счетное). Предполагается, что появление того или иного типа — случайное
событие. Таким образом, в описании байесовской игры должно быть задано распределе-
ние вероятностей на множестве
? = ?1 ??????m.
Если множества типов ?i конечны, то достаточно задать вероятности появления сочета-
ний типов (?1, ..., ?m) ? ?, т.е. функцию
?(?): ? &  +,
для которой выполнены стандартные предположения о том, что вероятности должны быть
неотрицательны и их сумма должна равняться единице.
В дальнейшем мы, как правило, будем предполагать, что имеет место независимость по-
явления типов у разных игроков (для краткости будем называть это независимостью ти-
пов). В таком случае достаточно задать вероятности появления каждого из типов для каж-
дого игрока, то есть m функций
?i(?): ?i &  +, i = 1, ..., m,
таких что ?i(?) — вероятность появления типа ? ? ?i игрока i. Это случай, когда знание
своего типа не дает игроку дополнительной информации о типах других игроков.
Если типы — это действительные числа, то можно считать, что дана функция распределе-
ния типов, F(?1, ..., ?m). Независимость типов в данном контексте означает, что функцию
распределения можно представить как произведение функций распределения типов от-
дельных игроков
m
F(?1, ..., ?m) = «Fi(?i).
i=1

Предполагается, что все типы одного и того же игрока имеют одинаковые множества дей-
ствий Xi.256 Выигрыш в статических байесовских играх зависит не только от выбранных
игроками действий, (x1, ..., xm) ? X, но и от того, какие именно типы, (?1, ..., ?m) ? ?, уча-
ствуют в игре. Предпочтения игроков заданы функциями выигрышей:
ui : X ? ? &  ,
где X = X1 ? ??? ? Xm.
Таким образом, описание статической байесовской игры должно включать в себя сле-
дующие составляющие:
@ множество игроков;
@ для каждого игрока — множество типов;
@ распределение вероятностей на множествах типов;
@ для каждого игрока — множество возможных действий;
@ для каждого игрока — функции выигрышей.
В частном случае, когда множества типов конечны, статическая байесовская игра есть
набор
?I, {?i}I , ?, {Xi}I , {ui}I?.

256
Если моделируется ситуация, в которой множества возможных действий разные у разных типов, то это
можно смоделировать, введя для некоторых действий запретительно маленькие выигрыши («равные минус
бесконечности»), так чтобы соответствующий тип их заведомо не стал выбирать.

672
673
Стратегии в статических байесовских играх не совпадают с действиями. В соответствии
со сложившейся терминологией, стратегия игрока описывает действия каждого из типов
этого игрока. Можно представить стратегию как функцию si(?), которая ставит в соответ-
ствие каждому типу ? ? ?i некоторые действия si(?) ? Xi.
Естественное обобщение понятия рациональности в данном случае состоит в том, что ка-
ждый тип каждого игрока максимизирует ожидаемый выигрыш при некоторых ожиданиях
относительно стратегий других игроков.257 Поскольку игрок знает свой тип, то математи-
ческое ожидание должно быть условным по этому типу. (Условные вероятности в общем
случае рассчитываются по формуле Байеса — отсюда и термины «байесовские игры»,
«байесовское равновесие»). Ожидаемый выигрыш игрока i, имеющего тип ? и выбравше-
го действия xi, в предположении, что остальные игроки выбрали стратегии
s–i(?) = (s1(?), ..., si–1(?), si+1(?), ..., sm(?)),
равен
Ui(?, xi, s–i(?)) = E(ui(xi, s–i(?–i), ?, ?–i) | ?i = ?),
где ?–i = (?1, ..., ?i–1, ?i+1, ..., ?m) — типы остальных игроков.
Если имеет место независимость типов, то условное по типу мат. ожидание совпадает с
безусловным, т.е.
Ui(?, xi, s–i(?)) = E(ui(xi, s–i(?–i), ?, ?–i)).
Если множества типов конечны и типы независимы, то ожидаемый выигрыш рассчитыва-
ется по формуле

Ui(?, xi, s–i(?)) = ¤ ?–i(?–i) ui(xi, s–i(?–i), ?, ?–i),
?–i ? ?–i

где мы обозначили
?–i = (?1, ..., ?i–1, ?i+1, ..., ?m)
и

?–i(?–i) = « ?j(?j)
j?i

(вероятность того, что типы остальных игроков окажутся равными ?–i = (?1, ..., ?i–1, ?i+1, ...,
?m)).

<< Предыдущая

стр. 156
(из 163 стр.)

ОГЛАВЛЕНИЕ

Следующая >>