<< Предыдущая

стр. 155
(из 165 стр.)

ОГЛАВЛЕНИЕ

Следующая >>

0 0
Рис. 16.20. Игра, в которой нет равновесия в чистых стратегиях

Конечно, мы можем прямо перенести понятие смешанной стратегии на динамические игры, вос-
пользовавшись представлением этих игр в нормальной форме. Согласно такой интерпретации, смешан-
ная стратегия игрока — это вероятности, с которыми игрок выбирает свои чистые стратегии. В этом
случае игроки рандомизируют стратегии. Однако более предпочтительной кажется другая концепция:
игроки рандомизируют действия. Эта концепция лучше соответствует идеологии динамических игр.
Стратегию с рандомизацией действий принято называть поведенческой стратегией. Поведенческая
стратегия должна указывать для каждого информационного множества, в котором ход принадлежит
игроку, некоторое распределение вероятностей на множестве действий, из которых он выбирает в
данном информационном множестве. При этом предполагается, что распределения вероятностей в
разных информационных множествах статистически независимы.
Фундаментальный результат, принадлежащий Куну, состоит в том, что в играх с идеальной памя-
тью использование поведенческих стратегий эквивалентно использованию смешанных стратегий (со
случайным выбором чистых стратегий). Мы понимаем под эквивалентностью двух наборов стратегий
то, что они порождают одно и то же распределение вероятностей на множестве конечных вершин
(или, что то же самое, на множестве всех траекторий игры, начинающихся в начальной вершине).
Несложно понять, что каждый набор смешанных стратегий однозначно порождает набор поведенче-
ских стратегий, при этом оба они порождают одно и то же распределение на множестве конечных
вершин. Обратное утверждение состоит в том, что для любого набора поведенческих стратегий най-
дется хотя бы один набор смешанных стратегий, который его порождает. В дальнейшем мы везде
будем говорить о смешанных стратегиях, имея в виду поведенческие стратегии.
Алгоритм обратной индукции можно естественным образом распространить на случай случайного
выбора игроками своих действий. Заметим, что в играх с совершенной информацией с различными вы-
игрышами такая обратная индукция даст то же самое единственное решение, что и обычная обратная
индукция. Смешанные стратегии в этом решении будут вырожденными: каждый игрок будет выби-
рать одно из действий с единичной вероятностью. По-видимому, смешанные стратегии имеет смысл
рассматривать только в играх с несовершенной информацией.
16.4. Динамические игры с несовершенной информацией 662

Рассмотрим в качестве примера Игру 16.4 «Набеги на банки» (с. 659). Как мы уже видели, в этой
игре существует три равновесия в чистых стратегиях. Мы сейчас увидим, что в игре, кроме того,
существуют равновесия в смешанных стратегиях.
Обозначим через µ1 вероятность того, что первый вкладчик не забирает деньги на первом этапе
(вероятность выбора L1 ), а через ?1 — вероятность того, что второй вкладчик не забирает деньги на
первом этапе (вероятность выбора L2 ). Соответствующие вероятности на втором этапе обозначим µ2
и ?2 (вероятности выбора L3 и L4 соответственно).
В игре второго этапа существуют три равновесия Нэша в смешанных стратегиях (см. Рис. 16.21).
Два из этих равновесий — равновесия в вырожденных смешанных стратегиях. Есть также равновесие
в невырожденных смешанных стратегиях: µ2 = 1/2 и ?2 = 1/2. Ожидаемые выигрыши вкладчиков
составят при этом по 3/2 . Структура равновесий в редуцированной игре 1-го этапа зависит от того,
какое из трех возможных равновесий второго этапа ожидают игроки. Равновесия в вырожденных
смешанных стратегиях аналогичны рассмотренным выше равновесиям в игре с чистыми стратегиями.
Кроме того, в редуцированной игре при v1 , v2 = 3 (когда на втором этапе оба оставляют деньги в
банке) существует равновесие в невырожденных смешанных стратегиях: µ1 = 1/2 и ?1 = 1/2 .

?2
?2 (µ2 )
1


µ2 (?2 )
1
2



µ2
1 1
2



Рис. 16.21. Равновесия в смешанных стратегиях второго этапа игры «Набеги на банки»



Задачи
 701. «Раз-два-три» Каждый из двух игроков одновременно называет одно из трех чисел: 1 , 2 или
3 . При совпадении второй игрок дает первому названное и совпавшее число (при несовпадении никто
не платит). Дополнительно игроки получают удовольствие от участия в игре, которые они оценивают
в 1/2 . Какую сумму z первый игрок должен заплатить второму до начала игры, чтобы тот согласился
играть? Нарисуйте дерево, описывающее данную ситуацию.
 702. В игре участвуют 2 игрока. Игра состоит из двух этапов. На первом этапе игроки одновременно
решают, хотят ли они участвовать во втором этапе. Если игрок говорит, что хочет участвовать во
втором этапе то он платит $1. Второй этап начинается, только если оба решают участвовать во втором
этапе, в противном случае игра заканчивается, и деньги забирает организатор игры. В игре второго
этапа игроки одновременно заявляют, хотят ли они забрать имеющиеся $2. В случае их отказа, деньги
достаются организатору этой игры. Если же на эти деньги претендуют оба, то между ними происходит
ссора, потери от которой обо игрока оценивают выше, чем достающаяся им доля, так что выигрыш
обоих — отрицательный. Полностью эта игра с указанием всех выигрышей изображена на Рис. 16.22.
На первом этапе L обозначает «дать доллар», R — «не давать доллар». На втором этапе L обозначает
«попытаться забрать доллары», R — «отказаться от долларов».
Проанализируйте эту игру и найдите в ней все совершенные в подыграх равновесия как в чистых,
так и в смешанных стратегиях.
 703. Найдите равновесие в смешанных стратегиях для игры, изображенной на Рис. 16.20 (с. 661).
 704. 50 пиратов делят добычу в 100 дукатов. Правило дележа следующее. В порядке старшинства
каждый пират предлагает свою схему дележа. Если большинство пиратов (не менее половины, включая
пирата, который предлагает дележ) принимает предложение, то оно выполняется и процедура дележа
заканчивается. Если предложение отвергается, то пират, который его сделал, исключается из числа
16.5. Статические игры с неполной информацией 663

1-й
L1 R1
2-й
R2L2 R2
L2
0
?1 0 0
?1
0
1-й
L3 R3
2-й
R4L4
L4 R4
?10 ?1
?1
1
?10 ?1
?1 1

Рис. 16.22.


участвующих в дележе, и тогда настает очередь следующего по старшинству пирата предложить схему
дележа между оставшимися пиратами.
(1) Объясните, почему описанная игра является игрой с почти совершенной информацией.
(2) Как будет поделена добыча? (Предложите решение игры.)
(3) Будет ли равновесие единственным?




16.5 Статические игры с неполной информацией
Рассматривая статические игры, мы предполагали, что игроки в равной степени информированы о
структуре игры, так что каждый из игроков знает множества возможных действий и целевые функции
других игроков (более того, мы предполагали, что все это общеизвестно). На самом деле экономические
субъекты всегда бывают в разной степени информированы или, другими словами, асимметрично ин-
формированы, поэтому многие экономические явления невозможно адекватно описать, не отказавшись
от этого упрощающего предположения.
Мы рассмотрим здесь разновидность игр, в которых игроки могут не знать точно предпочтения
других игроков. Предпочтения игроков в этих играх зависят от случайных событий, при этом игро-
ки в разной степени владеют информацией о том, какое именно событие произошло. Формально это
учитывается с помощью введения понятия типа игрока: каждый из игроков может быть нескольких
типов. При этом считается, что каждый из игроков знает только свой собственный тип. Можно счи-
тать, что первый ход делает природа, выбирая типы всех игроков. Такого рода игры называют играми
с неполной информацией или байесовскими играми.
Концепция игр с неполной информацией оказывается очень плодотворной, и позволяет моделиро-
вать различные ситуации, содержащие элемент случайности, которые невозможно смоделировать в
рамках игр с полной информацией, которые были рассмотрены нами выше. Например, характеристи-
ки игрока могут зависеть от некоторых случайных параметров. Стратегия игрока при этом должна
описывать, какие действия он выберет при каждом возможном значении параметра.
В этом параграфе мы разберем статические игры с неполной информацией. Динамическим играм
с неполной информацией посвящен следующий параграф.
Опишем структуру статической игры с неполной информацией (статической байесовской игры).
Как и раньше, I = {1, . . . , m} — множество игроков. В байесовских играх каждый игрок имеет
несколько типов, ?i ? ?i , где ?i — множество типов i-го игрока (не обязательно конечное или счет-
ное). Предполагается, что появление того или иного типа — случайное событие. Таким образом, в
описании байесовской игры должно быть задано распределение вероятностей на множестве

? = ?1 ? · · · ? ?m .
16.5. Статические игры с неполной информацией 664

Если множества типов ?i конечны, то достаточно задать вероятности появления сочетаний типов
(?1 , . . . , ?m ) ? ?, т. е. функцию
?(·) : ? > R+ ,
для которой выполнены стандартные предположения о том, что вероятности должны быть неотрица-
тельны и их сумма должна равняться единице.
В дальнейшем мы, как правило, будем предполагать, что имеет место независимость появления
типов у разных игроков (для краткости будем называть это независимостью типов). В таком случае
достаточно задать вероятности появления каждого из типов для каждого игрока, то есть m функций

?i (·) : ?i > R+ , i = 1, . . . , m,

таких что ?i (?) — вероятность появления типа ? ? ?i игрока i. Это случай, когда знание своего типа
не дает игроку дополнительной информации о типах других игроков.
Если типы — это действительные числа, то можно считать, что дана функция распределения
типов, F (?1 , . . . , ?m ). Независимость типов в данном контексте означает, что функцию распределения
можно представить как произведение функций распределения типов отдельных игроков
m
F (?1 , . . . , ?m ) = Fi (?i ).
i=1

Предполагается, что все типы одного и того же игрока имеют одинаковые множества действий
30
Xi . Выигрыш в статических байесовских играх зависит не только от выбранных игроками действий,
(x1 , . . . , xm ) ? X , но и от того, какие именно типы, (?1 , . . . , ?m ) ? ?, участвуют в игре. Предпочтения
игроков заданы функциями выигрышей:

ui : X ? ? > R,

где X = X1 ? · · · ? Xm .
Таким образом, описание статической байесовской игры должно включать в себя следующие со-
ставляющие:
( множество игроков;
( для каждого игрока — множество типов;
( распределение вероятностей на множествах типов;
( для каждого игрока — множество возможных действий;
( для каждого игрока — функции выигрышей.
В частном случае, когда множества типов конечны, статическая байесовская игра есть набор

I, {?i }I , ?, {Xi }I , {ui }I .

Стратегии в статических байесовских играх не совпадают с действиями. В соответствии со сложив-
шейся терминологией, стратегия игрока описывает действия каждого из типов этого игрока. Можно
представить стратегию как функцию si (·), которая ставит в соответствие каждому типу ? ? ?i неко-
торые действия si (?) ? Xi .
Естественное обобщение понятия рациональности в данном случае состоит в том, что каждый
тип каждого игрока максимизирует ожидаемый выигрыш при некоторых ожиданиях относительно
стратегий других игроков31 . Поскольку игрок знает свой тип, то математическое ожидание должно
быть условным по этому типу. (Условные вероятности в общем случае рассчитываются по формуле
Байеса — отсюда и термины «байесовские игры», «байесовское равновесие».) Ожидаемый выигрыш
игрока i, имеющего тип ? и выбравшего действия xi , в предположении, что остальные игроки выбрали
стратегии
s?i (·) = (s1 (·), . . . , si?1 (·), si+1 (·), . . . , sm (·)),
30
Если моделируется ситуация, в которой множества возможных действий разные у разных типов, то это
можно смоделировать, введя для некоторых действий запретительно маленькие выигрыши («равные минус
бесконечности»), так чтобы соответствующий тип их заведомо не стал выбирать.
31
Можно задать целевые функции не для типов, а для игроков. В таком случае игрок максимизирует ожи-
даемую полезность, исходя из вероятности того, что он окажется того или иного типа. Оба подхода совпадают
при естественном предположении, что вероятность появления любого типа не равна нулю.
16.5. Статические игры с неполной информацией 665

равен
Ui (?, xi , s?i (·)) = E[ui (xi , s?i (??i ), ?, ??i ) | ?i = ?],
где ??i = (?1 , . . . , ?i?1 , ?i+1 , . . . , ?m ) — типы остальных игроков.
Если имеет место независимость типов, то условное по типу мат. ожидание совпадает с безуслов-
ным, т. е.
Ui (?, xi , s?i (·)) = E(ui (xi , s?i (??i ), ?, ??i )).
Если множества типов конечны и типы независимы, то ожидаемый выигрыш рассчитывается по
формуле
Ui (?, xi , s?i (·)) = ??i (??i )ui (xi , s?i (??i ), ?, ??i ),
??i ???i

где мы обозначили
??i = (?1 , . . . , ?i?1 , ?i+1 , . . . , ?m )
и
??i (??i ) = ?j (?j )
j=i

(вероятность того, что типы остальных игроков окажутся равными ??i = (?1 , . . . , ?i?1 , ?i+1 , . . . , ?m )).
Для байесовских игр предложена концепция равновесия32 , аналогичная равновесию Нэша в играх
с полной информацией.

Определение 95:
Набор стратегий (?1 (·), . . . , sm (·)) является равновесием Нэша — Байеса (байесовским равновесием)
s ?
в игре с неполной информацией, если для каждого типа ? ? ?i каждого игрока i действия si (?) мак-
?
симизируют его ожидаемую полезность в предположении, что все другие игроки выбрали равновесные
стратегии:
Ui (?, si (?), ??i (·)) = max Ui (?, xi , ??i (·)).
? s s
xi ?Xi


Для того, чтобы введенные определения стали более понятными, проиллюстрируем их на условном
примере.
Игра 10. «Выбор компьютера»
В игре участвуют два игрока, использующие в работе компьютеры. Каждый игрок может быть двух
типов — предпочитает работать либо на IBM PC, либо на Макинтоше, причем любители IBM PC по-
падаются с вероятностью ? (для обоих игроков). Каждый из игроков выбирает либо IBM PC, либо
Макинтош. Лишь после того, как игрок выбрал тип компьютера, он узнает, с партнером какого типа
ему предстоит работать, и какой тот выбрал себе компьютер. Каждый из типов каждого из игроков
оценивает пользование компьютером любимой разновидности в 1 у. е., а пользование другим компью-
тером в 0 у. е. Игроки получают дополнительный выигрыш в 2 у. е., если выберут компьютеры одной
и той же разновидности.

Игра представлена в Таблице 16.17.
Мы не будем полностью решать эту игру. Найдем только условия для параметра ? , при которых
набор стратегий «если игрок любит IBM, то оно выбирает IBM; если игрок любит Mac, то он выбирает
Mac», т. е. ((IBM, Mac), (IBM, Mac)), будет равновесием Нэша — Байеса.
Рассмотрим выбор 1-го игрока, если он предпочитает IBM PC. Если он ожидает, что стратегией
2-го игрока является (IBM, Mac), то его ожидаемая полезность от выбора компьютеров IBM PC и
Макинтош равна соответственно

<< Предыдущая

стр. 155
(из 165 стр.)

ОГЛАВЛЕНИЕ

Следующая >>