<< Предыдущая

стр. 5
(из 18 стр.)

ОГЛАВЛЕНИЕ

Следующая >>

использование закона ОУ гарантирует достоверность сообщаемой
элементами информации. Приведем достаточное условие
существования единственной ситуации равновесия вида si = ri в
системе с законом ОУ. Обозначим: Ei(si) = Arg max ?i(xi, si) -
x i ?X i
множество согласованных планов i-го АЭ. Будем считать, что для i-
го элемента выполнено условие равноправия функций предпочтения,
если имеет место: ? si1 ? si2 ? ?i Ei(si1) ? Ei(si2) = ?, то есть при
любых допустимых несовпадающих оценках соответствующие
множества согласованных планов не пересекаются. Справедливо
следующее утверждение: условие равноправия функций
предпочтения для всех АЭ является достаточным условием
единственности ситуации равновесия.
Приведем ряд необходимых и достаточных условий сообщения
достоверной информации как доминантной стратегии.
Необходимым и достаточным условием сообщения достоверной
информации как доминантной стратегии при любых идеальных
точках является существование множеств Xi(s-i), для которых
выполнены условия совершенного согласования [137, 169].
Напомним, что Xi(s-i) - множество допустимых планов i-го АЭ,
которое в соответствии с условиями приведенного выше результата
зависит от сообщений остальных элементов s-i и не зависит от
сообщения si i-го АЭ. Рассмотрим механизм с сильными штрафами
за отклонение состояния от плана, то есть механизм с полной
централизацией планирования [84, 148, 195]. Пусть множество
допустимых планов представимо в виде: ? Di(s-i): Xi(s-i) = Xi ? Di(s-i)
? ?. В [137] доказана теорема о том, что для того, чтобы механизм с
сильными штрафами обеспечивал сообщение достоверной
информации как доминантной стратегии при любых точках пика,
необходимо и достаточно, чтобы: 1) существовали множества Di(s-i);
выполнялись условия совершенного согласования.
2)
Соответствующие вычислительные процедуры рассматривались в
[136, 138, 145, 318].

30
Интересным и перспективным представляется предложенный в
[240] геометрический подход к получению достаточных условий
неманипулируемости путем анализа конфигураций множеств
диктаторства. В рамках этого подхода уже удалось получить ряд
конструктивных условий индивидуальной и коалиционной
неманипулируемости механизмов планирования в АС.
Достоверность сообщаемой информации при использовании
принципа ОУ при условии, что множество допустимых планов АЭ
не зависит от сообщаемой им оценки, интуитивно обосновывает
рассмотрение систем с большим числом элементов. Пусть часть
плановых показателей ? является общей для всех элементов, то есть
номенклатура плана имеет вид ? = (?, {xi}). Если искать управления
?, выгодные для всех элементов системы (как это делается при
использовании принципа согласованного планирования), то
возникает принципиальный вопрос о существовании решения.
Такого рода проблем не возникает в системах с большим числом
элементов, когда влияние оценки отдельного элемента на общее
управление мало. Если при сообщении своей оценки si каждый АЭ
не учитывает ее влияния на ?(s), то считается выполненной гипотеза
слабого влияния (ГСВ). При справедливости ГСВ необходимо
согласовывать планы только по индивидуальным переменным. В
[84, 123, 137] доказано, что если выполнена ГСВ и компоненты x(s)
плана удовлетворяют условиям совершенного согласования, то
сообщение достоверной информации является доминантной
стратегией.
В [84, 242] приведены условия выполнения гипотезы слабого
влияния и для ряда примеров показано, что при достаточно большом
числе элементов в системе это условие выполняется.
До сих пор мы интересовались, в основном, условиями
сообщения достоверной информации. Возникает закономерный
вопрос: как соотносятся такие свойства механизма
функционирования как неманипулируемость и оптимальность?
Иначе говоря, всегда ли среди оптимальных механизмов найдется
неманипулируемый и, соответственно, всегда ли среди
неманипулируемых механизмов содержится хоть один
оптимальный. Получить ответ на этот вопрос необходимо, так как,
быть может, не обязательно стремиться к обеспечению

31
достоверности информации, лишь бы механизм имел максимальную
эффективность. Поэтому приведем ряд результатов по
оптимальности смысле максимальной эффективности)

механизмов открытого управления также условия
(см.
неманипулируемости ?-согласованных механизмов в [195]).
Известно [142, 155], что в АС с одним активным элементом для
любого механизма существует механизм открытого управления не
меньшей эффективности.
Для систем с большим числом элементов результат об
оптимальности механизмов открытого управления справедлив лишь
для ряда частных случаев. Например, аналогичные результаты были
получены для механизмов распределения ресурса [123, 194, 243] и
для механизмов выработки коллективных экспертных решений
(задач активной экспертизы) [123, 155] (см. также ниже описание
базовых механизмов ТАС). Более общие, но достаточно громоздкие
достаточные условия неманипулируемости, обобщающие
результаты по механизмам распределения ресурса и механизмам
активной экспертизы, приведены в [375, 376].
Если в рамках ГСВ ввести дополнительное предположение, что
план x(s) может быть представлен в виде функции от общего
управления ?(s) и сообщения si, то при Xi =Xi(s-i) на множестве таких
механизмов существует оптимальный механизм ОУ [123, 243, 315]
(см. также выше). Оптимальность механизма ОУ имеет место также
на множестве механизмов с сильными штрафами. Анализ законов
ОУ в задачах распределения ресурса проведен в [242]. В этой работе
также вводится ряд условий на законы управления (названные
законами "минимально разумного управления"), обеспечивающих
асимптотически оптимальное распределение ресурса в точке
равновесия Нэша с ростом числа элементов.
Полученные в ТАС результаты о связи оптимальности и
неманипулируемости механизмов вселяют некоторый оптимизм, в
том смысле, что эти два свойства не являются взаимно
исключающими. В то же время ряд примеров (см., например, [84,
153, 233, 240, 376]), свидетельствуют о неоптимальности в общем
случае механизмов, обеспечивающих сообщение элементами
достоверной информации. Вопрос о соотношении оптимальности и
неманипулируемости в общем случае остается открытым.

32
Неманипулируемость механизма функционирования является
одним из основных его свойств, изучаемых в теории коллективного
выбора. Сравнительный обзор основных результатов, полученных
отечественными и зарубежными авторами в этой области, приведен
в [153].
Выше при рассмотрении механизмов стимулирования в АС
согласованными были названы механизмы, побуждающие АЭ к
выполнению планов. В АС, в которых стратегией АЭ является как
выбор сообщений, так и действий (комбинация задач
стимулирования и планирования - см. формальное описание в [195]),
механизмы, являющиеся одновременно согласованными и
неманипулируемыми, получили название правильных. Значительный
интерес представляет вопрос о том, в каких случаях оптимальный
механизм можно искать в классе правильных механизмов. Ряд
достаточных условий оптимальности правильных механизмов
управления АС приведен в [149, 195, 376, 382]. Также следует
отметить результаты исследования механизмов критериального
управления [84, 323, 342, 346], при использовании которых центр
выбирает целевую функцию АЭ из заданного класса.

6. Расширения базовой модели

Под расширениями базовой модели управления активными
системами понимаются рассматриваемые ниже динамические
активные системы (функционирующие в течение нескольких
периодов времени), многоуровневые активные системы и активные
системы, функционирующие в условиях неопределенности (см.
классификацию задач управления АС выше).

6.1. Динамические активные системы

Интуитивно понятно, что при таком естественном обобщении
простейшей базовой (статической) модели, как рассмотрение
нескольких несвязанных периодов функционирования, задачу
управления удается декомпозировать, "развалив" ее на набор
базовых. Трудности появляются при исследовании систем со
связанными периодами функционирования. Методы и алгоритмы
решения задачи синтеза оптимального механизма управления в этом
33
случае характеризуются высокой структурной и вычислительной
сложностью. Как правило, универсального подхода к
аналитическому решению этого класса задач найти не удается.
Однако, преодоление трудностей анализа оправданно, так как в
динамических АС присутствуют новые качественные свойства,
отсутствующие в базовой модели (не говоря уже о том, что
большинство реальных организационных систем функционируют
достаточно долго).
Динамические АС, функционирующие в течение длительного
времени, существенно отличаются от статических: возможность
адаптации, сглаживания влияния случайных параметров на
результаты деятельности АЭ, пересмотра стратегий - все эти
эффекты появляются при переходе от статических к динамическим
АС. Основными характеристиками динамических моделей являются
степень учета игроками будущего и конечность или бесконечность
игры. Модели, учитывающие дальновидность АЭ - способность
спрогнозировать будущие последствия принимаемых сегодня
решений, гораздо труднее поддаются анализу, нежели чем модели с
недальновидными АЭ, но, в то же время, являются более
адекватными действительности. В бесконечных играх (бесконечное
повторение одношаговых игр) центр имеет больше возможностей по
управлению элементами, в отличие от конечных игр, в которых в
последние периоды АЭ может, не опасаясь будущего наказания10,
"делать что ему заблагорассудится" [276, 371]. Отметим, что
используемые здесь и далее термины "конечная" и "бесконечная"
(игра) характеризуют не множества допустимых стратегий АЭ, а
число периодов функционирования АС.
Содержательно, качественное отличие повторяющихся
(многопериодных) игр от "обычных" (статических, однопериодных)
заключается в том, что наличие нескольких периодов повышает
ответственность игроков за свои действия - если кто-то повел себя
не так как следовало, то в следующих периодах он может быть
наказан остальными игроками за это отклонение. Для того, чтобы

10
Следует отметить, что именно возможность использования
наказаний АЭ за те или иные отклонения от договоренностей (о
равновесии и т.д.) со стороны других АЭ или центра в повторяющихся
играх расширяет множество достижимых распределений полезности.
34
предотвращать отклонения, наказание должно быть достаточно
сильным и компенсировать возможный выигрыш игрока, который
тот получает отклоняясь. Переключение с "нормального" режима на
наказание (и быть может возвращение к исходному режиму через
несколько периодов) получило название триггерной стратегии.
Примеры того, как строить триггерные стратегии и того, как
определить наилучший момент переключения (ведь не всегда можно
достоверно установить факт отклонения), приведены в [371].
Существенной в повторяющихся играх оказывается
информированность игроков. Если все игроки наблюдают все
стратегии, выбранные партнерами в прошлом, то говорят, что имеет
место полная информированность [371]. Если же стратегии,
выбираемые в прошлом, ненаблюдаемы, а есть другая информация,
например, если наблюдаемы полезности игроков, то имеет место
неполная информированность. При полной информированности в
суперигре (последовательности однопериодных игр) может
существовать равновесие Нэша, доминирующее по Парето
равновесие Нэша однопериодной игры. Если игроки не
дисконтируют будущие полезности, то множества равновесных
векторов полезностей в однопериодной и многопериодной игре
совпадают. Если игроки дисконтируют будущие полезности, то все
равновесия суперигры, в принципе, могут быть неэффективны (по
Парето), хотя, обычно, при условии, что дисконтирующие
множители не очень малы, существуют равновесия суперигры,
доминирующие по Парето однопериодные [276, 336, 371].
В теории активных систем исследование динамики
функционирования проводилось, в основном, для следующей
модели [31, 410, 425]. В активной системе, состоящей из центра и
одного АЭ, целевая функция центра в периоде t имеет вид ?t(xt,yt), а
активного элемента: ft(xt,yt), xt - план на период t, yt - действие,
выбранное АЭ в этом периоде. Траектория x = (x1, x2, , xT)
называется плановой траекторией, а траектория y = (y1, y2, , yT) -
траекторией реализаций. Как и в одноэлементной статической
задаче, центр выбирает систему стимулирования и устанавливает
планы (на каждый период), а АЭ выбирает действие,
максимизирующее его целевую функцию. Возникает вопрос - что
понимать под целевой функцией АЭ в этой повторяющейся игре.
Если допустимые множества не изменяются со временем и АЭ
35
вообще не учитывает будущего (недальновидный АЭ), то задача
сводится к набору статических задач.
Достаточно детально в ТАС были изучены так называемые
активные системы с динамикой модели ограничений [32, 40, 195,
414, 416]. Изменение модели ограничений (допустимых множеств)
со временем учитывается зависимостью множества допустимых
действий АЭ в периоде t от его действий в предыдущем периоде и от
плана текущего периода, то есть At = At(xt, yt-1), t = 2,T , A1 = A1(x1).
Таким образом, при известной плановой траектории
недальновидный АЭ будет решать задачу поиска траектории
реализаций: ft(xt,yt)> , t = 2,T . Целевая функция
max
y t ?At ( x t , y t ?1 )
l
? ? k fk(xk,yk), где ? -
дальновидного АЭ имеет вид: gt = ft(xt,yt) +
k = t +1
коэффициент дисконтирования. Для верхнего индекса суммирования
возможны следующие варианты: l = t + N (фиксированный
горизонт) - АЭ учитывает N будущих периодов, l = T - АЭ
учитывает все будущие периоды и т.д. [425, 426, 432]. То есть
дальновидный АЭ в каждом периоде t решает задачу выбора
реализаций (действий - yt, yt+1, ) с целью максимизации gt. Задача
центра заключается в выборе плановой траектории,
T
?? t
максимизирующей его целевую функцию, имеющую вид:
t =1
?t(xt,yt), считая, что реализации будут совпадать с планами. Если АЭ
и центр имеют различные степени дальновидности (N + 1 < T), то
АЭ не может построить прогноз на весь плановый период. В работах
[425, 426] приведены условия на распределения дальновидностей,
обеспечивающие совпадение реализации с планом, и показано, что
динамическую задачу удается свести к статической, решаемой в
"расширенном" пространстве параметров.
При решении задачи планирования центр может предполагать,

<< Предыдущая

стр. 5
(из 18 стр.)

ОГЛАВЛЕНИЕ

Следующая >>