<< Предыдущая

стр. 7
(из 18 стр.)

ОГЛАВЛЕНИЕ

Следующая >>

моделей механизмов стимулирования как в детерминированных
активных системах, так и в АС с различными типами и видами
неопределенности.
После описания модели, то есть задания в соответствии с
введенными выше параметрами модели и системой классификаций
задач управления в АС класса исследуемых активных систем,
определяется рациональное поведение АЭ: на основании известных
предпочтений АЭ на множестве результатов деятельности (эти
предпочтения зависят от используемого центром механизма
управления) и имеющейся информации о неопределенных факторах
(взаимосвязи между действиями АЭ и результатами его
деятельности) определяются предпочтения АЭ на множестве его
43
стратегий (действий и/или сообщаемых оценок). В случае
интервальной неопределенности этот переход осуществляется с
использованием принципа МГР, в случае вероятностной (нечеткой)
неопределенности целевая функция АЭ на множестве результатов
его деятельности совместно с распределением вероятностей
(нечеткой информационной функцией) индуцирует на множестве
допустимых стратегий целевую функцию - ожидаемую полезность
(индуцированное нечеткое отношение предпочтения (НОП) и т.д.).
Множество выбора (решений игры) при заданном множестве
стратегий и предпочтениях АЭ, выражаемых, например, его целевой
функцией, НОП и т.д., определяется стандартным образом. В случае,
если множество выбора состоит более, чем из одного элемента,
необходимо доопределить однозначно (используя ГБ или МГР)
выбор АЭ. Этот выбор будет зависеть от механизма управления,
эффективность которого задается значением целевой функции
центра на множестве выбора АЭ (если предпочтения центра зависят
от неопределенных параметров, то необходимо найти его
детерминированную индуцированную систему предпочтений).
Следует отметить, что структура предпочтений центра и АЭ
(возможность ранжирования стратегий) в большинстве случаев
позволяет определять выбор (недоминируемые стратегии)
достаточно тривиально.
Имея критерий сравнения эффективностей различных систем
стимулирования на их допустимом множестве, задача синтеза в АС с
неопределенностью (и в детерминированных АС - см. выше)
формулируется следующим образом: найти допустимую систему
стимулирования, имеющую максимальную эффективность. Все
трудности при решении этой задачи (поиска точки в области
функционального пространства, максимизирующей заданный
функционал, переменные которого в свою очередь сложным образом
зависят от искомой функции) возникают потому, что она в общем
случае не может быть сведена к какой-либо стандартной задаче
оптимизации. В детерминированном случае свойства решения
(которое является скачкообразной или компенсаторной системой
стимулирования) дается теоремой Ю.Б. Гермейера [276]. В ряде АС
с неопределенностью удается дискретные задачи стимулирования
свести к тем или иным известным оптимизационным (см. обзоры
[152, 153, 371]). Высокая вычислительная сложность алгоритмов
44
численного решения дискетных задач и отсутствие возможности
анализа зависимости оптимального решения от параметров модели,
приводят к необходимости разработки методов получения именно
аналитического решения. Поэтому основной акцент в ТАС делается
именно на поиск аналитического решения задачи синтеза.
Лобовой поиск аналитического решения, как правило, не
приводит к успеху - в большинстве случаев приходится "угадывать"
решение, а затем доказывать его оптимальность, благо, что
эвристические принципы угадывания, да и техника формального
доказательства для различных моделей АС, имеют много общего.
Техника доказательства большинства результатов использует
анализ множества реализуемых действий - тех действий АЭ,
которые он выбирает (гарантированно или по ГБ) при заданной
функции стимулирования. Критерий сравнения различных систем
стимулирования по эффективности может быть сформулирован в
терминах множеств реализуемых действий: чем "шире" множество
действий, реализуемых системой стимулирования, тем в рамках ГБ
выше ее эффективность (двойственным подходом является
сравнение минимальных затрат на стимулирование по реализации
фиксированного действия) [382].
Поэтому оптимальная система стимулирования (точнее - их
класс) имеет максимальное множество реализуемых действий.
Следовательно, для того, чтобы доказать оптимальность некоторого
класса систем стимулирования достаточно показать, что не
существует другой допустимой системы стимулирования, имеющей
большее множество реализуемых действий. Этот подход
оказывается плодотворным не только при доказательстве
оптимальности, но и при исследовании свойств решения, влияния
неопределенности и т.д.
Более того, в рамках каждой из перечисленных выше базовых
моделей М1-М13 возможны различные постановки задачи
стимулирования - прямые и обратные, первого и второго рода, с
различными представлениями целевых функций участников АС и
т.д. В то же время, опыт их исследования свидетельствует, что
достаточно исследовать полностью одну из них - решение остальных
задач данного класса требует лишь незначительных модификаций.
В качестве иллюстрации использования единства
предложенного подхода сформулируем общую для всех моделей АС
45
с неопределенностью последовательность их исследования,
включающую следующие этапы:
1. Описание модели: определение целевых функций и
допустимых множеств, их свойств, а также порядка
функционирования и информированности участников АС и т.д.
2. Определение рационального поведения АЭ в рамках
рассматриваемой модели: задание процедуры (метода) устранения
неопределенности и рационального выбора АЭ (определение
множества решений игры - множества реализуемых действий).
3. Определение эффективности механизма стимулирования и
формулировка, собственно, задачи синтеза оптимального механизма
стимулирования.
4. Решение задачи синтеза: поиск аналитического решения
и/или разработка алгоритмов численного решения задачи и
исследование их свойств: сходимости, сложности и т.д.
5. Нахождение необходимых и достаточных условий
оптимальности.
6. Анализ оптимального решения:
а) свойства оптимального решения и множества реализуемых
действий, содержательные интерпретации;
б) влияние неопределенности на эффективность и свойства
оптимального механизма стимулирования;
в) влияние параметров модели и определения рационального
поведения на эффективность и свойства оптимального механизма
стимулирования, в том числе - анализ устойчивости оптимального
решения.
Исследование частных случаев усилении
7. (при
предположений и допущений о параметрах и свойствах модели АС)
и возможностей обобщения (соответственно, при ослаблении).
8. Исследование устойчивости решений и адекватности модели
моделируемой системе.
9. Внедрение модели: корректировка, разработка рекомендаций
по практическому использованию, создание вычислительных
средств, автоматизированных систем поддержки принятия решений
и имитационных моделей.
Итак, этапы 1-3 включают описание АС и постановку задачи,
этапы 4-5 соответствуют аналитическому и/или численному
решению задачи, этапы 6-8 - исследованию модели и свойств
46
оптимального решения, этап 9 - внедрению и практическому
использованию результатов исследования.
Обнадеживающим представляется тот факт, что оптимальными
в базовых моделях оказываются достаточно "простые" системы
стимулирования11. Так, результаты теоретического исследования
подтверждают высокую эффективность следующих широко
распространенных на практике систем стимулирования (см. их
подробное описание в четвертом разделе): - скачкообразных (С-
типа), компенсаторных (К-типа) и пропорциональных (L-типа) [299,
363, 382]. Отдельно следует отметить, что ни в одной из базовых
моделей пропорциональные системы стимулирования (L-типа) не
доминируют скачкообразные и компенсаторные.
Таблица 3 содержит сводку результатов теоретического
исследования задач стимулирования в АС с неопределенностью (см.
подробное описание, а также вводимые предположения в [382]): для
базовых моделей М1-М13 (за исключением М3 и М9, которые на
сегодняшний день недостаточно полно исследованы, быть может - в
силу затруднений в их содержательных интерпретациях) указаны
оптимальные системы стимулирования ((ОСС) - "и" означает -
одновременно, "или" означает - в зависимости от вводимых
предположений), соотношение между эффективностями K и
гарантированными эффективностями Kg стимулирования в АС с
неопределенностью и соответствующих детерминированных АС (K0
и Kg0), изменение эффективности (гарантированной эффективности)
с ростом неопределенности ("^" - возрастает, "v" - убывает, "^v" -
может как возрастать, так и убывать).
Отдельного обсуждения заслуживает влияние
неопределенности на эффективность управления АС, так как
возможность использования единого подхода к анализу базовых
моделей механизмов управления (стимулирования) в АС с
различными типами и видами неопределенности позволяет сделать
ряд общих выводов о роли неопределенности в управлении АС. В
детерминированной активной системе оптимальным оказывается
целое множество систем стимулирования - от наиболее "жестких" –

11
Например, хрестоматийной моделью вероятностной АС, в которой
легко удается получить аналитическое решение задачи управления,
стала модель простого активного элемента [84,99,110,174,237].
47
№ ОСС K/K0 Kg/Kg0 K Kg
?1 ?1 ? ?
М1 СиК
?1 ?1 v v
М2 СиК
?1
?
^v v
М4 С или К 1
?

?1 ?1 v v
М5 К
?1 ?1 v v
М6 С или К
?1 ?1 ^ v
М7 С или К
?1
?
^v v
М8 С 1
?

?1 ?1 v v
М10 СиК
?1 ?1 v v
М11 СиК
?1
?
^v v
М12 С или К 1
?

?1 ?1 v v
М13 С

Таблица 3. Результаты исследования задач
стимулирования в АС с неопределенностью

скачкообразных до наиболее слабых - компенсаторных. Все задачи
стимулирования в АС с неопределенностью, рассматриваемые в
ТАС, удовлетворяют принципу соответствия: при предельном
переходе ("стремлении" неопределенности к "нулю") они переходят
в детерминированные АС, а их оптимальные решения - в
оптимальные решения соответствующих детерминированных задач
стимулирования. Причем в большинстве случаев оптимальными
оказываются "граничные" системы стимулирования - С-типа или К-
типа. Таким образом, множество оптимальных систем
стимулирования в АС с неопределенностью является
подмножеством (иногда собственным) систем стимулирования,
оптимальных в соответствующих детерминированных активных
системах.
Ключевыми понятиями детерминированной теории активных
систем являются понятия согласованного плана и согласованной
системы стимулирования (см. выше). Если при исследовании
моделей механизмов стимулирования в АС с неопределенностью
48
основной акцент делается на анализ множества реализуемых
действий, а условие реализуемости есть ни что иное, как условие
согласованности (в ТК этому термину соответствует ICC - Incentive
ограничение согласованности
Compatibility Constraint -
стимулирования [152]), то вопрос о том, что следует понимать под
согласованностью плана в АС с неопределенностью заслуживает
особого обсуждения. Так как, например, в вероятностных АС,
результат деятельности АЭ является случайной величиной, то вряд
ли разумно определять план как некоторую "точку" (хотя, задавая
область, можно считать ее "планом", который выполняется, если при
выборе АЭ реализованного действия результат деятельности
оказывается в этой области, например, с вероятностью не ниже
заданной и т.д.). Считать планом точку скачка в системах
стимулирования С-типа полную аналогию с
(проводя
детерминированным случаем) нецелесообразно по тем же причинам.
Так или иначе, даже не наблюдая действий АЭ, центр, подбирая
систему стимулирования, управляет именно выбором действия.
Поэтому можно считать планом действие, реализуемое заданной
системой стимулирования (такой план всегда согласован). Важный
методологический вывод, который следует из проведенного анализа,
заключается в следующем: непосредственное обобщение понятий
плана и согласованного плана с детерминированной модели на
модели АС с неопределенностью невозможно, так как в общем
случае в последних план (в детерминированном понимании) не
совпадает ни с выбором (действием) АЭ, ни с результатом его
деятельности. Поэтому требуется дополнительное исследование и
введение нового общего понятия плана для АС с
неопределенностью, которое удовлетворяло бы принципу
соответствия и включало в себя "детерминированное" определение
как частный случай.
Вполне согласованными с практическим опытом
представляются результаты о том, что во всех базовых моделях с
ростом верхнего ограничения механизма стимулирования
расширяется множество реализуемых действий, что совместно с
результатами анализа влияния информированности участников на
эффективность управления АС позволяет расширить класс моделей
АС, для которых применима уже разработанная технология и
техника анализа, включив в него АС с платой за информацию,
49
смешанной неопределенностью, некоторые динамические и

<< Предыдущая

стр. 7
(из 18 стр.)

ОГЛАВЛЕНИЕ

Следующая >>