<< Предыдущая

стр. 5
(из 14 стр.)

ОГЛАВЛЕНИЕ

Следующая >>

? ix (z, ?, r) = ? , i ? I,
*
(6)
z?x
?0,
вектор действий АЭ y*(x, ?, r) реализуется как единственное РДС с
минимальными затратами центра на стимулирование равными
?*(x, ?, r).
24
Доказательство утверждения 1 практически повторяет доказа-
тельство теоремы 4.5.1 в [90] и опускается.
На втором шаге решения задачи стимулирования ищется наи-
более выгодный для центра результат деятельности АС
x*(?, ?, r) ? A0 как решение задачи оптимального согласованного
планирования:
(7) x*(?, ?, r) = arg max [? x – ?*(x, ?, r)].
x?A0
В [90] доказана «теорема об идеальном агрегировании в моде-
лях стимулирования», которая утверждает, что в случае, когда
функция дохода центра зависит только от результата деятельности
АС, эффективности стимулирования одинаковы как при использо-
вании стимулирования АЭ за наблюдаемые действия, так и при
стимулировании за агрегированный результат деятельности. Этот
результат справедлив и в рассматриваемой модели при условии,
что центру известны: цена ?, функции затрат агентов (то есть,
параметры {ri}) и технология производства ?.
Подставляя (7) и ?*(x*(?, ?, r), ?, r) в (1) получаем зависимость
целевой функции центра (которую можно рассматривать как его
прибыль) от параметров ?, ? и r:
(8) F(?, ?, r) = ? x*(?, ?, r) – ?*(x*(?, ?, r), ?, r).
Если параметр ? интерпретируется как внешняя (экзогенно за-
данная) стоимость единицы результата деятельности АС, то, варьи-
руя два оставшихся параметра – ? и r, центр может оптимизировать
свою «прибыль», то есть, максимизировать выражение (8).
Таким образом, мы осуществили переход от «микромодели»
(задачи синтеза оптимальной функции стимулирования), в которой
описывалось взаимодействие центра с подчиненными ему АЭ, к
«макромодели», отражающей эффективность технологии деятель-
ности сотрудников заданной квалификации в зависимости от внеш-
них условий (см. выражение (8)). Другими словами, получена
возможность рассматривать оптимизационные задачи, не акценти-
руя внимания на аспектах активности участника и задачах управле-
ния АЭ (отражаемыми в теоретико-игровых моделях стимулирова-
ния с агрегированием информации).
Понятно, что, как изменение технологии ?, так и квалифика-
ции r (эффективности деятельности) сотрудников – АЭ – требует
определенных затрат, которые будем описывать функциями
25
c?(?1, ?2) и сr(r1, r2), которые отражают затраты центра соответст-
венно на изменение технологии с ?1 ? 0 на ?2 ? 0 и изменение
типов с r1 ? ? на r2 ? ?.
Относительно функций затрат предположим следующее: если
?2 ? ?1, то c?(?1, ?2) ? 0, если ?2 ? ?1, то c?(?1, ?2) ? 0, если r2 ? r1,
то cr(r1, r2) ? 0. Обозначим (?0, r0) – начальное состояние (до реали-
зации ОП) АС.
Возникают следующие три (две частных и одна общая) задачи:
1. Задача развития персонала. При заданных ?, ? и r0 опреде-
лить r ? ?, максимизирующее целевую функцию центра (8) с
учетом затрат на изменение квалификации персонала:
(9) F(?, ?, r) – cr(r0, r) > max .
r??
Решение этой задачи имеет вид r*(?, ?, r0);
2. Задача развития центра (совершенствования технологии дея-
тельности). При заданных ?, r и ?0 определить ? ? 0, максимизи-
рующее целевую функцию центра (8) с учетом затрат на изменение
технологии:
(10) F(?, ?, r) – c?(?0, ?) > max .
? ?0
Решение этой задачи имеет вид ?*(?, ?0, r);
3. Задача комплексного развития. При заданном начальном со-
стоянии (?0, r0) определить конечное состояние (? ? 0, r ? ?),
максимизирующее целевую функцию центра (8) с учетом затрат на
изменение технологии и квалификации персонала:
(11) F(?, ?, r) – c?(?0, ?) – cr(r0, r) > max .
r?? , ? ?0

Решение этой задачи имеет вид (r (?, ?0, r0), ?*(?, ?0, r0)).
*

При известных зависимостях F(?), c?(?), cr(?) задачи (9)-(11) яв-
ляются стандартными оптимизационными задачами. Приведем
пример их решения.
Пример 1. Пусть агенты имеют квадратичные функции затрат
типа Кобба-Дугласа: ci(yi, ri) = yi2 /2ri, i ? I, а оператор агрегирова-
?y
ния Q(y, ?) = ? .
i
i?I




26
?r ,
yi* (x, ?, r) = x ri / ? R,
Тогда где R= i
i?I
?*(z, ?, r) = x2 / 2 ?2 R, x*(?, ?, r) = ? ?2 R, F(?, ?, r) = ?2 ? R / 2 2

(отметим, что в рассматриваемом примере имеет место идеальное
агрегирование).
Если c?(?0, ?) = ? exp {? – ?0}, cr(r0, r) = ? exp {r – r0}, то
R = R0 + ln (?2 ?2 / 2 ?), а ?* определяется из решения следующего
*

трансцендентного уравнения (если условие второго порядка не
выполнено, то на максимальную величину ? необходимо наклады-
вать ограничения): ?2 ? [R0 + ln (?2 ?2 / 2 ?)] = ? exp {? – ?0}. •7
До сих пор мы рассматривали, фактически, статический слу-
чай, в котором решалась задача выбора конечного состояния при
известном начальном (см. задачу комплексного развития выше), то
есть процесс перехода от начального состояния к конечному не
детализировался. В ОП во многих случаях существенным оказыва-
ется процесс перехода, поэтому сформулируем динамическую
задачу комплексного развития.
Пусть имеются T периодов времени: t = 1, T , для которых из-
вестна (точно или в виде прогноза) последовательность цен
{?t}t = 1, T . Известно также начальное состояние ОС (?0, r0). Требу-
ется определить допустимые траектории развития персонала
{rt ? ?t}t = 1, T и изменения технологии {?t ? 0}t = 1, T , которые
максимизируют суммарную дисконтированную (с коэффициентом
?) полезность центра:
T

? {F(?t, ?t, rt) – c?(?t-1, ?t) – cr(rt-1, rt)} > max
(12) .
{ rt ?? t ,? t ?0}t =1 ,T
t =1
Для решения задачи (12) может быть использован метод дина-
мического программирования.
Модель 2. Рассмотрим АС с распределенным контролем (РК),
включающую один АЭ, характеризуемый функцией затрат c(y, s),
y ? A, s ? S, и k центрами, характеризуемыми функциями дохода
Hi(y, ri), где ri ? ?i, i ? K = {1, 2, …, k} – множеству центров. Целе-
вая функция i-го центра имеет вид
7
Символ «•» здесь и далее обозначает окончание примера, доказательст-
ва и т.д.
27
(13) ?i(?i(?), y, ri) = Hi(y, ri) – ?i(y), i ? K,
а целевая функция АЭ:
? ? i ( y) – c(y, s),
(14) f(?(?), y, s) =
i?K
где ?(?) = (?1(?), .., ?n(?)).
Порядок функционирования таков – сначала центры одновре-
менно и независимо выбирают свои стратегии – функции стимули-
рования, а затем при известных функциях стимулирования АЭ
выбирает действие, максимизирующее его целевую функцию (14).
В [91] доказано, что при использовании центрами компенса-
торных систем стимулирования существуют два режима взаимо-
действия центров (два типа равновесий их игры) – режим сотруд-
ничества и режим конкуренции, причем последний неэффективен
для системы в целом. Поэтому одной из основных задач управле-
ния АС РК является обеспечение режима сотрудничества центром.
Введем следующие величины:
(15) Wi(s, ri) = max {Hi(y, ri) – c(y, s)}, i ? K,
y?A

?
(16) x*(s, r) = arg max { Hi(y, ri) – c(y, s)},
y?A
i?K

??
где r = (r1, r2, …, rn) ? ? = ,
i
i?K

?
(17) W*(s, r) = max { Hi(y, ri) – c(y, s)}.
y?A
i?K
По аналогии с [44, 47, 91] запишем область компромисса
(18) ?*(r, s) = {?i ? 0 | Hi(x*(s, r), ri) – ?i ? Wi(s, ri), i ? K;
?
?i = c(x*(s, r), s)}.
i?K
В соответствии с результатами, полученными в [44], режим со-
трудничества имеет место тогда и только тогда, когда множество
(18) не пусто. Обозначим
(19) ?* ? S* = {(r, s) ? ? ? S | ?*(r, s) ? ?}.
Пусть s0 ? S и r0 ? ? – начальные параметры АС и известны
затраты cs,r(s0, r0, s, r) по их изменению до значений s ? S и r ? ?,
соответственно. Тогда возможны две постановки задачи.
Первая задача, которую условно можно назвать задачей выбо-
ра направления развития, заключается в определении таких значе-

28
ний параметров участников АС из множества (19), при которых
затраты на изменения минимальны:
(20) cs,r(s0, r0, s, r) > min* * .
( s , r ) ? ? ?S

Второй задачей является задача оптимального развития, кото-
рая заключается в выборе таких значений параметров участников
АС, при которых выигрыш АС в целом (с учетом затрат на измене-
ния) максимален:
(21) W*(s, r) – cs,r(s0, r0, s, r) > max .
( s , r ) ? ? ?S

Задачи (20) и (21) являются стандартными задачами условной
оптимизации. Термины «саморазвитие» и «самоорганизация»
применимы к ним, так как они должны решаться центрами или
метацентром, то есть участниками рассматриваемой АС.
В заключение рассмотрения настоящей модели отметим, что
все полученные результаты по аналогии с тем, как это делалось в
[44], могут быть обобщены на случаи: нескольких агентов с век-
торными предпочтениями, векторных предпочтений центров, мно-
гоуровневых АС.
Результаты исследования двух приведенных в настоящем раз-
деле моделей саморазвития в управлении ОП (см. также модели
матричных структур управления в шестом разделе) позволяют
говорить о существовании единого подхода к описанию эффектов
саморазвития и самоорганизации (см. также модели обучения
менеджеров проектов в [37]). Подход этот заключается в следую-
щем: сначала описывается зависимость равновесного (в теоретико-
игровом смысле) состояния АС от параметров центра и агентов,
характеризующих их свойства, которые могут изменяться. Затем
вводятся затраты на целенаправленное изменение этих параметров,
и решается задача определения таких новых значений этих пара-
метров (или траектории их изменения), которые максимизировали
бы эффективность функционирования АС в будущем (или в про-
цессе перехода из заданного начального состояния в конечное) с
учетом затрат на «переход». Применение данного подхода к мак-
симально широкому классу задач управления динамическими АС
представляется перспективным направлением будущих исследова-
ний.


29
5. СИНТЕЗ ОПТИМАЛЬНОГО КОМПЛЕКСА
МЕХАНИЗМОВ УПРАВЛЕНИЯ8

Приведем постановку задачи синтеза оптимального комплекса
механизмов управления ОС. Пусть ОС описывается набором (век-
тором) множества переменных:
L= {1, 2, …, l}
?
y = (y1, y2, …, yl) ? A = Ai , где yi ? Ai, i ? L, и существуют гло-
i?L
бальные ограничения A на комбинации переменных: y ? A’ ? A*.
*

Под механизмом u(?) ? ? будем понимать отображение множе-
ства Mu ? L значений управляемых переменных во множество
Ku ? L значений управляющих переменных, то есть u: AMu > AKu,
? ?
Ai . Будем считать, что множество ?
где AMu = Ai , AKu =
i?M u i?K u

допустимых механизмов таково, что для любого механизма
u(?) ? ?, выполнены глобальные ограничения, то есть
(1) ? = {u(?) | ? (yMu, yKu): yKu = u(yMu) > (yMu, yKu) ? ProjMu?Ku(A*)},
где yMu =(yj)j ? Mu, yKu =(yj)j ? Ku.
Введем ? ? ? – подмножество множества допустимых меха-
низмов, ? ? 2? – множеству всех подмножеств множества ?. Обо-
значим Q? – множество всевозможных последовательностей эле-
ментов множества ?, q? – произвольный элемент множества Q?.
Множество ? механизмов назовем непротиворечивым, если
¬
(2) ? q? ? Q?: ? (u, …, v) ? q?: Mu ? Kv ? ?.
Свойство непротиворечивости означает, что для данного набо-
ра механизмов не существует их последовательности, для которой
нашлась бы переменная, которая была бы одновременно управляе-
мой для первого механизма в этой последовательности и управ-
ляющей – для последнего.
Непротиворечивость множества механизмов порождает в ОС
иерархию: множество параметров АС может быть упорядочено – на

<< Предыдущая

стр. 5
(из 14 стр.)

ОГЛАВЛЕНИЕ

Следующая >>