<< Предыдущая

стр. 7
(из 19 стр.)

ОГЛАВЛЕНИЕ

Следующая >>

наиболее жестким требованием является возможность однознач-
ного восстановления искомой зависимости по заданной. Если по
известной зависимости А можно однозначно вычислить зависи-

41
мость В, где А, В ? {I; II; III; IV}, то будем говорить, что В явля-
ется следствием А, и будем обозначать этот факт А > В. Если
одновременно выполнено А > В и В > А, то описания А и В
эквивалентны.
Требование возможности однозначного восстановления и,
тем более, эквивалентности является во многих случаях слишком
жестким. Поэтому, помня, что нас интересует поведение агента,
рациональное с точки зрения формально описанной системы его
предпочтений (в силу гипотезы рационального поведения рацио-
нальным является выбор агентом стратегии, максимизирующей
его целевую функцию или функцию полезности), можно исполь-
зовать более слабый вид «причинно-следственных» связей, осно-
вывающийся на эквивалентности наблюдаемого извне системы
ее поведения. Действительно, если, например, две различных
целевых функции имеют одинаковые точки максимума (что в
рамках гипотезы рационального поведения приводит к выбору
агентом этой точки), то с точки зрения внешнего наблюдателя
(который «видит» только выбранную агентом стратегию) обе
целевых функции эквивалентны. Такой вид причинно-
следственных связей будем называть «эквивалентностью по
внешнему поведению1» (ЭВП).
Перейдем к последовательному рассмотрению двенадцати
вариантов связей между четырьмя представлениями индивиду-
альных предпочтений.
Вариант 1. Пусть известна функция полезности агента u(q, t),
исследуем возможность получения на основании этой информа-
ции зависимости ?(?) минимальной ставки оплаты, побуждаю-
щей агента отработать заданное число часов.
Если положить значение ставки оплаты равной той, на кото-
рой достигается максимум полезности при заданной продолжи-

1
Необходимо помнить, что эквивалентность по внешнему поведению
зависит от используемых предположений о рациональности индивиду-
ального поведения и, кроме того, от того как доопределяется выбор
агента на множестве решений игры (может использоваться гипотеза
благожелательности, гарантированный результат и т.д. [21, 22]). Два
описания могут удовлетворять ЭВП при одних гипотезах о рациональ-
ности и не удовлетворять ЭВП при использовании других гипотез.
42
тельности рабочего времени, то есть ?(?) = arg max u(? ?, T – ?),
? ?0
то максимум полезности может достигаться при бесконечных
ставках оплаты (см. также выше).
Поэтому о зависимости ?(?) в этом случае имеет смысл го-
ворить в предположении, что агент использует какую-либо част-
ную стратегию, например, стратегию 4 (см. выше), то есть стре-
мится максимизировать свободное время при условии, что его
доход не ниже некоторой заданной величины q0 (условие 1.1). В
последнем случае выполнено:
(3) ?(?) = q0 / ?.
Альтернативой является стратегия (условие 1.2), заключаю-
щаяся в стремлении агента обеспечить себе заданный уровень
полезности, например, уровень U , соответствующий резервной
заработной плате [15, 41]. Тогда имеет место
(4) ?(?) = min {? ? 0 | u(??, T – ?) ? U }.
В случае, если выполнено (4), затраты агента определяются
наиболее просто – они равны тому доходу, который необходимо
выплатить агенту для того, чтобы он получил заданный уровень
полезности:
(5) c(?) = ? ?(?).
Таким образом, утверждение I > II в общем случае не имеет
места, оно справедливо лишь при наложении дополнительных
(достаточных1) условий, например – условий 1.1 или 1.2.
Вариант 2. Однозначное восстановление функции полезно-
сти u(q, t) по известной зависимости ?(?) в общем случае невоз-
можно. Соответствующие достаточные условия могут быть
установлены для набора частных случаев и не носят сколь либо
общего характера (см. также вариант 10).
Вариант 3. Отображение ?(?) может рассматриваться как об-
ратное к функции ?(?), поэтому с формальной точки зрения2

1
Другими словами, необходима конкретизация того, что понимается
под "минимальностью" ставки оплаты.
С содержательной точки зрения кривые ?-1(?) и ?(?), а также ?-1(?) и
2

?(?), не должны совпадать, так как зависимость ?(?) отражает
минимальную ставку оплаты, а ?(?) – желаемую продолжительность
43
достаточным условием существования обратной функции являет-
ся, например, условие 3: функция ?(?) – непрерывная и строго
монотонная. Содержательные интерпретации взаимосвязи описа-
ний II и III приведены выше.
Вариант 4. По аналогии с вариантом 3 с формальной точки
зрения можно утверждать, что для того, чтобы для функции ?(?)
существовала обратная функция (а не многозначное отображе-
ние) достаточно, чтобы выполнялось условие 4: функция ?(?) –
непрерывная и строго монотонная.
Вариант 5. Пусть известна функция ?(?), исследуем возмож-
ность получения на основании этой информации целевой функ-
ции f(?, ?). Так как целевая функция представляет собой разность
между стимулированием и затратами, и именно затраты являются
искомой величиной, то под «восстановлением» целевой функции
следует понимать определение функции затрат агента.
По известной функции ?(?) можно вычислить зависимость
дохода от ставки оплаты:
(6) q(?) = ? ?(?).
Желательный доход агента может рассматриваться как ми-
нимальные затраты центра на стимулирование по компенсации
затрат агента [15, 22]. Однако, затраты агента в явном виде зави-
сят от его действия – продолжительности рабочего времени
? ? [0; T], поэтому использовать выражение (6) «в лоб» для
определения затрат нельзя – необходимо перейти от зависимости
q(?) к зависимости q(?). Сделать это можно, в частности, в рам-
ках варианта 4, что требует введения дополнительных предполо-
жений. Поэтому в качестве достаточного для возможности рас-
сматриваемого перехода может рассматриваться условие 4 (см.
также описание варианта 11).
Однако, такой подход к определению функции затрат непра-
вомерен по следующей причине. Если используется пропорцио-
нальная система стимулирования, то в предположении существо-


рабочего времени, причем каждый из этих параметров может оцени-
ваться субъектом по различным критериям. Это суждение подтвер-
ждается экспериментальными данными (см. показатели L1 и L2, от-
ражающие уровень притязаний, во второй главе настоящей работы).
44
вания внутреннего решения выбираемое агентом действие долж-
но удовлетворять уравнению
(7) c'(?) = ?,
где c'(?) – производная функции затрат. Выражая из (7) продол-
жительность рабочего времени, получаем:
(8) ?(?) = c'-1(?),
где c'-1(?) – функция, обратная производной функции затрат. Зная
зависимость ?(?), можно (в рамках предположений о монотонно-
сти и непрерывности производной функции затрат, а также пред-
положения о том, что c(0) = 0) найти функцию затрат как реше-
ние уравнений (7)-(8), то есть
y
(9) c(y) = ? ? ?1 ( z ) dz .
0
Для существования функции затрат, вычисляемой в соответ-
ствии с выражением (9), достаточно выполнения условия 4. В
случае нарушения условия 4 при обработке экспериментальных
данных (см. вторую часть настоящей работы) использовалась
минимальная ветвь отображения ?-1(?). Сравнивая выражения (6)
и (9), получаем, что при любой монотонно возрастающей поло-
жительнозначной функции ?(?) выполнено
y
?1
?? ( z ) dz ? y ?-1(y), y ? 0,
0
то есть именно выражение (9) характеризует минимальные затра-
ты на стимулирование.
Вариант 6. По известной целевой функции (то есть по из-
вестным затратам c(?)) зависимость ?(?) вычисляется достаточно
просто (см. также варианты 8 и 9, так как рассматриваемый
вариант является частным случаем их комбинации), и при этом
не требуется введения дополнительных предположений.
Рассмотрим пропорциональную систему стимулирования
(систему стимулирования L-типа [15, 19, 23]) со ставкой оплаты
?: ?L(?) = ? ?. Тогда целевая функция агента равна: f(?, ?) = ? ? –
c(?). Положим ?(?) = arg max {? ? – c(?)}. Если функция затрат
? ?[ 0;T ]
является гладкой, строго монотонной и выпуклой, то зависимость
45
желательной продолжительности рабочего времени от ставки
оплаты определяется в явном виде следующим образом: ?(?) =
c ' ?1 (? ) .
Вариант 7. Данный вариант представляет самостоятельный
интерес (не только в контексте настоящего исследования) по
следующим причинам. Как отмечалось выше, целевая функция,
записанная в виде «стимулирование минус затраты», является
частным случаем представления функции полезности.
В теории принятия решений задаче декомпозиции функции
полезности посвящено значительное число исследований. Наи-
более известна так называемая задача аддитивной представимо-
сти, которая заключается в следующем1 (мы опишем ее на при-
мере рассматриваемой в настоящей работе функции полезности,
зависящей от двух переменных – дохода и свободного времени).
Пусть известна функция u(q, t). Необходимо определить ка-
ким требованиям она должна удовлетворять (какими свойствами
она должна обладать) для того, чтобы ее можно было предста-
вить в виде суммы двух функций полезности, одна из которых
зависит только от первой переменной – дохода, а вторая – только
от второй переменной – свободного времени, то есть:
(10) u(q, t) = u1(q) + u2(t).
Нас в рамках седьмого варианта интересует частный случай
задачи аддитивной представимости функции полезности в виде
u(q, t) = q – c(?), то есть u1(q) = q, u2(t) = c(T – t) (см. стратегию 6
˜
индивидуального поведения, в рамках которой c(?) = – µ (T – ?).
Для решения этой задачи можно воспользоваться общими ре-
зультатами, полученными в теории принятия решений (см. ссыл-
ки в сноске), однако мы используем специфику задачи стимули-
рования.
В задаче стимулирования при заданной функции стимулиро-
вания доход является функцией, зависящей от рабочего времени,
поэтому условно можно считать, что полезность зависит только
от одной переменной: U?(?) = u(?(?), T – ?). При заданной систе-

1
Необходимые и достаточные условия декомпозиции функции полезно-
сти для многих практически важных моделей принятия решений при-
ведены, например, в [40], их подробный обзор проведен в [59].
46
ме стимулирования целевая функция f(?, ?) также может рас-
сматриваться как функция одной переменной: F?(?) = ?(?) – c(?).
Будем говорить, что представление индивидуальных предпочте-
ний в виде целевой функции эквивалентно по внешнему поведе-
нию представлению индивидуальных предпочтений в виде функ-
ции полезности, если для заданной функции полезности
существует функция затрат, такая, что для любых функций сти-
мулирования из того, что в некоторой точке достигается глобаль-
ный максимум функции полезности U?(?) следует, что в этой же
точке достигается максимум целевой функции F?(?), и наоборот.
Запишем формальное определение. Два представления ин-
дивидуальных предпочтений (функциями полезности и целевыми
функциями) удовлетворяют ЭВП, если:
+
? c(?): [0; T] > ?1 : ? ?(?) Arg max U?(z) = Arg max F?(z).
z?[0;T ] z?[0;T ]
Поиск классов функций полезности, удовлетворяющих при-
веденному выше условию, представляет собой самостоятельную
(и достаточно сложную1) математическую задачу. Мы воспользу-
емся тем, что возможна следующая цепочка переходов между
различными представлениями: I > III > IV (см. варианты 9 и 5, а
также рисунок 22 ниже). Для осуществления указанной последо-
вательности переходов достаточно, например, выполнения усло-
вия 4 (см. описание варианта 5 выше).
Таким образом, для определения целевой функции по из-
вестной функции полезности необходимо произвести следую-
щую цепочку действий. Первое – вычислить по известной функ-
ции полезности u(q, t) зависимость ?(?) (см. вариант 9). Второе –
по известной функции ?(?) определить зависимость ?(?) (см.
вариант 5). Если ?(?) – непрерывная строго монотонная функция
(условие 4), то функция затрат вычисляется в соответствии с (7)-
(9).
Вариант 8. Целевая функция f(?, ?) = ?(?) – c(?) с учетом
взаимосвязи дохода и стимулирования: q = ?(?), действия и

1
Например, в модели простого активного элемента [ ] совпадают
участки монотонности его функции полезности и ожидаемой полезно-
сти.
47
рабочего времени: y - ?; а также взаимосвязи свободного и
рабочего времени: t + ? = T, может рассматриваться как частный
(аддитивный) случай функции полезности u(q, t), то есть имеет
место:
u(q, t) = f(?(T – t), T – t) = ?(T – t) – c(T – t).
Следовательно, по заданной целевой функции всегда можно
формально построить функцию полезности (понятно, что при
этом они будут также эквивалентны по внешнему поведению).
Вариант 9. При известной функции полезности зависимость
желательной продолжительности рабочего времени от ставки
оплаты определяется следующим образом – она будет равна
такому значению продолжительности рабочего времени, которое
максимизирует полезность при заданной системе оплаты, то есть:
(11) ?(?) = arg max u(? ?, T – ?).
? ?[ 0;T ]
В более общем случае (то есть при нелинейной зависимости
вознаграждения от числа отработанных часов) имеет место:
(12) ?(?) = arg max u(?(?), T – ?).
? ?[ 0;T ]
Никаких дополнительных условий рассматриваемый пере-
ход не требует.
Вариант 10. По заданной зависимости ?(?) желательной про-
должительности рабочего времени от ставки оплаты восстано-
вить функцию полезности в общем случае нельзя (см. также
вариант 2). Действительно, однозначное восстановление функции
двух переменных по параметрически заданному множеству точек

<< Предыдущая

стр. 7
(из 19 стр.)

ОГЛАВЛЕНИЕ

Следующая >>