<< Предыдущая

стр. 39
(из 65 стр.)

ОГЛАВЛЕНИЕ

Следующая >>

а б
Рис. 8.5
1. Дисперсии ? i2 пропорциональны хi (рис. 8.5, а).
у i2 = ?2 ? хi (?2 ? коэффициент пропорциональности).
220
Тогда уравнение (8.9) преобразуется делением его левой и правой час-
тей на x i :
yi x e yi
a 1
+ b xi + v i . (8.11)
= +b i + i ? =a
xi xi xi xi xi xi
ei
Несложно показать, что для случайных отклонений vi = выпол-
xi
няется условие гомоскедастичности. Следовательно, для регрессии
(8.11) применим обычный МНК. Действительно, в силу выполнимо-
сти предпосылки у i2 = ?2 (?i) = ?2 ?хi имеем:
еi 1 1
у 2 (v i ) = у 2 ( ) = у 2 (еi ) = у 2 ? x i = у 2 = const.
xi xi
xi
Таким образом, оценив для (8.11) по МНК коэффициенты ?0 и ?1,
затем возвращаются к исходному уравнению регрессии (8.8).
Если в уравнении регрессии присутствует несколько объясняю-
щих переменных, можно поступить следующим образом. Вместо кон-
)
кретной объясняющей переменной Xj используется Y исходного урав-
)
нения множественной линейной регрессии Y = b0 + b1X1 + ... + bmXm ,
т. е. фактически линейная комбинация объясняющих переменных. В
этом случае получают следующую регрессию:
yi x i1 x еi
1
= в 0 ) + в 1 ) + ... + в m im + ) . (8.12)
) )
yi yi yi yi yi
Иногда из всех объясняющих переменных выбирается наиболее
подходящая, исходя из графического представления (рис. 8.4).

2. Дисперсия ?i2 пропорциональна хi2 (рис. 8.4, б).
В случае, если зависимость ?i2 от хi целесообразнее выразить не
линейной функцией, а квадратичной, то соответствующим преобразо-
ванием будет деление уравнения регрессии (8.8) на хi:
yi 1 е yi 1 е
= в 0 + в1 + i ? = в 0 + в1 + v i , где v i = i . (8.13)
xi xi xi xi xi xi
По аналогии с вышеизложенным несложно показать, что для от-
клонений vi будет выполняться условие гомоскедастичности. После
определения по МНК оценок коэффициентов ?0 и ?1 для уравнения
(8.13) возвращаются к исходному уравнению (8.8).

221
Отметим, что для применения описанных выше преобразований
существенную роль играют знания об истинных значениях дисперсий
отклонений ?i2, либо предположения, какими эти дисперсии могут
быть. Во многих случаях дисперсии отклонений зависят не от вклю-
ченных в уравнение регрессии объясняющих переменных, а от тех,
которые не включены в модель, но играют существенную роль в ис-
следуемой зависимости. В этом случае они должны быть включены в
модель. В ряде случаев для устранения гетероскедастичности необхо-
димо изменить спецификацию модели (например, линейную на лог-
линейную, мультипликативную на аддитивную и т. п.).
В заключение отметим, что наличие гетероскедастичности не по-
зволяет получить эффективные оценки, что зачастую приводит к не-
обоснованным выводам по их качеству. Обнаружение гетероскеда-
стичности - достаточно трудоемкая проблема и для ее решения разра-
ботано несколько методов (тестов). В случае установления наличия
гетероскедастичности ее корректировка также представляет довольно
серьезную проблему. Одним из возможных решений является метод
взвешенных наименьших квадратов (при этом необходима определен-
ная информация либо обоснованные предположения о величинах дис-
персий отклонений). На практике имеет смысл попробовать несколько
методов определения гетероскедастичности и способов ее корректи-
ровки (преобразований, стабилизирующих дисперсию).
Вопросы для самопроверки
1. В чем суть гетероскедастичности?
2. Какое из следующих утверждений верно, ложно или не определено:
а) вследствие гетероскедастичности оценки перестают быть эффективными и
состоятельными;
б) оценки и дисперсии оценок остаются несмещенными;
в) выводы по t- и F-статистикам являются ненадежными;
г) при наличии гетероскедастичности стандартные ошибки оценок будут за-
ниженными;
д) гетероскедастичность проявляется через низкое значение статистики Дар-
бина?Уотсона DW;
е) не существует общего теста для анализа гетероскедастичности;
ж) тест ранговой корреляции Спирмена основан на использовании t-
статистики;
з) тест Парка является частным случаем теста Глейзера;
и) использование метода взвешенных наименьших квадратов носит ограни-
ченный характер, т. к. для его использования необходимо знать дисперсии от-
клонений;


222
к) если в парной регрессии дисперсия случайных отклонений пропорцио-
нальна величине объясняющей переменной (х), то для получения эффектив-
ных оценок необходимо все наблюдаемые значения поделить на х.
3. Приведите аргументы в пользу графического теста, теста Парка и теста Глей-
зера.
4. Приведите схему теста Голдфелда?Квандта.
5. В чем суть метода взвешенных наименьших квадратов (ВНК)?
6. Объясните кратко, почему при наличии гетероскедастичности ВНК позволяет
получить более эффективные оценки, чем обычный МНК.
7. Есть основание считать, что в регрессии, построенной по квартальным дан-
ным, случайные отклонения в первых кварталах больше, нежели отклонения в
других кварталах. Как это можно проверить?

Упражнения и задачи
Пусть зависимость заработной платы (Y) от стажа работы (X) сотрудника вы-
1.
ражена следующим уравнением регрессии:
Y = ?0 + ?1X + ?D + ?,
где D ? фиктивная переменная, отражающая пол сотрудника. Как можно
проверить предположение о том, что пол сотрудника не влияет на диспер-
сию случайных отклонений ?i?

Приведены данные в условных единицах по доходам (Х) и расходам на не-
2.
продовольственные товары (Y) для тридцати домохозяйств:
X 26.2 33.1 42.5 47.0 48.5 49.0 49.1 50.9 52.4 53.2
Y 10.0 11.2 15.0 20.5 21.2 19.5 23.0 19.0 19.5 18.0

Х 54.0 54.8 59.0 61.3 62.5 63.1 64.0 66.2 70.0 71.5
Y 24.5 21.5 35.4 25.0 17.3 21.6 15.3 32.6 34.0 23.8

Х 73.2 75.4 76.0 80.6 81.2 83.3 92.0 95.5 103.2 110.4
Y 22.5 27.4 40.0 23.5 20.0 40.1 15.5 39.0 47.4 21.3
а) Определите по МНК оценки парного уравнения регрессии yi = b0+ b1xi+ ei.
б) Оцените качество построенного уравнения.
в) Проведите графический анализ остатков.
г) Примените для указанных статистических данных ВНК предположение,
2 22
что ? (ei) = ? xi .
д) Примените к полученным в п. а) результатам тест ранговой корреляции
Спирмена и тест Парка.
е) Определите, существенно ли повлияла гетероскедастичность на качество
оценок в уравнении, построенном по МНК.



223
Для предприятий некоторой отрасли анализируют зависимость заработной
3.
платы (Y) сотрудников в зависимости от масштаба (от количества сотрудни-
ков) предприятия (Х). Наблюдения по тридцати случайно отобранным пред-
приятиям представлены следующей таблицей:
Y X
75.5 75.5 77.5 78.5 80.0 81.0 100
80.5 82.0 84.5 85.0 85.5 86.5 200
85.5 88.5 90.0 91.0 95.0 96.0 300
93.0 93.5 97.5 99.0 102.5 105.0 400
102.0 105.5 107.0 110.5 115.0 118.5 500
а) Постройте уравнение регрессии Y на Х и оцените его качество.
б) Можно ли ожидать наличие гетероскедастичности в данном случае. Ответ
поясните.
в) Проверьте наличие гетероскедастичности, используя тест Голдфелда?
Квандта. Рекомендуется использовать разбиение, при котором k = 12.
г) Если предположить, что гетероскедастичность имеет место, и дисперсии
отклонений пропорциональны значениям Х, то какое преобразование вы
предложите, чтобы получить несмещенные, эффективные и состоятельные
оценки.
д) Постройте новое уравнение регрессии на основе преобразования, осуще-
ствленного в предыдущем пункте, и оцените его качество.
е) Сравните результаты, полученные в пунктах а) и д).

Пусть для эмпирического уравнения парной регрессии Y = b0 + b1X + e име-
4.
2 2
ет место следующее соотношение M(ei ) = ? xi. Какое преобразование мож-
но предложить, чтобы устранить проблему гетероскедастичности. Опишите
поэтапно предложенную схему.

Пусть для регрессии Y = b0 + b1X1 + b2X2 + e, оцениваемой по ежегодным
5.
данным (1971?1998), получены следующие результаты: сумма квадратов от-
2
клонений для данных 1971?1980 гг. равна S1 = ?ei = 15, для данных 1981?
2
1998 гг. эта сумма равна S2 = ?ei = 50. С помощью теста Голдфелда?Кванд-
та проверьте предположение о том, что дисперсия отклонений не постоянна
(в частности, что дисперсия претерпела изменение где-то в 1981 г.).

Анализируется объем инвестиций для вымышленной страны. По данным с
6.
1961 по 1990 г. построены два уравнения регрессии:
)
1) it = 52.5 + 0.275gnp t ? 0.63c t ,
2
(t) = (12.5) (10.2) (6.4) R = 0.98.
)
it c
1
+ 0.27 ? 0.62 t ,
= 50.7
2)
gnp t gnp t gnp t
2
(t) (13.3) (9.3) (6.9) R = 0.87,

224
где GNP ? валовой национальный продукт; С ? совокупное частное потреб-
ление; I ? объем инвестиций; gnpt, ct, it ? значения соответствующих показа-
телей в момент времени t.
а) Что могло послужить причиной преобразования первого уравнения во
второе?
б) Если причиной преобразования являлась гетероскедастичность, то какое
предположение о дисперсии отклонений являлось основанием для данного
преобразования?
в) Можно ли сравнить качества обоих уравнений на основе коэффициентов
детерминации? Ответ поясните.
г) Должно ли преобразованное уравнение проходить через начало коорди-
нат?

Выдвигается предположение, что средняя заработная плата наемных рабо-
7.
чих пропорциональна их стажу. Для анализа данного утверждения обследу-
ются по 20 рабочих восьми категорий стажа. Получены следующие стати-
стические данные:
[0, 5) [5, 10) [10, 15) [15, 20) [20, 25) [25, 30) [30, 35) [35, 40]
Стаж
З/п 10000 12500 14300 18700 25400 29000 32000 34300
а) Постройте эмпирическое уравнение регрессии, в котором заработная пла-
та является зависимой переменной, а стаж работы ? объясняющей перемен-
ной (уравнение строится в предположение, что дисперсии отклонений по-
стоянны).
б) Оцените качество построенной регрессии.
в) Есть ли основания считать, что для данной регрессионной модели весьма
вероятна гетероскедастичность? Если да, то почему?
г) Предполагая, что дисперсия отклонений пропорциональна трудовому
стажу, постройте на основании тех же данных уравнение по методу взве-
шенных наименьших квадратов (ВНК).
д) Предполагая, что дисперсия отклонений пропорциональна квадрату вели-
чины трудового стажа, постройте по ВНК соответствующее уравнение
регрессии.
е) Какое из трех предположений относительно дисперсии отклонений наи-
более реалистично с вашей точки зрения?

Исследуется зависимость между доходом (Х) домохозяйства и его расходом
8.
(Y) на продукты питания. Выборочные данные по 40 домохозяйствам пред-
ставлены ниже.
X 25.5 26.5 27.2 29.6 35.7 38.6 39.0 39.3 40.0 41.9 42.5 44.2 44.8 45.5
Y 14.5 11.3 14.7 10.2 13.5 9.9 12.4 8.6 10.3 13.9 14.9 11.6 21.5 10.8
Х 45.5 48.3 49.5 52.3 55.7 59.0 61.0 61.7 62.5 64.7 69.7 71.2 73.8 74.7
Y 13.8 16.0 18.2 19.1 16.3 17.5 10.9 16.1 10.5 10.6 29.0 8.2 14.3 21.8


225
Х 75.8 76.9 79.2 81.5 82.4 82.8 83.0 85.9 86.4 86.9 88.3 89.0
Y 26.1 20.0 19.8 21.2 29.0 17.3 23.5 22.0 18.3 13.7 14.5 27.3
а) Постройте эмпирическое уравнение регрессии Y на Х.
б) Вычислите отклонения ei.
в) Проведите анализ модели на гетероскедастичность по тесту ранговой
корреляции Спирмена.
г) Проведите графический анализ отклонений и выдвиньте предположение о
зависимости дисперсии отклонений от значений Х.
д) На основании предыдущего пункта постройте новое уравнение регрессии,
используя для этого ВНК.

Проводится анализ зависимости средней заработной платы от средней про-
9.
изводительности на предприятиях различного масштаба. Проведенное об-
следование нашло отражение в следующей таблице.
Количество сотрудников Средняя Средняя Стандартное
предприятия, производительность, з/п, отклонение з/п,
?i ($)
n X ($) Y ($)

<< Предыдущая

стр. 39
(из 65 стр.)

ОГЛАВЛЕНИЕ

Следующая >>