<< Предыдущая

стр. 35
(из 65 стр.)

ОГЛАВЛЕНИЕ

Следующая >>

Если все эти показатели удовлетворительны, то данная модель
может быть предложена для описания исследуемого реального про-
цесса. Если же какая-либо из описанных выше характеристик не явля-
ется удовлетворительной, то есть основания сомневаться в качестве
данной модели (неправильно выбрана функциональная форма уравне-
ния; не учтена важная объясняющая переменная; имеется объясняю-
щая переменная, не оказывающая значимого влияния на зависимую
переменную).
Для более детального анализа адекватности модели может быть
предложено исследование остаточного члена модели.
7.7.4. Исследование остаточного члена модели
Графическое представление поведения остаточного члена e (т. е.
графическое представление случайных отклонений ei, i = 1, 2, ..., n)
позволяет прежде всего проанализировать наличие автокорреляции и
гетероскедастичности (непостоянства дисперсий отклонений). Данные
проблемы будут обсуждены в следующих главах.
ei ei




i i
0 0

Функциональная Случайная
связь связь

а б
Рис. 7.4
Кроме того, с помощью графического представления отклонений
ei может быть также обнаружена неправильная спецификация уравне-
197
ния. Для этого строится график зависимости величин отклонений e от
номера наблюдения i. Если зависимость, изображенная на этом графи-
ке, имеет регулярный (неслучайный) характер (рис. 7.4, а), то это оз-
начает, что исследуемое уравнение регрессии неверно специфициро-
вано.
Существует и ряд других тестов обнаружения ошибок специфи-
кации, среди которых можно выделить:
1. Тест Рамсея RESET (Regression specification error test).
2. Тест (критерий) максимального правдоподобия (The
Likelihood Ratio test).
3. Тест Валда (The Wald test).
4. Тест множителя Лагранжа (The Lagrange multiplier test).
5. Тест Хаусмана (The Hausman test).
6. Box–Cox преобразование (Box?Cox trasformation).
Подробное описание данных тестов выходит за рамки вводного
курса. Отметим, что суть данных тестов состоит либо в осуществле-
нии преобразований случайных отклонений, либо масштаба зависи-
мой переменной с тем, чтобы можно было сравнить начальное и пре-
образованное уравнения регрессии на основе известного критерия.
Например, суть теста Рамсея (RESET) состоит в следующем:
а) Оценивают линейную регрессию между переменными задачи
Y = b 0 + b1 X 1 + b 2 X 2 + L + b m X m + e
)
? Y = a 0 + a 1 X1 + L + a m X m .
)
б) Анализируют графически зависимость ei( y i ). Так, если она
может быть представлена явной функциональной зависимостью e =
)
= f( Y ), то данную зависимость вводят в исходное уравнение регрес-
сии и затем оценивают уравнение
)
Y = a 0 + a 1X 1 + L + a m X m + f( Y. ) + e .
в) Сравнивают коэффициенты детерминации для начального и
вновь построенного уравнений регрессии на основе следующей F-ста-
тистики:
R 2 ? R1 n ? k
2
F= 2 2 ? . (7.46)
1? R2 r
Здесь n – число наблюдений, k – число параметров в новой моде-
ли, r – число новых регрессоров (одночленов уравнения). Статистика
F имеет распределение Фишера с числами степеней свободы ?1 = r, ?2

198
= = n – k. Если F-статистика окажется статистически значимой, то это
означает, что исходное уравнение регрессии было неправильно спе-
цифицировано.
В качестве примера приведем анализ зависимости суммарных из-
держек от объема выпуска. В общем случае такая зависимость выра-
жается кубической функцией:
y i = в 0 + в 1x i + в 2 x i2 + в 3 x 3 + e i . (7.47)
i

Пусть на начальном этапе эта же зависимость моделируется ли-
нейной функцией:
y i = г 0 + г 1x i + e i . (7.48)
Модель (7.48), скорее всего, будет неудовлетворительной по ряду ста-
тистических показателей. В частности, изменение отклонений еi будет
носить системный характер, который найдет отражение на графике e =
)
= f( Y ), вероятный вид которого приведен на рис. 7.5.
e




)
Y
0




Рис. 7.5

Ломаная линия графика в большой степени соответствует кубиче-
ской функции. Поэтому в модель (7.48) целесообразно ввести два до-
) )
полнительных регрессора y i2 и y 3 : i
) )
y i = л 0 + л1x i + л 2 y i2 + л 3 y 3 + e i . (7.49)
i

Сравнивают коэффициенты детерминации R 2 и R 1 для уравнений
2
2
(7.49) и (7.48) на основе F-статистики (7.46) (при этом k = 4; r = 2). Ес-
ли Fнабл. > Fкр. = F?;2;n?4, тогда есть основания считать, что модель (7.48)
неверно специфицирована.


199
К сожалению, тест Рамсея не указывает напрямую специфика-
цию модели лучшую, чем исследуемая. Поэтому подбор лучшей спе-
цификации требует определенных усилий.
Дополнением либо альтернативой к тесту Рамсея может слу-
жить тест множителя Лагранжа, суть которого легко пояснить на
предыдущем примере.
)
По виду зависимости e = f( Y ) высказывается предположение о
необходимых направлениях уточнения модели. В нашем примере ли-
нейная зависимость должна быть заменена кубической, что потребует
введения двух дополнительных регрессоров x i2 и x 3 . Следовательно,
i
строится модель (7.47). Для вновь построенной модели определяется
коэффициент детерминации R2. Доказано, что при большом объеме
выборки n произведение nR2 имеет ?2-распределение с числом степе-
ней свободы r, равным числу добавленных регрессоров модели. В на-
шем примере nR2 ? ч 2 (при n > ?). Построенная статистика сравни-
2

вается с соответствующей критической точкой ч 2 . Если nR2 > ч 2 , то
r r
первоначально выбранная модель должна быть отклонена в пользу
вновь построенной.
Описание других методов выходит за рамки вводного курса и мо-
жет быть найдено в [ 6, 9].

7.8. Проблемы спецификации
Итак, стандартная схема анализа зависимостей состоит в осуще-
ствлении ряда последовательных процедур.
• Подбор начальной модели. Он осуществляется на основе экономи-
ческой теории, предыдущих знаний об объекте исследования, опы-
та исследователя и его интуиции.
• Оценка параметров модели на основе имеющихся статистических
данных.
• Осуществление тестов проверки качества модели (обычно исполь-
зуются t-статистики для коэффициентов регрессии, F-статистика
для коэффициента детерминации, статистика Дарбина–Уотсона для
анализа отклонений и ряд других тестов).
• При наличии хотя бы одного неудовлетворительного ответа по ка-
кому-либо тесту модель совершенствуется с целью устранения вы-
явленного недостатка.


200
• При положительных ответах по всем проведенным тестам модель
считается качественной. Она используется для анализа и прогноза
объясняемой переменной.
Однако необходимо предостеречь от абсолютизации полученного
результата. Проблема заключается в том, что даже качественная мо-
дель является подгонкой спецификации модели под имеющийся набор
данных. Поэтому вполне реальна картина, когда исследователи, обла-
дающие разными наборами данных, строят разные модели для объяс-
нения одной и той же переменной. Другой проблемой является ис-
пользование модели для прогнозирования значений объясняемой пе-
ременной. Иногда хорошие с точки зрения диагностических тестов
модели обладают весьма низкими прогнозными качествами.
Одним из главных направлений эконометрического анализа явля-
ется постоянное совершенствование моделей. Здесь следует отметить,
что какого-то глобального подхода, определяющего заранее возмож-
ные пути совершенствования, нет и, скорее всего, быть не может. Ис-
следователь должен помнить, что совершенной модели не существует.
В силу постоянно изменяющихся условий протекания экономических
процессов не может быть и постоянно качественных моделей. Новые
условия требуют пересмотра даже весьма устойчивых моделей.
До сих пор достаточно спорным является вопрос, как строить мо-
дели:
а) начинать с самой простой и постоянно усложнять ее;
б) начинать с максимально сложной модели и упрощать ее на ос-
нове проводимых исследований.
И тот и другой подход имеют как достоинства, так и недостатки.
Например, если следовать схеме а), то происходит обыкновенная под-
гонка модели под эмпирические данные. При теоретически более оп-
равданном подходе б) поиск возможных направлений совершенство-
вания модели зачастую сводится к полному перебору, что делает про-
водимый анализ неэффективным. Возможно также на этапах упроще-
ния модели отбрасывание объясняющих переменных, которые были
бы весьма полезны в упрощенной модели. В итоге, построение модели
является индивидуальным подходом к конкретной ситуации, опи-
рающимся на серьезные знания экономической теории и статистиче-
ского анализа.
При этом отметим, что при всех недостатках моделей принятие на
их основе решений приводит в целом к гораздо более высоким или

201
ка F имеет распределение Фишера с числами степеней свободы ?1 = r,
?2 = n – k. Если F-статистика окажется статистически значимой, то это
означает, что исходное уравнение регрессии было неправильно спе-
цифицировано.
В качестве примера приведем анализ зависимости суммарных из-
держек от объема выпуска. В общем случае такая зависимость выра-
жается кубической функцией:
y i = в 0 + в 1x i + в 2 x i2 + в 3 x 3 + e i . (7.47)
i

Пусть на начальном этапе эта же зависимость моделируется ли-
нейной функцией:
y i = г 0 + г 1x i + e i . (7.48)
Модель (7.48), скорее всего, будет неудовлетворительной по ряду ста-
тистических показателей. В частности, изменение отклонений еi будет
носить системный характер, который найдет отражение на графике e =
)
= f( Y ), вероятный вид которого приведен на рис. 7.5.
e




)
Y
0




Рис. 7.5

Ломаная линия графика в большой степени соответствует куби-
ческой функции. Поэтому в модель (7.48) целесообразно ввести два
) )
дополнительных регрессора y i2 и y 3 : i
) )
y i = л 0 + л1x i + л 2 y i2 + л 3 y 3 + e i . (7.49)
i

Сравнивают коэффициенты детерминации R 2 и R 1 для уравне-
2
2
ний (7.49) и (7.48) на основе F-статистики (7.46) (при этом k = 4; r = 2).
Если Fнабл. > Fкр. = F?;2;n?4, тогда есть основания считать, что модель
(7.48) неверно специфицирована.


199
К сожалению, тест Рамсея не указывает напрямую специфика-
цию модели лучшую, чем исследуемая. Поэтому подбор лучшей спе-
цификации требует определенных усилий.
Дополнением либо альтернативой к тесту Рамсея может слу-
жить тест множителя Лагранжа, суть которого легко пояснить на
предыдущем примере.
)
По виду зависимости e = f( Y ) высказывается предположение о
необходимых направлениях уточнения модели. В нашем примере ли-
нейная зависимость должна быть заменена кубической, что потребует
введения двух дополнительных регрессоров x i2 и x 3 . Следовательно,
i
строится модель (7.47). Для вновь построенной модели определяется

<< Предыдущая

стр. 35
(из 65 стр.)

ОГЛАВЛЕНИЕ

Следующая >>