<< Предыдущая

стр. 27
(из 65 стр.)

ОГЛАВЛЕНИЕ

Следующая >>

? 1 x1 ? (xi2 ? x2 )2 + x2 ? (xi1 ? x1 )2 ? 2x1x2 ? (xi1 ? x1 )(xi2 ? x2 ) ? 2
2 2
S20 =? + ? ?S ,
b 2 2 2
? (xi1 ? x1 ) ? (xi2 ? x2 ) ? (? (xi1 ? x1 )(xi2 ? x2 ))
?n ?
2
? (x i2 ? x 2 )
?S2
S21 = ?
b 2 2 2
? (x i1 ? x1 ) ? (x i2 ? x 2 ) ? ( ? (x i1 ? x1 )(x i2 ? x 2 ))
S2
S21 = , (6.24)
b 2 2
? (x i1 ? x1 ) ? (1 ? r12 )
2
? (x i1 ? x1 )
?S2
S2 2 = ?
b 2 2 2
? (x i1 ? x1 ) ? (x i2 ? x 2 ) ? ( ? (x i1 ? x1 )(x i2 ? x 2 ))
S2
S2 2 = ,
b
(x i2 ? x 2 ) 2 ? (1 ? r12 )
2
?

S b0 = S 20 , Sb1 = S21 , Sb2 = S22 .
b b b

Здесь r12 = rx1x 2 ? выборочный коэффициент корреляции между
объясняющими переменными Х1 и Х2.
Ковариация между коэффициентами рассчитывается по формуле:
? r12 ? S2
Cov(b1, b2) = . (6.25)
2 2 2
(1 ? r12 ) ? (x i1 ? x1 ) (x i2 ? x 2 )

151
6.4. Интервальные оценки коэффициентов
теоретического уравнения регресcии
По аналогии с парной регрессией (см. параграф 5.4) после опре-
деления точечных оценок bj коэффициентов ?j (j = 0, 1, …, m) теоре-
тического уравнения регрессии могут быть рассчитаны интервальные
оценки указанных коэффициентов. Для построения интервальной
оценки коэффициента ?j строится t-статистика
bj ?в j
t= , (6.26)
Sb j
имеющая распределение Стьюдента с числом степеней свободы ? =
= n ? m ? 1 (n ? объем выборки, m ? количество объясняющих пере-
менных в модели).
Пусть необходимо построить 100(1 ? ?)%-ный доверительный
интервал для коэффициента ?j. Тогда по таблице критических точек
распределения Стьюдента по требуемому уровню значимости ? и
числу степеней свободы ? находят критическую точку t б ,
, n ? m ?1
2
удовлетворяющую условию
P( | t | < t б ) = P( ? t б < t < tб )=1??. (6.27)
, n ? m ?1
, n ? m ?1 , n ? m ?1
2
2 2
Подставляя (6.26) в (6.27), получаем
bj ? в j
P( ? t б < < tб ) = 1? б ,
Sb j
, n ? m ?1 , n ? m ?1
2 2

или после преобразования

P( b j ? t б ? Sb j < в j < b j + t б ? Sb j ) = 1 ? б . (6.28)
, n ? m ?1 , n ? m ?1
2 2
Напомним, что S b j рассчитывается по формуле
n
2
? ei
S b j = S ? z ?jj = ? z ?jj .
i =1
(6.29)
n ? m ?1
Таким образом, доверительный интервал, накрывающий с надеж-
ностью (1 ? ?) неизвестное значение параметра ?j, определяется нера-
венством

152
bj ? tб ? Sb j < в j < b j + t б ? Sb j . (6.30)
, n ? m ?1 , n ? m ?1
2 2

Не вдаваясь в детали, отметим, что по аналогии с парной регрес-
сией (см. раздел 5.5) может быть построена интервальная оценка для
среднего значения предсказания:
) ) ) )
T
Yp ? t б ? S(Yp ) < M(Yp X p ) < Yp + t б ? S(Yp ) . (6.31)
,n ? m ?1 ,n ? m ?1
2 2
В матричной форме это неравенство имеет вид:
) )
? S XT (XT X)?1 Xp < M(Y XT ) < Yp + t б ? S XT (XT X)?1 Xp .
Yp ? t б p p p p
,n?m?1 ,n?m?1
2 2
(6.32)

6.5. Анализ качества эмпирического уравнения
множественной линейной регрессии
Построение эмпирического уравнения регрессии является на-
чальным этапом эконометрического анализа. Первое же построенное
по выборке уравнение регрессии очень редко является удовлетвори-
тельным по тем или иным характеристикам. Поэтому следующей
важнейшей задачей эконометрического анализа является проверка ка-
чества уравнения регрессии. В эконометрике принята устоявшаяся
схема такой проверки (по крайней мере, на начальной стадии). Это
нашло отражение практически во всех современных эконометриче-
ских пакетах.
Проверка статистического качества оцененного уравнения рег-
рес- сии проводится по следующим направлениям:
• проверка статистической значимости коэффициентов уравнения
регрессии;
• проверка общего качества уравнения регрессии;
• проверка свойств данных, выполнимость которых предполагалась
при оценивании уравнения (проверка выполнимости предпосылок
МНК).

6.6. Проверка статистической значимости
коэффициентов уравнения регрессии
Как и в случае парной регрессии (см. раздел 5.3, формула (5.16)),
статистическая значимость коэффициентов множественной линейной


153
регрессии с m объясняющими переменными проверяется на основе
t-статистики:
bj
t= (6.33)
,
Sb j
имеющей в данной ситуации распределение Стьюдента с числом сте-
пеней свободы ? = n ? m ? 1 (n ? объем выборки). При требуемом уро-
вне значимости ? наблюдаемое значение t-статистики сравнивается с
критической точкой t б распределения Стьюдента.
, n ? m ?1
2
Если ?t? > t б , то коэффициент bj считается статистически
, n ? m ?1
2
значимым.
В противном случае (?t? < t б ) коэффициент bj считается
, n ? m ?1
2
статистически незначимым (статистически близким к нулю). Это оз-
начает, что фактор Xj фактически линейно не связан с зависимой пе-
ременной Y. Его наличие среди объясняющих переменных не оправ-
дано со статистической точки зрения. Не оказывая сколь-нибудь серь-
езного влияния на зависимую переменную, он лишь искажает реаль-
ную картину взаимосвязи. Поэтому после установления того факта,
что коэффициент bj статистически незначим, рекомендуется исклю-
чить из уравнения регрессии переменную Xj. Это не приведет к суще-
ственной потере качества модели, но сделает ее более конкретной.
Зачастую строгая проверка значимости коэффициентов заменяет-
ся простым сравнительным анализом.
• Если ?t? < 1 ( bj < Sb j ), то коэффициент статистически незначим.
• Если 1 < ?t? < 2 ( bj < 2Sb j ), то коэффициент относительно значим.
В данном случае рекомендуется воспользоваться таблицами.
• Если 2 < ?t? < 3, то коэффициент значим. Это утверждение явля-
ется гарантированным при числе степеней ? > 20 и ? ? 0.05 (см.
таблицу критических точек распределения Стьюдента).
• Если ?t? > 3, то коэффициент считается сильно значимым. Вероят-
ность ошибки в данном случае при достаточном числе наблюде-
ний не превосходит 0.001.




154
6.7. Проверка общего качества уравнения регрессии
После проверки значимости каждого коэффициента регрессии
обычно проверяется общее качество уравнения регрессии. Для этой
цели, как и в случае парной регрессии, используется коэффициент
детерминации R2, который в общем случае рассчитывается по форму-
ле:
2
? ei
2
R =1? . (6.34)
2
? (yi ? y )
Суть данного коэффициента как доли общего разброса значений
зависимой переменной Y, объясненного уравнением регрессии, по-
дробно рассмотрена в разделе 5.6. Как отмечалось, в общем случае
0 ? R2 ? 1. Чем ближе этот коэффициент к единице, тем больше урав-
нение регрессии объясняет поведение Y. Поэтому естественно жела-
ние построить регрессию с наибольшим R2.
Для множественной регрессии коэффициент детерминации явля-
ется неубывающей функцией числа объясняющих переменных. До-
бавление новой объясняющей переменной никогда не уменьшает зна-
чение R2. Действительно, каждая следующая объясняющая перемен-
ная может лишь дополнить, но никак не сократить информацию, объ-
ясняющую поведение зависимой переменной. Это уменьшает (в худ-
шем случае не увеличивает) область неопределенности в поведении Y.
Иногда при расчете коэффициента детерминации для получения
несмещенных оценок в числителе и знаменателе вычитаемой из еди-
ницы дроби делается поправка на число степеней свободы. Вводится
так называемый скорректированный (исправленный) коэффициент
детерминации:
2
? e i /( n ? m ? 1)
2
R = 1? . (6.35)
2
? ( y i ? y) /(n ? 1)
Можно заметить, что ? ( y i ? y) 2 /(n ? 1) является несмещенной
оценкой общей дисперсии ? дисперсии отклонений значений перемен-
ной Y от y . При этом число ее степеней свободы равно (n ?1). Одна
степень свободы теряется при вычислении y .
2
? e i /( n ? m ? 1) является несмещенной оценкой остаточной диспер-
сии ? дисперсии случайных отклонений (отклонений точек наблюде-
ний от линии регрессии). Ее число степеней свободы равно (n?m?1).
Потеря (m + 1) степени свободы связана с необходимостью решения

155
системы (m + 1) линейного уравнения при определении коэффициен-
тов эмпирического уравнения регрессии. Попутно заметим, что не-
смещенная оценка объясненной дисперсии (дисперсии отклонений то-
чек на линии регрессии от y ) имеет число степеней свободы, равное
разности степеней свободы общей дисперсии и остаточной дисперсии:
(n ? 1) ? (n ? m ? 1) = m.
Соотношение (6.35) может быть представлено в следующем виде:
n ?1
R 2 = 1 ? (1 ? R 2 ) . (6.36)
n ? m ?1
Из (6.36) очевидно, что R 2 < R 2 для m > 1. С ростом значения m
скорректированный коэффициент детерминации R 2 растет медлен-
нее, чем (обычный) коэффициент детерминации R2. Другими словами,
он корректируется в сторону уменьшения с ростом числа объясняю-
щих переменных. Нетрудно заметить, что R 2 = R 2 только при R2 = 1.
R 2 может принимать отрицательные значения (например, при R2 = 0).
Доказано, что R 2 увеличивается при добавлении новой объяс-
няющей переменной тогда и только тогда, когда t-статистика для этой
переменной по модулю больше единицы. Поэтому добавление в мо-
дель новых объясняющих переменных осуществляется до тех пор, по-
ка растет скорректированный коэффициент детерминации.
Обычно в эконометрических пакетах приводятся данные как по
R2, так и по R 2 , являющиеся суммарными мерами общего качества
уравнения регрессии. Однако не следует абсолютизировать значи-
мость коэффициентов детерминации. Существует достаточно приме-
ров неправильно специфицированных моделей, имеющих высокие ко-
эффициенты детерминации (обсудим данную ситуацию позже). По-
этому коэффициент детерминации в настоящее время рассматривается
лишь как один из ряда показателей, который нужно проанализиро-
вать, чтобы уточнить строящуюся модель.
6.7.1. Анализ статистической значимости
коэффициента детерминации
После оценки индивидуальной статистической значимости каж-
дого из коэффициентов регрессии обычно анализируется совокупная
значимость коэффициентов. Такой анализ осуществляется на основе
проверки гипотезы об общей значимости ? гипотезы об одновремен-


156
ном равенстве нулю всех коэффициентов регрессии при объясняющих
переменных:

<< Предыдущая

стр. 27
(из 65 стр.)

ОГЛАВЛЕНИЕ

Следующая >>