<< Предыдущая

стр. 26
(из 44 стр.)

ОГЛАВЛЕНИЕ

Следующая >>

0.60
0.40
0.20
0.00
100


200


300


400


500


600


700


800


900
0




-0.20
-0.40
-0.60
-0.80
-1.00


Дисперсия оценок параметров линейной регрессии
Оценка дисперсии случайных отклонений отклика Y от линии
регрессии (необъясненная дисперсия) вычисляется по формуле:
1 N2 1N
? ek = N ? 2 ? ( yk ? atk ? b) 2
?=2

N ? 2 k =1
e
k =1
Вычисленные значения необъясненной дисперсии и соответст-
вующее с.к.о. равны:
? e2 = 0.098 ? e = 0.313
Оценка дисперсии параметров a и b выражаются формулами:
N

?x 2
? ? k
2 2
?a = ? b2 = ? k =1
2 e e
N N

? (x
? (x
N
? X )2 ? X )2
k k
k =1 k =1
Расчетные значения этих величин по выборке составляют:
? a = 2.2 ? 10 ?9 ? a = 4.7 ? 10 ?5
2


? b2 = 4.8 ? 10 ? 4 ? b = 2.2 ? 10 ? 2
Коэффициент детерминации
Качество линии регрессии характеризуется коэффициентом де-
терминации:

144
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 10. Применение МНК при изучении динамических рядов

N

?e 2
k
R2 = 1? k =1
N

?(y ? Y )2
k
k =1

В рассматриваемом случае эта величина равна R = 0.9348 . Так
2

как среднеквадратичные отклонения отклика Y и ошибок аппрок-
? e = 1 ? R 2 ? ? y , то получаем,
симации e связаны соотношением
что с.к.о. ошибок приблизительно в четыре раза меньше с.к.о. от-
клика: ? e = 0.255? y .

10.4. Статистические выводы о величине параметров рег-
рессии.
Необходимо убедиться, что значения параметров регрессии
значимо отличаются от нуля. Для проверки этого выдвигаются
гипотезы:
H0 : a = 0 H0 : b = 0
H1 : a ? 0 H1 : b ? 0
1) Примем величину уровня значимости
q = 0.05
2) Рассчитаем критерии проверки
a 0.005
ta = = = 106.4
? a 4.7 ? 10 ?5


b 4.402
tb = = = 200
? b 2.2 ? 10 ? 2
3) Правило принятия решения
Принять Н0 , если ? t1? q / 2, ? ? t ? t1? q / 2, ?
В противном случае принять Н1 , то есть Н1 принимается, когда
критерий проверки t попадает в критическую область
| t | > t1? q / 2, ? .
4) Расчет границ критической области



145
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 10. Применение МНК при изучении динамических рядов


t1? q / 2,? = СТЬЮДРАСПОБР (q, N ? 2) =
= СТЬЮДРАСПОБР (0.05, 814) = 1.96
5) Проверка гипотезы
Так как критерии проверки для обоих параметров регрессии
находятся в критической области, мы принимаем гипотезу Н1.
Это означает, что при заданном уровне значимости параметры
регрессии статистически значимо отличаются от нуля.
Статистические выводы о величине коэффициента детерми-
нации
Убедимся в том, что коэффициент детерминации значимо
отличается от нуля. Для проверки этого выдвигается гипотеза:
H0 : R2 = 0
H1 : R 2 > 0
1) Примем величину уровня значимости
q = 0.05
2) Рассчитаем критерий проверки
R2 0.9348
F= = = 11671
(1 ? R 2 ) /( N ? 2) (1 ? 0.9348) / 814
3) Правило принятия решения
Принять Н0 , если F ? F1? q , ? 1,? 2 .
В противном случае принять Н1 , то есть Н1 принимается, когда
критерий проверки F попадает в критическую область
F > F1? q , ? 1,? 2 .
F1? q , ? 1,? 2 - это квантиль F -распределения, соответствующая
? 1 = 1 степенями свободы для
уровню значимости q с
числителя и ? 2 = N ? 2 степенями свободы для знаменателя.
4) Расчет границ критической области
F1? q , ? 1,? 2 = FРАСПОБР(q,? 1 ,? 2 ) =
= FРАСПОБР(0.05, 1, 814) = 3.85
5) Проверка гипотезы
Так как критерий проверки для коэффициента детерминации
находится в критической области, мы принимаем гипотезу Н1.
146
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 10. Применение МНК при изучении динамических рядов


Это означает, что при заданном уровне значимости изменения
отклика y объясняются изменением фактора t .

10.5. Полоса неопределенности рассеяния эмпирических
данных относительно линии регрессии.
Дисперсия случайной величины y = f + e в произвольной точке t
вычисляется по формуле:
? ?
? ?
(t ? T ) 2 ?
2? 1
? 2 +e = ? e ? 1+ + N
?N ?
f

? (t k ? T ) 2 ?
?
? ?
k =1
где
? e = 0.313 N = 816 T = 407.5
N

? (t ? T ) 2 = 45 278 140
k
k =1
В данном случае на большом диапазоне изменения t без
существенной потери точности вторым и третьим слагаемым в
скобках можно пренебречь, то есть ? f + e ? ? e .
2 2


?y = 2t1?q / 2, ? ? f +e
Величина называется шириной полосы
неопределенности. Зададимся доверительной вероятностью
P = 0.95 ( q = 0.05 ). Тогда квантиль распределения Стьюдента
равна
t1? q / 2,? = СТЬЮДРАСПОБР (q,? ) =
= СТЬЮДРАСПОБР (0.05, 814) = 1.96
Ширина полосы неопределенности составит
?y = 2 ? 1.96 ? 0.313 = 1.226
Следовательно, с вероятностью P = 0.95 случайная величина
y = f + e будет лежать в пределах:
f ? ?y / 2 ? y ? f + ?y / 2
(0.005 t + 4.402) ? 0.613 ? y ? (0.005 t + 4.402) + 0.613
Эмпирическая зависимость и ее полоса неопределенности изобра-
жены на рисунке:
147
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 10. Применение МНК при изучении динамических рядов


Э мпирическая зав исимость и полоса неопределенности

10.00
9.00

8.00
7.00
6.00
5.00

4.00
3.00
100


200


300


400


500


600


700


800


900
0




Приведем также график ошибок МНК и его полосу неопреде-

<< Предыдущая

стр. 26
(из 44 стр.)

ОГЛАВЛЕНИЕ

Следующая >>