<< Предыдущая

стр. 25
(из 43 стр.)

ОГЛАВЛЕНИЕ

Следующая >>

май.79

мар.86
сен.65
янв.52




янв.93
Полулогарифмический график дает основания полагать, что тренд
логарифма цены закрытия можно в первом приближении описать
линейной функцией времени.
Для построения регрессионной модели в качестве фактора (не-
зависимой переменной) будем использовать номер месяца. При
этом первый месяц в выборке (январь 1932 года) получает номер 0,
последний месяц в выборке (декабрь 1999 года) получает номер
815, то есть t k = 0,...,815 . Объем выборки N = 816 точек.
Откликом (зависимой переменной) является логарифм цены
закрытия y k = ln( Pk ) . Эмпирическая зависимость отклика от фак-
тора приведена на рисунке:
Эмпирическая зависимость
10.00

9.00

8.00

7.00

6.00

5.00

4.00

3.00
100


200


300


400


500


600


700


800


900
0




142
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 10. Применение МНК при изучении динамических рядов


Оценка параметров линейной регрессии
Примем гипотезу о том, что связь фактора и отклика выражает-
ся линейной функцией f (t ) = at + b . Оценки параметров
линейной регрессии проводятся по формулам:
N

?t yk ? N ? T ? Y
k
a= b = Y ? a ?T
k =1
N

?t
2
? N ?T
2
k
k =1
где
1N 1N
T = ? tk Y = ? yk
N k =1 N k =1

Вычисленные значения параметров составляют:
a = 0.005, b = 4.402
Эмпирическая зависимость и линейная аппроксимация изобра-
жены на рисунке:
Эмпирическая зависимость и линейная аппроксимация

10.00
9.00
8.00
7.00
6.00
5.00
4.00
3.00
100


200


300


400


500


600


700


800


900
0




При этом график ошибок аппроксимации
ek = y k ? at k ? b = y k ? 0.005 t k ? 4.402
имеет вид:



143
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 10. Применение МНК при изучении динамических рядов


Ошибки линейной аппроксимации
1.00
0.80
0.60
0.40
0.20
0.00
100


200


300


400


500


600


700


800


900
0




-0.20
-0.40
-0.60
-0.80
-1.00


Дисперсия оценок параметров линейной регрессии
Оценка дисперсии случайных отклонений отклика Y от линии
регрессии (необъясненная дисперсия) вычисляется по формуле:
1 N2 1N
? ek = N ? 2 ? ( yk ? atk ? b) 2
?=2
e
N ? 2 k =1 k =1
Вычисленные значения необъясненной дисперсии и соответст-
вующее с.к.о. равны:
? e2 = 0.098 ? e = 0.313
Оценка дисперсии параметров a и b выражаются формулами:
N

?x 2
? ? k
2 2
?a = ? b2 = ? k =1
2 e e
N N
N
? (x
? (x ? X )2 ? X )2
k k
k =1 k =1
Расчетные значения этих величин по выборке составляют:
? a = 2.2 ? 10 ?9 ? a = 4.7 ? 10 ?5
2


? b2 = 4.8 ? 10 ? 4 ? b = 2.2 ? 10 ? 2
Коэффициент детерминации
Качество линии регрессии характеризуется коэффициентом де-
терминации:

144
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 10. Применение МНК при изучении динамических рядов

N

?e 2
k
R2 = 1? k =1
N

?(y ? Y )2
k
k =1

В рассматриваемом случае эта величина равна R = 0.9348 . Так
2

как среднеквадратичные отклонения отклика Y и ошибок аппрок-
? e = 1 ? R 2 ? ? y , то получаем,
симации e связаны соотношением
что с.к.о. ошибок приблизительно в четыре раза меньше с.к.о. от-
клика: ? e = 0.255? y .

10.4. Статистические выводы о величине параметров рег-
рессии.
Необходимо убедиться, что значения параметров регрессии
значимо отличаются от нуля. Для проверки этого выдвигаются
гипотезы:
H0 : a = 0 H0 : b = 0
H1 : a ? 0 H1 : b ? 0
1) Примем величину уровня значимости
q = 0.05
2) Рассчитаем критерии проверки
a 0.005
ta = = = 106.4
? a 4.7 ? 10 ?5


b 4.402
tb = = = 200

<< Предыдущая

стр. 25
(из 43 стр.)

ОГЛАВЛЕНИЕ

Следующая >>