<< Предыдущая

стр. 22
(из 43 стр.)

ОГЛАВЛЕНИЕ

Следующая >>



H 1 : S12 > S 2
2

2) Принятая величина уровня значимости
125
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 8. Регрессионный анализ


q = 0.05 или q = 0.01
3) Критерий проверки
S12
F= 2
S2
4) Правило принятия решения
Принять Н0 , если F ? F1? q , ? 1, ? 2
В противном случае принять Н1 , то есть Н1 принимается,
когда критерий проверки F попадает в критическую об-
ласть F > F1? q , ? 1, ? 2 .
5) Проверка гипотезы
- Если F ? F1? q , ? 1, ? 2 , то критерий проверки F не попадает в
критическую область и мы принимаем гипотезу Н0 . Это оз-
начает, что при заданном уровне значимости дисперсия
ошибок уравнения регрессии постоянна.
- В противном случае мы принимаем гипотезу Н1 . Это озна-
чает, что при заданном уровне значимости уравнении рег-
рессии не является наилучшим приближением исходных
данных.
Непостоянство дисперсии ошибок МНК возникает как правило в
том случае, если неправильно выбран вид математической модели
зависимости фактора Х и отклика Y. Например, если нелинейную
зависимость пытаются аппроксимировать линейной функцией.
Проверка гипотезы о том, что ошибки независимы
Одним из предполагаемых свойств уравнения регрессии
y = ax + b + e является то, что ошибки е независимы между
собой. На практике проверяется не независимость, а
некоррелированность этих величин, которая является
необходимым, но недостаточным признаком независимости.
При этом проверяется некоррелированность не любых, а
соседних величин ошибок, которые можно получить, если ис-
ходная выборка ( x k , y k ) k = 1,..., N упорядочена по возраста-
нию величины х.
Рассмотрим например корреляцию ошибок, сдвинутых друг
относительно друга на один шаг.
126
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 8. Регрессионный анализ


e1 e2 e3 K e k K eN
e1 e2 K ek ?1 K e N ?1 eN
Тогда значение выборочного коэффициента корреляции между вы-
боркой (e2 , e3 ,..., e N ) и выборкой (e1 , e2 ,..., e N ?1 ) запишется в
виде:
N ?1

? (e ? e)(ek +1 ? e)
k
? k , k +1 = k =1
N ?1 N ?1

? (e ? (e
? e) ? e) 2
2
k +1
k
k =1 k =1
Эту величину называют еще коэффициентом автокорреляции
первого порядка. Так как согласно допущениям МНК
математическое ожидание ошибки равно нулю, то формулу можно
упростить:
N ?1

?e e k k +1
? k , k +1 = k =1
N ?1 N ?1

?e ?e 2 2
k +1
k
k =1 k =1
Мы можем считать, что автокорреляция отсутствует, если
выборочный коэффициент автокорреляции незначимо отличается
от нуля, то есть в данном случае мы должны проверить гипотезу:
H 0 : ? k , k +1 = 0
H 1 : ? k , k +1 ? 0
В случае однофакторной линейной регрессии случайная
? k , k +1
t = N ?3?
величина будет подчиняться
2
1 ? ? k , k +1
распределению Стьюдента с ? = ( N ? 1) ? 2 степенями свободы.
Поэтому гипотеза будет проверяться следующим образом:
1) Гипотеза
H 0 : ? k , k +1 = 0
H 1 : ? k , k +1 ? 0
127
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 8. Регрессионный анализ


2) Принятая величина уровня значимости
q = 0.05 или q = 0.01
3) Критерий проверки
? k , k +1
t = N ?3?
2
1 ? ? k , k +1
4) Правило принятия решения
Принять Н0 , если ? t1? q / 2, ? ? t ? t1? q / 2, ? .
В противном случае принять Н1 , то есть Н1 принимается,
когда критерий проверки t попадает в критическую область
| t | > t1? q / 2, ? .
5) Проверка гипотезы
- Если ? t1? q / 2, ? ? t ? t1? q / 2, ? , то критерий проверки t не попа-
дает в критическую область и мы принимаем гипотезу Н0 .
Это означает, что при заданном уровне значимости выбо-
рочный коэффициент автокорреляции первого порядка
? k ,k +1 статистически незначимо отличается от нуля. Следо-
вательно, автокорреляция первого порядка ошибок МНК от-
сутствует.
- В противном случае мы принимаем гипотезу Н1 . Это может
означать, что нужно принять другую аналитическую модель
зависимости между переменными Х и Y.

8.14. Сведение нелинейной функциональной зависимости к
линейной путем преобразования данных.
До сих пор мы обсуждали линейную зависимость между
фактором Х и откликом Y. Когда истинная взаимосвязь между
ними носит нелинейный характер, в ряде случаев ее можно
свести к линейной путем соответствующего преобразования
данных. После этого к преобразованным данным может быть
применена линейная регрессия. Преобразованные переменные и
)
параметры мы будем отмечать символом ? (например x ).
В этом параграфе мы рассмотрим несколько наиболее
употребительных видов нелинейной зависимости.

128
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 8. Регрессионный анализ


1) Экспоненциальная функция y = be ax
Экспоненциальная функция используется, когда при увели-
чении фактора Х отклик Y растет (a > 0) или снижается
(a < 0) с постоянной относительной скоростью.
)
) ))
y = ax + b
Приведение к линейной зависимости
осуществляется путем следующего преобразования данных:
)
) ) )
y = ln( y ) x=x a=a b = ln(b)

2) Логарифмическая функция y = b + a ln(x)
Логарифмическая функция используется, когда при увели-
чении фактора Х отклик Y растет (a > 0) или снижается
(a < 0) с уменьшающейся скоростью при отсутствии
предельно возможного значения. Преобразование данных:
)
) ) )
y=y x = ln( x) a=a b =b

3) Степенная функция y = bx a
Степенная функция используется когда при увеличении
фактора Х отклик Y растет или снижается с разной мерой
пропорциональности. Преобразование данных:
)
) ) )
y = ln( y ) x = ln( x) a=a b = ln(b)

1
4) Логистическая функция y =
1 + e ( x ?b ) / a
Логистическая кривая имеет вид положенной на бок латин-
ской буквы S. Она описывает случай когда при увеличении
фактора Х отклик Y изменяется (снижается при a > 0 или
растет при a < 0 ) в пределах от 0 до 1. При этом изменения
происходят при x < b с увеличивающейся скоростью и при
x > b с уменьшающейся скоростью. Преобразование
данных:
)
) ) )
y = ln(1 / y ? 1) x=x a = 1/ a b = ?b / a

a
5) Гиперболическая функция y = c +
x+b
129
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 8. Регрессионный анализ


Во многих случаях для аппроксимации нелинейной зависи-
мости очень удобно использовать гиперболу, однако зачас-
тую об этом трудно догадаться. Дело в том, что мы легко
узнаем только простую гиперболу, асимптотами которой
являются оси координат, то есть y = a / x . Если эта гипер-
бола сдвинута вдоль одной из осей или вдоль обеих осей, то
ее как правило не узнают.
Проверка того, является ли данная кривая гиперболой со
сдвигом только вдоль оси х, то есть y = a /( x + b) , прово-
дится путем следующего преобразования данных:
)
) ) )
y = 1/ y x=x a = 1/ a b = b/a
Проверка того, является ли данная кривая гиперболой со
сдвигом только вдоль оси у, то есть y = c + a / x , проводит-
ся путем преобразования данных:
)
) ) )
y=y x = 1/ x a=a b =c
Особенно сложным является случай, когда гипербола сдви-
нута одновременно по обеим осям, то есть имеет вид
a
y =c+ . В этом случае нужно двигаться методом по-
x+b
следовательных приближений, то есть
- задавать ряд значений параметра b,
- вычислять значения 1 /( x + b) ,
- строить графики, где по оси абсцисс откладывать
1 /( x + b) , по оси ординат у,
- выбрать то значение параметра b, при котором график
наиболее близок к прямой линии.

8.15. Функция регрессии как комбинация нескольких функ-
ций.
На практике может оказаться, что функцию регрессии не-
возможно описать удовлетворительным образом ни линейной
зависимостью, ни любой из перечисленных в предыдущем пара-
графе нелинейных функций. Тогда стоит попытаться аппрокси-
мировать ее комбинацией этих функций. Делается это следую-
щим образом:
130
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 8. Регрессионный анализ


- В общем случае считаем, что зависимость между фактором
Х и откликом Y нелинейна. Тогда, используя результаты из
предыдущего параграфа, преобразуем исходную выборку
( x k , y k ), k = 1,..., N таким образом, чтобы в первом при-
ближении можно было считать, что связь между преобразо-
))
ванными данными ( x k , y k ), k = 1,..., N носит линейный ха-
рактер.
- Вычисляем параметры линейной регрессии.
Вычисляем ошибки МНК ek , k = 1,..., N .
-
- Проверяем свойства ошибок МНК. Если ошибки не удовле-
творяют допущениям МНК, то полученная аппроксимация
является слишком грубой.
- Дальнейшее уточнение модели можно сделать, если в каче-
стве зависимой переменной использовать полученные
ошибки, то есть выборка приобретает вид
) , e ), k = 1,..., N . Эту выборку необходимо обработать по
( xk k
той же схеме. Процесс продолжается до тех пор, пока на оп-
ределенном шаге ошибки не станут удовлетворять допуще-
ниям МНК. При этом надо помнить, что нельзя излишне пе-
реусложнять модель, и что полученные по модели результа-
ты должны разумным образом интерпретироваться.



<< Предыдущая

стр. 22
(из 43 стр.)

ОГЛАВЛЕНИЕ

Следующая >>