<< Предыдущая

стр. 20
(из 43 стр.)

ОГЛАВЛЕНИЕ

Следующая >>

N

? (x ? X )( yk ? Y )
?y
k
=?
a1 = k =1

?x
N

? (x ? X )2
k
k =1
N

?(x ? X )( y k ? Y )
?x
k
=?
a2 = k =1

?y
N

?(y ? Y )2
k
k =1

Тангенс угла наклона функции Y = a1 X + b1 к оси х равен
a1 = ? ? (? y / ? x ) , а тангенс угла наклона функции X = a 2Y + b2
к оси х равен 1 / a2 = (1 / ? ) ? (? y / ? x ) . Это разные величины, сле-
довательно линии регрессии Y на Х и Х на Y - это разные прямые.
Они совпадают только тогда, когда модуль коэффициента
корреляции | ? |= 1 , то есть когда между переменными Х и Y
существует строгая функциональная зависимость.
В несовпадении линий регрессии Y на Х и Х на Y и состоит
необратимость решений МНК, то есть нельзя использовать
величины ( a 2 , b2 ) для вычисления величин ( a1 , b1 ) и наоборот:
1 b2 1 b1
a1 ? b1 ? ? a2 ? b2 ? ?
a2 a2 a1 a1
114
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 8. Регрессионный анализ


8.9. Статистические выводы о величине параметров одно-
факторной линейной регрессии.
Полученные в этой главе формулы для выборочных
коэффициентов однофакторной линейной регрессии дают лишь
оценки истинных значений этих коэффициентов.
Введем обозначения:
- истинные значения параметров линейной регрессии (a, b) ,
- выборочные значения параметров линейной регрессии
( a, b) ,
2 2
выборочные дисперсии параметров (? a ,? b ) .
-

Выборочное распределение параметров линейной регрессии
При анализе коэффициентов регрессии считают, что
a?a b?b
случайные величины t a = и tb = подчиняются
?a ?b
распределению Стьюдента с ? = ( N ? 2) степенями свободы,
где N - объем выборки. В этих формулах:
N

? (x ? X )( yk ? Y )
k
1N 1N
b = ? y k ? a ? xk
a= k =1
N
N k =1 N k =1
? (x ? X )2
k
k =1
2 2
?e ?e 1N 2
? ? xk
2 2
?a = ?b =
N N
N k =1
? (x ? (x
? X) ? X )2
2
k k
k =1 k =1
N
1
? ( y k ? a xk ? b ) 2
2
?e =
N ? 2 k =1
Доверительный интервал для параметров линейной регрес-
сии
Доверительный интервал возможных значений величины t ,
характеризующийся доверительной вероятностью P или
уровнем значимости q = 1 ? P , это такой интерквантильный
115
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 8. Регрессионный анализ


промежуток t q / 2,? ? t ? t1? q / 2,? , внутри которого лежат 100 P
процентов всех значений случайной величины t , а 100q
процентов лежат вне этого промежутка. При этом 100q / 2
процентов лежит слева от t q / 2,? и 100q / 2 процентов лежит
справа от t1? q / 2,? .
Величины t q / 2,? и t1? q / 2,? - это квантили распределения
Стьюдента с ? = N ? 2 степенями свободы, причем, так как это
распределение симметрично и имеет нулевое математическое
ожидание, то t q / 2,? = ?t1? q / 2,? .
Подставив значения t a = (a ? a ) / ? a и tb = (b ? b) / ? b в
? t1? q / 2,? ? t ? t1? q / 2,?
двойное неравенство получим
доверительные интервалы для истинных значений параметров
линейной регрессии (a, b) :
a ? t1? q / 2, ? ? a ? a ? a + t1? q / 2, ? ? a
b ? t1? q / 2, ? ? b ? b ? b + t1? q / 2, ? ? b
Гипотезы о величине параметров линейной регрессии
Когда речь идет о линейной регрессии, необходимо знать,
насколько значимо отличаются от нуля величины параметров
регрессии. Для проверки этого выдвигаются гипотезы:
H0 : a = 0 H0 : b = 0
или
H1 : a ? 0 H1 : b ? 0
Проверка данных гипотез осуществляется в отдельности для
каждого из параметров по следующей схеме:
1) Априорные предположения
Истинные значения параметров регрессии равны нулю
a=0
b=0
2) Результаты испытания
Выборочные коэффициенты регрессии и их выборочные
с.к.о.
116
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 8. Регрессионный анализ


a, ? a
b, ? b
при объеме выборки N.
3) Гипотеза
H0 : a = 0 H0 : b = 0
или
H1 : a ? 0 H1 : b ? 0
4) Принятая величина уровня значимости
q = 0.05 или q = 0.01
5) Критерий проверки
a?a a
ta = =
?a ?a
b?b b
tb = =
?b ?b
6) Правило принятия решения
Принять Н0 , если ? t1? q / 2,? ? t ? t1? q / 2,?
В противном случае принять Н1 , то есть Н1 принимается,
когда критерий проверки t попадает в критическую область
| t | > t1? q / 2, ? .
Граница критической области вычисляется как
t1? q / 2,? = СТЬЮДРАСПОБР (q, N ? 2)
В качестве критерия проверки t используются t a и t b .
7) Проверка гипотезы
- Если ? t1? q / 2,? ? t ? t1? q / 2,? то критерий проверки t не попа-
дает в критическую область и мы принимаем гипотезу Н0 .
Это означает, что при заданном уровне значимости соответ-
ствующий параметр регрессии статистически незначимо от-
личается от нуля.
- В противном случае мы принимаем гипотезу Н1 . Это озна-
чает, что при заданном уровне значимости соответствующий
параметр регрессии статистически значимо отличается от
нуля.

117
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 8. Регрессионный анализ


8.10. Статистические выводы о величине коэффициента де-
терминации.
Коэффициент детерминации является индикатором того,
насколько хорошо изменения фактора X объясняют изменения
отклика Y . Чем он ближе к единице, тем выше качество урав-
нения регрессии.
Так как коэффициент детерминации вычисляется по
конечной случайной выборке, то он сам является случайной
величиной. Проверка значимости коэффициента детерминации -
это проверка гипотезы о том, что он значимо отличается от
нуля.
H0 : R2 = 0
H1 : R 2 > 0
Критерий проверки рассчитывается по формуле:
R2 / m
F=
(1 ? R 2 ) /( N ? m ? 1)
где N - объем выборки, m - количество независимых
переменных (факторов). Критерий проверки подчиняется F -
распределению с m степенями свободы для числителя и
( N ? m ? 1) степенями свободы для знаменателя.
В случае однофакторной линейной регрессии критерий
проверки принимает вид:
R2
F=
(1 ? R 2 ) /( N ? 2)
Количество степеней свободы для числителя равно 1,
количество степеней свободы для знаменателя равно ( N ? 2) .
Если в действительности переменная Y не зависит от
переменной X , то коэффициент детерминации R 2 и критерий
проверки F равны нулю. При этом их оценки по случайной
выборке могут отличаться от нуля, но чем больше это отличие,
тем менее оно вероятно.
Если же критерий проверки F больше некоторого
критического значения при заданном уровне доверительной
вероятности, то это событие считается слишком маловероятным
118
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 8. Регрессионный анализ


и мы отвергаем гипотезу H 0 и принимаем гипотезу H 1 . Это
значит, что переменная Y зависит от переменной X .
Проверка гипотезы для однофакторной линейной регрессии
проводится по следующей схеме:
1) Гипотеза
H0 : R2 = 0
H1 : R 2 > 0
2) Принятая величина уровня значимости
q = 0.05 или q = 0.01
3) Критерий проверки
R2
F= ( N ? 2)
1? R2
4) Правило принятия решения
Принять Н0 , если F ? F1? q , ? 1,? 2 .
В противном случае принять Н1 , то есть Н1 принимается, когда
критерий проверки F попадает в критическую область
F > F1? q , ? 1,? 2 .
F1? q , ? 1,? 2 F -распределения,
Здесь - это квантиль
? 1 = 1 степенями
соответствующая уровню значимости q с
свободы для числителя и ? 2 = N ? 2 степенями свободы для
знаменателя.
Величину F1? q , ? 1,? 2 можно вычислить с помощью электронных
таблиц Microsoft Excel:
F1? q , ? 1,? 2 = FРАСПОБР (q,? 1 ,? 2 )
5) Проверка гипотезы
- Если F ? F1? q , ? 1,? 2 , то критерий проверки F не попадает в
критическую область и мы принимаем гипотезу Н0 . Это озна-
чает, что при заданном уровне значимости изменения фактора
X не объясняют изменения отклика Y и регрессионная мо-
дель должна быть отвергнута.
- В противном случае мы принимаем гипотезу Н1 . Это означает,
что при заданном уровне значимости переменная Y зависит от
переменной X .
119
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 8. Регрессионный анализ


8.11. Полоса неопределенности однофакторной линейной
регрессии.
Так как параметры линейной регрессии зависимы между
( b = Y ? a ? X ),

<< Предыдущая

стр. 20
(из 43 стр.)

ОГЛАВЛЕНИЕ

Следующая >>