<< Предыдущая

стр. 17
(из 44 стр.)

ОГЛАВЛЕНИЕ

Следующая >>

M ? a 0 + ? a k x k ? и D? a 0 + ? a k x k ?
? ? ? ?
k =1 k =1

Математическое ожидание
Математическое ожидание обладает следующими свойствами:
1) Постоянный множитель можно выносить за знак
математического ожидания
M (ax) = aM ( x) ? aµ x
2) Математическое ожидание суммы случайной величины и
константы равно сумме математического ожидания этой
величины и константы
M ( x + a) = M ( x) + a ? µ x + a
3) Математическое ожидание суммы случайных величин равно
сумме их математических ожиданий
M ( x + y ) = M ( x) + M ( y ) ? µ x + µ y
Следовательно, для линейной комбинации произвольного коли-
чества случайных величин получаем
? ?
N N N
M ? a0 + ? ak xk ? = a0 + ? ak M ( xk ) ? a0 + ? ak µ k
? ?
k =1 k =1 k =1

Дисперсия
Аналогичные свойства для дисперсии следующие:
1) Постоянный множитель можно выносить за знак дисперсии,
возведя его в квадрат
D(ax) = a 2 D( x) ? a 2? x
2


2) Дисперсия суммы случайной величины и константы равна
дисперсии случайной величины
D( x + a) = D( x) ? ? x
2



96
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 7. Корреляция случайных величин


3) Дисперсия суммы случайных величин равно сумме их
дисперсий плюс удвоенное произведение их коэффициента
корреляции на среднеквадратичные отклонения
D( x + y ) = M [( x + y ) ? ( µ x + µ y )]2 =
= M ( x ? µ x ) 2 + M ( y ? µ y ) 2 + 2 M [( x ? µ x )( y ? µ y )] =
= ? x + ? y + 2 ? xy? x? y
2 2


Следовательно, для линейной комбинации произвольного количе-
ства случайных величин получаем
? ? N 22
N N N
D? a0 + ? ak xk ? = ? ak ? k + 2? ? ai ak ?ik? i? k
? ? k =1
k =1 k =1 i = k +1
Если все случайные величины независимы, то так как
коэффициенты корреляции для различных случайных величин
равны 0, а коэффициент корреляции случайной величины с
самой собой равен 1, формула упрощается
? ? N 22
N
D? a0 + ? ak xk ? = ? ak ? k
? ? k =1
k =1
Полученные выражения для математического ожидания и
дисперсии линейной комбинации произвольного количества
коррелированных случайных величин позволяют сделать
следующие выводы:
- математическое ожидание линейной комбинации случай-
ных величин - это взвешенная сумма математических ожида-
ний отдельных случайных величин,
- дисперсия линейной комбинации случайных величин - это
взвешенная сумма ковариаций всех пар случайных величин,
при этом вес каждой ковариации равен произведению весов
соответствующей пары случайных величин, а ковариация
случайной величины с самой собой является дисперсией
данной величины.

7.6. Оценка ковариации и коэффициента корреляции по вы-
борке случайных величин.
Для оценки ковариации и коэффициента корреляции между
случайными величинами Х и Y мы должны располагать двумя
соответствующими друг другу выборками этих величин:
97
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 7. Корреляция случайных величин


k = 1,..., N
{xk },{ yk }
Оценка ковариации
В качестве оценки математического ожидания случайных
величин Х и Y используем средние арифметические значения по
соответствующим выборкам:
1N 1N
X = ? xk Y = ? yk
N k =1 N k =1
Тогда выборочная ковариация случайных величин Х и Y за-
дается формулой:
1N
? ( xk ? X )( yk ? Y )
? xy =
N ? 1 k =1
Оценка коэффициента корреляции
Для оценки коэффициента корреляции между случайными
величинами Х и Y нам понадобятся выборочные
среднеквадратичные отклонения этих величин:
1N 1N
? ( xk ? X ) 2 ? ( yk ? Y ) 2
?x = ?y =
N ? 1 k =1 N ? 1 k =1
Тогда выборочный коэффициент корреляции случайных
величин Х и Y задается формулой:
N

? (x ? X )( y k ? Y )
? xy k
? xy = = k =1

? x ?? y N N

? (x ?(y
? X) ? Y )2
2
k k
k =1 k =1

Дисперсию и с.к.о. выборочного коэффициента корреляции
можно оценить как
(1 ? ? xy ) 2 1 ? ? xy
2 2

?? = ?? =
2

N ?1 N ?1




98
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 7. Корреляция случайных величин


7.7. Оценка коэффициентов линейной регрессии по выборке
случайных величин.
В параграфе 7.3 было получено, что в случае, когда
величины Х и Y представлены своими генеральными совокупно-
стями, уравнение регрессии Y на Х имеет вид:
y ? µ y = ? ? (? y / ? x ) ? ( x ? µ x )
Следовательно, так как ? ? (? y / ? x ) ? ? xy / ? x , то коэффициен-
2


ты (a, b) линейной регрессии y = ax + b можно представить в
виде:
a = ? xy / ? x b = µ y ? aµ x
2


Переходя к выборочным оценкам получаем:
N N

? (x ?x
? X )( y k ? Y ) yk ? N ? X ? Y
? xy k k
a= = =
k =1 k =1
2 N N
?x
? ( xk ? X ) ? xk2 ? N ? X
2
2

k =1 k =1

b =Y ?a? X
Аналогичным образом можно получить оценку коэффициентов
линейной регрессии Х на Y.

7.8. Линейная регрессия как наилучшая оценка по методу
наименьших квадратов.
Докажем, что полученные в предыдущем параграфе оценки
коэффициентов линейной регрессии Y на Х определяют такую
прямую линию, что сумма квадратов отклонений величины Y от
этой прямой имеет минимальное значение, по сравнению с
суммой квадратов отклонений величины Y от любой другой
прямой.
Пусть величины Х и Y представлены своими выборками:
k = 1,..., N
{xk },{ yk }
Предположим, что зависимость величины Y от величины Х
можно аппроксимировать прямой линией y = ?x + ? . Найдем
коэффициенты ? и ?, которые минимизируют сумму квадратов
отклонений величины Y от этой прямой:
99
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 7. Корреляция случайных величин

N
S = ? ( y k ? ?x k ? ? ) 2
k =1
Возьмем частные производные S по ? и по ?, и приравняем их к
нулю:
?S N
= ?2? ( yk ? ?xk ? ? ) = 0
?? k =1

?S N
= ?2? xk ( yk ? ?xk ? ? ) = 0
?? k =1
Следовательно:
N N

?y ? ? ? x k ? ?N = 0
k
k =1 k =1
N N N

?x y k ? ? ? x ? ? ? xk = 0 2
k k
k =1 k =1 k =1
Из первого уравнения этой системы следует, что
1N 1N
? = ? y k ? ? ? xk = Y ? ? ? X
N k =1 N k =1
Подставив это выражение во второе уравнение системы после
несложных преобразований получим:
N

?x yk ? N ? X ? Y
k
?= k =1
N

?x
2
?N?X
2
k
k =1
Использованный метод поиска коэффициентов ? и ? назы-
вается методом наименьших квадратов. Сравнивая
коэффициенты ? и ? с полученными в предыдущем параграфе
выборочными коэффициентами линейной регрессии видим, что
они совпадают. Следовательно, утверждение о том, что
коэффициенты линейной регрессии Y на Х определяют такую
прямую линию, что сумма квадратов отклонений величины Y от
этой прямой имеет минимальное значение, по сравнению с
суммой квадратов отклонений величины Y от любой другой
прямой, доказано.

100
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 8. Регрессионный анализ


8. РЕГРЕССИОННЫЙ АНАЛИЗ

8.1. Введение.
Различные экономические и финансовые переменные связаны
между собой. Если не принимать во внимание случайный характер
этих переменных, то для описания связей между ними можно при-
менить функциональный подход, то есть предположить, что связь

<< Предыдущая

стр. 17
(из 44 стр.)

ОГЛАВЛЕНИЕ

Следующая >>