<< Предыдущая

стр. 16
(из 43 стр.)

ОГЛАВЛЕНИЕ

Следующая >>

условной плотностью распределения:
p y| x ( x, y ) = p xy ( x, y ) / p x ( x)
Используя условную плотность распределения можно найти
математическое ожидание случайной величины Y , при условии
того, что случайная величина Х равна фиксированному значению х
(условное математическое ожидание):
+?

? y? p
M y| x ( x ) = ( x, y )dy
y| x
??
Условное математическое ожидание M y| x ( x) называют еще
функцией регрессии Y на Х. Функция регрессии обладает
важнейшим свойством: среднеквадратичное отклонение случайной
величины Y от функции регрессии Y на Х меньше, чем ее средне-
квадратичное отклонение от любой другой функции от х.
Если функцию регрессии можно удовлетворительным образом
аппроксимировать линейной зависимостью, то такая регрессия

92
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 7. Корреляция случайных величин


называется линейной. Линейная регрессия обладает тем свойством,
что если регрессия Y на Х линейна, то регрессия X на Y также ли-
нейна.
Заметим, что функции регрессии X на Y и Y на Х не являют-
ся взаимно обратными и соответствующие линии регрессии
совпадают только в случае, когда величины Y и Х связаны
функционально. Если эти величины связаны корреляционно, то
линии регрессии X на Y и Y на Х различны.
В дальнейшем мы ограничимся рассмотрением только тех
случаев, когда функция регрессии является линейной.

7.3. Линейная корреляция.
Корреляционная зависимость между случайными величи-
нами X и Y называется линейной корреляцией, если обе функции
регрессии X на Y и Y на Х являются линейными.
Пусть математическое ожидание и дисперсия случайной
величины Х равны µ x , ? x , а математическое ожидание и
2


дисперсия случайной величины Y равны µ y , ? y .
2


Выведем уравнение регрессии Y на Х, то есть найдем коэф-
фициенты линейной функции y = ax + b .
1) Выразим коэффициент b через математические ожидания X
иY
µ y ? M ( y ) = M (ax + b) = aM ( x) + b = aµ x + b
b = µ y ? aµ x
2) Тогда уравнение регрессии можно переписать в виде
y = ax + µ y ? aµ x
y ? µ y = a ? (x ? µx )
3) Найдем коэффициент регрессии а через математическое
ожидание произведения случайных величин X и Y
M ( xy ) = M [ x(ax + µ y ? aµ x )]
M ( xy ) = aM ( x 2 ) + M ( x) µ y ? aM ( x) µ x
M ( xy ) = aM ( x 2 ) + µ x µ y ? aµ x
2




93
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 7. Корреляция случайных величин


M ( xy ) = a[ M ( x 2 ) ? µ x ] + µ x µ y
2


M ( xy ) = a? x + µ x µ y
2


M ( xy ) ? µ x µ y
a=
? x2
4) Назовем коэффициентом корреляции между X и Y
следующую безразмерную и симметричную относительно X
и Y величину
? ( x ? µ x ) ( y ? µ y ) ? M [( x ? µ x )( y ? µ y )]
? = M? ?=
?
? ?y ?
? ?x ? x? y
?
5) Тогда математическое ожидание произведения случайных
величин X и Y можно выразить через коэффициент
корреляции
M ( xy ) ? M [( x ? µ x + µ x )( y ? µ y + µ y )]
M ( xy ) = M [( x ? µ x )( y ? µ y )] + µ x M ( y ? µ y ) +
+ µ yM (x ? µx ) + µxµ y
M ( xy ) = M [( x ? µ x )( y ? µ y )] + µ x µ y
M ( xy ) = ?? x? y + µ x µ y
6) Окончательно для коэффициента регрессии Y на Х получаем
a = ? ? (? y / ? x )
7) В итоге уравнение регрессии Y на Х приобретает вид
y ? µ y = ? ? (? y / ? x ) ? ( x ? µ x )
Тангенс угла наклона, под которым эта прямая пересекает
ось х равен ? ? (? y / ? x ) .
8) Аналогично можно получить уравнение регрессии Х на Y
x ? µ x = ? ? (? x / ? y ) ? ( y ? µ y )
Тангенс угла наклона, под которым эта прямая пересекает
ось х равен (1 / ? ) ? (? y / ? x ) .
Заметим, что прямые регрессии Y на Х и Х на Y пересекают ось х
под разными углами. Эти прямые совпадают только тогда, когда
модуль коэффициента корреляции | ? |= 1 . Обе прямые регрес
94
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 7. Корреляция случайных величин


сии проходят через центр двумерного распределения
вероятностей величин Х и Y - точку с координатами ( µ x , µ y ) .

7.4. Коэффициент корреляции. Ковариация.
Рассмотрим подробнее введенный в предыдущем параграфе
коэффициент корреляции. Было выяснено, что он равен
? ( x ? µ x ) ( y ? µ y ) ? M ( xy ) ? µ x µ y
? xy = ? yx = M ? ?=
?
?? ?y ? ? x? y
? ?
x

Следовательно, коэффициент корреляции характеризует
относительное отклонение математического ожидания
произведения двух случайных величин от произведения
математических ожиданий этих величин. Так как отклонение
имеет место только для зависимых величин, то коэффициент
корреляции характеризует степень этой зависимости.
Коэффициент корреляции обладает следующими
свойствами:
1) Линейные преобразования случайных величин Х и Y не
изменяют коэффициента корреляции между ними
? ( x, y ) = ? (a 0 + a1 x, b0 + b1 y )
для любых констант a 0 , a1 > 0, b0 , b1 > 0 .
2) Коэффициент корреляции случайных величин Х и Y заключен в
пределах между -1 и +1, достигая этих крайних значений толь-
ко в случае линейной функциональной зависимости между Х и
Y.
3) Коэффициент корреляции между независимыми случайными
величинами равен нулю.
Обратное утверждение вообще говоря неверно, то есть если
коэффициент корреляции равен нулю, то это не означает
независимости соответствующих величин. В этом случае
говорят, что величины некоррелированы.
Как уже говорилось выше, коэффициент корреляции является
безразмерной величиной. Произведение коэффициента
корреляции на среднеквадратичные отклонения случайных
величин Х и Y имеет размерность дисперсии и называется кова-
риацией случайных величин Х и Y:
cov( x, y ) ? ? xy = ? yx = M [( x ? µ x )( y ? µ y )] = M ( xy ) ? µ x µ y
95
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 7. Корреляция случайных величин


7.5. Математическое ожидание и дисперсия линейной ком-
бинации случайных величин.
В этом параграфе мы рассмотрим правила вычисления
математического ожидания и дисперсии многомерной
случайной величины, являющейся линейной комбинацией
коррелированных случайных величин:
? ? ? ?
N N
M ? a 0 + ? a k x k ? и D? a 0 + ? a k x k ?
? ? ? ?
k =1 k =1

Математическое ожидание
Математическое ожидание обладает следующими свойствами:
1) Постоянный множитель можно выносить за знак
математического ожидания
M (ax) = aM ( x) ? aµ x
2) Математическое ожидание суммы случайной величины и
константы равно сумме математического ожидания этой
величины и константы
M ( x + a) = M ( x) + a ? µ x + a
3) Математическое ожидание суммы случайных величин равно
сумме их математических ожиданий
M ( x + y ) = M ( x) + M ( y ) ? µ x + µ y
Следовательно, для линейной комбинации произвольного коли-
чества случайных величин получаем
? ?
N N N
M ? a0 + ? ak xk ? = a0 + ? ak M ( xk ) ? a0 + ? ak µ k
? ?
k =1 k =1 k =1

Дисперсия
Аналогичные свойства для дисперсии следующие:
1) Постоянный множитель можно выносить за знак дисперсии,
возведя его в квадрат
D(ax) = a 2 D( x) ? a 2? x
2


2) Дисперсия суммы случайной величины и константы равна
дисперсии случайной величины
D( x + a) = D( x) ? ? x
2



96
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 7. Корреляция случайных величин


3) Дисперсия суммы случайных величин равно сумме их
дисперсий плюс удвоенное произведение их коэффициента
корреляции на среднеквадратичные отклонения
D( x + y ) = M [( x + y ) ? ( µ x + µ y )]2 =
= M ( x ? µ x ) 2 + M ( y ? µ y ) 2 + 2 M [( x ? µ x )( y ? µ y )] =
= ? x + ? y + 2 ? xy? x? y
2 2


Следовательно, для линейной комбинации произвольного количе-
ства случайных величин получаем
? ? N 22
N N N
D? a0 + ? ak xk ? = ? ak ? k + 2? ? ai ak ?ik? i? k
? ? k =1
k =1 k =1 i = k +1
Если все случайные величины независимы, то так как
коэффициенты корреляции для различных случайных величин
равны 0, а коэффициент корреляции случайной величины с
самой собой равен 1, формула упрощается
? ? N 22
N
D? a0 + ? ak xk ? = ? ak ? k
? ? k =1
k =1
Полученные выражения для математического ожидания и
дисперсии линейной комбинации произвольного количества
коррелированных случайных величин позволяют сделать
следующие выводы:
- математическое ожидание линейной комбинации случай-
ных величин - это взвешенная сумма математических ожида-
ний отдельных случайных величин,
- дисперсия линейной комбинации случайных величин - это
взвешенная сумма ковариаций всех пар случайных величин,
при этом вес каждой ковариации равен произведению весов
соответствующей пары случайных величин, а ковариация
случайной величины с самой собой является дисперсией
данной величины.

7.6. Оценка ковариации и коэффициента корреляции по вы-
борке случайных величин.
Для оценки ковариации и коэффициента корреляции между
случайными величинами Х и Y мы должны располагать двумя
соответствующими друг другу выборками этих величин:
97
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 7. Корреляция случайных величин


k = 1,..., N
{xk },{ yk }
Оценка ковариации
В качестве оценки математического ожидания случайных

<< Предыдущая

стр. 16
(из 43 стр.)

ОГЛАВЛЕНИЕ

Следующая >>