<< Предыдущая

стр. 16
(из 44 стр.)

ОГЛАВЛЕНИЕ

Следующая >>

Фактическое значение ? 2 = 35.635 . Проверим гипотезу о
том, что ? 2 ? ? 12? q , ? .
H 0 : ? 2 ? ? 12? q , ?
H 1 : ? 2 > ? 12? q , ?
Пусть уровень значимости q = 0.01 . Тогда граница крити-
ческой области вычисляется как:
? 12?q , ? = ХИ 2ОБР (0.01, 23) = 41.638
Так как ? 2 ? ? 12? q , ? , то исследуемое распределение при
заданном уровне значимости можно аппроксимировать
обобщенным экспоненциальным распределением.
В заключении следует сказать, что для ликвидных
российских акций, торгующихся в РТС, таких как РАО ЕЭС,
Лукойл, Сургутнефтегаз, Ростелеком, Мосэнерго,
распределения логарифмов относительного изменения цены за-
крытия также можно описать обобщенным экспоненциальным
распределением с соответствующим математическим
ожиданием, среднеквадратичным отклонением и показателем
степени.




90
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 7. Корреляция случайных величин


7. КОРРЕЛЯЦИЯ СЛУЧАЙНЫХ ВЕЛИЧИН

7.1. Введение.
Существует два типа зависимостей между переменными:
функциональная (строго детерминированная) и статистическая
(стохастически детерминированная).
В случае функциональной зависимости каждому значению
одной переменной соответствует одно или несколько строго за-
данных значений другой переменной. Функциональная связь
двух переменных возможна, если вторая переменная зависит от
первой и ни от чего более. На практике таких связей не сущест-
вует, то есть функциональная связь является упрощающей ре-
альность абстракцией.
В случае статистической связи каждому значению одной
величины соответствует определенное распределение вероятно-
сти другой величины. Это связано с тем, что в любой математи-
ческой модели на описываемый показатель влияют не только
явным образом входящие в модель переменные, но и большое
количество факторов, которые существуют в действительности,
но не учитываются моделью, причем часть из этих факторов -
это случайные величины. Этим можно объяснить случайный ха-
рактер многих финансовых переменных и взаимосвязей между
ними.
Важнейшим частным случаем статистической связи являет-
ся корреляционная связь, когда каждому значению одной пере-
менной соответствует определенное математическое ожида-
ние другой переменной, и при изменении значения одной вели-
чины математическое ожидание другой величины изменяется
закономерным образом. Если же при изменении значения одной
переменной закономерным образом изменяется другая стати-
стическая характеристика второй переменной (дисперсия, асим-
метрия, эксцесс и т.д.), то связь является статистической, но не
корреляционной. Данная глава посвящена изучению линейной
корреляционной связи между случайными величинами.

7.2. Функция регрессии.
Рассмотрим две непрерывные случайные величины Х и Y.
Тогда вероятность того, что в некотором испытании величина Х
91
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 7. Корреляция случайных величин


окажется в интервале от x до x + dx , а величина Y окажется в
интервале от y до y + dy равна p xy ( x, y )dxdy . Величина
p xy ( x, y ) называется плотностью двумерного распределения
вероятностей величин Х и Y.
Для двумерного распределения вероятностей плотность
распределения координат х и у выражается формулами:
+?

?p
p x ( x) = ( x, y )dy
xy
??
+?

?p
p y ( y) = ( x, y )dx
xy
??
Случайные величины Х и Y находятся в корреляционной
зависимости, если:
- каждому значению переменной Х соответствует определенное
математическое ожидание переменной Y,
- каждому значению переменной Y соответствует определенное
математическое ожидание переменной Х.

Рассмотрим условное распределение вероятности переменной
Y при фиксированном значении переменной Х. Оно описывается
условной плотностью распределения:
p y| x ( x, y ) = p xy ( x, y ) / p x ( x)
Используя условную плотность распределения можно найти
математическое ожидание случайной величины Y , при условии
того, что случайная величина Х равна фиксированному значению х
(условное математическое ожидание):
+?

? y? p
M y| x ( x ) = ( x, y )dy
y| x
??
Условное математическое ожидание M y| x ( x) называют еще
функцией регрессии Y на Х. Функция регрессии обладает
важнейшим свойством: среднеквадратичное отклонение случайной
величины Y от функции регрессии Y на Х меньше, чем ее средне-
квадратичное отклонение от любой другой функции от х.
Если функцию регрессии можно удовлетворительным образом
аппроксимировать линейной зависимостью, то такая регрессия

92
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 7. Корреляция случайных величин


называется линейной. Линейная регрессия обладает тем свойством,
что если регрессия Y на Х линейна, то регрессия X на Y также ли-
нейна.
Заметим, что функции регрессии X на Y и Y на Х не являют-
ся взаимно обратными и соответствующие линии регрессии
совпадают только в случае, когда величины Y и Х связаны
функционально. Если эти величины связаны корреляционно, то
линии регрессии X на Y и Y на Х различны.
В дальнейшем мы ограничимся рассмотрением только тех
случаев, когда функция регрессии является линейной.

7.3. Линейная корреляция.
Корреляционная зависимость между случайными величи-
нами X и Y называется линейной корреляцией, если обе функции
регрессии X на Y и Y на Х являются линейными.
Пусть математическое ожидание и дисперсия случайной
величины Х равны µ x , ? x , а математическое ожидание и
2


дисперсия случайной величины Y равны µ y , ? y .
2


Выведем уравнение регрессии Y на Х, то есть найдем коэф-
фициенты линейной функции y = ax + b .
1) Выразим коэффициент b через математические ожидания X
иY
µ y ? M ( y ) = M (ax + b) = aM ( x) + b = aµ x + b
b = µ y ? aµ x
2) Тогда уравнение регрессии можно переписать в виде
y = ax + µ y ? aµ x
y ? µ y = a ? (x ? µx )
3) Найдем коэффициент регрессии а через математическое
ожидание произведения случайных величин X и Y
M ( xy ) = M [ x(ax + µ y ? aµ x )]
M ( xy ) = aM ( x 2 ) + M ( x) µ y ? aM ( x) µ x
M ( xy ) = aM ( x 2 ) + µ x µ y ? aµ x
2




93
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 7. Корреляция случайных величин


M ( xy ) = a[ M ( x 2 ) ? µ x ] + µ x µ y
2


M ( xy ) = a? x + µ x µ y
2


M ( xy ) ? µ x µ y
a=
? x2
4) Назовем коэффициентом корреляции между X и Y
следующую безразмерную и симметричную относительно X
и Y величину
? ( x ? µ x ) ( y ? µ y ) ? M [( x ? µ x )( y ? µ y )]
? = M? ?=
?
? ?y ?
? ?x ? x? y
?
5) Тогда математическое ожидание произведения случайных
величин X и Y можно выразить через коэффициент
корреляции
M ( xy ) ? M [( x ? µ x + µ x )( y ? µ y + µ y )]
M ( xy ) = M [( x ? µ x )( y ? µ y )] + µ x M ( y ? µ y ) +
+ µ yM (x ? µx ) + µxµ y
M ( xy ) = M [( x ? µ x )( y ? µ y )] + µ x µ y
M ( xy ) = ?? x? y + µ x µ y
6) Окончательно для коэффициента регрессии Y на Х получаем
a = ? ? (? y / ? x )
7) В итоге уравнение регрессии Y на Х приобретает вид
y ? µ y = ? ? (? y / ? x ) ? ( x ? µ x )
Тангенс угла наклона, под которым эта прямая пересекает
ось х равен ? ? (? y / ? x ) .
8) Аналогично можно получить уравнение регрессии Х на Y
x ? µ x = ? ? (? x / ? y ) ? ( y ? µ y )
Тангенс угла наклона, под которым эта прямая пересекает
ось х равен (1 / ? ) ? (? y / ? x ) .
Заметим, что прямые регрессии Y на Х и Х на Y пересекают ось х
под разными углами. Эти прямые совпадают только тогда, когда
модуль коэффициента корреляции | ? |= 1 . Обе прямые регрес
94
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 7. Корреляция случайных величин


сии проходят через центр двумерного распределения
вероятностей величин Х и Y - точку с координатами ( µ x , µ y ) .

7.4. Коэффициент корреляции. Ковариация.
Рассмотрим подробнее введенный в предыдущем параграфе
коэффициент корреляции. Было выяснено, что он равен
? ( x ? µ x ) ( y ? µ y ) ? M ( xy ) ? µ x µ y
? xy = ? yx = M ? ?=
?
?? ?y ? ? x? y
? ?
x

Следовательно, коэффициент корреляции характеризует
относительное отклонение математического ожидания
произведения двух случайных величин от произведения
математических ожиданий этих величин. Так как отклонение
имеет место только для зависимых величин, то коэффициент
корреляции характеризует степень этой зависимости.
Коэффициент корреляции обладает следующими
свойствами:
1) Линейные преобразования случайных величин Х и Y не
изменяют коэффициента корреляции между ними
? ( x, y ) = ? (a 0 + a1 x, b0 + b1 y )
для любых констант a 0 , a1 > 0, b0 , b1 > 0 .
2) Коэффициент корреляции случайных величин Х и Y заключен в
пределах между -1 и +1, достигая этих крайних значений толь-
ко в случае линейной функциональной зависимости между Х и
Y.
3) Коэффициент корреляции между независимыми случайными
величинами равен нулю.
Обратное утверждение вообще говоря неверно, то есть если
коэффициент корреляции равен нулю, то это не означает
независимости соответствующих величин. В этом случае
говорят, что величины некоррелированы.
Как уже говорилось выше, коэффициент корреляции является
безразмерной величиной. Произведение коэффициента
корреляции на среднеквадратичные отклонения случайных
величин Х и Y имеет размерность дисперсии и называется кова-
риацией случайных величин Х и Y:
cov( x, y ) ? ? xy = ? yx = M [( x ? µ x )( y ? µ y )] = M ( xy ) ? µ x µ y
95
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 7. Корреляция случайных величин


7.5. Математическое ожидание и дисперсия линейной ком-
бинации случайных величин.
В этом параграфе мы рассмотрим правила вычисления
математического ожидания и дисперсии многомерной
случайной величины, являющейся линейной комбинацией
коррелированных случайных величин:
? ? ? ?
N N

<< Предыдущая

стр. 16
(из 44 стр.)

ОГЛАВЛЕНИЕ

Следующая >>