<< Предыдущая

стр. 15
(из 43 стр.)

ОГЛАВЛЕНИЕ

Следующая >>

6
4
2
0
-0.20 -0.10 0.00 0.10 0.20


Функция распределения
1.0

0.8

0.6

0.4

0.2

0.0
-0.20 -0.10 0.00 0.10 0.20


86
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 6. Идентификация закона распределения по выборке случайной ве-
личины

Отметим, что с.к.о. превышает математическое ожидание
более чем в 46 раз, то есть исследуемая случайная величина яв-
ляется высоковолатильной. Распределение имеет очень неболь-
шую отрицательную асимметрию, которая вероятно носит слу-
чайный характер, поэтому гистограмма плотности вероятности
была центрирована.
Эксцесс распределения существенно превышает эксцесс
нормального распределения, то есть данное распределение яв-
ляется островершинным.
Гистограмма распределения имеет 27 столбцов. Для боль-
шей наглядности плотность вероятности приведена не в виде
гистограммы, а как плавная линия, проходящая через середины
интервалов разбиения.

6.5. Использование критериев согласия при идентификации
закона распределения случайной величины.
После построения гистограммы распределения можно вы-
двинуть гипотезу о том, что данная гистограмма может быть ап-
проксимирована одним из изученных ранее законов распределе-
ния. При этом степень близости гистограммы и принятой анали-
тической модели может быть проверена с использованием кри-
териев согласия. Здесь будет рассмотрен один из этих критериев
- критерий ?2 Пирсона.
При использовании критерия согласия Пирсона необходимо
вычислить величину:
(Ti ? si ) 2
L
? =?
2

Ti
i =1
где
L - количество столбцов гистограммы,
si - фактическая частота попадания в i-й столбец,
Ti - теоретическая частота попадания в i-й столбец.
Для идеально подобранной модели все разности (Ti ? si ) равны
нулю и, следовательно, величина ?2 также равна нулю. Таким
образом, ненулевое значение ?2 является мерой суммарного рас-
хождения между фактическим распределением и моделью.
87
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 6. Идентификация закона распределения по выборке случайной ве-
личины

Насколько велико это расхождение можно проверить, срав-
нив фактическое значение ?2 с теоретической величиной ? 12? q , ? ,
которая определяет максимально возможное расхождение меж-
ду фактическими данными и моделью, соответствующее приня-
тому уровню значимости q .
Уровень значимости q определяет вероятность ошибки 1-го
рода, то есть вероятность того, что будет отвергнута не проти-
воречащая эмпирическим данным модель.
Величина ? - это число степеней свободы ?2-
распределения. Число степеней свободы зависит от количества
столбцов гистограммы эмпирических данных L и количества
параметров r, описывающих теоретическую модель:
? = L ?1? r .
Величина ? 12? q , ? - это такая квантиль ?2-распределения, что
100(1 ? q) процентов всех значений случайной величины ?2
лежат слева от ? 12? q , ? , а 100q процентов всех значений
случайной величины ?2 лежат справа от ? 12? q , ? .
Если ? 2 ? ? 12? q , ? , то считают, что модель не противоречит
фактическим данным при заданном уровне значимости.
Если ? 2 > ? 12? q , ? , то считают, что при заданном уровне
значимости модель не описывает удовлетворительным образом
фактические данные и должна быть отвергнута.
Следует особо подчеркнуть, что при проверке модели по
критерию согласия определенным является лишь отрицатель-
ный ответ, то есть отклонение модели.
Положительный ответ означает лишь то, что модель не про-
тиворечит эмпирическим данным. Это вовсе не означает, что
именно этой моделью данные описываются на самом деле, что
это наилучшая модель, что нельзя подобрать другую модель для
описания данных и т.д. Фактически, положительный ответ при
проверке по критерию согласия следует понимать как "возмож-
но эти данные описываются такой-то моделью", и не более того.


88
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 6. Идентификация закона распределения по выборке случайной ве-
личины

Вернемся к полученной в предыдущем параграфе гисто-
грамме натуральных логарифмов относительного изменения це-
ны закрытия индекса РТС.
Гистограмма имеет ярко выраженный пик и достаточно по-
логие спады. Островершинность подтверждается еще и значени-
ем эксцесса, существенно превышающим эксцесс нормального
распределения. Как нам уже известно, распределения с подоб-
ными характеристиками могут быть описаны обобщенным экс-
поненциальным распределением с показателем степени меньше
двух.
Выдвинем гипотезу о том, что фактическое распределение
описывается моделью
?
? x?µ ?
?
exp? ? ?
p ( x) = ? ? < x < +?
? ?? ?
2 Г (1 / ? )?? ? ?
где
математическое ожидание µ = 0.0007
среднеквадратичное отклонение ? = 0.0324
показатель степени ? = 0.87
Показатель степени был найден из значения оценки эксцес-
са распределения, так как для обобщенного экспоненциального
распределения показатель степени и эксцесс имеют взаимно од-
нозначное соответствие:
? = Г (1 / ? ) Г (5 / ? ) /[ Г (3 / ? )]2
Исследуемое эмпирическое распределение имеет 27 столб-
цов. Аналитическая модель имеет 3 параметра. Следовательно,
число степеней свободы для критерия Пирсона равно
? = L ? 1 ? r = 27 ? 1 ? 3 = 23 .
Фактические и теоретические частоты попадания в столбцы
гистограммы дадим для наглядности в графическом виде.




89
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 6. Идентификация закона распределения по выборке случайной ве-
личины


Распределение фактических и теоретических частот

600
Фактическая 500
частота
400
Теоретическая
частота
300

200

100

0
-0.20 -0.15 -0.10 -0.05 0.00 0.05 0.10 0.15 0.20


Фактическое значение ? 2 = 35.635 . Проверим гипотезу о
том, что ? 2 ? ? 12? q , ? .
H 0 : ? 2 ? ? 12? q , ?
H 1 : ? 2 > ? 12? q , ?
Пусть уровень значимости q = 0.01 . Тогда граница крити-
ческой области вычисляется как:
? 12?q , ? = ХИ 2ОБР (0.01, 23) = 41.638
Так как ? 2 ? ? 12? q , ? , то исследуемое распределение при
заданном уровне значимости можно аппроксимировать
обобщенным экспоненциальным распределением.
В заключении следует сказать, что для ликвидных
российских акций, торгующихся в РТС, таких как РАО ЕЭС,
Лукойл, Сургутнефтегаз, Ростелеком, Мосэнерго,
распределения логарифмов относительного изменения цены за-
крытия также можно описать обобщенным экспоненциальным
распределением с соответствующим математическим
ожиданием, среднеквадратичным отклонением и показателем
степени.




90
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 7. Корреляция случайных величин


7. КОРРЕЛЯЦИЯ СЛУЧАЙНЫХ ВЕЛИЧИН

7.1. Введение.
Существует два типа зависимостей между переменными:
функциональная (строго детерминированная) и статистическая
(стохастически детерминированная).
В случае функциональной зависимости каждому значению
одной переменной соответствует одно или несколько строго за-
данных значений другой переменной. Функциональная связь
двух переменных возможна, если вторая переменная зависит от
первой и ни от чего более. На практике таких связей не сущест-
вует, то есть функциональная связь является упрощающей ре-
альность абстракцией.
В случае статистической связи каждому значению одной
величины соответствует определенное распределение вероятно-
сти другой величины. Это связано с тем, что в любой математи-
ческой модели на описываемый показатель влияют не только
явным образом входящие в модель переменные, но и большое
количество факторов, которые существуют в действительности,
но не учитываются моделью, причем часть из этих факторов -
это случайные величины. Этим можно объяснить случайный ха-
рактер многих финансовых переменных и взаимосвязей между
ними.
Важнейшим частным случаем статистической связи являет-
ся корреляционная связь, когда каждому значению одной пере-
менной соответствует определенное математическое ожида-
ние другой переменной, и при изменении значения одной вели-
чины математическое ожидание другой величины изменяется
закономерным образом. Если же при изменении значения одной
переменной закономерным образом изменяется другая стати-
стическая характеристика второй переменной (дисперсия, асим-
метрия, эксцесс и т.д.), то связь является статистической, но не
корреляционной. Данная глава посвящена изучению линейной
корреляционной связи между случайными величинами.

7.2. Функция регрессии.
Рассмотрим две непрерывные случайные величины Х и Y.
Тогда вероятность того, что в некотором испытании величина Х
91
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 7. Корреляция случайных величин


окажется в интервале от x до x + dx , а величина Y окажется в
интервале от y до y + dy равна p xy ( x, y )dxdy . Величина
p xy ( x, y ) называется плотностью двумерного распределения
вероятностей величин Х и Y.
Для двумерного распределения вероятностей плотность
распределения координат х и у выражается формулами:
+?

?p
p x ( x) = ( x, y )dy
xy
??
+?

?p
p y ( y) = ( x, y )dx
xy
??
Случайные величины Х и Y находятся в корреляционной
зависимости, если:
- каждому значению переменной Х соответствует определенное
математическое ожидание переменной Y,
- каждому значению переменной Y соответствует определенное
математическое ожидание переменной Х.

Рассмотрим условное распределение вероятности переменной
Y при фиксированном значении переменной Х. Оно описывается

<< Предыдущая

стр. 15
(из 43 стр.)

ОГЛАВЛЕНИЕ

Следующая >>