<< Предыдущая

стр. 14
(из 43 стр.)

ОГЛАВЛЕНИЕ

Следующая >>

количества столбцов гистограммы как функции от объема
выборки N и эксцесса ? , пригодная к применению для
широкого класса распределений следующая:
? + 1.5
L= N 0.4
6
Вычисленное по этой формуле значение должно быть
округлено вниз до ближайшего большего или равного пяти
нечетного целого.
Используя значение L , ширину столбца гистограммы
2 max(| xk ? X |)
можно найти по формуле: d =
L

6.3. Построение гистограммы распределения.
Изложим алгоритм построения гистограммы по выборке
случайных величин {xk }, k = 1,..., N :
1) Упорядочить исходную выборку по возрастанию.
2) Вычислить оценки центра распределения:
81
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 6. Идентификация закона распределения по выборке случайной ве-
личины


Хмедиана, Хцентр_сгибов, X , X 50% , Хцентр_размаха.
Упорядочить эти оценки по возрастанию и выбрать из них в
качестве центра распределения серединное, то есть третье
по счету, значение, которое обозначить как ХЦЕНТР.
3) Вычислить оценку среднеквадратичного отклонения
1N
? ( xk ? X ЦЕНТР ) 2
?=
N ? 1 k =1
4) Вычислить оценку эксцесса
N 2 ? 2N + 3 N
1
? ( xk ? Х ЦЕНТР ) 4 ?
?= 4?
? ( N ? 1)( N ? 2)( N ? 3) k =1
3(2 N ? 3)( N ? 1)
?
N ( N ? 2)( N ? 3)
5) Вычислить коэффициент цензурирования
G = 1.55 + 0.8 ? lg( N / 10) ? ? ? 1
6) Исключить из выборки все значения (промахи), лежащие за
пределом интервала
X ЦЕНТР ? G ? ? ? x ? X ЦЕНТР + G ? ?
Если в выборке присутствовали промахи, то ее объем
уменьшился. Обозначим как {x k }, k = 1,..., M очищенную
от промахов выборку ( M ? N ) . Все дальнейшие операции
будут проводиться с очищенной выборкой.
7) Заново вычислить параметры распределения
M
1
?x
X= k
M k =1

1M
? ( xk ? X ) 2
?=
M ? 1 k =1
M
1 M
? ( xk ? X ) 3
?= 3?
? ( M ? 1)( M ? 2) k =1


82
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 6. Идентификация закона распределения по выборке случайной ве-
личины


M 2 ? 2M + 3 M
1
? ( xk ? X ) 4 ?
?= 4?
? ( M ? 1)( M ? 2)( M ? 3) k =1
3(2M ? 3)( M ? 1)
?
M ( M ? 2)( M ? 3)
8) Рассчитать оптимальное количество столбцов гистограммы
? + 1.5
L= M 0.4
6
Полученное число округлить вниз до ближайшего большего
или равного пяти нечетного целого.
9) Рассчитать левую и правую границы гистограммы
X min = X ? max(| xk ? X |)
X max = X + max(| xk ? X |)
10) Рассчитать ширину столбца гистограммы
X max ? X min 2 max(| xk ? X |)
d= =
L L
11) Рассчитать массив узлов разбиения на оси х
X i = X min + (i ? 1) ? d
i = 1,..., L + 1
Интервалы между соседними узлами являются интервалами
разбиения.
12) Рассчитать количество случайных величин из выборки
{x k }, k = 1,..., M , которое попадает в каждый из интервалов
разбиения. В результате получится ненормированная
гистограмма распределения или гистограмма частот. Она
задана в виде массива, который обозначим как
{s i }, i = 1,..., L .
13) В случае, если есть основания полагать, что плотность
вероятности должна быть симметричной, и в подтверждение
этого, вычисленный на шаге 7 коэффициент асимметрии
незначительно отличается от нуля, то можно провести
расчетное симметрирование гистограммы. Центральный
столбец остается без изменения, а в симметричных

83
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 6. Идентификация закона распределения по выборке случайной ве-
личины

относительно него парах столбцов количество отсчетов
усредняется.
14) Вычислить площадь S ненормированной гистограммы. Она
должна быть равна произведению ширины столбца d на
объем выборки M.
15) Нормировать гистограмму путем деления количества
отсчетов в каждом столбце на S. Таким образом на этом
шаге получена гистограмма плотности вероятности:
pi = si / S = si /(d ? M )
i = 1,..., L
16) Рассчитать значения интегральной функции распределения в
узлах разбиения
F1 ? 0
Fi = Fi ?1 + p i ?1 ? d
i = 2,..., L + 1
Фактически, на этом шаге мы получили функцию
распределения в табличном виде, то есть мы имеем массив
значений случайной величины { X i } и соответствующий
ему массив значений {Fi }, i = 1,..., L + 1 .

6.4. Гистограмма логарифмов относительных изменений ин-
декса РТС.
Рассмотрим временной ряд, состоящий из
последовательных значений цены некоторого актива
{Pt }, t = 0,..., T . Тогда цену в момент времени Т можно пред-
ставить, как
P P2 Pt P
PT = P0 1
... T
...
P0 P Pt ?1 PT ?1
1
Движение цены актива - это случайный процесс, вызванный
действиями большого количества участников рынка. Предполо-
жим, что отношения цен активов в любой момент времени яв-
ляются случайными величинами с одинаковым законом распре-
деления.

84
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 6. Идентификация закона распределения по выборке случайной ве-
личины

Тогда по выборке этих случайных величин, которая может
быть получена из ценового ряда, можно определить их закон
распределения.
Но исследовать непосредственно отношение цен представ-
ляется не совсем удобным. Дело в том, что так как цена не мо-
жет упасть ниже нуля, то отношение цен также не может быть
меньше нуля. С другой стороны, цена может сколь угодно силь-
но вырасти, то есть отношение цен может быть неограниченно
большим. Этих качественных рассуждений достаточно, чтобы
понять, что плотность вероятности отношения цен будет иметь
положительную асимметрию. Однако, если мы перейдем к лога-
рифмам отношения цен, ситуация изменится.
P
P1 P P
ln( PT ) ? ln( P0 ) = ln( ) + ln( 2 ) + ... + ln( t ) + ... + ln( T )
P0 P1 Pt ?1 PT ?1
Распределение логарифмов уже может быть симметрично и
возможна его аппроксимация одним из аналитических законов
распределения, которые были рассмотрены во второй главе.
В качестве примера ценового ряда рассмотрим индекс Рос-
сийской торговой системы (индекс РТС) за период с 1 сентября
1995 года по 31 декабря 2002 года. График этого ряда изображен
на рисунке:
Индекс РТС
600

500

400

300

200

100

0
янв.00
апр.97




апр.02
ноя.97

июн.98



июл.99
мар.96




дек.98




авг.00
сен.95




фев.01

сен.01
окт.96




окт.02




Исследуемой выборкой случайных величин будут нату-
ральные логарифмы отношения цен закрытия индекса РТС.

85
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 6. Идентификация закона распределения по выборке случайной ве-
личины

Подробный алгоритм вычисления параметров распределе-
ния, построения графиков плотности распределения и функции
распределения рассмотрен в предыдущем параграфе, поэтому
здесь приведем только результаты.

Наименование оценки Величина

Центр распределения (математическое 0.0007
ожидание)
Среднеквадратичное отклонение 0.0324
Коэффициент асимметрии -0.3064
Эксцесс 7.4301
Плотность вероятности
18
16
14
12
10
8

<< Предыдущая

стр. 14
(из 43 стр.)

ОГЛАВЛЕНИЕ

Следующая >>