<< Предыдущая

стр. 7
(из 43 стр.)

ОГЛАВЛЕНИЕ

Следующая >>

11
F ( x) = + arctg[( x ? a) / b]
2?
Казалось бы, распределение Коши выглядит очень привле-
кательно для описания и моделирования случайных величин.
Однако в действительности это не так. Свойства распределения
Коши резко отличны от свойств распределения Гаусса, Лапласа
и других экспоненциальных распределений.
Дело в том, что распределение Коши близко к предельно
пологому. Напомним, что распределение называется предельно
пологим, если при x > ±? его плотность вероятности
p( x) ? 1 / | x |1+? , где ? - сколь угодно малое положительное
число. При более пологих, чем 1 / | x |1+? спадах, площадь под
39
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 2. Аналитические законы распределения случайных величин


кривой бесконечна, то есть не выполняется условие
нормирования, и такие кривые не могут описывать плотность
распределения вероятностей.
Для распределения Коши не существует даже первого
начального момента распределения, то есть математического
ожидания, так как определяющий его интеграл расходится. При
этом распределение имеет и медиану и моду, которые равны
параметру a .
Разумеется, дисперсия этого распределения (второй
центральный момент) также равна бесконечности. На практике это
означает, что оценка дисперсии по выборке из распределения Коши
будет неограниченно возрастать с увеличением объема данных.
Из вышесказанного следует, что аппроксимация
распределением Коши случайных процессов, которые
характеризуются конечным математическим ожиданием и
конечной дисперсией, неправомерна.

2.9. Распределение Парето.
Распределение Парето - это усеченное слева распределение,
плотность вероятности и функция распределения которого выра-
жаются в виде:
x< B: p ( x) = F ( x) = 0
?
x ? B > 0,? > 0 : p( x) = ( B / x)1+? F ( x) = 1 ? ( B / x)?
B
Плотность р(х) распределения равна нулю при x < B , имеет мак-
симальное значение при x = B и монотонно убывает при x > B .
Распределение Парето можно модифицировать таким образом,
чтобы его можно было использовать для описания симметричных
распределений вероятностей.
Введя новую переменную t = x ? B , получим
? ?
? [ B /( B + t )]1+? = ? [1 /(1 + t / B)]1+?
p (t ) =
B B
0 ? t < +?, B > 0, ? > 0
Взяв величину t по модулю, эту формулу можно распространить на
всю числовую ось, введя при этом нормировочный коэффициент
1/2.

40
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 2. Аналитические законы распределения случайных величин


?
? [1 /(1+ | t | / B)]1+?
p (t ) =
2B
? ? < t < +?, B > 0, ? > 0
Описываемое последней формулой распределение имеет центр в
точке t = 0 . Для распределения с центром в произвольной точке
t = A получим
?
? [1 /(1+ | t ? A | / B)]1+?
p (t ) =
2B
? ? < t < +?, B > 0, ? > 0
Итак, мы получили симметричное распределение, зависящее от
трех параметров, с помощью которого можно описывать выборки
случайных величин, в том числе с пологими спадами. Однако, это
распределение обладает недостатками, которые были рассмотрены
при обсуждении распределения Коши, а именно, математическое
ожидание существует только при ? > 1 , дисперсия конечна только
при ? > 2 , и вообще, конечный момент распределения к-го
порядка существует при ? > k .

2.10. Обобщенное экспоненциальное распределение.
Выше в этой главе были рассмотрены два вида
экспоненциальных распределений: Гаусса и Лапласа. У них много
общего: они симметричны, зависят от двух параметров ( µ , ? ) ,
имеют конечные моменты любого порядка. Отличие же состоит в
том, что из-за того, что переменная х возводится в разную степень
под знаком экспоненты (в квадрат у распределения Гаусса и в пер-
вую степень у распределения Лапласа), эксцесс у них разный. На-
помним, что эксцесс характеризует остроту пика распределения и
крутизну спада хвостов распределения. Возникает вопрос: можно
ли записать формулу для плотности вероятности
экспоненциального распределения в общем виде, то есть с
произвольной положительной степенью переменной х под знаком
экспоненты? Оказывается, такая формула существует:
?
? x?µ ?
?
exp? ? ?
p ( x) = ? ? < x < +?
? ?? ?
2 Г (1 / ? )?? ? ?

41
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 2. Аналитические законы распределения случайных величин


? = Г (1 / ? ) Г (3 / ? )
где Г (t ) - это гамма-функция. О том, как вычисляется гамма-
функция, рассказано в ПРИЛОЖЕНИИ 2.1 к этой главе.
Распределение с приведенной выше плотностью вероятности
мы будем называть обобщенным экспоненциальным
распределением, которое характеризуется тремя параметрами:
- математическим ожиданием (медианой, модой) µ ,
- среднеквадратичным отклонением ? (дисперсией ? ),
2

- показателем степени распределения ? .
Показатель степени ? характеризует форму распределения:
- при ? < 1 распределение имеет очень острый пик и очень
пологие спады,
- при ? = 1 распределение тождественно распределению
Лапласа,
- при ? = 2 распределение тождественно распределению
Гаусса,
- при ? > 2 распределение становится похожим на
равнобедренную трапецию, то есть имеет плоскую вершину и
резко спадающие хвосты,
- при ? > ? распределение тождественно равномерному
распределению.
Эксцесс распределения однозначно определяется показателем сте-
пени ? : ? = Г (1 / ? ) Г (5 / ? ) /[ Г (3 / ? )] .
2

Соответственно, из вычисленного по выборке случайных величин
значения оценки эксцесса, можно определить оценку показателя
?.
Обычно в справочниках распределения Гаусса, Лапласа и рав-
номерное рассматриваются как разные распределения, хотя в изла-
гаемой здесь концепции - это одно и тоже распределение. Единст-
венным параметром, характеризующим форму (а значит и свойст-
ва) этих распределений является показатель ? .
В дальнейшем, если принята гипотеза о том, что плотность ве-
роятности случайной величины имеет экспоненциальный характер,
для описания этой величины будем использовать именно обобщен-
ное экспоненциальное распределение.
На рисунке приведена плотность стандартного обобщенного
экспоненциального распределения при различных значениях ? .

42
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 2. Аналитические законы распределения случайных величин



0.80
alpha = 1 (Лаплас)
alpha = 2 (Гаусс)
0.60
alpha = 100

0.40


0.20


0.00
-4.0 -3.0 -2.0 -1.0 0.0 1.0 2.0 3.0 4.0


В общем случае плотность вероятности обобщенного экспо-
ненциального распределения нельзя проинтегрировать для получе-
ния функции распределения вероятностей F(x) в явном виде. F(x)
можно найти с использованием:
- численных методов интегрирования функции р(х),
- путем разложения функции р(х) в ряд с последующим аналити-
ческим интегрированием этого ряда.
О том, как это делается, будет рассказано в следующих параграфах.
Вычисление интегральной функции обобщенного экспоненци-
ального распределения в Microsoft Excel
Не приводя доказательства скажем, что интегральная функция
обобщенного экспоненциального распределения может быть
выражена через интегральную функцию гамма-распределения
(встроенная функция Excel) следующим образом:
? x?µ ? 1 ?
x ? µ : F ( x ) = 0 . 5 + 0 . 5 ? ГАММАРАСП ? , ,1, ИСТИНА ?
? ?? ?
?
? ?
? x?µ ? 1 ?
F ( x ) = 0 . 5 ? 0 . 5 ? ГАММАРАСП ? ?
x<µ: , ,1, ИСТИНА
? ?? ?
?
? ?

2.11. Поиск интегральной функции распределения путем
численного интегрирования плотности распределения.
Пусть дана случайная величина, которая подчиняется обоб-
щенному экспоненциальному распределению с параметрами
43
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 2. Аналитические законы распределения случайных величин


( µ ,? ,? ) , то есть плотность вероятности имеет вид:
?
? x?µ ?
?
exp? ? ?
p ( x) = ? ? < x < +?
? ?? ?
2 Г (1 / ? )?? ? ?
Требуется найти интегральную функцию распределения:
x

? p( z )dz
F ( x) =
??
Прежде всего заметим, что задачу можно упростить, перейдя к
переменной t = ( x ? µ ) / ? . Случайная величина t имеет математи-
ческое ожидание, равное нулю, и дисперсию, равную единице.
Формулы для плотности вероятности и функции распределения
примут вид:

( )
? ?
exp ? t ?
p (t ) = ? ? < t < +?
2 Г (1 / ? )?
t

? p( z )dz
F (t ) =
??
Для решения поставленной задачи достаточно:
- разбить всю область определения переменной t на N интерва-
лов, при этом узлы разбиения будут образовывать массив
{Tk }, k = 0,..., N .
- вычислить в узлах разбиения массив значений интегральной
функции {Fk }, k = 0,..., N .
Тогда для произвольного значения переменной t, такого, что
Tk ? t ? Tk +1 значение интегральной функции F(t) может быть при-
ближенно определено в виде:
F (t ) = Fk + (t ? Tk )( Fk +1 ? Fk ) /(Tk +1 ? Tk )
Так как между узлами разбиения величина F
аппроксимируется линейной зависимостью, то интервал разбиения
должен быть достаточно мал, то есть количество узлов разбиения
достаточно велико.
Однако, плотность вероятности определена на всей числовой
оси, а разбить бесконечный интервал на конечное количество ин-
тервалов конечной длины невозможно. Поэтому приближенно бу-
дем считать, что
44
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 2. Аналитические законы распределения случайных величин



( )
? ?
exp ? t ?
p(t ) = ?R?t ? R
2 Г (1 / ? )?

<< Предыдущая

стр. 7
(из 43 стр.)

ОГЛАВЛЕНИЕ

Следующая >>