<< Предыдущая

стр. 4
(из 44 стр.)

ОГЛАВЛЕНИЕ

Следующая >>

При рассмотрении квантильного отклонения, мы не случайно в
качестве примера использовали отклонение с 90%-ной доверитель-
ной вероятностью. Дело в том, что величина d 0.90 обладает
уникальным свойством, которое заключается в том, что только
19
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 1. Вероятностное описание случайных величин


квантильное отклонение d 0.90 имеет однозначное соотношение со
среднеквадратичным отклонением ? (которое будет рассмотрено
ниже) в виде d 0.90 ? 1.6? для очень широкого класса наиболее
употребительных законов распределения. Поэтому, при отсутствии
данных о виде закона распределения, для оценки квантильного
отклонения рекомендуется пользоваться доверительной
вероятностью, равной 0.90.
Дисперсия и среднеквадратичное отклонение
Если в качестве показателя центра распределения выбрано
математическое ожидание, то в качестве меры рассеяния слу-
чайной величины используют дисперсию. Дисперсия - это сред-
нее значение квадратов отклонений случайной величины от ее
математического ожидания. Дисперсия является вторым цен-
тральным моментом распределения.
Дисперсия обозначается как D и вычисляется по формулам:
- для дискретного распределения
D = ? ( xn ? µ ) 2 pn
n
для непрерывного распределения
-
+?
D = ? ( x ? µ ) 2 p( x)dx
??
В формуле для дисперсии в качестве центра распределения
использовано математическое ожидание. Это не случайно. Дело
в том, что использование в качестве центра распределения
математического ожидания минимизирует средний квадрат
отклонения случайной величины от ее центра. При этом
минимум среднего квадрата отклонений как раз и равен
дисперсии. Дисперсия и математическое ожидание связаны
соотношением:
D( x) = M ( x 2 ) ? [ M ( x)]2
Дисперсия имеет размерность квадрата случайной величи-
ны. Поэтому для более наглядной характеристики рассеяния ис-
пользуют корень квадратный из дисперсии, который называется
среднеквадратичным отклонением (с.к.о.): ? = D.

20
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 1. Вероятностное описание случайных величин


Дисперсия - наиболее широко применяемая оценка рассея-
ния случайных величин. Это связано с тем, что она обладает
свойством аддитивности, то есть дисперсия суммы статистиче-
ски независимых случайных величин равна сумме дисперсий
этих величин, безотносительно к разнообразию законов распре-
деления каждой из суммируемых величин и возможной дефор-
мации законов распределения при суммировании. Отметим, что
среднеквадратичное отклонение не аддитивно.
Таким образом, для того, чтобы рассеяния случайных вели-
чин можно было суммировать аналитически, эти рассеяния
должны быть представлены своими дисперсиями, а не кван-
тильными (доверительными) отклонениями.
Однако, конечная дисперсия существует только у тех
распределений, у которых при x > ±? плотность вероятности
спадает как 1 / | x |3+? или круче, где ? - сколь угодно малое
положительное число. При более пологих, чем 1 / | x |3+? спадах,
определяющий дисперсию интеграл расходится.

1.8. Показатели формы распределения - коэффициент асим-
метрии.
При изучении формы распределения случайной величины
важно выяснить, симметрична ли относительно центра распределе-
ния кривая плотности вероятности. Показателем степени несим-
метричности этой кривой является безразмерная величина, назы-
ваемая коэффициентом асимметрии. Коэффициент асимметрии
обозначается как ? или As . Рассмотрим на качественном уровне
понятие асимметрии.
В случае, если кривая плотности вероятности имеет крутой ле-
вый и пологий правый спад, говорят, что распределение имеет по-
ложительную асимметрию. В этом случае координаты показате-
лей центра распределения располагаются на оси абсцисс, как пра-
вило, следующим образом:
мода < медиана < математическое ожидание.
Если кривая плотности вероятности имеет пологий левый и
крутой правый спад, распределение имеет отрицательную асим-
метрию. В этом случае для показателей центра распределения име-
ем:
математическое ожидание < медиана < мода.
21
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 1. Вероятностное описание случайных величин


Наконец, у симметричных распределений, медиана, мода и ма-
тематическое ожидание совпадают.
Разумеется, все вышесказанное о соотношении показателей
центра, справедливо только для тех распределений, у которых су-
ществует мода и/или математическое ожидание. Напомним, что
понятие медианы применимо к любому распределению.
Существует несколько методов для оценки коэффициента
асимметрии.
Оценка коэффициента асимметрии с помощью квантилей рас-
пределения
Рассмотрим, например, интерквантильный промежуток с 90%-
ной вероятностью. Напомним, что он образован с помощью 5%-ной
и 95%-ной квантилей распределения. Тогда соответствующий
коэффициент асимметрии вычисляется по следующей формуле:
( x0.95 ? x0.50) ? ( x0.50 ? x0.05) + x0.05 ? 2 x0.50
=x 0.95

? x0.05 ? x0.05
x x
0.95 0.95
Разумеется, таким способом можно вычислить коэффициент
асимметрии на любом интерквантильном промежутке, однако сле-
дует сказать, что подобная оценка будет зависеть от выбора интер-
квантильного промежутка, то есть, например, оценка на 90%-ном и
на 50%-ном промежутках будут давать вообще говоря разные ре-
зультаты. Достоинством данного метода является то, что с его по-
мощью можно рассчитать коэффициент асимметрии для любого
распределения.
Оценка коэффициента асимметрии с помощью третьего
центрального момента распределения
Если в качестве показателя центра распределения выбрано ма-
тематическое ожидание, то коэффициент асимметрии рассчитыва-
ют, используя третий центральный момент распределения.
В этом случае коэффициент асимметрии - это отношение
третьего центрального момента (имеющего размерность куба слу-
чайной величины) к среднеквадратичному отклонению (размер-
ность которого совпадает с размерностью случайной величины),
возведенному в третью степень.
Коэффициент асимметрии вычисляется по формулам:
- для дискретного распределения

22
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 1. Вероятностное описание случайных величин


? (x ? µ ) 3 pn
n
?= n

?3
для непрерывного распределения
-
+?

? ( x ? µ ) 3 p( x)dx
? = ??
?3
1.9. Показатели формы распределения - эксцесс.
Чрезвычайно важным показателем формы распределения
является безразмерный показатель, называемый эксцессом. Эксцесс
обозначается как ? или Ex . Эксцесс характеризует:
- во-первых, остроту пика распределения,
- во-вторых, крутизну спада хвостов распределения.
Если за точку отсчета принять нормальное распределение (которое
будет подробно рассмотрено ниже), то распределения плотности
вероятности можно условно разделить на три группы:
- островершинные,
- средневершинные,
- плосковершинные.
Островершинные распределения характеризуются более
выраженным, чем у нормального распределения, пиком и полого
спадающими, "тяжелыми" хвостами.
Средневершинные распределения незначительно отличаются от
нормального.
Плосковершинные распределения имеют слабо выраженный пик
или совсем не имеют пика и, соответственно, моды. Кроме того,
они характеризуются резко спадающими хвостами.
Определим эксцесс как отношение четвертого центрального
момента распределения к среднеквадратичному отклонению, воз-
веденному в четвертую степень. Эксцесс вычисляется по форму-
лам:
- для дискретного распределения
? (x ? µ ) 4 pn
n
?= n
?4
для непрерывного распределения
-

23
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 1. Вероятностное описание случайных величин

+?

? (x ? µ )
4
p( x)dx
?= ??
?4
Для различных законов распределения эксцесс может иметь
значение от 1 до +?. Нормальное распределение имеет эксцесс,
равный трем.
Эксцесс удобно использовать для характеристики остроты
пика и крутизны спадов хвостов распределения:
- островершинные распределения имеют эксцесс > 3,
- средневершинные распределения имеют эксцесс ? 3,
- плосковершинные распределения имеют эксцесс < 3,
Часто в качестве эксцесса используют отношение
четвертого центрального момента к четвертой степени
среднеквадратичного отклонения, за вычетом числа три. Однако
здесь и далее мы будем рассчитывать эксцесс по приведенным
выше формулам.

1.10. Плотность распределения функции от случайной вели-
чины.
Пусть Х - это случайная величина, имеющая плотность
распределения p x (x) . Найдем плотность распределения p y ( y )
случайной величины Y, которая является функцией от Х.
Пусть функция y (x) монотонно возрастает. Тогда любой ин-
тервал ( x1 , x2 ) взаимно однозначно отображается на интервал
( y1 , y 2 ) . Следовательно, вероятности попадания случайных вели-
чин Х и Y в соответствующие интервалы равны. В применении к
малым интервалам это означает равенство дифференциалов веро-
ятности:
p x ( x)dx = p y ( y )dy
dx
Следовательно p y ( y ) = p x [ x( y )] ?
dy
где x( y ) - это функция, обратная функции y (x) .
Если функция y (x) монотонно убывает, то положительному
значению dx соответствует отрицательное значение dy.

24
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 1. Вероятностное описание случайных величин


Следовательно, в уравнении равенства дифференциалов нужно
заменить dy на -dy=|dy|. Это приводит к более общей зависимости:
dx
p y ( y ) = p x [ x( y )] ?
dy
Для иллюстрации вышесказанного рассмотрим несколько приме-
ров.
1) y ( x) = ax + b, a ? 0
В зависимости от знака параметра a эта функция может быть
как монотонно возрастающей, так и монотонно убывающей.
Переменные х и y определены на всей числовой оси.
y ?b dx 1
x( y ) = =
a dy a
? y ?b?
1
p y ( y) = px ? ?
|a| ? a ?
y ( x) = x 3
2)
Эта функция является монотонно возрастающей. Переменные
х и y определены на всей числовой оси.
dx 1
x( y ) = y1 / 3 = 2/3
dy 3 y
1
p y ( y) = p x ( y1 / 3 )
3y2/3
y ( x) = ln( x)
3)
Эта функция является монотонно возрастающей. Переменная х
определена на интервале от 0 до +?. Переменная y определена
на всей числовой оси.
dx
x( y ) = e y = ey
dy
p y ( y ) = e y p x (e y )

<< Предыдущая

стр. 4
(из 44 стр.)

ОГЛАВЛЕНИЕ

Следующая >>