<< Предыдущая

стр. 3
(из 43 стр.)

ОГЛАВЛЕНИЕ

Следующая >>

3) F ( ??) = 0, F ( +?) = 1
Для случайной величины с непрерывной и дифференцируемой
функцией распределения вероятностей F (x) можно найти диффе-
ренциальный закон распределения вероятностей, выражаемый как
производная F (x) , то есть p ( x) = dF ( x) / dx . Эта зависимость
называется плотностью распределения вероятностей. Плотность
распределения p (x) обладает следующими свойствами:
p( x) ? 0 для любого x
1)
x

? p(t )dt
P{ X < x} ? F ( x) =
2)
??
b
P{a ? X < b} = F (b) ? F (a ) = ? p (t )dt
3)
a


15
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 1. Вероятностное описание случайных величин

+?

? p( x)dx = 1
4)
??
Распределение называется предельно пологим, если при
x > ±? его плотность вероятности p ( x) ? 1 / | x |1+? , где ? -
сколь угодно малое положительное число. При более пологих,
чем 1 / | x |1+? спадах, площадь под кривой бесконечна, то есть не
выполняется условие нормирования, и такие кривые не могут
описывать плотность распределения вероятностей.

1.5. Показатели центра распределения.
Координата центра распределения определяет положение
случайной величины на числовой оси. Дать однозначное
определение этого понятия невозможно. Центр распределения
может быть найден несколькими способами:
- как медиана распределения,
- как мода распределения,
- как математическое ожидание.
Медиана
Наиболее общим, а следовательно наиболее
фундаментальным, является определение центра распределения
согласно принципу симметрии, то есть как такой точки на оси x,
слева и справа от которой вероятности появления случайной
величины одинаковы и равны 0.5. Такой показатель центра
распределения называется медианой. В отличие от других
показателей центра, медиана существует у любого
распределения. Медиану обычно обозначают как Me .
Мода
Точка на оси x, соответствующая максимуму кривой
плотности распределения, называется модой, то есть мода – это
наиболее вероятное значение случайной величины. Однако,
мода существует не у всех распределений. В качестве примера
можно привести равномерное распределение. В этом случае
определение центра распределение как моды невозможно. Моду
обычно обозначают как Mo .
16
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 1. Вероятностное описание случайных величин


Математическое ожидание
Наиболее часто используемым методом оценки центра
распределения является математическое ожидание.
Преимущественное использование математического ожидания
объясняется тем, что это единственная оценка, которую можно
выразить аналитически.
Математическое ожидание обозначается как µ и
вычисляется по формулам:
- для дискретного распределения
M ( x) ? µ = ? x n p n
n
- для непрерывного распределения
+?

? xp( x)dx
M ( x) ? µ =
??
Необходимо отметить, что математическое ожидание
существует только у тех распределений, у которых при x > ±?
плотность вероятности спадает как 1 / | x |2 +? или круче, где ? -
сколь угодно малое положительное число. При более пологих,
чем 1 / | x |2 +? спадах, математическое ожидание не существует,
так как определяющий его интеграл расходится.

1.6. Моменты распределения.
Для описания свойств распределений нам понадобится понятие
момента распределения. Существуют два типа моментов:
начальные и центральные. Начальным называется момент
распределения, найденный без исключения систематической
составляющей. Соответственно, центральным является момент,
вычисленный с исключением систематической составляющей.
Начальный момент k-го порядка вычисляется по формулам:
- для дискретного распределения
M k = ? xn pn
k

n
- для непрерывного распределения
+?

?x
Mk = k
p( x)dx
??

17
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 1. Вероятностное описание случайных величин


Первый начальный момент был уже рассмотрен выше - это
математическое ожидание.
Центральный момент k-го порядка вычисляется по
формулам:
- для дискретного распределения
mk = ? ( xn ? µ ) k pn
n
- для непрерывного распределения
+?
mk = ? ( x ? µ ) k p ( x)dx
??
Понятие моментов распределения будет использовано при
изучении показателей рассеяния случайной величины и
показателей формы распределения.

1.7. Показатели меры рассеяния.
Оценив величину центра распределения, нам необходимо
иметь представление, как случайная величина рассеяна вокруг
этой точки. Для оценки меры рассеяния используются, как пра-
вило, два способа:
- квантильное отклонение случайной величины,
- дисперсия и среднеквадратичное отклонение случайной ве-
личины.
Квантильное отклонение
Площадь, заключенная под кривой плотности распределения
p(x), согласно правилу нормирования, равна единице, то есть
отражает вероятность всех возможных событий.
Выберем точку Х1 на оси х таким образом, чтобы площадь под
кривой р(х) слева от точки Х1 была бы равна, например, 5% от
общей площади, то есть вероятность того, что случайная величина
меньше, чем Х1 составляет 0.05. В этом случае говорят, что Х1 - это
5%-ная квантиль распределения. Ее удобно обозначить как
X 1 = X 0.05 .
Выберем далее точку Х3 на оси х таким образом, чтобы
площадь под кривой р(х) слева от точки Х3 была бы равна 95% от
общей площади, то есть вероятность того, что случайная величина


18
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 1. Вероятностное описание случайных величин


меньше, чем Х3 составляет 0.95. Тогда Х3 - это 95%-ная квантиль
распределения. Обозначим ее как X 3 = X 0.95 .
Медиана распределения - это 50%-ная квантиль, так как она
делит площадь под кривой р(х) на две равные части. Медиану
можно обозначить как X 2 = X 0.50 .
Заметим, что точки X 1 = X 0.05 и X 3 = X 0.95 симметричны в том
смысле, что
- во-первых, вероятность того, что случайная величина меньше
Х1, и вероятность того, что случайная величина больше Х3,
равны между собой,
- во-вторых, вероятность того, что случайная величина
находится в интервале от Х1 до Х2, и вероятность того, что
случайная величина находится в интервале от Х2 до Х3, также
равны между собой.
Интервал значений х между X 1 = X 0.05 и X 3 = X 0.95 называют
интерквантильным промежутком с 90%-ной вероятностью. Его
? 0.90 = X 0.95 ? X 0.05 . Половину указанного
протяженность
промежутка, которую будем называть квантильным отклонением с
90%-ной вероятностью, обозначим как d 0.90 = ? 0.90 / 2 .
На основании вышеизложенного подхода можно ввести
понятие квантильной оценки рассеяния случайной величины, то
есть значения рассеяния с заданной доверительной вероятностью.
Для симметричных распределений квантильное рассеяние с
заданной доверительной вероятностью P - это такой интервал
неопределенности ( X 0.50 ? d P , X 0.50 + d P ) , внутри которого лежат
100 P процентов всех значений случайной величины, а 100(1 ? P)
процентов лежат вне этого интервала.
Так как квантили, ограничивающие доверительный интервал,
могут быть различными, при указании квантильной оценки рассея-
ния обязательно должна быть указана доверительная вероятность
такой оценки. Квантильная оценка рассеяния применима для лю-
бых законов распределения случайной величины.
При рассмотрении квантильного отклонения, мы не случайно в
качестве примера использовали отклонение с 90%-ной доверитель-
ной вероятностью. Дело в том, что величина d 0.90 обладает
уникальным свойством, которое заключается в том, что только
19
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 1. Вероятностное описание случайных величин


квантильное отклонение d 0.90 имеет однозначное соотношение со
среднеквадратичным отклонением ? (которое будет рассмотрено
ниже) в виде d 0.90 ? 1.6? для очень широкого класса наиболее
употребительных законов распределения. Поэтому, при отсутствии
данных о виде закона распределения, для оценки квантильного
отклонения рекомендуется пользоваться доверительной
вероятностью, равной 0.90.
Дисперсия и среднеквадратичное отклонение
Если в качестве показателя центра распределения выбрано
математическое ожидание, то в качестве меры рассеяния слу-
чайной величины используют дисперсию. Дисперсия - это сред-
нее значение квадратов отклонений случайной величины от ее
математического ожидания. Дисперсия является вторым цен-
тральным моментом распределения.
Дисперсия обозначается как D и вычисляется по формулам:
- для дискретного распределения
D = ? ( xn ? µ ) 2 pn
n
- для непрерывного распределения
+?
D = ? ( x ? µ ) 2 p( x)dx
??
В формуле для дисперсии в качестве центра распределения
использовано математическое ожидание. Это не случайно. Дело
в том, что использование в качестве центра распределения
математического ожидания минимизирует средний квадрат
отклонения случайной величины от ее центра. При этом
минимум среднего квадрата отклонений как раз и равен
дисперсии. Дисперсия и математическое ожидание связаны
соотношением:
D( x) = M ( x 2 ) ? [ M ( x)]2
Дисперсия имеет размерность квадрата случайной величи-
ны. Поэтому для более наглядной характеристики рассеяния ис-
пользуют корень квадратный из дисперсии, который называется
среднеквадратичным отклонением (с.к.о.): ? = D.

20
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 1. Вероятностное описание случайных величин


Дисперсия - наиболее широко применяемая оценка рассея-
ния случайных величин. Это связано с тем, что она обладает
свойством аддитивности, то есть дисперсия суммы статистиче-
ски независимых случайных величин равна сумме дисперсий
этих величин, безотносительно к разнообразию законов распре-
деления каждой из суммируемых величин и возможной дефор-
мации законов распределения при суммировании. Отметим, что
среднеквадратичное отклонение не аддитивно.
Таким образом, для того, чтобы рассеяния случайных вели-
чин можно было суммировать аналитически, эти рассеяния
должны быть представлены своими дисперсиями, а не кван-
тильными (доверительными) отклонениями.
Однако, конечная дисперсия существует только у тех
распределений, у которых при x > ±? плотность вероятности
спадает как 1 / | x |3+? или круче, где ? - сколь угодно малое
положительное число. При более пологих, чем 1 / | x |3+? спадах,
определяющий дисперсию интеграл расходится.

1.8. Показатели формы распределения - коэффициент асим-
метрии.
При изучении формы распределения случайной величины
важно выяснить, симметрична ли относительно центра распределе-
ния кривая плотности вероятности. Показателем степени несим-
метричности этой кривой является безразмерная величина, назы-
ваемая коэффициентом асимметрии. Коэффициент асимметрии
обозначается как ? или As . Рассмотрим на качественном уровне
понятие асимметрии.

<< Предыдущая

стр. 3
(из 43 стр.)

ОГЛАВЛЕНИЕ

Следующая >>