<< Предыдущая

стр. 3
(из 44 стр.)

ОГЛАВЛЕНИЕ

Следующая >>



13
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 1. Вероятностное описание случайных величин


Относительной частотой случайного события называется
отношение количества случаев появления этого события M к
общему числу проведенных испытаний N.
Опыт показывает, что при многократном повторении испы-
таний относительная частота M/N случайного события обладает
устойчивостью. В разных достаточно длинных сериях испыта-
ний относительные частоты случайного события группируются
вокруг некоторого определенного числа. Устойчивость относи-
тельной частоты может быть объяснена как проявление объек-
тивного свойства случайного события, которое заключается в
существовании определенной степени его возможности.
Таким образом, степень возможности случайного события
можно описать числом. Это число называется вероятностью
случайного события. Именно вокруг вероятности группируются
относительные частоты данного случайного события. Относи-
тельная частота и вероятность случайного события являются
безразмерными величинами, которые могут принимать значения
от 0 до 1. Вероятность является первичным, базовым понятием,
и в общем случае ее нельзя определить через более простые
термины.

1.3. Случайная величина.
Случайной величиной называется такая величина, которая
принимает те или иные значения с определенными вероятно-
стями. Случайные величины могут быть дискретными и непре-
рывными.
Дискретной случайной величиной называется такая величи-
на, все возможные значения которой образуют конечную или
бесконечную последовательность чисел ( x1 , x2 ,..., xn ) и
принятие ей каждого из указанных значений есть случайное
событие, характеризующееся соответствующей вероятностью
( p1 , p2 ,..., pn ) . При этом должно соблюдаться условие норми-
?p = 1.
рования, то есть n
n
Непрерывной случайной величиной называется такая вели-
чина, все возможные значения которой целиком заполняют не-
который промежуток и попадание в любой интервал ( x1 , x2 )
14
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 1. Вероятностное описание случайных величин


есть случайное событие, характеризующееся соответствующей
P{x1 ? x ? x2 } . При этом вероятность
вероятностью
достоверного события P{?? ? x ? +?} = 1 .
Генеральной совокупностью будем называть все возможные
значения, которые может принимать случайная величина.

1.4. Законы распределения случайной величины.
Для характеристики вероятности появления различных
значений случайной величины используют законы распределения
вероятностей случайной величины. При этом различают два вида
представления законов распределения: интегральный и
дифференцальный.
Интегральным законом, или функцией распределения
вероятностей случайной величины X, называется функция, значе-
ние которой для любого x является вероятностью события, заклю-
чающегося в том, что случайная величина X принимает значения,
меньшие x, то есть функция F ( x) = P{ X < x} . Функция
распределения вероятностей обладает следующими
F (x)
свойствами:
1) 0 ? F ( x) ? 1 для любого x
F ( x1 ) ? F ( x 2 ), если x1 ? x 2
2)
3) F ( ??) = 0, F ( +?) = 1
Для случайной величины с непрерывной и дифференцируемой
функцией распределения вероятностей F (x) можно найти диффе-
ренциальный закон распределения вероятностей, выражаемый как
производная F (x) , то есть p ( x) = dF ( x) / dx . Эта зависимость
называется плотностью распределения вероятностей. Плотность
распределения p (x) обладает следующими свойствами:
p( x) ? 0 для любого x
1)
x

? p(t )dt
P{ X < x} ? F ( x) =
2)
??
b
P{a ? X < b} = F (b) ? F (a ) = ? p (t )dt
3)
a


15
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 1. Вероятностное описание случайных величин

+?

? p( x)dx = 1
4)
??
Распределение называется предельно пологим, если при
x > ±? его плотность вероятности p ( x) ? 1 / | x |1+? , где ? -
сколь угодно малое положительное число. При более пологих,
чем 1 / | x |1+? спадах, площадь под кривой бесконечна, то есть не
выполняется условие нормирования, и такие кривые не могут
описывать плотность распределения вероятностей.

1.5. Показатели центра распределения.
Координата центра распределения определяет положение
случайной величины на числовой оси. Дать однозначное
определение этого понятия невозможно. Центр распределения
может быть найден несколькими способами:
- как медиана распределения,
- как мода распределения,
- как математическое ожидание.
Медиана
Наиболее общим, а следовательно наиболее
фундаментальным, является определение центра распределения
согласно принципу симметрии, то есть как такой точки на оси x,
слева и справа от которой вероятности появления случайной
величины одинаковы и равны 0.5. Такой показатель центра
распределения называется медианой. В отличие от других
показателей центра, медиана существует у любого
распределения. Медиану обычно обозначают как Me .
Мода
Точка на оси x, соответствующая максимуму кривой
плотности распределения, называется модой, то есть мода – это
наиболее вероятное значение случайной величины. Однако,
мода существует не у всех распределений. В качестве примера
можно привести равномерное распределение. В этом случае
определение центра распределение как моды невозможно. Моду
обычно обозначают как Mo .
16
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 1. Вероятностное описание случайных величин


Математическое ожидание
Наиболее часто используемым методом оценки центра
распределения является математическое ожидание.
Преимущественное использование математического ожидания
объясняется тем, что это единственная оценка, которую можно
выразить аналитически.
Математическое ожидание обозначается как µ и
вычисляется по формулам:
- для дискретного распределения
M ( x) ? µ = ? x n p n
n
для непрерывного распределения
-
+?

? xp( x)dx
M ( x) ? µ =
??
Необходимо отметить, что математическое ожидание
существует только у тех распределений, у которых при x > ±?
плотность вероятности спадает как 1 / | x |2 +? или круче, где ? -
сколь угодно малое положительное число. При более пологих,
чем 1 / | x |2 +? спадах, математическое ожидание не существует,
так как определяющий его интеграл расходится.

1.6. Моменты распределения.
Для описания свойств распределений нам понадобится понятие
момента распределения. Существуют два типа моментов:
начальные и центральные. Начальным называется момент
распределения, найденный без исключения систематической
составляющей. Соответственно, центральным является момент,
вычисленный с исключением систематической составляющей.
Начальный момент k-го порядка вычисляется по формулам:
- для дискретного распределения
M k = ? xn pn
k

n
для непрерывного распределения
-
+?

?x
Mk = k
p( x)dx
??

17
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 1. Вероятностное описание случайных величин


Первый начальный момент был уже рассмотрен выше - это
математическое ожидание.
Центральный момент k-го порядка вычисляется по
формулам:
- для дискретного распределения
mk = ? ( xn ? µ ) k pn
n
для непрерывного распределения
-
+?
mk = ? ( x ? µ ) k p ( x)dx
??
Понятие моментов распределения будет использовано при
изучении показателей рассеяния случайной величины и
показателей формы распределения.

1.7. Показатели меры рассеяния.
Оценив величину центра распределения, нам необходимо
иметь представление, как случайная величина рассеяна вокруг
этой точки. Для оценки меры рассеяния используются, как пра-
вило, два способа:
- квантильное отклонение случайной величины,
- дисперсия и среднеквадратичное отклонение случайной ве-
личины.
Квантильное отклонение
Площадь, заключенная под кривой плотности распределения
p(x), согласно правилу нормирования, равна единице, то есть
отражает вероятность всех возможных событий.
Выберем точку Х1 на оси х таким образом, чтобы площадь под
кривой р(х) слева от точки Х1 была бы равна, например, 5% от
общей площади, то есть вероятность того, что случайная величина
меньше, чем Х1 составляет 0.05. В этом случае говорят, что Х1 - это
5%-ная квантиль распределения. Ее удобно обозначить как
X 1 = X 0.05 .
Выберем далее точку Х3 на оси х таким образом, чтобы
площадь под кривой р(х) слева от точки Х3 была бы равна 95% от
общей площади, то есть вероятность того, что случайная величина


18
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 1. Вероятностное описание случайных величин


меньше, чем Х3 составляет 0.95. Тогда Х3 - это 95%-ная квантиль
распределения. Обозначим ее как X 3 = X 0.95 .
Медиана распределения - это 50%-ная квантиль, так как она
делит площадь под кривой р(х) на две равные части. Медиану
можно обозначить как X 2 = X 0.50 .
Заметим, что точки X 1 = X 0.05 и X 3 = X 0.95 симметричны в том
смысле, что
- во-первых, вероятность того, что случайная величина меньше
Х1, и вероятность того, что случайная величина больше Х3,
равны между собой,
- во-вторых, вероятность того, что случайная величина
находится в интервале от Х1 до Х2, и вероятность того, что
случайная величина находится в интервале от Х2 до Х3, также
равны между собой.
Интервал значений х между X 1 = X 0.05 и X 3 = X 0.95 называют
интерквантильным промежутком с 90%-ной вероятностью. Его
? 0.90 = X 0.95 ? X 0.05 . Половину указанного
протяженность
промежутка, которую будем называть квантильным отклонением с
90%-ной вероятностью, обозначим как d 0.90 = ? 0.90 / 2 .
На основании вышеизложенного подхода можно ввести
понятие квантильной оценки рассеяния случайной величины, то
есть значения рассеяния с заданной доверительной вероятностью.
Для симметричных распределений квантильное рассеяние с
заданной доверительной вероятностью P - это такой интервал
неопределенности ( X 0.50 ? d P , X 0.50 + d P ) , внутри которого лежат
100 P процентов всех значений случайной величины, а 100(1 ? P)
процентов лежат вне этого интервала.
Так как квантили, ограничивающие доверительный интервал,
могут быть различными, при указании квантильной оценки рассея-
ния обязательно должна быть указана доверительная вероятность
такой оценки. Квантильная оценка рассеяния применима для лю-
бых законов распределения случайной величины.

<< Предыдущая

стр. 3
(из 44 стр.)

ОГЛАВЛЕНИЕ

Следующая >>