<< Предыдущая

стр. 10
(из 43 стр.)

ОГЛАВЛЕНИЕ

Следующая >>

x = ХИ 2ОБР (q,? ) или x = ХИ 2ОБР (1 ? P,? )

3.3. F-распределение (распределение v2).
Плотность F-распределения задается формулой:

x < 0: p( x) = 0
x > 0:
Г ((? 1 + ? 2 ) / 2) (? 1 ? 2) / 2
p( x) = (? 1 / ? 2 ) 1 ? ? (1 + (? 1 / ? 2 ) ? x ) 1 2
? /2 ? (? +? ) / 2
?x
Г (? 1 / 2)Г (? 2 / 2)
Плотность F-распределения зависит от двух параметров
(? 1 ,? 2 ) , которые принято называть числом степеней свободы.
Приведем значения основных характеристик F-распределения:

?2
Математическое
при ? 2 > 2
ожидание
?2 ? 2
? 2 (? 1 ? 2)
Мода
при ? 1 > 2
? 1 (? 2 + 2)
Дисперсия 2? 2 (? 1 + ? 2 ? 2)
2
при ? 2 > 4
? 1 (? 2 ? 2) 2 (? 2 ? 4)

Типичная интерпретация
Пусть случайные величины Х и Y имеют нормальное
распределение с дисперсиями ? x и ? y соответственно.
2 2


Если имеются выборки этих случайных величин
( x1 , x 2 ,..., x N ) и ( y1 , y 2 ,..., y M ) , то состоятельными и
несмещенными оценками дисперсий по выборке будут
следующие величины:


57
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 3. Специальные распределения вероятностей


1N 1N
? ( xk ? X ) 2 ? ( yk ? Y ) 2
2 2
?x ?y
= =
N ? 1 k =1 M ? 1 k =1
Пусть выборочная дисперсия величины Х больше
выборочной дисперсии величины Y . Тогда случайная величина
2 2
F = ? x /? y будет подчиняться F-распределению с
? 1 = N ? 1, ? 2 = M ? 1 степенями свободы.
Вычисление F-распределения с помощью Microsoft Excel
Приведем несколько примеров вычисления характеристик
F-распределения. Все используемые функции можно найти в
разделе "Статистические функции" электронных таблиц Micro-
soft Excel.

Пусть случайная величина X подчиняется F-распределению с
числом степеней свободы ? 1 , ? 2 .
1) Вероятность того, что X ? x , вычисляется как:
P = 1 ? FРАСП ( x,? 1 ,? 2 )
2) Вероятность того, что X > x , равна:
q = FРАСП ( x,? 1 ,? 2 )
Величина q - это вероятность того, что случайная величина
X попадает в критическую область F-распределения.
3) Если известна вероятность P или вероятность q , то
соответствующее значение x , определяющее границу
интервала X ? x равно:
x = FРАСПОБР (q,? 1 ,? 2 ) или
x = FРАСПОБР (1 ? P,? 1 ,? 2 )




58
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 4. Оценка параметров распределения по выборке случайной вели-
чины

4. ОЦЕНКА ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ ПО ВЫ-
БОРКЕ СЛУЧАЙНОЙ ВЕЛИЧИНЫ

4.1. Введение.
Эта глава посвящена методам оценки по эмпирической вы-
борке параметров распределения случайной величины. Будут
указаны формулы для оценки центра распределения, дисперсии
и показателей формы распределения, а также практические
приемы удаления аномальных значений (промахов) из выборки.

4.2. Оценки центра распределения.
По возможности наиболее точная оценка центра распреде-
ления по выборке случайных величин исключительно важна, так
как центр распределения используется в формулах для вычисле-
ния дисперсии, среднеквадратичного отклонения, коэффициента
асимметрии и эксцесса распределения. Некорректное определе-
ние центра влечет за собой ошибки в определении всех этих ве-
личин.
Оценку центра распределения по выборке можно проводить
различными способами. Не зная априорно закона распределения
случайной величины, невозможно заранее указать наиболее
приемлемый способ. К тому же, некоторые из этих оценок чув-
ствительны к наличию аномальных значений в выборке (прома-
хов).
Поэтому для корректной оценки центра распределения мы
будем вычислять его пятью различными способами. После этого
пять полученных оценок упорядочим по возрастанию и выберем
из них в качестве центра распределения серединное, то есть
третье по счету, значение.
Выборку случайных величин будем обозначать как
{xk }, k = 1,..., N . Упомянутые выше пять оценок центра по вы-
борке следующие:
- медиана Хмедиана,
- центр 50%-ного интерквантильного промежутка (центр сги-
бов) Хцентр_сгибов,
- среднее арифметическое по всей выборке X ,

59
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 4. Оценка параметров распределения по выборке случайной вели-
чины

- среднее арифметическое по 50%-ному интерквантильному
промежутку X 50% ,
- центр размаха Хцентр_размаха.
Серединное значение этих оценок будем обозначать как ХЦЕНТР.
Медиана
Перед вычислением медианы выборка {xk } должна быть
упорядочена по возрастанию, после чего медиану можно опре-
делить следующим образом:
- если объем выборки N является нечетным, то
X медиана = x( N +1) / 2
- если объем выборки N является четным, то
X медиана = ( xN / 2 + x( N / 2)+1 ) / 2
Медиана нечувствительна к промахам в выборке.
Центр 50%-ного интерквантильного промежутка (центр
сгибов)
Перед вычислением этой оценки выборка {xk } также должна
быть упорядочена по возрастанию. Обозначим как М четвертую
часть от объема выборки, то есть M=ЦЕЛОЕ(N/4).
Тогда центр сгибов определяется по формуле:
X центр сгибов = ( xM +1 + xN ? M ) / 2
Центр сгибов нечувствителен к промахам в выборке.
Среднее арифметическое по всей выборке
Среднее арифметическое (выборочная средняя) является самым
распространенным методом оценки центра распределения:
N
1
?x
X= k
N k =1
Эта величина является несмещенной и состоятельной оценкой
математического ожидания (генеральной средней) µ случайной
переменной х. Несмещенность заключается в том, что
математическое ожидание величины X равно µ. Состоятель


60
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 4. Оценка параметров распределения по выборке случайной вели-
чины

ность заключается в том, что при объеме выборки N > ? ,
значение величины X > µ .
Среднее арифметическое случайных величин само является
случайной величиной. Дисперсия и среднеквадратичное
отклонение среднего арифметического зависят от дисперсии и
среднеквадратичного отклонения самой случайной величины и
объема выборки:
D( X ) = D / N = ? 2 / N
? (X ) = ? / N
Это соотношение справедливо для независимых данных с конечной
дисперсией и с любым законом распределения. Таким образом,
с.к.о. среднего значения меньше, чем с.к.о. самой случайной
величины в N раз. Из этого следует, что точность оценки можно
повысить путем увеличения объема выборки. Среднее
арифметическое не защищено от промахов. Особенно большое
влияние на него оказывают промахи при малом объеме выборки.
При увеличении объема эта оценка становится все более
устойчивой.
Среднее арифметическое по 50%-му интерквантильному
промежутку
Перед вычислением этой оценки выборка {xk } должна быть
упорядочена по возрастанию. Данная оценка является аналогом
предыдущей, но усреднение проводится по усеченной на 25%
слева и справа выборке. Если обозначить как М четвертую часть
от объема выборки, то есть M=ЦЕЛОЕ(N/4), то
N ?M
1
?x
=
X 50% k
N ? 2M k = M +1
Среднее арифметическое по 50%-ному интерквантильному про-
межутку нечувствительно к промахам в выборке.
Центр размаха
Центр размаха определяется как среднее между максимальным
и минимальным значением в выборке:
= [max( xk ) + min( xk )] / 2
X центр размаха

61
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 4. Оценка параметров распределения по выборке случайной вели-
чины

Центр размаха не защищен от промахов в выборке. Более того, в
отличие от среднего арифметического, объем выборки оказывает
гораздо меньшее влияние на точность этой оценки.

4.3. Оценка дисперсии и среднеквадратичного отклонения.
Оценки дисперсии и среднеквадратичного отклонения по
выборке случайной величины {xk }, k = 1,..., N вычисляются по
формулам:
1N
? ( xk ? X ) 2
D=
N ? 1 k =1
?= D
В случае небольших выборок и при наличии промахов
вместо среднего арифметического X следует применять ХЦЕНТР.
Эти оценки называют еще выборочной дисперсией и
выборочным с.к.о. Они определяют рассеяние случайной
величины, однако сами также являются случайными
величинами со своими показателями рассеяния.
Приближенные формулы для вычисления дисперсии и с.к.о.
выборочной дисперсии, а также дисперсии и с.к.о. выборочного
с.к.о. следующие:
4
m ??
? ( D) = D( D)
D( D) ? 4
N
4
m4 ? ?
D (? ) ? ? (? ) = D(? )
2
4 N?
где m4 - это оценка четвертого центрального момента
распределения, которая приведена в следующем параграфе.

4.4. Оценка коэффициента асимметрии и эксцесса.
Оценки третьего и четвертого моментов распределения по вы-
борке {xk }, k = 1,..., N определяются как:
N
N
? ( xk ? X ) 3
m3 =
( N ? 1)( N ? 2) k =1
62
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 4. Оценка параметров распределения по выборке случайной вели-
чины


N 2 ? 2N + 3 N

? ( xk ? X ) 4 ?
m4 =
( N ? 1)( N ? 2)( N ? 3) k =1
3(2 N ? 3) N N

? ( xk ? X ) ? ( xk ? X ) 2
? 2

<< Предыдущая

стр. 10
(из 43 стр.)

ОГЛАВЛЕНИЕ

Следующая >>