<< Предыдущая

стр. 13
(из 43 стр.)

ОГЛАВЛЕНИЕ

Следующая >>

3) Гипотеза
2
H0 : ? = ? 2
2
H1 : ? ? ? 2
4) Принятая величина уровня значимости
q = 0.05
5) Критерий проверки
2
?
? 2 = ( N ? 1) 2
?
6) Правило принятия решения
Принять Н0 , если ? q / 2, ? ? ? 2 ? ? 12? q / 2, ?
2


В противном случае принять Н1 , то есть Н1 принимается,
когда критерий проверки ? 2 попадает в критическую об-
ласть ? 2 < ? q / 2, ? или ? 2 > ? 12? q / 2, ?
2



75
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 5. Статистические выводы


7) Расчет границ критической области
? q / 2, ? = ? 02.025, 24 = ХИ 2ОБР(1 ? 0.025, 24) = 12.40
2


?12?q / 2, ? = ? 02.975, 24 = ХИ 2ОБР(1 ? 0.975, 24) = 39.36
8) Расчет критерия проверки
2
? 6.25
? 2 = ( N ? 1) 2 = 24 = 37.50
? 4
9) Проверка гипотезы
Так как ? q / 2, ? ? ? 2 ? ? 12? q / 2, ? , то критерий проверки
2


? 2 = 37.50 не попадает в критическую область и мы при-
нимаем гипотезу Н0. Это означает, что при заданном уровне
2
значимости выборочная дисперсия ? = 6.25 статистически
незначимо отличается от априорной величины генеральной
дисперсии ? 2 = 4 .
Правосторонняя проверка гипотез
1) Априорная информация
Генеральная дисперсия ? 2 = 3.6
2) Результаты испытания
2
? = 2.5 ? = 6.25
N = 25
3) Гипотеза
2
H0 : ? = ? 2
2
H1 : ? > ? 2
4) Принятая величина уровня значимости
q = 0.05
5) Критерий проверки
2
?
? = ( N ? 1) 2
2

?
6) Правило принятия решения
Принять Н0 , если ? 2 ? ? 12? q , ?


76
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 5. Статистические выводы


В противном случае принять Н1 , то есть Н1 принимается,
когда критерий проверки ? 2 попадает в критическую об-
ласть ? 2 > ? 12? q , ?
7) Расчет границ критической области
? 12? q , ? = ? 02.95, 24 = ХИ 2ОБР(1 ? 0.95, 24) = 36.42
8) Расчет критерия проверки
2
? 6.25
? 2 = ( N ? 1) 2 = 24 = 41.67
? 3.6
9) Проверка гипотезы
Так как ? 2 > ? 12? q , ? , то критерий проверки ? 2 = 41.67 на-
ходится в критической области и мы отвергаем гипотезу Н0
и принимаем гипотезу Н1. Это означает, что при заданном
2
уровне значимости выборочная дисперсия ? = 6.25 стати-
стически значимо отличается от априорной величины гене-
ральной дисперсии ? 2 = 3.6 .
Левосторонняя проверка гипотез
1) Априорная информация
Генеральная дисперсия ? 2 = 9
2) Результаты испытания
2
? = 2.5 ? = 6.25
N = 25
3) Гипотеза
2
H0 : ? = ? 2
2
H1 : ? < ? 2
4) Принятая величина уровня значимости
q = 0.05
5) Критерий проверки
2
?
? = ( N ? 1) 2
2

?
6) Правило принятия решения
Принять Н0 , если ? 2 ? ? q , ?
2


77
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 5. Статистические выводы


В противном случае принять Н1 , то есть Н1 принимается,
когда критерий проверки ? 2 попадает в критическую об-
ласть ? 2 < ? q , ?
2


7) Расчет границ критической области
? q , ? = ? 02.05, 24 = ХИ 2ОБР (1 ? 0.05, 24) = 13.85
2


8) Расчет критерия проверки
2
? 6.25
? 2 = ( N ? 1) 2 = 24 = 16.67
? 9
9) Проверка гипотезы
Так как ? 2 ? ? q , ? , то критерий проверки ? 2 = 16.67 не
2


попадает в критическую область и мы принимаем гипотезу
Н0. Это означает, что при заданном уровне значимости вы-
2
борочная дисперсия ? = 6.25 статистически незначимо
отличается от априорной величины генеральной дисперсии
?2 =9.




78
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 6. Идентификация закона распределения по выборке случайной ве-
личины

6. ИДЕНТИФИКАЦИЯ ЗАКОНА РАСПРЕДЕЛЕНИЯ ПО
ВЫБОРКЕ СЛУЧАЙНОЙ ВЕЛИЧИНЫ.

6.1. Введение.
В данной главе будет рассмотрен вопрос о том, как по эм-
пирической выборке идентифицировать закон распределения
случайной величины.
Подробно рассмотрена проблема группировки данных, то
есть расчет оптимального количества интервалов группировки и
оптимальной ширины интервала, а также построения по сгруп-
пированным данным гистограммы распределения.
Полученное эмпирическое распределение будет аппрокси-
мировано непрерывной аналитической функцией, то есть будет
идентифицирован закон распределения случайной величины.
Также рассмотрено использование критериев согласия при
идентификации закона распределения.
В качестве выборки случайной величины использована вы-
борка, состоящая из логарифмов относительного изменения ве-
личины индекса Российской торговой системы (индекса РТС) за
период с 1 сентября 1995 года по 31 декабря 2002 года.

6.2. Группировка данных. Оптимальное число интервалов
группировки.
Для расчета оценок математического ожидания, дисперсии,
среднеквадратичного отклонения, коэффициента асимметрии и
эксцесса (на основе моментов распределения) не требуется
предварительного упорядочивания и группировки данных. Эти
величины могут быть найдены непосредственно по исходной
выборке.
Для определения медианы, квантилей распределения, для
удаления промахов из выборки данные необходимо располо-
жить в порядке возрастания, то есть упорядочить выборку.
Группировка данных необходима для того, чтобы найти
форму распределения, то есть, в конечном итоге идентифициро-
вать закон распределения.
В результате группировки выборка представляется в виде
гистограммы, состоящей из L столбцов (интервалов
79
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 6. Идентификация закона распределения по выборке случайной ве-
личины

группировки), каждый из которых имеет ширину d. После
нормирования гистограмма представляет собой эмпирическую
плотность распределения случайной величины.
Из качественных соображений следует, что должно
существовать оптимальное число интервалов группировки.
Действительно, при большом количестве столбцов и
поэтому малой ширине столбца, из-за случайности выборки
гистограмма будет заполнена очень неравномерно, иметь сильно
изрезанный вид, состоять из большого количества всплесков и
провалов.
При другой крайности, то есть очень малом числе столбцов
большой ширины, гистограмма будет излишне сглаживать
распределение, уничтожать его характерные особенности.
Например, если выбрать только один интервал группировки с
шириной, равной размаху выборки, то любое распределение
сведется к прямоугольному. Два столбца выбирать нельзя, так
как любое симметричное распределение, как и в предыдущем
случае, сведется к прямоугольному. Три столбца также дают
мало информации о форме распределения.
Эти сугубо качественные рассуждения показывают, что
должно существовать некоторое оптимальное количество
интервалов группировки.
Если исходить из предположения, что генеральная
совокупность, из которой получена данная конкретная выборка,
имеет гладкую кривую плотности вероятности (это справедливо
в большинстве случаев), то неравномерности гистограммы
являются случайным шумом, обусловленным случайностью
выборки. Увеличение ширины столбца и уменьшение
количества столбцов фильтруют этот шум. Однако, дальнейшее
увеличение ширины столбца начинает сглаживать уже само
распределение.
Следовательно, определение оптимального числа
интервалов группировки при построении гистограммы является
задачей оптимальной фильтрации. При этом оптимальное
количество столбцов гистограммы - это такое количество,
при котором максимально возможное сглаживание случайного
шума сочетается с минимальным искажением от
сглаживания самого распределения.
80
С.В. Булашев. Статистика для трейдеров (электронная версия).
Глава 6. Идентификация закона распределения по выборке случайной ве-
личины

Оптимальное число столбцов должно зависеть не только от
объема выборки, как это указано в большинстве пособий по
статистике. Очевидно, что это число зависит еще и от формы
распределения. Действительно, если плосковершинные
распределения можно приблизить достаточно малым
количеством столбцов, то для островершинных распределений с
их длинными, пологими спадами это количество естественно
должно быть больше.
Количество интервалов группировки должно быть
нечетным числом. При четном числе столбцов область вблизи
центра распределения будет описываться двумя симметрично
расположенными относительно центра столбцами гистограммы,
тем самым пик распределения будет неоправданно
сглаживаться. Это особенно критично для островершинных
распределений. Как уже говорилось выше, три столбца дают
очень мало информации о форме распределения. Поэтому будем
считать, что количество столбцов гистограммы должно быть
нечетным числом не менее пяти.
Эмпирическая формула для оценки оптимального

<< Предыдущая

стр. 13
(из 43 стр.)

ОГЛАВЛЕНИЕ

Следующая >>