<< Предыдущая

стр. 12
(из 65 стр.)

ОГЛАВЛЕНИЕ

Следующая >>

x = 244 г. В каком интервале с надежностью 95 % лежит истинное значение
среднего веса пакетов?
Логично считать, что СВ Х имеет нормальный закон распределения:
Х ? N(m, 10). Для определения 95 % -го доверительного интервала найдем крити-
ческую точку u б = u0.025 из приложения 1 по соотношению
2
0.95
= 0.475 . ? u 0.025 = 1.96.
Ф(u 0.025) =
2
Тогда по формуле (3.5) построим доверительный интервал:
10 10
(244 ? 1.96? ; 244 + 1.96? ) = (240.8; 247.92).
5 5
3.3.2. Доверительный интервал для математического ожидания
нормальной СВ при неизвестной дисперсии
В реальности истинное значение дисперсии исследуемой СВ,
скорее всего, известно не будет. Это приводит к необходимости ис-
67
пользования другой формулы при определении доверительного ин-
тервала для математического ожидания СВ, имеющей нормальное
распределение.
Пусть Х ? N(m, ?2), причем m и ?2 ? неизвестны. Необходимо
построить доверительный интервал, накрывающий с надежностью
? = 1 ? ? истинное значение параметра m.
Для этого из генеральной совокупности СВ Х извлекается выбор-
ка объема n: х1, х2, ..., хn.
1. В качестве точечной оценки математического ожидания m ис-
пользуется выборочное среднее x , а в качестве оценки дисперсии
1n
2 2 2
? ? исправленная выборочная дисперсия S = ? (x i ? x ) ,
n ? 1 i =1
которой соответствует стандартное отклонение S = S2 .
2. Для нахождения доверительного интервала строится статисти-
x?m
ка T = , имеющая в этом случае распределение Стьюдента с
S/ n
числом степеней свободы ? = n ? 1 независимо от значений пара-
метров m и ?2.
3. Задается требуемый уровень значимости ?.
4. Применяется следующая формула расчета вероятности

) = 1 ? ?,
P(?T?< t б ) = P(? t б < T < tб (3.6)
, n ?1 , n ?1 , n ?1
2 2 2

где t б – критическая точка распределения Стьюдента, которая
, n ?1
2
находится по соответствующей таблице (приложение 2). Тогда
x?m
Р(? t б < T < tб ) = P(? t б < < tб )=
S/ n
, n ?1 , n ?1 , n ?1 , n ?1
2 2 2 2
(3.7)
S S
) = 1 ? ?.
= P( x ? t б ? < m < x + tб ?
n n
, n ?1 , n ?1
2 2
S S
Это означает, что интервал ( x ? t б ? ; x + tб ? ) накрывает
n n
, n ?1 , n ?1
2 2
неизвестный параметр m с надежностью 1 ? ?.


68
3.3.3. Доверительный интервал для дисперсии нормальной СВ
Пусть Х ? N(m, ?2), причем m и ?2 ? неизвестны. Пусть для оцен-
ки ?2 извлечена выборка объема n: х1, х2, ..., хn .
1. В качестве точечной оценки дисперсии D(X) используется ис-
1n
2 2
правленная выборочная дисперсия S = ? (x i ? x ) , которой
n ? 1 i =1
соответствует стандартное отклонение S = S2 .
2. Для нахождения доверительного интервала для дисперсии в
(n ? 1)S2
, имеющая ?2-рас-
2
этом случае вводится статистика ч =
у2
пределение с числом степеней свободы ? = n ? 1 независимо от
значения параметра ?2 .
3. Задается требуемый уровень значимости ?.
4. Тогда, используя таблицу критических точек ?2-распределения,
нетрудно указать критические точки ч 2 , ч2 , для ко-
б б
1? , n ?1 , n ?1
2 2
торых будет выполняться следующее равенство:
P( ч 2 б < ч 2 < ч 2б ) =1? б . (3.8)
1 ? , n ?1 , n ?1
2 2
2
Подставив вместо ? соответствующее значение, получим
(n ? 1)S2
2 2 2 2
< ч2
<ч < ч
P( ч ) = P( ч < )=
2
у
б б б б
1? , n ?1 , n ?1 1? , n ?1 , n ?1
2 2 2 2
S2 (n ? 1) S2 (n ? 1)
2
) =1? б .
= P( 2 <у < 2 (3.9)
ч ч
б б
, n ?1 1 ? , n ?1
2 2

S2 (n ? 1) S2 (n ? 1)
2
Неравенство <у < 2 может быть преобразовано в
2
ч ч
б б
, n ?1 1 ? , n ?1
2 2
следующее неравенство:
n ?1 n ?1
S2 <у< S . (3.10)
2
ч ч
б б
, n ?1 1? , n ?1
2 2


69
S2 (n ? 1) S2 (n ? 1)
Таким образом, доверительный интервал ( 2 ,2 )
ч ч
б б
, n ?1 1 ? , n ?1
2 2
накрывает неизвестный параметр ?2 с надежностью 1 ? ? . А довери-
n ?1 n ?1
) с надежностью 1 ? ?
тельный интервал ( S 2 ,S 2
ч ч
б б
, n ?1 1 ? , n ?1
2 2
накрывает неизвестный параметр ?.

3.4. Статистическая проверка гипотез
3.4.1. Основные понятия
Большинство эконометрических моделей требуют многократного
улучшения и уточнения. Для этого требуется проведение соответст-
вующих расчетов, связанных с установлением выполнимости или не-
выполнимости тех или иных предпосылок, анализом качества найден-
ных оценок, достоверностью полученных выводов. Обычно эти расче-
ты проводятся по схеме статистической проверки гипотез. Поэтому
знание основных принципов проверки гипотез является обязательным
для эконометриста.
Во многих случаях необходимо знать закон распределения гене-
ральной совокупности. Если закон распределения неизвестен, но есть
основания предположить, что он имеет определенный вид (назовем
его А), выдвигают гипотезу: генеральная совокупность (СВ Х) рас-
пределена по закону А. Например, можно выдвинуть предположение,
что доход населения, ежедневное количество покупателей в магазине,
размер выпускаемых деталей имеют нормальный закон распределе-
ния.
Возможен случай, когда закон распределения известен, а его па-
раметры неизвестны. Если есть основания предположить, что неиз-
вестный параметр ? равен ожидаемому числу ?0, выдвигают гипотезу:
? = ?0. Например, можно выдвинуть предположение о величине сред-
него дохода населения, среднего ожидаемого дохода по акциям, о раз-
бросе в доходах и т. д.
Статистической называют гипотезу о виде закона распределе-
ния или о параметрах известного распределения. В первом случае ги-
потеза называется непараметрической, а во втором – параметриче-
ской.
70
Гипотеза Н0, подлежащая проверке, называется нулевой (основ-
ной). Наряду с нулевой рассматривают гипотезу Н1, которая будет
приниматься, если отклоняется Н0. Такая гипотеза называется аль-
тернативной (конкурирующей). Например, если проверяется гипотеза
о равенстве параметра ? некоторому значению ?0, т. е. Н0: ? = ?0, то в
качестве альтернативной могут рассматриваться следующие гипотезы:
(1) (2) (3) (4)
H 1 : и ? и0 ; H 1 : и > и0 ; H 1 : и < и0 ; H1 : и = и1 (и1 ? и0 ).
Выбор альтернативной гипотезы определяется конкретной фор-
мулировкой задачи, а нулевая гипотеза часто специально подбирается
так, чтобы отвергнуть ее и принять тем самым альтернативную гипо-
тезу. Для того чтобы принять гипотезу о наличии корреляции между
двумя экономическими показателями (например, между инфляцией и
безработицей), можно опровергнуть гипотезу об отсутствии такой
корреляции, взяв ее в качестве нулевой гипотезы.
Гипотезу называют простой, если она содержит одно конкретное
(4)
предположение ( H 0 : и = и0 , H1 : и = и1 ). Гипотезу называют слож-
ной, если она состоит из конечного или бесконечного числа простых
(1) (2) (3)
гипотез ( H1 : и ? и0 ; H1 : и > и0 ; H1 : и < и0 . ).
Сущность проверки статистической гипотезы заключается в том,
чтобы установить, согласуются или нет данные наблюдений и выдви-
нутая гипотеза. Можно ли расхождение между гипотезой и результа-
том выборочных наблюдений отнести за счет случайной погрешности,
обусловленной механизмом случайного отбора? Эта задача решается с
помощью специальных методов математической статистики – мето-
дов статистической проверки гипотез.
При проверке гипотезы выборочные данные могут противоречить
гипотезе Н0. Тогда она отклоняется. Если же статистические данные
согласуются с выдвинутой гипотезой, то она не отклоняется. На
практике часто в таких случаях говорят, что нулевая гипотеза прини-
мается (такая формулировка не совсем точна, однако она широко рас-
пространена). Статистическая проверка гипотез на основании выбо-
рочных данных неизбежно связана с риском принятия ложного реше-
ния. При этом возможны ошибки двух родов.
Ошибка первого рода состоит в том, что будет отвергнута пра-
вильная нулевая гипотеза.
Ошибка второго рода состоит в том, что будет принята нулевая
гипотеза, в то время как в действительности верна альтернативная ги-
потеза.
71
Возможные результаты статистических выводов представлены
следующей таблицей:
Таблица 3.1
Возможные состояния гипотезы
Результаты проверки гипотезы
верна Н0 верна Н1
Гипотеза Н0 отклоняется Ошибка первого рода Правильный вывод
Гипотеза Н0 не отклоняется Правильный вывод Ошибка второго рода

В большинстве случаев последствия указанных ошибок неравно-
значны. Первая приводит к более осторожному, консервативному ре-
шению, вторая – к неоправданному риску. Что лучше или хуже – за-
висит от конкретной постановки задачи и содержания нулевой гипо-
тезы. Например, если Н0 состоит в признании продукции предприятия
качественной, и допущена ошибка первого рода, то будет забракована
годная продукция. Допустив ошибку второго рода, мы отправим по-
требителю брак. Очевидно, последствия второй ошибки более серьез-
ны с точки зрения имиджа фирмы и ее долгосрочных перспектив.
Исключить ошибки первого и второго рода невозможно в силу
ограниченности выборки. Поэтому стремятся минимизировать потери
от этих ошибок. Отметим, что одновременное уменьшение вероятно-
стей данных ошибок невозможно, так как задачи их уменьшения яв-
ляются конкурирующими, и уменьшение вероятности допустить одну
из них влечет за собой увеличение вероятности допустить другую. В
большинстве случаев единственный способ уменьшения вероятности
ошибок состоит в увеличении объема выборки.
Вероятность совершить ошибку первого рода принято обозначать
буквой ?, и ее называют уровнем значимости. Вероятность совер-
шить ошибку второго рода обозначают ?. Тогда вероятность несо-
вершения ошибки второго рода (1 ? ?) называется мощностью кри-
терия.
Обычно значения ? задают заранее круглыми числами (напри-
мер, 0.1; 0.05; 0.01 и т. п.), а затем стремятся построить критерий наи-
большей мощности. Таким образом, если ? = 0.05, то это означает, что
исследователь не хочет совершить ошибку первого рода более чем в 5
случаях из 100.
3.4.2. Критерии проверки. Критическая область
Проверку статистической гипотезы осуществляют на основании
данных выборки. Для этого используют специально подобранную СВ


72
(статистику, критерий), точное или приближенное значение которой

<< Предыдущая

стр. 12
(из 65 стр.)

ОГЛАВЛЕНИЕ

Следующая >>