<< Предыдущая

стр. 15
(из 65 стр.)

ОГЛАВЛЕНИЕ

Следующая >>


H0 : у 2 = у 2 ,
x y

H1 : у 2 ? у 2 (H1 : у 2 > у 2 ).
(1) (2)
x y x y


83
По независимым выборкам x1, x2, ... , xn и y1, y2, ... , yk объемов
n и k соответственно определяются x, y, S2 и S2 (для однозначности
x y

пусть S2 ? S2 . В противном случае эти величины можно переобозна-
x y
чить).
В качестве критерия проверки Н0 принимают СВ
S2
F= 2 ,
x
(3.18)
Sy
определяемой отношением большей исправленной выборочной дис-
персии к меньшей. Если Н0 верна, то данная статистика F имеет F-
распределение Фишера с н1 = n ? 1 и н2 = k ? 1 степенями свободы.
1) При H1 : у 2 ? у 2 по таблицам критических точек распределе-
(1)
X Y
ния Фишера (приложение 4) по уровню значимости ? и числам
степеней свободы ?1 и ?2 определяется критическая точка
Fб/2, н1 , н2 .
Если Fнабл. < Fб/2, н1 , н2 – нет оснований для отклонения Н0.
(1)
Если Fнабл. ? Fб/2, н1 , н2 – Н0 отклоняется в пользу H1 .
(2)
2) При H1 : у 2 > у 2 определяется критическая точка Fб, н1 , н2 .
x y

Если Fнабл. < Fб, н1 , н2 – нет оснований для отклонения Н0.
Если Fнабл. ? Fб, н1 , н2 – Н0 отклоняется в пользу H1 .
(2)



Заметим, что при проверке гипотезы о равенстве дисперсий в ка-
честве альтернативной гипотезы в большинстве случаев используется
(2)
гипотеза H1 .
Пример 3.6. В условиях примера 3.5 определите, есть ли основания счи-
тать, что дисперсии двух СВ X и Y существенно отличаются друг от друга (т. е.
разброс оценок у студентов больше, чем у студенток).
Из условий задачи строится следующая гипотеза:
2 2
H0 : у x = у y ,
2 2
H1 : у x > у y .
Для проверки гипотезы по формуле (3.18) строится статистика Fнабл. =
= 300/150 = 2. Критическая точка распределения Фишера Fкр.= F0.05; 24; 24 = 1.98.
Поскольку Fнабл. = 2 > 1.98 = Fкр., то H0 должна быть отклонена в пользу H1, и
имеются основания считать, что разброс в оценках у студентов данного универси-
тета существенно больше разброса в оценках у студенток.


84
3.5.7. Проверка гипотезы о значимости
коэффициента корреляции
Одним из важнейших элементов эконометрического анализа яв-
ляется установление наличия связи между различными показателями
(между ценой и спросом, доходом и потреблением, инфляцией и без-
работицей). Обычно анализ начинают с простейшей ? линейной зави-
симости. Для того чтобы установить наличие значимой линейной свя-
зи между двумя СВ X и Y, следует проверить гипотезу о статистиче-
ской значимости коэффициента корреляции. В этом случае использу-
ется следующая гипотеза:
H 0 : с xy = 0,
(1)
H1 : с xy ? 0.
Для проверки Н0 по выборке (x1, y1), (x2, y2), ... , (xn, yn) объема n
строится статистика
rxy ? n ? 2
T= , (3.19)
2
1 ? rxy
где rxy – выборочный коэффициент корреляции.
При справедливости Н0 статистика Т имеет распределение Стью-
дента с н = n ? 2 степенями свободы. По таблице критических точек
распределения Стьюдента (приложение 2) по заданному уровню зна-
чимости ? и числу степеней свободы n ? 2 определяем критическую
точку t?/2,n?2.
rxy ? n ? 2
Если Tнабл. = < t б/2,n ?2 , то нет оснований для отклоне-
2
1? rxy
ния Н0. Если Tнабл. > t б/2,n?2 , то Н0 отклоняется в пользу альтернатив-
(1)
ной H1 .
Если H0 отклоняется, то фактически это означает, что коэффици-
ент корреляции статистически значим (существенно отличен от нуля).
Следовательно, X и Y – коррелированы, т. е. между ними существует
линейная связь.
Пример 3.7. Определяется наличие линейной зависимости между уровнями
инфляции (X) и безработицы (Y) в некоторой стране за 11 лет. По статистическим
данным рассчитан выборочный (эмпирический) коэффициент корреляции rxy =
= ? 0.34. Существует ли значимая линейная связь между указанными показателя-
ми в данной стране на рассматриваемом временном интервале (? = 0.02)?

85
Для ответа на вопрос проанализируем следующую гипотезу:
H 0 : с xy = 0,

H 1 : с xy ? 0.
(1)


? 0.34 ? 11 ? 2
= ?3.254.
По формуле (3.19) построим Т-статистику Тнабл. =
1 ? ( ?0.34) 2


По таблице критических точек распределения Стьюдента определим t?/2;n–2 =
= t0.01; 9 = 2.821. Поскольку ?Тнабл.?= 3.254 > 2.821 = tкр., то коэффициент корре-
ляции rxy статистически значим. Следовательно, ?xy существенно отличается от
нуля, и между уровнями инфляции (X) и безработицы (Y) существует определен-
ная отрицательная линейная зависимость.

Вопросы для самопроверки
1. Что такое точечная оценка и каковы желательные свойства?
2. Дайте определение несмещенности, эффективности и состоятельности оценок.
3. В чем различие между несмещенностью и асимптотической несмещенностью?
Приведите примеры асимптотически несмещенных оценок.
4. Какие оценки называются наилучшими линейными несмещенными (BLUE-
оценками)?
5. Что такое интервальная оценка? Как она строится?
6. Чем отличаются интервальные оценки для математического ожидания нор-
мальной СВ при известной и неизвестной дисперсиях?
7. Как строятся доверительные интервалы для дисперсии и среднего квадратиче-
ского отклонения нормальной СВ?
8. Что такое статистическая гипотеза?
9. Какова цель проверки гипотез?
10. В чем отличие параметрических и непараметрических гипотез?
11. Что такое нулевая и альтернативная гипотезы? Назовите принципы их по-
строения.
12. Что такое статистический критерий? Приведите конкретные примеры крите-
риев.
13. Сформулируйте общую схему проверки гипотез.
14. Что такое ошибки первого и второго рода? Как можно уменьшить вероятности
этих ошибок?
15. Что такое уровень значимости?
16. Что определяет мощность критерия?
17. Приведите примеры проверки гипотез в экономике. Какими критериями мож-
но воспользоваться при их проверке?
18. К проверке каких гипотез сводятся исследования среднего дохода населения и
анализ разброса в уровне дохода?

86
Упражнения и задачи
1. Приведена статистика по годовым темпам (%) инфляции в стране за послед-
ние 10 лет: 2.8; 3.2; 5.1; 1.8; ?0.6; 0.7; 2.1; 2.7; 4.1; 3.5. Необходимо
найти несмещенные оценки среднего темпа инфляции, дисперсии и среднего
квадратического отклонения.

2. Оценивается годовой доход (Х, $ тыс.) на душу населения в некотором горо-
де. Случайная выборка из 16 обследованных человек дала следующие ре-
зультаты: 8.5; 10.5; 12.25; 7.0; 17.0; 8.75; 10.0; 9.3; 8.0; 11.5; 10.0; 12.0;
9.0; 6.5; 13.0; 10.2. Оцените среднедушевой доход в городе и разброс в до-
ходах. Будут ли такими же значения для всего города?

3. Предполагается, что месячный доход граждан страны имеет нормальное
2
распределение с математическим ожиданием m = $1000 и дисперсией ? =
2
= 40000($) . По выборке из 500 человек определили выборочный средний
доход x = $900.
а) Постройте 90 и 95 %-ные доверительные интервалы для среднедушевого
дохода в стране.
б) Следует ли на основании построенных доверительных интервалов откло-
нить предположение об ежемесячном доходе в $1000?
в) Как проверить то же предположение на основании общей схемы проверки
гипотез? Какую альтернативную гипотезу вы выбрали и почему?

4. Для изучения влияния двухнедельной диеты и соответствующего комплекса
упражнений на изменение веса спортивный клуб провел анализ по двум вы-
боркам из 7 человек до и после диеты и упражнений. Отбор и в том и в дру-
гом случаях осуществлялся случайным образом по членским карточкам. По-
лучены следующие результаты (буквы ? инициалы испытуемого, цифры ?
вес, кг).
I выборка: АГ 85.5; ВТ 92.7; ДИ 79; КД 68.6; КЛ 102.5; МА 88.3; ТВ 82.7.
II выборка: БП 90.5; ДИ 77.5; ИВ 85.3; КР 72.5; ЛМ 108.7; МТ 80.3; ЯК 79.
а) Определите 95 %-ные доверительные интервалы для 1) среднего веса до
диеты; 2) среднего веса после диеты; 3) для среднего изменения веса за
время диеты.
б) Можно ли по имеющимся данным достаточно объективно оценить ре-
зультаты диеты и упражнений? Да или нет, почему?
в) Для того же анализа в повторную выборку отобрали тех же людей, что и в
первую выборку, и получили следующие данные: АГ 83; ВТ 90.5; ДИ 79;
КД 68; КЛ 94.5; МА 85; ТВ 80.5. По этим данным постройте 95 %-ный
доверительный интервал для потери веса.
г) Есть ли основания не доверять рекламному проспекту клуба, обещающе-
му потерю веса в 3 кг?

5. Станок-автомат заполняет пакеты чипсами по 250 г. Считается, что станок
требует подналадки, если стандартное отклонение от номинального веса

87
превышает 5 г. Контрольное взвешивание 10 пакетов дало следующие ре-
зультаты: 245, 248, 250, 250, 252, 256, 243, 251, 244, 253.
а) Постройте 95 и 99 %-ные доверительные интервалы для стандартного от-
клонения от номинального веса.
б) Можно ли по этим интервалам судить о необходимости подналадки стан-
ка? Как ответить на этот вопрос на основе использования статистической
проверки гипотез?

6. Расход (Х) бензина автомобилей некоторой фирмы имеет нормальный закон
распределения с mх = 7.5 л и ?х = 0.5 л. Выпустив новую модификацию ав-
томобиля, фирма утверждает, что у него средний расход my топлива снижен
до 7 л при том же ?. Выборки из 15 автомобилей каждой модели дали сле-
дующие средние расходы x = 7.45; y = 7.15. Можно ли по этим данным до-
верять рекламе фирмы?

7. Два университета (А и В) готовят специалистов аналогичных специально-
стей. Министерство образования решило проверить качество подготовки в
обоих университетах, подготовив для этого объемный тестовый экзамен для
студентов пятого курса. Отобранные случайным образом студенты показали
следующие суммы баллов:
А: 41, 50, 35, 45, 53, 30, 57, 20, 50, 44, 36, 48, 55, 28, 40, 50.
В: 40, 57, 52, 38, 25, 47, 52, 48, 55, 48, 53, 39, 46, 51, 45, 55, 43, 51, 55, 40.
а) Каковы точечные оценки средних баллов и дисперсий результатов для
обоих университетов?
б) Можно ли утверждать при уровне значимости ? = 0.05, что один из уни-
верситетов обеспечивает лучшую подготовку? Какие тесты целесообразно
использовать для такого рода анализа?
в) Сравните разброс в знаниях студентов этих университетов.
г) Были бы выводы такими же при уровне значимости ? = 0.01?

8. На сновании наблюдений за работой 25 кандидатов на должность секретаря-
референта установлено, что в среднем они тратили 7 минут на набор одной
страницы сложного текста на компьютере при выборочном стандартном от-
клонении S = 2 минуты. При предположении, что время (Х) набора текста
имеет нормальный закон распределения:
а) определите 90 и 99 %-ные доверительные интервалы для математического
ожидания mx и среднего квадратического отклонения ?x.
б) Оцените количество претендентов на работу, которые набрали текст бы-
стрее, чем за 5 минут.
в) Предполагалось, что среднее время набора страницы текста должно соста-
вить 5.5 минут. Не противоречат ли полученные данные этой гипотезе?

9. Предполагается, что месячная зарплата сотрудников фирмы составляет
$1000 при стандартном отклонении ? = 100. Выборка из 36 человек дала
следующие результаты: x = $900 и S = $150. Можно ли по результатам про-

88
веденных наблюдений утверждать, что средняя зарплата сотрудников фир-
мы меньше рекламируемой, а разброс в зарплатах больше? Какие критиче-
ские области вы в этом случае использовали?

10. Расход бензина по паспортным данным автомобиля должен составлять 10 л
на 100 км. На новую модель автомобиля устанавливается модернизирован-
ный двигатель, обеспечивающий расход в 9 л на 100 км. Данное утвержде-
ние считается неверным, если x > 9.4. Найти вероятности ошибок первого и
второго рода, если решение принимается по выборке n = 25.

11. Обследование 25 человек показало, что их средний доход составил $1200
при среднем отклонении S = $120. Полагая, что доход имеет нормальный за-
кон распределения, определите:
а) 90 % -ные интервальные оценки для математического ожидания m и
среднего квадратического отклонения ?.
б) С какой вероятностью можно утверждать, что абсолютное значение
ошибки оценивания m не превзойдет $50?

<< Предыдущая

стр. 15
(из 65 стр.)

ОГЛАВЛЕНИЕ

Следующая >>