<< Предыдущая

стр. 24
(из 65 стр.)

ОГЛАВЛЕНИЕ

Следующая >>

(? (x i ? x)(y i ? y) ) 2
? (x i ? x)(y i ? y)
=? ? = r2 .
=
? ? (x ? x) 2 ? ( y - y ) 2 ? xy
2 2
? (x i ? x) ? ( y i - y ) ? ?
i i


Рассчитаем коэффициент детерминации R2 для примера 4.1.
2
? ei 35.3
2
R =1? =1? = 0.983.
(yi ? y )2
? 2108.6668
Столь высокое значение коэффициента детерминации свидетельствует о высоком
2 2 2
общем качестве построенного уравнения регрессии. R = 0.983 ? (0.9914) = rxy
(неточности в данном случае связаны с округлением вычислений).




134
Вопросы для самопроверки
1. Перечислите предпосылки МНК, каковы последствия их выполнимости либо
невыполнимости?
2. В чем суть наилучших линейных несмещенных оценок (BLUE)?
3. Как определяются стандартные ошибки регрессии и коэффициентов регрес-
сии?
4. Опишите схему проверки гипотез о величинах коэффициентов регрессии.
5. В чем суть статистической значимости коэффициентов регрессии?
6. Опишите “грубое” правило анализа статистической значимости коэффициен-
тов регрессии.
7. Приведите схему определения интервальных оценок коэффициентов регрес-
сии.
8. Как строится и что позволяет определить доверительный интервал для услов-
ного математического ожидания зависимой переменной?
9. В чем суть предсказания индивидуальных значений зависимой переменной?
10. Объясните суть коэффициента детерминации.
11. В каких пределах изменяется коэффициент детерминации?
12. Дайте определения следующих понятий:
а) оценка коэффициента регрессии;
б) стандартная ошибка регрессии;
в) статистическая значимость коэффициента;
г) общая (объясненная, необъясненная) сумма квадратов отклонений;
д) коэффициент детерминации;
е) интервальная оценка коэффициента регрессии.
13. Объясните, какое из указанных утверждений истинно, ложно, не определено.
а) Предпосылки МНК являются обязательным условием построения линейной
регрессионной модели.
б) Теоретическим обоснованием МНК является теорема Гаусса–Маркова.
в) Оценки коэффициентов регрессии будут иметь нормальное распределение,
если случайные отклонения распределены нормально.
г) В любой линейной регрессионной модели, построенной по МНК, справед-
лива формула ?ei = 0.
д) Построение интервальных оценок для коэффициентов регрессии основано
на том, что эти оценки имеют нормальное распределение.
е) Чем больше стандартная ошибка регрессии, тем точнее оценки коэффици-
ентов.
ж) Условная средняя СВ и среднее значение СВ являются по сути одним и
тем же.
з) 90 %-ный доверительный интервал для условного математического ожида-
ния зависимой переменной определяет область возможных значений для 90 %
наблюдений за зависимой переменной при соответствующем уровне объяс-
няющей переменной.
2
и) 0 ? R ? 1.

135
к) Для парной линейной регрессии коэффициент корреляции превосходит ко-
эффициент детерминации.
14. По наблюдениям за 150 фирмами в отрасли стремятся построить регрессион-
ную модель Y = ?0 + ?1X + ? и оценить коэффициенты ?0 и ?1 по МНК. Здесь
Х ? прибыль фирм, Y ? затраты на обновление основного капитала.
а) Если прибыль у всех фирм будет одинаковой, возможно ли построение
уравнения регрессии?
б) Если условные дисперсии затрат Y при различных прибылях различны, то
мы не можем быть уверены в найденных оценках (да; нет; нет определенного
ответа).
в) Если прибыль фирм не имеет нормального распределения, то использова-
ние МНК нецелесообразно (да; нет; нет определенного ответа).
г) Если условия Гаусса–Маркова выполнены, то для определения оценок ко-
эффициентов мы обязаны использовать МНК, т. к. в этом случае полученные
оценки будут наилучшими линейными несмещенными оценками.
15. С увеличением объема выборки
а) увеличивается точность оценок;
б) уменьшается ошибка регрессии;
в) расширяются интервальные оценки;
г) уменьшается коэффициент детерминации;
д) увеличивается точность прогноза по модели.
(Да; нет; не определено. Ответ поясните).
16. При оценке парной линейной регрессии Y = ?0 + ?1X + ? по МНК получена
завышенная оценка b1 коэффициента ?1. Какая оценка в этом случае более ве-
роятна для коэффициента ?0: завышенная, заниженная или несмещенная? От-
вет поясните графически.

Упражнения и задачи
1. Имеются данные за 10 лет по прибылям (Х и Y) двух компаний:
?5.8 ?3.5
Х (%) 19.2 15.8 12.5 10.3 5.7 5.2 7.3 6.7
Y (%) 20.1 18.0 10.3 12. 5 6.0 ?6.8 ?2.8 3.0 8.5 8.0
а) Постройте регрессионную модель Y = b0 + b1X + e.
б) Оцените статистическую значимость коэффициентов регрессии.
2
в) Оцените коэффициент детерминации R данного уравнения.
г) Постройте регрессионную модель Y = bX + u.
д) Приведите формулы расчета коэффициента b, его стандартной ошибки Sb
и стандартной ошибки регрессии S (обратите внимание на число степеней
свободы при расчете данной оценки).
е) Значимо или нет различаются коэффициенты b1 и b?
ж) Какую из построенных моделей вы предпочтете?
з) Можно ли на основе построенных регрессий утверждать, что прибыль од-
ной из компаний является следствием прибыли другой?


136
2. Для прогноза возможного объема экспорта на основе ВНП предложено ис-
пользовать линейную регрессионную модель. При этом используются дан-
ные с 1989 по 1998 г.
Годы 89 90 91 92 93 94 95 96 97 98
ВНП 1000 1090 1150 1230 1300 1360 1400 1470 1500 1580
Экспорт 190 220 240 240 260 250 280 290 310 350

а) Сформулируйте соответствующую регрессионную модель, дав интерпре-
тацию ее параметров;
б) рассчитайте на основе имеющихся данных оценки параметров модели;
в) рассчитайте стандартную ошибку регрессии;
г) рассчитайте стандартные ошибки коэффициентов;
д) рассчитайте 90 %-ные и 95 %-ные доверительные интервалы для теорети-
ческих коэффициентов регрессии;
е) проанализируйте статистическую значимость коэффициентов при уров-
нях значимости ? = 0.1 и ? = 0.05;
ж) оцените коэффициент корреляции между ВНП и экспортом;
з) дайте прогнозы по объему экспорта на 2000 и 2003 гг.;
и) рассчитайте 95 %-ные доверительные интервалы для этих прогнозов;
к) рассчитайте коэффициент детерминации и сравните его с коэффициентом
корреляции;
л) какие предпосылки относительно случайного отклонения модели
необходимы для обоснованности выводов по предыдущим пунктам?
м) сделайте выводы по построенной модели.

3. Имеется информация за семь лет относительно среднего дохода и среднего
потребления (млн руб.):
Годы 91 92 93 94 95 96 97
Доход ( I ) 14.56 15.70 16.30 18.50 20.34 21.70 23.50
Потребление (С) 12.00 12.70 13.00 15.50 16.70 17.30 20.00

а) Оцените коэффициенты линейной регрессии C = b0 + b1X + e по МНК;
б) проинтерпретируйте найденные коэффициенты;
в) проверьте статистическую значимость коэффициентов при уровне значи-
мости ? = 0.05;
г) рассчитайте 95 %-ные доверительные интервалы для теоретических коэф-
фициентов регрессии;
д) спрогнозируйте потребление при доходе I = 25.00; постройте доверитель-
ный интервал для данного прогноза;
е) оцените коэффициенты регрессии C = b0 + b1X + e, проведя прямую через
крайние точки наблюдений;
ж) оцените коэффициенты регрессии C = b0 + b1X + e, проведя прямую через
средние значения для пары крайних значений (91, 92) и (96, 97);

137
з) являются ли оценки, найденные в пунктах е) и ж), несмещенными оценка-
ми теоретических коэффициентов регрессии ?0, ?1;
и) сравните построенные три регрессии на основе стандартных ошибок ре-
грессий и сделайте выводы;
к) насколько изменится потребление, если доход вырастет на 3 млн руб.

4. Проводится анализ взаимосвязи количества населения (POP) и количества
практикующих врачей (МЕD).
Годы 81 82 83 84 85 86 87 88 89 90
POP(млн чел.) 10.0 10.3 10.4 10.55 10.6 10.7 10.75 10.9 10.9 11.0

MED(тыс.чел) 12.1 12.6 13.0 13.8 14.9 16.0 18.0 20.0 21.0 22.0

а) Оцените по МНК коэффициенты линейного уравнения регрессии
MEDt = b0 + b1POP.
б) Существенно ли отличаются от нуля найденные коэффициенты?
в) Рассчитайте коэффициент корреляции rpop;med; существенно ли он отличен
от нуля?
г) Если прогнозное количество населения в 1995 г. составит 11.5 млн, каково
ожидаемое количество врачей? Рассчитайте 99 %-ный доверительный ин-
тервал для данного предсказания.
д) Если население вырастет на 0.8 млн, насколько изменится количество
врачей?
2
е) Рассчитайте коэффициент детерминации R для построенного уравнения,
сравните его с коэффициентом корреляции, найденным в пункте в).
ж) Сделайте вывод по построенной модели.

5. Пусть имеются следующие наблюдения за переменными Х и Y:
Х 0 0 2 2
Y 0 2 0 2
а) Постройте эмпирическое уравнение регрессии Y = b0 + b1X + e и изобра-
зите его на корреляционном поле.
б) Постройте эмпирическое уравнение регрессии Y = bX + v и изобразите
его на корреляционном поле.
в) Рассчитайте коэффициенты детерминации для обоих уравнений.
г) Каковы выводы из построенных моделей.

6. По 10 наблюдениям за СВ Х и Y получены следующие данные:
? xi = 1700; ? yi = 1100; ? xiyi = 204400;
2 2
? x i = 316000; ? y i = 135000.
Предполагая, что предпосылки МНК выполнены, оцените
а) коэффициенты b0 и b1;

138
б) стандартные ошибки коэффициентов;
в) 90 и 99 %-ные доверительные интервалы для коэффициентов ?0 и ?1;
г) можно ли на основе построенных доверительных интервалов принять ги-
потезу Н0: ?1 = 0;
д) коэффициент детерминации R2.

7. По данным 15-летних наблюдений построена следующая регрессионная мо-
дель:
ВНП t = ?787.4723 + 8.0863M1t + e t
se = ( … ) (0.2197)
2
t = (?10.0) ( … ), R = 0.9912.
ВНП ? валовой национальный продукт (в млрд $), M1 ? денежная масса.
а) заполните скобки;
б) оцените статистическую значимость коэффициентов регрессии;
в) оцените общее качество уравнения регрессии;
г) по утверждениям монетаристов, денежная масса имеет существенное по-
ложительное влияние на ВНП. Находит ли это подтверждение по построен-
ной регрессии?
д) каков смысл отрицательного свободного члена?
е) предложение денег в году после интервала наблюдений планируется на
уровне 550 млрд $. Каково прогнозное значение ВНП на данный год?
ж) в каком интервале будет лежать прогнозируемое значение ВНП с надеж-
ностью 95 %.

8. По данным за 9 лет построена следующая эмпирическая регрессия:
)
y t = ?70.85 + 0.888x t ,
2
t = (?5.89) (5.9), R = 0.685,
где Y ? индекс цен оптовой торговли; Х ? процент использования производ-
ственных мощностей.
а) Совпадает ли знак коэффициента b1 с ожидаемым априори?
б) Как трактуется угловой коэффициент данного уравнения регрессии?
в) Оцените значимость коэффициентов.
г) Существенно или нет коэффициент b1 отличается от единицы?
д) Оцените качество модели.

9. Наблюдаются две переменные Х и Y помесячно в течение года. Имеется сле-
дующая информация:
2
x = 122.167 ; y = 125.25; ?(xi ? x ) = 2135.679;
2
?(yi ? y ) = 2216.168; ?(xi ? x )(yi ? y ) = 2115.
Рассчитайте
а) по МНК коэффициенты парного линейного уравнения регрессии;
б) стандартную ошибку регрессии;
в) стандартные ошибки коэффициентов регрессии;

139
г) коэффициент детерминации;
д) оцените качество построенного уравнения регрессии и статистическую
значимость коэффициентов.

10. Пусть построена следующая регрессия:
)
Y = 150 + 5Х,
2
se = (20) (1.2), R = 0.87,
где xt = zt / zt?1 ? темп роста показателя Z. Как изменится регрессия, если в

<< Предыдущая

стр. 24
(из 65 стр.)

ОГЛАВЛЕНИЕ

Следующая >>