<< Предыдущая

стр. 47
(из 65 стр.)

ОГЛАВЛЕНИЕ

Следующая >>

рифм от отношения вероятностей через линейную функцию. Если
0 ? pi ? 1, то -? < zi < +? (т. е. при сохранении свойств вероятности
указанный логарифм меняется от -? до +?).
Logit модель весьма напоминает полулогарифмическую модель, и
создается впечатление, что для ее оценки может быть использован
обыкновенный МНК. Однако это не так в силу того, что для этого не-
p
обходимо знать значения зависимой переменной ln i , которые
1 ? pi
обычно неизвестны. Поэтому предварительно необходимо определить
значения pi. В случае, если имеется выборка сгруппированных дан-
)n
ных, то в качестве pi можно использовать ее оценку p i = i (относи-
n
тельную частоту). В случае несгруппированных данных для нахожде-

271
ния оценок pi обычно используется метод максимального правдопо-
добия.
Опуская технику применения указанных расчетов, отметим, что
использование обыкновенного МНК в данном случае нецелесообразно
в силу проблемы гетероскедастичности. Поэтому при расчетах коэф-
фициентов обычно используется взвешенный МНК, устраняющий
указанный недостаток.
Вопросы для самопроверки
1. Что представляет собой фиктивная (двоичная, искусственная переменная)?
2. Каковы основные причины использования фиктивных переменных в регрес-
сионных моделях?
3. Что представляют собой ANOVA-модели? Приведите примеры их использо-
вания.
4. Что представляют собой ANСOVA-модели? Приведите примеры их исполь-
зования.
5. В чем суть основного правила использования фиктивных переменных?
6. В чем суть “ловушки фиктивной переменной”?
7. Каковы принципы использования фиктивной переменной в аддитивном и
мультипликативном видах?
8. В чем суть теста Чоу?
9. Приведите примеры использования фиктивных переменных в сезонном ана-
лизе.
10. В каких ситуациях фиктивная переменная используется в качестве зависимой
переменной?
11. Каковы основные достоинства и недостатки модели LPM?
12. В чем суть logit модели?
13. Определите, какие из следующих факторов отражаются в моделях через фик-
тивные переменные:
а) индекс потребительских цен;
б) образование;
в) вхождение в определенный торговый союз;
г) население стран, входящих в определенный торговый союз;
д) членство в Европейском Союзе;
е) принадлежность к определенной группе населения;
ж) налог на определенный вид торговых операций;
з) введение налога на определенную деятельность в конкретные периоды
времени.
)
14. Пусть для некоторой отрасли оценена регрессионная модель Y = 5 + 2X + 3D,
где Y ? заработная плата, Х ? стаж работы, D ? фиктивная переменная, отра-
жающая пол сотрудника (D = 0 ? для женщин и D = 1 ? для мужчин). Как из-


272
менится результат, если положить D = 1 ? для женщин и D = 0 ? для мужчин?
Как изменится результат, если положить D = ?1 ? для женщин и D = 1 ? для
мужчин?
Пусть оценивается регрессия Y = ?0 + ?1X1 + ?D + ?, где переменная D отра-
15.
жает пол сотрудника. Пусть процентное соотношение мужчин в выборке
вдвое превышает процентное соотношение мужчин в генеральной совокупно-
сти. Необходимо ли вносить какие-либо коррективы в построенную модель?
Если да, то какие?
16. Анализируется доход населения (Y) в зависимости от образования. Население
классифицируется по трем группам: с начальным образованием (1), со сред-
ним образованием (2), с высшим образованием (3). Строится регрессия сле-
дующего вида: Y = ?0 + ?1D1 + ?2D2 + ?, где Di = 0 ? для лиц i-й группы, и Di =
= 1 – для всех других групп.
а) Какова величина ожидаемого дохода для лиц с высшим образованием?
б) Как можно проверить гипотезу о том, что наличие высшего образования
повышает доход?
в) Будет ли с вашей точки зрения более предпочтительной по сравнению с
предложенной моделью следующая модель Y = ?0 + ?1X1 + ? (где X1 ?
продолжительность обучения)? Ответ поясните.
г) Будет ли более точной по сравнению с предложенной модель
Y = ?0 + ?1D1 + ?2D2 + ?3D3 + ? (где D3 = 0 для лиц, имеющих высшее образова-
ние, и D3 = 1 – для лиц, не имеющих высшего образования)? Ответ поясните.
17. Пусть оценено эмпирическое уравнение регрессии:
)
Y = 16 + 10Х + 5DS + 3DE + 2DSE,
где Y ? годовая заработная плата работника данной фирмы; Х ? стаж работы;
DS, DE, DSE ? фиктивные переменные (DS = 0 для женщин, DS = 1 для муж-
чин; DE = 0, если у субъекта нет высшего образования, DE = 1 при наличии у
субъекта высшего образования; DSE = DS?DE).
)
а) Как будет выражаться значение Y при рассмотрении следующих вариан-
тов: мужчины с высшим образованием, мужчины без высшего образования и
женщины с высшим образованием?
б) Столкнемся ли мы при рассмотрении данной модели с проблемой
мультиколлинеарности?
в) Как можно проинтерпретировать в данном случае коэффициент при DSE?
г) Будет ли обоснованным использование фиктивной переменной DSE для
рассматриваемой зависимости?
18. Оценивается регрессионная модель зависимости спроса на товар (Q) от цены
товара (P) и дохода населения (I). Данная зависимость носит сезонный харак-
тер. По квартальным данным за 15 лет строят следующую модель:
qt = ?0 + ?1pt + ?2it + ?1D1+ ?2D2 + ?3D3 + ?4D4 + ?,
где Dj = 1 при рассмотрении i-го квартала, и Dj = 0 – в случае (j = 1, …, 4).
а) Может ли эта модель быть оценена? Ответ поясните.


273
б) В случае отрицательного ответа на вопрос а) поясните, какие преобразова-
ния модели необходимо осуществить для нахождения однозначных оценок.
в) Какие переменные вы бы использовали, если бы сезонность выражалась
соотношением “зима ? лето”?
19. Предполагается, что ежемесячное потребление пива студентами определяется
(линейно) доходом, возрастом, полом студентов, а также временем обучения
“младшие курсы ? старшие курсы”.
а) Сколько количественных и качественных объясняющих переменных долж-
на включать модель?
б) Как должна выглядеть модель, чтобы отразить влияние качественных пе-
ременных на свободный член модели и на угловые коэффициенты?
в) Как проверить предположение о том, что пол студента существенно влияет
на количество потребляемого пива?
20. Исследуется вопрос о владении собственным домом в зависимости от дохода
семьи. Как будет в данном случае выглядеть модель, отражающая данную за-
висимость? Какими методами могут быть найдены оценки предложенной мо-
дели?

Упражнения и задачи
Пусть Y = ?0 + ?1D + ?, где D ? фиктивная переменная, отражающая пол
1.
субъекта исследований (D = 0 – для женщин, и D = 1 – для мужчин). Сред-
нее значение переменной Y для 15 мужчин равно 5, для 25 женщин ? 3. При
2
этом известно, что дисперсия ? (?i) = 64.
а) Определите оценки коэффициентов ?0 и ?1.
б) Проверьте гипотезу о том, что ?1 = 1 (? = 0.05).

На предприятии используются станки трех фирм (A, B, C). Исследуется на-
2.
дежность этих станков. При этом учитываются возраст станка (M, в меся-
цах) и время (H, в часах) безаварийной работы до последней поломки. Вы-
борка из 40 станков дала следующие результаты:
Фирма A B C A C A B C B A B C C B A A C B A A
M 23 30 65 69 75 63 25 75 75 52 20 70 62 40 66 20 39 25 48 59
H 280 230 112 176 90 176 216 110 45 200 265 148 150 176 123 245 176 260 236 205
Фирма ABACBACBABBCABACBABA
M 25 69 71 26 45 40 30 69 30 22 33 48 75 21 56 58 50 37 56 67
H 240 65 115 200 126 225 210 45 260 220 194 156 100 240 170 116 120 240 88 120

а) Оцените уравнение регрессии H = ?0 + ?1M + ? без учета различия стан-
ков разных фирм.
б) Оцените уравнение регрессии, учитывающее различие качества станков
разных фирм. Как выглядит это уравнение?
в) Сравните качества построенных моделей.
г) Постройте корреляционное поле и нанесите на него графики функций.
д) Сделайте выводы о необходимости использования фиктивных перемен-
ных в этом случае.


274
Производитель исследует эффективность лекарств (ЕF) от возраста пациен-
3.
тов (AG), при этом он сравнивает эффективность трех видов лекарств (A, B,
C). Имеются данные по 36 пациентам:
ВИД C A B A B B A C C A C A A B C B C A
AG 29 53 29 58 66 67 63 59 51 67 63 33 33 42 67 33 23 28
EF 36 69 47 73 64 60 62 71 62 70 71 52 63 48 71 46 25 55
ВИД C B B A C C B A C B C A B B C A A B
AG 19 30 23 21 56 45 43 38 37 43 27 43 45 48 47 48 53 58
EF 28 40 41 56 62 50 45 58 46 58 34 65 55 57 59 64 61 62
а) Постройте корреляционное поле для переменных AG и EF, отображая
точки, соответствующие различным видам лекарств, разными символами.
б) Оцените уравнение регрессии EF = ?0 + ?1AG + ?. Что оно отражает?
в) Оцените качество построенной регрессии.
г) Оцените уравнение регрессии EF = ?0 + ?1AG + ?1D1+ ?2D2 + ?, где D1, D2 ?
фиктивные переменные, отражающие наличие лекарств трех видов. Дайте
интерпретацию построенной регрессии.
д) Оцените качество построенной регрессии.
е) Оцените уравнение регрессии
EF = ?0 + ?1AG + ?1D1+ ?2D2 + ?1AG?D1 +?2 AG?D2 + ?.
ж) Дайте интерпретацию построенного уравнения. Что выражается через
произведения переменных AG?D1 и AG?D2?
з) Оцените качество построенной регрессии.
и) Какая из моделей, с вашей точки зрения, предпочтительнее для выраже-
ния исследуемой зависимости и почему?

Рассматривая зависимость между доходом (Х) и сбережениями (Y) за два-
4.
дцать лет, исследователь заметил, что на двенадцатом году наблюдений эко-
номическая ситуация изменилась, что стимулировало население к большим
сбережениям по сравнению с первым этапом рассматриваемого интервала.
Использовались следующие статистические данные:
Год 75 76 77 78 79 80 81 82 83 84 85
Х 100 105 108 111 115 122 128 135 143 142 147
Y 4.7 6.1 6.5 6.8 5.2 6.5 7.5 8.0 9.0 9.1 8.7
Год 86 87 88 89 90 91 92 93 94
Х 155 167 177 188 195 210 226 238 255
Y 12.0 16.2 18.5 18.0 17.6 20.0 23.0 22.5 24.3
а) Постройте общее уравнение регрессии для всего интервала наблюдений, а
также уравнение регрессии, учитывающее изменение ситуации в 1986 г.
б) Каким образом вы учли в модели данное изменение?
в) Проверьте с помощью теста Чоу необходимость разбиения интервала на-
блюдений на два подынтервала и построения для каждого из них отдельного
уравнения (принять уровень значимости ? = 0.05).



275
При анализе зависимости заработной платы (S) 70 сотрудников фирмы (45
5.
мужчин и 25 женщин) от стажа работы (T) на фирме получены следующие
регрессионные модели:
)
1. S = 50 + 0.12 T
2
t = (5.23) (9.35) R = 0.63 DW = 0.17
)
2. S = 30 + 0.092 T + 25 D
2
t = (4.63) (4.3) (6.23) R = 0.72 DW = 1.06
)
3. S = 25 + 0.078 T + 32 D + 0.07(T?D)
2
t = (3.07) (3.73) (2.93) (1.98) R = 0.912 DW = 1.83,
где D ? фиктивная переменная, отражающая пол сотрудника.
а) Какая из регрессий (1 или 2), с вашей точки зрения, более рациональна?
б) Какие ошибки при выборе регрессии 1 допускаются?
в) Какая из регрессий (2 или 3), с вашей точки зрения, более рациональна?
г) Объясните смысл каждого из коэффициентов в уравнении 3.

Исследуется вопрос о наличии собственного дома (Y = 1, если дом имеется;
6.
Y = 0, если дома нет) в зависимости от совокупного дохода семьи (Х). Вы-
борка из 40 семей дала следующие результаты:
Семья 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Х 10 20 22 18 9 15 25 30 40 16 12 8 20 19 30 50 37 28 45 38
Y 01100011100010111111

Семья 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
Х 30 12 16 27 19 15 32 18 43 13 22 14 10 17 36 45 14 22 41 34
Y 10010010101000110111
а) Постройте LPM-модель.
б) Оцените качество построенной модели.
в) Оцените вероятность того, что при доходе, равном 18, семья имеет дом.

В следующей таблице представлены данные о количестве семей (N), имею-
7.
щих определенный уровень дохода (X), и количестве семей (n), имеющих
частные дома.
X 10 15 20 25 30 35 40 45 50 55 60
Ni 35 45 60 80 100 130 90 65 50 30 15
ni 5 10 18 30 45 60 55 45 38 24 13
а) Оцените logit модель по МНК.
б) Оцените logit модель по ВНК, учитывая при этом, что дисперсии откло-
n
1 )
)
нений оцениваются по следующей формуле: у i2 = ) ; pi = i .
)
N i p i (1 ? p i ) Ni
в) Сравните качество построенных регрессий.
г) Сделайте выводы по построенным моделям.




276
12. ДИНАМИЧЕСКИЕ МОДЕЛИ
12.1. Временные ряды. Лаги в экономических моделях
При анализе многих экономических показателей (особенно в

<< Предыдущая

стр. 47
(из 65 стр.)

ОГЛАВЛЕНИЕ

Следующая >>