<< Предыдущая

стр. 11
(из 65 стр.)

ОГЛАВЛЕНИЕ

Следующая >>


?
Рис. 3.1


61
Каждая отдельная эффективная оценка не гарантирует того, что
она дает более точное значение исследуемого параметра, чем менее
эффективная. Однако вероятность такого исхода превышает 0.5.
Оценка называется асимптотически эффективной, если с увели-
чением объема выборки ее дисперсия стремится к нулю, т. е. D( и? )>0
n

при n >? (индекс n в оценке и? применяется для подчеркивания объ-
n
ема выборки).
Оценка и? называется состоятельной оценкой параметра ?,
n

если и? сходится по вероятности к ? при n > ?, т. е. для любого ? > 0
n

при n> ? P(? и? ? ??< ?) > 1. Другими словами, состоятельной назы-
n
вается такая оценка, которая дает истинное значение при достаточно
большом объеме выборки вне зависимости от значений входящих в
нее конкретных наблюдений.
Схема возможного улучшения точности (несмещенности) со-
стоятельной оценки приведена на рис. 3.2.
f(?*)


f(?*)n = 100



f(?*)n = 50

f(?*)n = 10



?
Рис. 3.2
В большинстве случаев несмещенная оценка является и состоя-
тельной. С другой стороны, состоятельные оценки (возможно, не яв-
ляющиеся несмещенными при малых объемах выборок) с увеличени-
ем объема выборки будут приближаться и лежать все “плотнее” к ис-
тинному значению (рис. 3.2). Это указывает на асимптотическую не-
смещенность состоятельной оценки. Поэтому при невозможности по-
лучения несмещенной оценки целесообразно найти хотя бы состоя-
тельную оценку.

62
если М( и? ) > ? и
Справедливо следующее утверждение: n

D( и? )> 0 при n > ?, то и? ? состоятельная оценка параметра ?.
n n
Оценки, являющиеся линейными функциями от выборочных на-
блюдений, называются линейными.
Очень важную роль в эконометрике играют так называемые наи-
лучшие линейные несмещенные оценки, или коротко BLUE-оценки
(Best Linear Unbiased Estimators). Такие оценки, являясь линейными и
несмещенными, имеют наименьшую дисперсию среди всех возмож-
ных оценок данного класса.
Наиболее употребляемыми методами нахождения точечных оце-
нок являются метод моментов, метод максимального правдоподобия,
метод наименьших квадратов, описание которых можно найти в лю-
бом учебнике по математической статистике.
3.2. Свойства выборочных оценок
На начальном этапе в качестве оценки той или иной числовой ха-
рактеристики (математического ожидания, дисперсии и т. п.) берется
выборочная числовая характеристика. Затем, исследуя свойства этой
оценки, ее уточняют таким образом, чтобы она удовлетворяла опи-
санным выше свойствам.
1n
Доказано, что выборочная средняя x В = ? x i является несме-
n i =1
щенной и состоятельной оценкой математического ожидания М(Х)
генеральной совокупности.
1n
Выборочная дисперсия Dв = ? (x i ? x B ) 2 является смещенной
n i =1
оценкой дисперсии D(X) = ?2 СВ Х генеральной совокупности, т. к.
n ?1
доказано, что Dв = ?2 . То есть выборочная дисперсия оценивает
n
n ?1
генеральную дисперсию с недостатком. Хотя при n > ? > 1,
n
и оценка Dв является асимптотически несмещенной, но в качестве
оценки дисперсии D(X) удобнее брать исправленную дисперсию:

n 1n 1k
2 2 2
DВ = ? (x i ? x B ) = ? n i (x i ? x B ) .
S= (3.1)
n ?1 n ? 1 i =1 n ? 1 i =1



63
Исправленная дисперсия S2 является несмещенной и состоятель-
ной оценкой дисперсии D(X) СВ Х.
Аналогично вводится исправленное среднее квадратическое от-
клонение или так называемый эмпирический стандарт S:

1n 1k
2 2 2
S= ? (x i ? x B ) = ? n i (x i ? x B ) .
S= (3.2)
n ? 1 i =1 n ? 1 i =1

Отметим, что при n > 30 различие между Dв и S2 (?в и S) прак-
тически незначимо. Поэтому при большом объеме выборки и ту и
другую оценки можно считать несмещенными. В дальнейшем оценки
дисперсии D(X) и среднего квадратического отклонения ?(Х) будем
обозначать S2 и S соответственно.
n
Относительная частота i является несмещенной и состоятель-
n
ной оценкой вероятности P(X = xi). Аналогично эмпирическая функ-
n
ция распределения F*(x) = x (накопленная относительная частота)
n
является несмещенной и состоятельной оценкой (теоретической)
функции распределения F(x) = P(X < x).
3.3. Интервальные оценки
После получения точечной оценки ?* желательно иметь данные о
надежности такой оценки. Особенно важно иметь сведения о точности
оценок для небольших выборок (поскольку с возрастанием объема n
выборки несмещенность и состоятельность основных оценок гаранти-
руется утверждениями математической статистики). Поэтому точеч-
ная оценка может быть дополнена интервальной оценкой ? интерва-
лом (?1, ?2), внутри которого с наперед заданной вероятностью ? на-
ходится точное значение оцениваемого параметра ?. Задачу определе-
ния такого интервала называют интервальным оцениванием, а сам ин-
тервал ? доверительным интервалом. При этом ? называют довери-
тельной вероятностью или надежностью, с которой оцениваемый
параметр ? попадает в интервал (?1, ?2).
Зачастую для определения доверительного интервала заранее вы-
бирают число ? = 1 ? ?, 0< ? < 1, называемое уровнем значимости, и
находят два числа ?1 и ?2, зависящих от точечной оценки ?* такие, что
P(?1 < ? < ?2) = 1 ? ? = ?. (3.3)
64
В этом случае говорят, что интервал (?1, ?2) накрывает неизвест-
ный параметр ? с вероятностью (1 ? ?) или в 100(1 ? ?)% случаев.
Границы интервала ?1 и ?2 называются доверительными, и они обыч-
но находятся из условия P( ? < ?1 ) = P( ? > ?2 ) = ?/2 .

P(?1 < ? < ?2) = 1 ? ?

P(? < ?1)= ?/2 P(? > ?2) = ?/2




??
?1 ? ?2
Рис. 3.3

Длина доверительного интервала, характеризующая точность ин-
тервальной оценки, зависит от объема выборки n и надежности ?
(уровня значимости ? = 1 ? ?). При увеличении величины n длина до-
верительного интервала уменьшается, а с приближением надежности
? к единице ? увеличивается. Выбор ? (или ? = 1 ? ?) определяется
конкретными условиями. Обычно используется ? = 0.1; 0.05; 0.01, что
соответствует 90, 95, 99 % -ным доверительным интервалам.
Общая схема построения доверительного интервала следующая:
1. Из генеральной совокупности с известным распределением СВ
Х f(x, ?) извлекается выборка объема n, по которой находится
точечная оценка ?* параметра ?.
2. Строится СВ Y(?), связанная с параметром ? и имеющая из-
вестную плотность вероятности f(y, ?).
3. Задается уровень значимости ?.
4. Используя плотность вероятности СВ Y, определяются два
числа с1 и с2 такие, что
c2
P(c1 < Y(?) < c2) = ? f(y, и)dy = 1 ? ? (3.4)
c1
Значения с1 и с2 выбираются, как правило, из условий
P(Y(?) < c1) = ?/2; P(Y(?) > c2 ) = ?/2 .
Неравенство с1 < Y(?) < c2 преобразуется в равносильное
?*? ? < ? < ?*+ ? такое, что P(?*? ? < ? < ?*+ ?) = 1 ? ?.

65
Полученный интервал (?*? ?, ?*+ ?), накрывающий неизвестный
параметр ? с вероятностью 1 ? ?, и является интервальной оценкой
параметра ?.
Интервальная оценка также носит случайный характер, так как
она напрямую связана с результатами выборки. Однако она позволяет
нам сделать следующий вывод. Если построен доверительный интер-
вал, который с надежностью ? = 1 ? ? накрывает неизвестный пара-
метр, и его границы рассчитываются по K выборкам одинакового объ-
ема n, то в (1 ? ?)?K случаях построенные интервалы накроют истин-
ное значение исследуемого параметра.
Поскольку в эконометрических задачах часто приходится нахо-
дить доверительные интервалы параметров СВ, имеющих нормальное
распределение, приведем схемы их определения.
3.3.1. Доверительный интервал для математического ожидания
нормальной СВ при известной дисперсии
Пусть количественный признак Х генеральной совокупности
имеет нормальное распределение с заданной дисперсией ?2 и неиз-
вестным математическим ожиданием m (X ? ?(m, ?)). Построим до-
верительный интервал для m.
1. Пусть для оценки m извлечена выборка х1, х2, ..., хn объема n.
1n
*
Тогда m = ? x i = x .
n i =1
x?m
2. Составим СВ U = . Нетрудно показать, что СВ U имеет
у/ n
стандартизированное нормальное распределение, т. е. U ? N(0, 1)
u2
1 ?
e ).
(f(u) = 2

3. Зададим уровень значимости ?.
4. Применяя формулу нахождения вероятности отклонения нор-
мальной величины от математического ожидания, имеем:
x?m
< uб ) =
P( U < u б ) = P(
у/ n
(3.5)
2 2
у у
= P( x ? u б ? < m < x + uб ? ) = 1? б .
n n
2 2
у у
Это означает, что доверительный интервал ( x ? u б ? ; x + uб ? )
n n
2 2

66
накрывает неизвестный параметр m с надежностью 1 ? ? . Точность
у
оценки определяется величиной ? = u б ? .
n
2
Отметим, что число u б определяется по таблице функции Лап-
2
1? б г
=.
ласа (приложение 1) из равенства Ф( u б ) =
2 2
2

f(u)




?=1??
?/2 ?/2



- uб 0 u

2 2
Рис. 3.4

Пример 3.1. На основе продолжительных наблюдений за весом Х пакетов
орешков, заполняемых автоматически, установлено, что стандартное отклонение
веса пакетов ? = 10 г. Взвешено 25 пакетов, при этом их средний вес составил

<< Предыдущая

стр. 11
(из 65 стр.)

ОГЛАВЛЕНИЕ

Следующая >>