<< Предыдущая

стр. 10
(из 65 стр.)

ОГЛАВЛЕНИЕ

Следующая >>

3. Что такое статистический ряд? Что такое интервальный статистический ряд?
4. Дайте определение эмпирической функции распределения, приведите ее ана-
литическое и графическое представление.
5. Что такое полигон частот и гистограмма? Для чего они используются?
6. Как вычисляются основные числовые характеристики по результатам выбор-
ки: выборочные среднее, дисперсия, среднее квадратическое отклонение?
7. Как вычисляется и где применяется выборочный коэффициент вариации?
8. Приведите формулы определения выборочных ковариации и коэффициента
корреляции.
9. Приведите основные свойства выборочного коэффициента корреляции.

55
Упражнения и задачи

Анализируются объемы ежедневных продаж некоторого товара за 60 дней.
1.
Получены следующие данные:
5, 6, 3, 2, 7, 7, 6, 6, 10, 11, 6, 4, 5, 6, 3, 12, 9, 10, 7, 4, 6, 7, 8, 8, 10, 5, 5, 4, 3, 6,
6, 7, 7, 8, 8, 10, 6, 4, 5, 6, 12, 7, 7, 8, 11, 9, 10, 5, 6, 4, 2, 7, 11, 8, 7, 9, 5, 6, 9, 5.
Необходимо:
а) построить статистический ряд;
б) определить размах выборки;
в) построить эмпирическую функцию распределения и ее график;
г) построить полигон относительных частот;
д) определить выборочные среднюю, дисперсию, среднее квадратическое
отклонение.
Анализируется продолжительность телефонных разговоров с клиентами на
2.
некоторой справочной телефонной службе. Случайным образом отобраны
55 телефонных разговоров и зафиксированы их длительности (в секундах):
39, 60, 40, 52, 32, 68, 77, 61, 68, 60, 47, 49, 70, 55, 66,
80, 35, 67, 70, 55, 42, 52, 60, 82, 70, 55, 47, 39, 50, 58,
45, 50, 53, 33, 49, 54, 55, 70, 62, 60, 60, 40, 59, 64, 70,
55, 54, 35, 48, 52, 57, 55, 82, 70, 51, 35, 49, 60, 55, 47.
Необходимо:
а) вычислить выборочную среднюю, выборочную дисперсию, выборочное
среднее квадратическое отклонение рассматриваемой величины;
б) построить интервальный статистический ряд, включающий 5 подынтер-
валов (какой шаг h вы при этом выбрали и почему?);
в) построить гистограмму и по ее виду выдвинуть предположение о законе
распределения рассматриваемой СВ;
г) вычислить выборочные числовые характеристики рассматриваемой вели-
чины на основании построенного интервального статистического ряда;
д) построить интервальный статистический ряд, включающий 7 подынтер-
валов и вычислить на его основании выборочные числовые характеристики
рассматриваемой величины;
г) сравнить результаты вычислений в пунктах а), г) и д); каковы ваши выво-
ды?

По имеющейся эмпирической функции распределения F?(x) построить ста-
3.
тистический ряд и полигон частот, если объем выборки n = 100.
х ? 10;
0,
10 < x ? 20;
0.2,
20 < x ? 30;
0.5,
F?(x) = 30 < x ? 40;
0.65,
40 < x ? 50;
0.9,
50 < x ? 60;
0.95,
1, x > 60.


56
Анализируется размер дивидендов по акциям некоторой компании. Для это-
4.
го отобраны данные за последние 20 лет:
5, 10, 7, -5, 3, 10, 15, 10, 5, -3, -5, 3, 7, 15, 10, 10, 0, -2, 5, 10.
а) Каков ожидаемый размер дивидендов?
б) Как можно оценить риск от вложений в данную компанию?
Анализируется прибыль (X) фирм в некоторой отрасли. Имеющиеся стати-
5.
стические данные по 100 фирмам представлены следующим интервальным
статистическим рядом:

[0, 5) [5, 10) [10, 15) [15, 20) [20, 25) [25, 30)
X%

ni 8 15 35 30 10 2


Необходимо:
а) оценить величину ожидаемой (средней) прибыли в отрасли;
б) построить гистограмму и выдвинуть предположение о виде закона рас-
пределения СВ Х;
в) оценить величину относительного разброса прибылей в данной отрасли.
Цена некоторого товара в 20 магазинах была следующей:
6.
50, 48, 47, 55, 50, 45, 50, 52, 48, 50, 52, 48, 50, 47, 50, 48, 52, 50, 50, 48.
На базе этих данных
а) построить статистический ряд;
б) построить полигон относительных частот;
в) выдвинуть предположение о виде закона распределения СВ ? цены това-
ра;
г) оценить параметры предполагаемого закона распределения.
Данные наблюдений за СВ X и Y представлены следующими таблицами:
7.

а) Х 1234 5 б) Х 1 3579 в) Х 01 2 3 4 5 6
Y 0235 6 Y 10 7 8 5 3 Y 94 1 0 1 4 9

Необходимо нанести точки наблюдений на декартову систему координат;
вычислить ковариацию и коэффициент корреляции; сделать выводы о ли-
нейной зависимости между переменными (о силе и направлении).

В следующей таблице приведены данные за 10 лет (1981?1990) по количест-
8.
ву вновь регистрируемых фирм (Х) и по количеству банкротств (Y) в неко-
тором государстве:




57
Год Х Y Год Х Y
1981 72500 1020 1986 82500 3000
1982 72900 1290 1987 87000 4000
1983 74150 1830 1988 86500 4200
1984 73500 2250 1989 90000 4500
1985 78350 2500 1990 89000 4000


а) Каково ожидаемое количество вновь регистрируемых фирм в течение го-
да для данного временного интервала; какова выборочная дисперсия и сред-
нее квадратическое отклонение для этого показателя?
б) Каково ожидаемое количество банкротств в течение года для данного
временного интервала; какова выборочная дисперсия и среднее квадратиче-
ское отклонение для этого показателя?
в) Вычислите ковариацию и коэффициент корреляции между Х и Y. Явля-
ются ли эти переменные независимыми?
г) Если Х и Y коррелированы, то можно ли утверждать, что один из этих по-
казателей является “следствием” другого, т. е. изменение одного влечет из-
менение другого?




58
3. СТАТИСТИЧЕСКИЕ ВЫВОДЫ:
ОЦЕНКИ И ПРОВЕРКА ГИПОТЕЗ
Статистические выводы – это заключения о генеральной сово-
купности (т. е. о законе распределения исследуемой СВ и его пара-
метрах, либо о наличии и силе связи между исследуемыми перемен-
ными) на основе выборки, случайно отобранной из генеральной сово-
купности. Например, анализ дохода (Х) населения некоторого двух-
миллионного города реально может быть осуществлен только на базе
выборки ограниченного объема (пусть n = 1000). В данном случае не
n
составит большого труда оценить средний доход x = ? x i n и разброс
i =1
n
S = ? (x i ? x) 2 n в доходах субъектов, попавших в выборку. Далее
2
i =1
встает вопрос: можно ли считать, что полученные значения будут та-
кими же для всего города. Другими словами, обобщение результатов,
полученных по выборке, на генеральную совокупность и есть суть
статистических выводов. При исследовании различных параметров
генеральной совокупности на основе выборки возможно лишь полу-
чение оценок этих параметров. Эти оценки получаются из ограничен-
ного набора данных, что влечет за собой вероятность погрешности.
Заметим, что значения оценок могут изменяться от выборки к выбор-
ке. Процесс нахождения оценок по определенному правилу (форму-
ле) будем называть оцениванием. Цель любого оценивания ? получе-
ние наиболее точного значения оцениваемой характеристики. Можно
выделить два вида оценивания: оценивание вида распределения и
оценивание параметров распределения. В качестве оценки вида рас-
пределения (в силу закона больших чисел) можно взять выборочное
распределение, подсчитав частоты попадания рассматриваемой СВ в
заданные подынтервалы интервального статистического ряда. Проце-
дура оценивания всегда однотипна. На основе выборки с помощью
соответствующей формулы рассчитывается оценка исследуемой ха-
рактеристики. В качестве оценок параметров распределения генераль-
ной совокупности берутся их выборочные оценки. При этом различа-
ют два вида оценок ? точечные и интервальные.
После определения оценок обычно встает вопрос об их качестве
и статистической значимости. С другой стороны, часто до определе-
ния оценок выдвигаются предположения о значениях исследуемых
параметров. Анализ соответствия результатов выборки выдвигаемым

59
предположениям и определение статистической значимости получен-
ных выводов обычно осуществляются по схеме статистической про-
верки гипотез, что также требует рассмотрения.
3.1. Точечные оценки и их свойства
Пусть оценивается некоторый параметр ? наблюдаемой СВ Х ге-
неральной совокупности. Пусть из генеральной совокупности извле-
чена выборка объема n: x1, x2, ..., xn, по которой может быть найдена
оценка ?* параметра ?. Например, для нормального закона распреде-
ления с плотностью вероятности
( x ? m) 2
?
1
e 2
f(x) = 2у
2р у
параметрами являются математическое ожидание m и среднее квадра-
тическое отклонение ?.
Точечной оценкой ?* параметра ? называется числовое значение
этого параметра, полученное по выборке объема n.
1n
*
Например, оценками m и ?(х) могут быть m = x = ? x i и
n i =1
1n
* 2
? (x i ? x ) соответственно.
? = ?В =
n i =1
Нетрудно заметить, что оценка ?* является функцией от выборки,
т. е. ?* = ?*(х1, х2, ..., хn). Так как выборка носит случайный характер,
то оценка ?* является СВ, принимающей различные значения для
различных выборок. Любую оценку ?* = ?*(х1, х2, ..., хn ) называют
статистикой или статистической оценкой параметра ?.
Число ? такое, что ?? - ?* ?? ? называется точностью оценки. Ес-
тественно стремление получить по возможности наиболее точную
оценку при данном объеме выборки.
Приведем свойства, выполнимость которых желательна для того,
чтобы оценка была признана удовлетворительной.
В силу случайности точечной оценки ?* она может рассматри-
ваться как СВ со своими числовыми характеристиками ? математиче-
ским ожиданием М(?*) и дисперсией D(?*). Чем ближе М(?*) к истин-
ному значению ? и чем меньше D(?*), тем лучше будет оценка (при
прочих равных условиях). Таким образом, качество оценок характери-
зуется следующими основными свойствами: несмещенность, эффек-
тивность и состоятельность.

60
Оценка ?* называется несмещенной оценкой параметра ?, если ее
математическое ожидание равно оцениваемому параметру: М(?*) =?.
Хотя каждая отдельная оценка лишь в редких случаях совпадает
с соответствующей характеристикой генеральной совокупности, при
“аккуратном” оценивании многократное осуществление выборок од-
ного объема n обеспечивает совпадение среднего значения оценки по
всем выборкам с истинным значением оцениваемого параметра.
Разность М(?) ? ? называется смещением или систематической
ошибкой оценивания. Для несмещенных оценок систематическая
ошибка равна нулю.
Свойство несмещенности оценки является важнейшим, но не
единственным. Зачастую существует несколько возможных оценок
одного и того же параметра. Какая из них лучше? Очевидно, выбор
будет сделан в пользу той из них, вероятность совпадения которой с
истинным значением оцениваемого параметра выше. Оценка должна
иметь такую плотность вероятности, которая наиболее “сжата” вокруг
истинного значения оцениваемого параметра. Нетрудно заметить, что
в этом случае она будет иметь наименьшую среди других оценок дис-
персию. Оценка ?* называется эффективной оценкой параметра ?, ес-
ли ее дисперсия D(?*) меньше дисперсии любой другой альтернатив-
ной оценки при фиксированном объеме выборки n, т. е. D(?*) = Dmin.
На рис. 3.1 приведена схема, наглядно демонстрирующая преимуще-
*
ство эффективной оценки и1 по сравнению с неэффективной оценкой
и* параметра ?.
2


f(?*)
*
f( и1 )




*
f( и 2 )

<< Предыдущая

стр. 10
(из 65 стр.)

ОГЛАВЛЕНИЕ

Следующая >>