<< Предыдущая

стр. 9
(из 65 стр.)

ОГЛАВЛЕНИЕ

Следующая >>

49
F?(x)
1
0.90


0.65



0.25

0.05
0 5 10 15 20 25 x
Рис. 2.1
Наглядно статистический ряд может быть представлен в виде полигона час-
тот (рис. 2.2, а) или полигона относительных частот (рис. 2.2, б):

ni
ni
n
• •
40 - 0.4-



• •
25 - 0.25-
• •
20 - 0.20-

• •
10 - 0.10-
• •
5- 0.05-

0 5 10 15 20 25 X 0 5 10 15 20 25 X
a б
Рис. 2.2
При большом объеме выборки ее элементы могут быть сгруппи-
рованы в интервальный статистический ряд. Для этого все n наблю-
даемых значений выборки x1 , x 2 , ... , x n разбивают по k непересе-
кающимся подынтервалам равной длины h (h – шаг разбиения). Пусть
ni – количество наблюдаемых значений СВ ?, попадающий в i-й по-
n
дынтервал. ? i = i – относительная частота попадания СВ ? в i-й по-
n
дынтервал. Тогда интервальный статистический ряд имеет вид:



50
Таблица 2.2
[ xi-1, xi) [ x0, x1 ) [ x1, x2 ) [ xk-1, xk )

ni n1 n2 … nk

ni n1 n2 nk
n n n n
Интервальный статистический ряд наглядно может быть пред-
ставлен в виде гистограммы ? графика, в котором по оси абсцисс от-
кладываются подынтервалы, на i-м из которых строится прямоуголь-
ni
ник высотой . По виду гистограммы обычно выдвигают предпо-
nh
ложение о виде закона распределения исследуемой величины, что по-
зволяет придать определенную направленность исследованиям.
Пример 2.2. Анализируется доход населения, для чего извлечена выборка
объема n = 300. По уровню дохода население подразделяется на k = 6 групп. По-
лученные по выборке данные сгруппированы в следующий интервальный стати-
стический ряд:

[ xi-1, xi ) [ 0, 20 ) [ 20, 40) [ 40, 60) [ 60, 80) [ 80, 100) [100,120)
ni 10 50 80 100 40 20
ni
1/30 5/30 8/30 10/30 4/30 2/30
n
Необходимо построить гистограмму и выдвинуть предположение о виде за-
кона распределения СВ Х ? дохода населения.
Отметим, что в последнюю группу могут быть включены все субъекты, чей
доход превышает 100 у. е. Однако для получения теоретических выводов послед-
ний подынтервал полагается той же длины h = 20, что и все предыдущие.
Построим гистограмму:
ni/(nh)

10/600 -
8/600 -

5/600 -
4/600 -
2/600 -
1/600 -
0 20 40 60 80 100 120 x
Рис. 2.3


51
Форма гистограммы (рис. 2.3) в наибольшей степени соответствует нор-
мальному закону распределения. Поэтому естественным является предположение
о нормальном распределении СВ Х ? дохода населения (Х ? N( m, ?)). Следую-
щим этапом исследования является определение параметров m и ?, что будет об-
суждаться далее.
2.3. Вычисление выборочных характеристик
Для любой СВ ? кроме определения ее функции распределения
желательно указать ее числовые характеристики, важнейшими из ко-
торых являются математическое ожидание, дисперсия, среднее квад-
ратическое отклонение. Пусть объем генеральной совокупности равен
N. Тогда математическим ожиданием СВ ? является генеральное
среднее:
1N
xГ = ? xi . (2.2)
N i =1
Дисперсией СВ ? является генеральная дисперсия:
1N
D Г = ? (x i ? x Г ) 2 . (2.3)
N i =1
Корень квадратный из генеральной дисперсии называется гене-
ральным средним квадратическим отклонением:
у Г = DГ . (2.4)
Таким образом, для нахождения генеральных числовых характе-
ристик необходим анализ всей генеральной совокупности. В силу то-
го, что в реальности практически всегда имеют дело с выборками,
приходится находить оценки указанных выше генеральных характе-
ристик - выборочные числовые характеристики: выборочное среднее,
выборочную дисперсию, выборочное среднее квадратическое откло-
нение.
Выборочное среднее – это среднее арифметическое наблюдаемых
значений выборки.
1n
xB = ? xi . (2.5)
n i =1
При задании выборки в виде статистического ряда x B рассчи-
тывается по следующей формуле:
1k
x B = ? nixi . (2.6)
n i =1
Оценкой генеральной дисперсии является выборочная дисперсия:

52
1k
D В = ? n i (x i ? x B ) 2 . (2.7)
n i =1
Зачастую для вычисления D В применяется следующая формула:
1n 2
D В = ? (x i ? 2x i ? x B + (x B ) 2 ) = x 2 ? x 2 . (2.8)
n i =1
При задании выборки в виде статистического ряда имеем:
1k
D В = ? n i (x i ? x B ) 2 . (2.9)
n i =1
Корень квадратный из выборочной дисперсии называется
выборочным средним квадратическим отклонением:
1k
у В = DВ = ? n i (x i ? x B ) 2 = x2 ?x 2 . (2.10)
n i =1
При задании выборки в виде интервального статистического ряда
в формулах (2.6), (2.9), (2.10) вместо xi рассматривается среднее значе-
x + xi
ние i-го подынтервала: x i = i?1 .
2
Для примера 2.1 имеем:
15 1
? nixi =
xB = (5 ? 5 + 20 ? 10 + 40 ? 15 + 25 ? 20 + 10 ? 25) = 15.75 ,
20 i =1 100

15 1
? n i (x i ? x B ) 2 = (5 ? 10.752 + 20 ? 5.752 + 40 ? 0.752 +
DВ =
100 i =1 100

+ 25 ? 4.752 + 10 ? 9.752 ) = 27.7625,

?B = 27.7625 = 5.269.

Для примера 2.2 имеем:
16 1
xB = ? ni xi = (10 ? 10 + 50 ? 30 + 80 ? 50 + 100 ? 70 +
300 i =1 300
+ 40 ? 90 + 20 ? 110) = 61.33,
16 1
2
(10 ? 51.332 + 50 ? 31.332 + 80 ? 11.332 +
DВ = ? n i (x i ? x B ) =
100 i =1 300
+ 100 ? 8.67 2 + 40 ? 28.67 2 + 20 ? 48.67 2 ) = 578.22,

?B = 578.22 = 24.05.


53
В дальнейшем для упрощения выкладок x B будем обозначать че-
рез x .
По аналогичной схеме определяются статистические оценки дру-
гих числовых характеристик СВ. Приведем формулы расчета число-
вых характеристик, упоминавшихся в главе 1.
Выборочный коэффициент вариации V определяется отношени-
ем выборочного среднего квадратического отклонения к выборочной
средней, выраженным в процентах:
у
V = В ?100% . (2.11)
x
Коэффициент вариации – безразмерная величина, удобная для
сравнения величин рассеивания двух выборок, имеющих различные
размерности.
Как отмечалось в параграфе 1.6, наиболее употребляемыми ха-
рактеристиками связи двух СВ являются меры их линейной связи –
ковариация и коэффициент корреляции. Их оценками являются выбо-
рочная ковариация Sxy и выборочный коэффициент корреляции rxy:
1n
Sxy = ? (x i ? x )(y i ? y) = xy ? x ? y , (2.12)
n i =1
Sxy
rxy = =
у В (X) ? у В (Y)
1n (2.13)
? (x i ? x)(y i ? y) xy ? x ? y
n i =1
= = .
1 1
n n 2 2 2 2
x ?x ? y ?y
2 2
? (x i ?x) ? ? (y i ? y)
n i =1 n i =1
1n
Здесь xy = ? x i y i . Следовательно, для нахождения выборочной
n i =1
ковариации и коэффициента корреляции необходимо иметь выборку
объема n из двумерной генеральной совокупности (X, Y): (xi, yi),
n = 1, 2, …, n.
Таблица 2.3

xi x1 x2 … xn

yi y1 y2 … yn



54
Выборочные ковариация и коэффициент корреляции обладают
теми же свойствами, что и их теоретические прототипы. В частности,
нетрудно показать, что справедливы следующие свойства:
1. Если между СВ ? и ? существует положительная (отрицатель-
ная) линейная зависимость, то rxy > 0 (rxy < 0).
2. Выборочный коэффициент корреляции rxy является безраз-
мерной величиной.
3. ?1 ? rxy ? 1.
4. Если между СВ ? и ? отсутствует линейная связь, то rxy = 0.
5. Чем ближе rxy по модулю к 1, тем сильнее линейная связь ме-
жду ? и ?.
Замечание. Близкая к нулю величина коэффициента корреляции
говорит об отсутствии линейной связи переменных, но не об отсутст-
вии связи между ними вообще (рис. 2.4, в).
y rxy > 0 y rxy < 0 y rxy = 0
• •
··. · ·: .
• •
:N :N
• •
. ·M · . ··
:N. .QN

0 x0 x 0 x
a б в
Рис. 2.4

Вопросы для самопроверки
1. Что такое генеральная совокупность и выборка?
2. Назовите основные виды выборок и способы отбора элементов в них.

<< Предыдущая

стр. 9
(из 65 стр.)

ОГЛАВЛЕНИЕ

Следующая >>