<< Предыдущая

стр. 5
(из 10 стр.)

ОГЛАВЛЕНИЕ

Следующая >>

6. Каковы преимущества и недостатки ex post гипотез?
7. Почему научная гипотеза должна быть воспроизводимой?
ЛИТЕРАТУРА
1. Голофаст В.Б. Методологический анализ в социологическом исследовании. Л.: Наука, 1980.
2. Кэмпбелл Дж. Научный вывод, артефакты и контроль / Пер. с англ. А.У. Хараша // Кэмпбелл Дж. Модели экспериментов в социальной психологии и прикладных исследованиях / Сост. и общ. ред. М.И. Бобневой; Вступ. ст. Г.М. Андреевой. М.: Прогресс, 1980.

143
3. Лазарсфельд П. Методологические проблемы социологии // Социология сегодня: Проблемы и перспективы: Американская буржуазная социология середины XX века/Сокр. пер. с англ.; Общ. ред. и предисл. Г.В. Осипова. М.: Прогресс, 1965.
4. Современная философия науки: Хрестоматия / Сост., пер., вступ. ст. и коммент. А.А. Печенкина. М.: Наука, 1994.
5. Структура и развитие науки: Из Бостонских исследований по методологии науки: Сборник переводов / Сост., вступ. ст. и общ. ред. Б.С. Грязнова, В.Н. Садовского. М.: Прогресс, 1978.

Глава 5.Проектирование выборки
1. Генеральная и выборочная совокупности
Понятие репрезентативности. Концептуальный объект и генеральная совокупность. Проектируемый объект. Проектируемая и реальная генеральная совокупности.
Мы знаем, что социологическая наука имеет дело не с текучей непосредственностью жизни, а с данными, организованными по определенным правилам в пространстве признаков. Под данными имеются в виду значения переменных, приписанные единицам исследования — объектам. Эти объекты — сообщества, институции, люди, тексты, вещи — образуют в пространстве признаков многообразные и нередко причудливые конфигурации, давая исследователю возможность высказывать обобщающие суждения о действительности.
Как только речь заходит о действительности, обнаруживается, что полученные данные относятся, строго говоря, только к регистрационным документам (анкетам, бланкам интервью, протоколам наблюдения и т. п.). Нет никаких гарантий, что действительность за окнами лаборатории (скажем, по ту сторону шкал) не окажется иной. До выборочной процедуры мы еще не дошли, но уже встает вопрос о репрезентативности данных: можно ли распространить сведения, полученные в процессе обследования, на объекты, находящиеся за пределами нашего конкретного опыта? Ответ однозначен: можно. В противном случае наши наблюдения не выходили бы за рамки «здесьи-теперь-совокупности». Они относились бы не к москвичам, а к тем, кто только что был опрошен по телефону в Москве; не к читателям газеты «Неделя», а к тем, кто прислал в редакцию по почте заполненный отрывной купон. После завершения опроса мы обязаны считать, что и «москвичи», и «читатели» остались прежними. Мы верим в стабильность мира потому, что научные наблюдения обнаруживают удивительное постоянство.
145
10-365
Любое единичное наблюдение распространяется на более широкую сферу наблюдений, и проблема репрезентации заключается в том, чтобы установить степень соответствия между параметрами обследованной совокупности и «реальными» характеристиками объекта. Выборочная процедура предназначена как раз для того, чтобы реконструировать реальный объект исследования и генеральную совокупность из отдельных моментных наблюдений.
Понятие выборочной репрезентативности близко понятию внешней валидности; только в первом случае производится экстраполяция одной и той же характеристики на более широкую совокупность единиц, а во втором — переход из одного смыслового контекста в другой. Выборочная процедура осуществляется каждым человеком тысячу раз на дню, при этом никто особенно не задумывается над репрезентативностью наблюдений. Опыт заменяет калькуляцию. Чтобы узнать, хорошо ли посолена каша, вовсе не обязательно съедать всю кастрюлю — здесь более эффективны методы неразрушающего контроля, в том числе выборочная проверка: нужно попробовать одну ложечку. При этом надо быть уверенным, что каша хорошо перемешана. Если каша перемешана плохо, имеет смысл провести не один замер, а серию, т. е. попробовать в разных местах кастрюли — это уже выборка. Сложнее убедиться в том, что ответ студента на экзамене репрезентирует его знания, а не является случайной удачей либо неудачей. Для этого и задаются несколько вопросов. Предполагается, что, если бы студент ответил на все возможные вопросы по предмету, результат был бы «истинный», т. е. отражал реальные знания. Но тогда никто не смог бы выдержать экзамен.
В основании выборочной процедуры всегда лежит «если бы» — предположение о том, что экстраполяция наблюдений существенно не изменит полученный результат. Поэтому генеральную совокупность можно определить как «объективную возможность» выборочной совокупности.
Проблема несколько усложняется, если разобраться в том, что имеется в виду под объектом исследования. Изучив достаточно многочисленную совокупность людей, социолог приходит к выводу, что переменная «радикализм—консерватизм» положительно коррелирует с возрастом: в частности, старшие поколения обнаруживают скорее консервативность, чем революционность. Но обследованный объект — выборочная совокупность — не существует в реальности как таковой. Он сконструирован процедурой отбора респондентов и проведения интервью, а затем сразу же исчезает, растворяется в массиве. Действительно, выборочная совокупность, с которой непосредственно «снимаются» данные, порождается процедурой, но в то же время она растворена в большой совокупности, которую представляет
146
или репрезентирует с разной степенью точности и надежности. Социологические заключения относятся не к обследованным на прошлой неделе респондентам, а к идеализированным объектам: «старшим поколениям», «молодежи», тем, кто обнаруживает «радикализм» или «консерватизм». Речь идет о категориальных обобщениях, не ограниченных пространственно-временными обстоятельствами. В этом отношении выборочная процедура помогает освободиться от наблюдений и перейти в мир идей.
Таким образом, у нас есть возможность провести разграничение объекта исследования и генеральной совокупности: объект — не просто совокупность единиц, а понятие, в соответствии с которым осуществляется идентификация и отбор единиц исследования. В этом отношении справедливо гегелевское предписание считать истинным только то бытие, которое соответствует своему понятию. Теоретически объем понятия, обозначающего объект исследования, должен соответствовать объему генеральной совокупности. Однако такое соответствие достигается крайне редко.
Нам понадобится понятие концептуального объекта — идеального конструкта, обозначающего рамки темы. «Россияне», «аудитория центральных газет», «электорат», «демократическая общественность» — таковы типичные объекты исследовательского интереса социологов. Несомненно, концептуальному объекту должна соответствовать вполне реальная генеральная совокупность. Для этого необходимо предусмотреть еще один объект исследования — проектируемый объект. Проектируемый объект — это совокупность доступных исследователю единиц. Задача состоит в том, чтобы установить группы, являющиеся недоступными либо труднодоступными для сбора данных.
Очевидно, что обследовать объект, обозначаемый как «россияне», практически невозможно. Среди россиян немало людей находится в тюрьмах, исправительно-трудовых учреждениях, в следственных изоляторах и иных труднодоступных для интервьюера местах. Эту группу придется «вычесть» из проектируемого объекта. «Вычесть» придется и многих пациентов психиатрических больниц, детей, часть престарелых. Вряд ли гражданскому социологу удастся обеспечить нормальные шансы на попадание в выборку и военнослужащим. Аналогичные проблемы сопровождают обследование читателей, избирателей, жителей малых городов, посетителей театров.
Перечисленные затруднения — лишь малая часть тех, зачастую непреодолимых препятствий, с которыми сталкивается социолог на полевой стадии исследования. Специалист должен предвидеть эти затруднения и не строить иллюзий по поводу полной реализации проектируемого объекта. В противном случае его ждут разочарования.
147
10*
Итак, объект исследования не совпадает с генеральной совокупностью примерно так же, как карта местности не совпадает с самой местностью.
Долго думали-гадали, Генералы все писали на большом листу. Было гладко на бумаге, да забыли про овраги, А по ним ходить, —
эти слова из старинной солдатской песни вполне применимы к проектированию выборки, если учесть, что ходить придется по квартирам.
Несомненно, генеральная совокупность — это та совокупность, из которой производится выборка единиц. Однако так только кажется. Выборка производится из той совокупности, из которой производится фактический отбор респондентов. Назовем ее реальной. Различия между проектируемой и реальной совокупностями можно увидеть воочию, сравнив списки «проектированных» респондентов и опрошенных фактически.
Реальный объект — та совокупность, которая сформировалась на стадии полевого исследования с учетом ограничений в доступности первичной социологической информации. Помимо заключенных, военнослужащих и больных, меньшую вероятность попасть в выборку имеют жители удаленных от транспортных коммуникаций сел, особенно если обследование производится осенью; те, кого, как правило, нет дома, не склонны к разговорам с посторонними людьми и т. п. Бывает, что интервьюеры, пользуясь отсутствием контроля, пренебрегают точным исполнением своих обязанностей и опрашивают не тех, кого положено опрашивать по инструкции, а тех, кого легче «достать». Например, посещать квартиры респондентов интервьюерам приказано по вечерам, когда легче застать их дома. Если исследование проводится, предположим, в ноябре, то уже в пять часов вечера в средней полосе России на улице совершенно темно. Во многих городах таблички с названиями улиц и номерами домов встречаются не часто. Если обязанности интервьюеров выполняют студентки местного пединститута, можно представить степень отклонения реального объекта от проектируемого. Иногда исследователи поступают еще проще: заполняют анкеты сами. Эти затруднения являются одним из источников так называемых систематических ошибок выборки.
Существуют достаточно эффективные способы контроля заполнения вопросников и приемы ремонта выборки, в частности «взвешивание» основных типологических групп респондентов: груп
148
пы тех, кого не хватает, увеличиваются, а избыточные группы уменьшаются. Так реальный массив подгоняется под проектируемый и это вполне оправданно.
2. Исчисление ошибки выборки: замкнутый круг
Понятие ошибки выборки. Почему невозможно сравнить выборочную совокупность с генеральной ?Как контролируется ошибка выборки в массовых опросах: практика ВЦИОМ.
Предположим, m — генеральная совокупность, обладает среднестатистической характеристикой xген Это может быть средний возраст, доход, доля консерваторов и количество испытывающих счастье. Предположим далее, что из генеральной совокупности m отобрана совокупность п — выборочная, которая обладает средней характеристикой хвы6 Ясно, что п < т. Тогда задача заключается в сопоставлении xген и хвы6 Отклонение выборочной средней от генеральной средней называется ошибкой выборки:

Из формулы следует, что исчисление ? — ошибки выборки является принципиально неосуществимым, если не известны значения переменной в выборочной и генеральной совокупностях. Так возникает замкнутый круг: чтобы установить значение генеральной средней, нужно построить выборку, но, даже реализовав выборку, мы не сможем определить ее ошибку, потому что не знаем генеральной средней. Если бы мы знали генеральную среднюю, задача определения ошибки выборки решалась бы просто, но в данном случае выборка была бы просто не нужна. Практически ошибка выборки определяется путем сравнения известных характеристик генеральной совокупности с выборочными средними. В социологии при обследованиях взрослого населения чаще всего используют данные переписей населения, текущего статистического учета, предшествующих опросов на том же объекте. В качестве контрольных параметров обычно применяются социально-демографические признаки. Это можно сделать по завершении анализа данных. Исключение составляют предвыборные опросы и опросы, предшествующие переписям населения и референдумам — исследователи стремятся предсказать их результаты и, тем самым, подтвердить репрезентативность своих данных.
Например, институт Дж. Гэллапа, систематически проводящий обследования общественного мнения по национальной выборке объемом 1500 человек, контролирует репрезентативность по имеющимся в национальных цензах данным о распределении населения по полу,
149
возрасту, образованию, доходу, профессии, расовой принадлежности (белый — цветной), месту проживания, величине населенного пункта1.
В исследованиях, проводимых Всероссийским центром изучения общественного мнения, надежность выборочных данных также оценивается посредством «апостериорного» контроля. В анкету мониторинга экономических и социальных перемен (руководитель — Т.И. Заславская) включены признаки (вопросы), по которым имеется информация в Государственном комитете по статистике Российской Федерации. Такими признаками являются пол, возраст, образование, тип поселения, семейное положение, сфера занятости, должностной статус респондента. Четыре показателя — пол, возраст, образование и место жительства респондента используются для выделения контролируемых групп при определении весов опрошенных — они должны соответствовать аналогичным группам в генеральной совокупности2.
Показатели семейного положения, сферы занятости и должностного статуса в определении весов не участвуют и служат для дополнительного контроля выборки (табл. 5.1).
Таблица 5.1
Соотношение параметров выборочной и генеральной совокупностей в мониторинге общественного мнения об экономических к социальных переменах в России, ВЦИОМ, март и июнь 1993 г., %
Группы населения (признаки I — II — контрольные при взвешивании)
Данные государственной статистики
Выборочные данные (взвешенные)
март
Июнь
Пол



1. Мужской
45,1
45,4
45,6
2. Женский
54,9
54,6
54,4
1Gallup G. The Gallup Poll: Public opinion 1978. Wilmington, Delaware: Scholarly Resources, 1979. P. XII.
2 Козеренко Е.В., Новиков С.Г. Выборка мониторинга: апостериорный контроль //Экономические и социальные перемены: Мониторинг общественного мнения: Информационный бюллетень/Междисциплинарный академический центр социальных наук; Всероссийский центр изучения общественного мнения. М.: АО «Аспект Пресс», 1993. № 5. С. 9.
150
Продолжение
Группы населения (признаки I — II контрольныепри взвешивании)
Данные государственной статистики
Выборочные данные (взвешенные)
март
июнь
Возраст
26,9
25,3
25,4
3, До 29 лет
44,5
47,2
45,9
4. 30 — 54 года
28,6
27,5
28,6
5. 55 лет и старше



Образование



6. Высшее и незаконченное



высшее
13,7
14,7
14,3
7. Среднее и среднее специальное
47,6
47,3
43,0
8. Неполное среднее
38,7
38,0
42,7
Тип поселения



9а. Санкт-Петербург, Москва
9,3
8,9
9,3
9б. Большие города
26,4
26,6
28,6
10. Средние и малые города
38,5
38,1
36,6
11. Сельские поселения
25,8
26,4
25,5
Семейное положение



12, Холост (незамужем)
16,1
16,7
16,4
13. Женат (замужем)
65,3
64,6
63,1
14. Разведен (разведена)
7,2
7,9
7,6
15. Вдовец (вдова)
11,1
10,8
12,7
Сфера занятости



16. Промышленность
49,4
43,9
48,8
17. Сельское хозяйство
13,4
43,9
13,7
18. Торговля, снабжение
13,5
14,4
14,7
19. Культсфера
19,8
15,5
16,7
20. Органы управления
3,2
18,8
2,7
21. Армия, милиция, МВД, МГБ
0,7
3,1
2,7
22. Другая отрасль
-
-
1,2
151
Специалисты ВЦИОМа обеспечивают при анализе данных тщательный ремонт выборки, чтобы минимизировать отклонения, возникшие на этапе полевых работ. Особенно сильные смещения наблюдаются по параметрам пола и возраста. Объясняется это тем, что женщины и люди с высшим образованием больше времени проводят дома и легче идут на контакт с интервьюером, т. е. являются легко достижимой группой по сравнению с мужчинами и людьми «необразованными»3. В принципе эту погрешность можно было бы уменьшить, увеличив число повторных посещений с трех до восьми-девяти, как делают западные социологи. Однако это привело бы к значительному увеличению расходов на проведение полевых работ, а во-вторых, к увеличению сроков проведения поля, — справедливо полагают Е.В. Козеренко и С.Г. Новиков4.
Максимальное отклонение показателей выборочной совокупности от соответствующих значений государственной статистики составляет 3,1 процентных пункта. Предполагается, что в этих пределах варьирует и ошибка выборки по изучаемому параметру, значение которого в генеральной совокупности неизвестно.
Аналогичным образом строятся другие всероссийские выборки. В обследованиях Центра «СоциоЭкспресс» Института социологии РАН выборка тоже имеет всероссийский масштаб. Ее проектный объем 2 тыс. человек. Опрос производится методом формализованного интервью по месту жительства. В основе размещения выборки лежат десять экономико-географических зон, в каждой из которых выделяются крупные города (численностью свыше 500 тыс. населения), средние города (50 — 500 тыс.), малые города (до 50 тыс.) или поселки городского типа, а также сельские населенные пункты. Репрезентативность контролируется по региональным пропорциям численности населения, пропорциям между городским и сельским населением, пропорциям между населением указанных типов населенных пунктов. Авторы полагают, что предельная ошибка их выборки не превышает трех процентов5.
Более надежны сопоставления данных выборочной совокупности с результатами иных крупномасштабных исследований, где используются «субъективные» переменные. Уникальные возможности в этом отношении возникают при проведении референдума, который являет
3 Там же. С. 10.
4 Там же. С. 9.
5 Зеркало мнений: Результаты социологического опроса населения России / Рос. академия наук, Институт социологии; Центр «СоциоЭкспресс»; Отв. за вып. В. Червяков. М.: Институт социологии РАН, 1993. С. 3 — 4.
152
собой опрос генеральной совокупности. 25 апреля 1993 г. в России состоялся референдум, где задавались четыре вопроса: о доверии президенту, об отношении к социально-экономической политике, проводимой президентом и правительством в 1992 г., о необходимости досрочных выборов президента, а также о необходимости досрочных выборов депутатов. Многие социологические службы страны делали свои прогнозы. Наиболее точным, но только по первым двум вопросам, оказался прогноз ВЦИОМ6, выполненный по заказу газеты «Известия» и опубликованный за день до референдума (табл. 5.2).
Таблица 5.2
Прогнозы результатов референдума 25 апреля 1993 г. различными социологическими службами, % положительных ответов
Прогнозы социологических служб и результаты референдума
Позиции вопросника
Доверяете ли Вы президенту России?
Одобряете ли Вы социальноэкономическую политику, проводимую президентом и правительством с 1992 г.
Прогноз ВЦИОМ в «Известиях»
57
522
Прогноз ВЦИОМ по опросу на избирательных участках
64
56
Cable News Research
65
58
Фонд «Общественное мнение»
74
66
Результат референдума
59
53
6 Седов Л.А. Референдум: прогнозы и итоги // Экономические и социальные перемены: мониторинг общественного мнения: Информационный бюллетень / Междисциплинарный академический центр социальных наук; Всероссийский центр изучения общественного мнения. М.: АО«Аспект Пресс», 1993. №3. С. 9
153
При отсутствии лучшего критерия следует согласиться с тем, что, если выборка выходит за приемлемые рамки по известным переменным, она непригодна и по изучаемой переменной. И все-таки важно сознавать, что одна и та же совокупность единиц описывается многообразными характеристиками, каждой из которых присуща своя степень вариации. Иначе говоря, по одним характеристикам генеральная совокупность «хорошо перемешана» и является однородной, по другим — дифференцированной. Например, по признаку «грамотность — неграмотность» современное российское общество практически однородно: можно, опросив нескольких человек, уверенно утверждать, что подавляющее большинство людей грамотны. Иное дело — дифференциация доходов. Она столь велика, что малой выборкой не обойдешься. Отсюда следует, что не существует выборки на все случаи социологической жизни. Лучшая выборка — не обязательно большая. Даже очень маленькая выборка может быть вполне представительной. Главное, чтобы она была хорошо перемешана в генеральной совокупности,
3. Случайные и систематические ошибки
Уменьшение случайных ошибок при возрастании объема выборки и независимость систематических ошибок от величины массива. Сколько человек нужно опросить для получения репрезентативных данных? Примеры из практики исследовании. Почему предвыборный прогноз «Literary Digest» 1936 г. оказался ошибочным?
Ошибки выборки подразделяются на два типа. Случайные ошибки уменьшаются при возрастании объема выборочной совокупности. Так кубик при достаточно большом числе бросаний будет падать примерно равное количество раз на каждую грань. При нескольких бросаниях он может показать преимущественное выпадение, например «шестерки». Тогда мы говорим, что число наблюдений слишком мало, чтобы судить о неслучайности выпадения «шестерок». Но если «шестерки» выпадают постоянно при сотнях и тысячах бросаний, мы говорим: крайне маловероятно, чтобы это происходило случайно. Таким образом, случайная ошибка — это вероятность того, что выборочная средняя выйдет (или не выйдет) за пределы заданного интервала. При случайном отборе следует неукоснительно соблюдать следующую заповедь: критерии доступа к единицам исследования должны быть независимы от изучаемых переменных.
Чудесное свойство случайных ошибок уменьшаться при возрастании объема выборочной совокупности делает бессмысленными обследования огромных массивов, которые предпринимаются чаще всего с целью произвести впечатление на профессионально неподготовленного заказчика.
154
Даже национальные выборки достаточно малы. Первая национальная выборка в США, спроектированная в 1935 г. тогда только начинавшим карьеру «поллстера» Джорджем Гэллапом старшим, насчитывала 1327 человек и пропорционально отражала основные группы населения. Одной из наиболее важных тем общественного мнения тогда, в 1930-е гг., было возобновление запрета на производство и продажу спиртных напитков. Чтобы установить вариацию выборочной средней, обусловленную величиной массива, выборка была случайным образом разбита на три примерно равных по численности группы7. Посмотрим на распределение опрошенных в первой подвыборке (табл. 5.3).
Таблица 5.3
Отношение американцев к возобновлению запрета на спиртные напитки, опрос Дж. Гэллапа, 1935 г., первая подвыборка: 442 человека
Мнение опрошенных
Количество опрошенных, абс
Количество опрошенных,%
Одобрительное
137
31
Неодобрительное
276
62
Неопределенное
29
7
Всего
442
100
Аналогичные результаты Гэллап получил во второй и третьей подвыборках примерно такой же величины. Каждая из них показывала некоторое отклонение от общей выборочной средней, и, если проанализировать подвыборки накопленным итогом, можно установить степень приближения результатов малых выборок к результатам большой. Мысленная экстраполяция совершенно точно указывает предел точности выборочной средней — это генеральная средняя. Но и на промежуточных стадиях видно, что подвыборочные средние отклоняются от параметров большой национальной выборки незначительно (табл. 5.4).

7 Gallup G. A guide to public opinion polls. 2nd ed. Princеton: Princeton University Press, 1948. P. 14.
155
Таблица 5.4
Отношение американцев к возобновлению запрета на спиртные напитки, опрос Дж. Гэллапа, 1935 г., три подвыборки накопленным итогом, %
Выборки
Одобряют
Не одобряют
Не имеют мнении
Первая выборка, 442 человека
31
62
7
Первая плюс вторая выборки, 884 человека
29
63
8
Первая плюс вторая плюс третья выборки, 1 327 человек
30
63
7
Третья строка таблицы показывает значения, полученные в проектной выборочной совокупности, — они ненамного отличаются от средней и малой подвыборок. А изменятся ли выборочные параметры при увеличении объема? Чтобы узнать это, Гэллап провел дополнительные обследования той же генеральной совокупности выборками нарастающего объема таким образом, что величина максимальной из них составила 12 494 человека. Каковы же результаты расширения выборки почти в десять раз (табл. 5.5)?
Таблица 5.5
Отношение американцев к запрету спиртных напитков в дополнительных выборках большего объема, опрос Дж. Гэллапа, 1935 г., %
Выборки
Одобряют
Не одобряют
Нет мнения

<< Предыдущая

стр. 5
(из 10 стр.)

ОГЛАВЛЕНИЕ

Следующая >>