1 Определение и истоки
2 Выбор исследовательского плана
3 Концептуализация и измерение: общий обзор
4 Уровни измерения
5 Общие правила конструирования опросников
6 «Сензитивные» вопросы
7 Выбор формата для ответов
8 Макет анкеты (опросника)
Библиографический список
1 Определение и истоки
Метод опроса — самый распространенный из социологических методов, определяющий «образ» социологии в глазах непосвященных и к тому же имеющий самую богатую и давнюю историю. Утверждение о том, что почти невозможно дать строгое и исчерпывающее определение того, что такое опрос, на первый взгляд кажется нелепостью. Однако в действительности представления о том, каким должен быть хороший социологический опрос, менялись так часто, что любая попытка свести определение опроса к конкретной технике сбора информации, плану исследования, типу анализа данных или характеру использования полученных сведений наверняка столкнется с трудностями. Трудности эти так существенны, что один известнейший специалист в этой области в монографии, посвященной анализу истории и перспектив опросного метода, предложил говорить о некотором «базовом типе» опроса, по отношению к которому можно было бы упорядочить все многообразие реальных опросных исследований. Идеальной моделью он предложил считать «модель Гэллапа», т. е. тот тип опроса общественного мнения, который сложился в 1930—1940-х гг. в результате сотрудничества (и конкуренции) между основанным Дж. Гэллапом в 1935 году Американским институтом общественного мнения и другими исследовательскими фирмами. Для типичного «гэллаповского» опроса характерны следующие признаки:
1) общенациональный характер;
2) отбор из генеральной совокупности всех лиц, достигших избирательного возраста;
3) максимальная приближенность времени проведения опроса ко времени выборов или референдумов;
4) среднее число респондентов в выборке — 2000 человек;
5) случайный или квотный характер выборки;
6) использование стандартных вопросников и личное интервьюирование каждого респондента по месту жительства;
7) «закрытый» характер вопросов;
8) сбор индивидуальных, неагрегированных данных (каждое наблюдение может быть соотнесено с конкретным индивидуумом в выборке).
Широко распространенные отклонения от описанной «гэллаповской» нормы все же столь существенны, что нам следует рассмотреть и другие подходы к определению сути опросного метода. Во-первых, следует вспомнить о том, что для социологии как науки главной функцией опроса является все же не предсказание результатов завтрашних выборов, а проверка гипотез о характере связей между различными переменными. (Переменная-признак задается как one-рационализация неких содержательных представлений о существенном для социологической теории качестве, свойстве: «социально-экономическом статусе», «отчуждении», «расовой сегрегации» и т. п.) Во-вторых, использование выборочного обследования, как говорится в главах 7 и 8, как раз и имеет основной целью либо оценку значения определенного параметра в совокупности, либо — в большинстве случаев — проверку статистической гипотезы о связи между переменными. Эксперимент — это идеальная модель исследовательского плана для анализа причинных связей. Выборочное обследование (опрос) — хорошее приближение к идеальной модели. Для идеального эксперимента, напомним, характерны:
1) контроль условий, т. е. возможность варьирования независимых переменных и измерения зависимых;
2) использование экспериментальной и контрольной групп для проведения повторных сравнений;
3) рандомизация, т. е. случайный отбор испытуемых в контрольную и экспериментальную группы.
В выборочном исследовании, строго говоря, отсутствует возможность контроля, так как исследователь лишен возможности манипулировать независимыми переменными, произвольно задавать их значение. Однако с помощью количественных методов измерения и статистического анализа связи между переменными выборочный опрос может максимально приблизиться к той модели причинного вывода, которая лежит в основе экспериментального метода.
В целом анализ связи между переменными — и экспериментальный, и сугубо статистический, основанный на опросных данных, — подразумевает перекрестную группировку данных по двум переменным (независимой и зависимой), обнаружение связи между ними и введение третьей, контрольной переменной для оценки ее влияния на изучаемую связь. (Кстати, те возможности для контроля влияния «посторонних» факторов на исследуемую взаимосвязь, которые возникают при анализе связи в выборочных обследованиях, обычно даже превосходят возможности эксперимента.) В последнем случае набор контрольных переменных, «изолируемых» с помощью эксперимента, обычно ограничен. В выборочном обследовании список переменных чаще всего значительно обширнее и к тому же включает в себя такие переменные, которые в принципе не могут использоваться в эксперименте из практических или этических соображений: нельзя, например, произвольно назначить испытуемому экспериментальное условие «родился чернокожим» или «часто подвергался жестокому обращению» Однако заметим сразу, что последнее обстоятельство все чаще используется не столько для восхваления, сколько для критики — во многих отношениях справедливой — применимости выборочных опросов для анализа причинных связей (о чем еще будет сказано ниже).
Случайный отбор, используемый на том или ином этапе как основа построения выборки для массового опроса, может рассматриваться как подобие рандомизации в эксперименте. В идеальном случае, почти не встречающемся на практике, любая единица генеральной совокупности имеет равные шансы попасть в выборку. Поэтому влияние внешних, «посторонних» факторов нейтрализуется, и систематическое смещение отсутствует. В реальности, как показано в обсуждении выборочного метода, мы редко можем реализовать простую вероятностную выборку, довольствуясь каким-то приемлемым и экономичным компромиссом между случайным отбором, стратификацией и квотированием.
Контрольная и экспериментальная группы, используемые в экспериментальных планах для сравнения и выявления эффекта некоего причинного фактора, «отбираются» в выборочных обследованиях на стадии анализа, апостериорно. Фактически они «конструируются» исследователем в ходе сравнения подвыборок, выделенных с помощью фиксации разных уровней одной (или нескольких) объяснительных переменных.
В целом опросные методы обладают рядом существенных достоинств:
1) позволяют достаточно быстро получить большой массив наблюдений, причем каждый индивидуальный «случай» (отдельное наблюдение) описывается с помощью целого набора теоретически релевантных переменных признаков;
2) стоимость выборочного опроса оказывается сравнительно небольшой, если принять во внимание объем получаемой информации;
3) использование стандартных опросных процедур и однородных количественных показателей при соблюдении определенных условий позволяет не только проверять гипотезы о причинных зависимостях, но и проводить вторичный и сравнительный анализ результатов.
Недостатки, также присущие этому методу, мы проанализируем в следующих разделах.
2 Выбор исследовательского плана
Даже в том случае, когда исследователь четко осознал, в чем заключаются содержательные вопросы, на которые он хочет получить ответ в ходе выборочного обследования; ему не стоит торопиться составлять анкету и нанимать интервьюеров. Прежде ему нужно поразмыслить над тем, какого рода логику анализа данных он собирается использовать, после того как эмпирические данные будут получены. Для того, чтобы сведения о людях, группах или сообществах (об их поведении, установках или других чертах) можно было рассматривать в качестве доказательства каких-то теоретических гипотез, следует сначала решить, что именно можно считать доказательством в данном случае, по каким правилам будут строиться логические сопоставления и статистические выводы, иными словами, необходимо выбрать принципиальный исследовательский план.
В планировании выборочного опроса исследователи исходят приблизительно из тех же соображений: сравнение «случаев», подгрупп, сравнение типа «до — после». Здесь мы рассмотрим лишь самые общие типы исследовательских планов, используемых в выборочных опросах.
Первый шаг в планировании опроса — это принятие решения о том, что считать единицей анализа. В простейшем случае мы стремимся приписать каждому индивиду (респонденту) определенное значение по каждой переменной. Предположим, наша цель заключается в том, чтобы на основании опроса 2000 респондентов узнать, как распределены в генеральной совокупности «партийная принадлежность», «судимость» и некоторые другие переменные, а кроме того, мы собираемся проанализировать связь этих переменных с полом, возрастом и семейным статусом. Некоторые из переменных будут строго количественными, другие будут описываться как качественные признаки. В любом случае нам нужно будет охарактеризовать каждого респондента по каждой переменной. В результате мы сможем построить структурированную матрицу данных, подобную той, что изображена в табл. 1. В столбцах этой матрицы содержится вся информация о респондентах, которые здесь и являются единицами анализа (или «случаями»). Именно их свойства нам предстоит оценивать, сравнивать в поисках взаимосвязей и т. п.
Таблица 1
Пример матрицы данных типа «респонденты х переменные»
«Случай» | 1-й респондент | 2-й респондент | …… | 2000-й респондент |
Переменная | ||||
Пол | мужской | женский | ……. | мужской |
Возраст | 38 лет | 23 года | ……. | 62 года |
Семейный статус | разведен | замужем | ……. | вдовец |
Судимость | отсутствует | отсутствует | ……. | 2 судимости |
Партийная | конституционный | беспартийная | ……. | христианский |
принадлежность | демократ | социалист |
Обычно единицами анализа, т. е. теми, кого исследуют, бывают именно люди. Однако единицами анализа могут быть и семьи, и организации, и регионы, и государства. Например, в матрице данных столбцы могли бы соответствовать городам, а строки — переменным типа «уровень преступности», «население», «число безработных» и т. п. Некоторые из переменных были бы получены путем агрегирования, «объединения», индивидуальных данных (например, о наличии дополнительных источников дохода), другие характеризовали бы город как целое (наличие аэропортов, доля прямых налоговых поступлений в бюджете). В любом случае исследователю нужно заранее представить себе, как будет выглядеть матрица данных и какие приемы анализа он собирается к ней применить. Любое конкретное исследование может предполагать и использование различных единиц анализа, т.е. полученная в нем эмпирическая информация может характеризовать и отдельных индивидов, и семьи, и — в результате использования агрегированных показателей — регионы или государства. Важно лишь, чтобы все единицы анализа, которые вы намерены использовать, были определены заранее. В ином случае в матрице данных «единица анализа х переменная» неизбежно возникнут пропуски или дублирование одной и той же информации. Так как количество матриц данных равно количеству предполагаемых единиц анализа (хотя размерность их будет разной), можно заранее создать соответствующее количество отдельных массивов данных (файлов), содержащих те данные, которые относятся к данной единице анализа. Скажем, сведения о возрасте попадут в массив «респонденты», а сведения о составе семьи — в массив «семьи» (даже если последние и были получены в результате беседы с одним из членов семьи).
Описанная выше двумерная матрица данных типична для одномоментного, «срезового» исследования, характеризующего ситуацию в момент опроса. Целью такого исследования может быть, во-первых, описание распределения каких-то переменных в совокупности. Например, мы можем узнать, сколько человек собирается проголосовать за демократов при условии, что выборы будут проведены тотчас же (типичный «гэллаповский» опрос). Во-вторых, мы можем попытаться использовать «срезовые» данные для характеристики отдельных подвыборок — например, «работающих пенсионеров», «высококвалифицированных рабочих в возрасте от 30 до 45 лет» и т. п. Далее, применяя различные методы статистического анализа, можно проверить какие-то гипотезы о взаимосвязи переменных (в данный момент времени). В последнем случае исследование становится объяснительным. Однако даже в чисто описательном исследовании мы столкнемся с необходимостью каких-то сравнений, делающих полученные нами оценки осмысленными. Если, например, мы узнаем, что 15% подростков читают медицинские журналы не реже 1 раза в месяц, то для того, чтобы понять много это или мало, нам нужно будет с чем-то сопоставить этот показатель. Скажем, мы можем сравнить подростков 2011 года с подростками 1954 года. (зменениям во времени подвержены не только отдельные показатели, но и взаимоотношения между переменными. Так, глобальные социально-экономические изменения — экономический кризис, сдвиг в социально-классовой структуре — могут привести к тому, что высокая зависимость дохода от продолжительности образования станет незначимой. Следовательно, изучение сложного причинного механизма воздействия образовательного уровня на доходы требует какой-то серии разделенных во времени обследований, позволяющих проследить динамику интересующего нас отношения под влиянием существенных внешних переменных.
Исследовательские планы, позволяющие анализировать данные во временной перспективе, называют лонгитюдными. Данные получают многократно, в разные моменты времени, причем цели исследования могут быть сугубо дескриптивными (доля голосующих за коммунистов, распределение положительных и отрицательных установок по отношению к «мыльным операм») и объяснительными.
Принято выделять основные виды лонгитюдных планов, каждый из которых имеет множество модификаций и «переходных» форм. Это трендовые, когортные и панельные исследования.
Трендовые обследования ближе всего к уже описанным однократным, «срезовым», опросам. Некоторое авторы даже предлагают обозначать их просто как регулярные опросы, т. е. опросы, проводимые через более или менее равные промежутки времени. В трендовом опросе одна и та же генеральная совокупность изучается в разные моменты времени, причем каждый раз выборка строится заново. Иными словами, анализируются последовательные выборки из одной и той же совокупности. Например, опрос Института Гэллапа, проводимый ежемесячно в ходе избирательной компании, является трендовым обследованием, показывающим динамику установок населения по отношению к кандидатам или партиям. Строго говоря, если количество тех, кто собирается голосовать за кандидата X, за месяц увеличилось на 16%, мы можем лишь зафиксировать изменение картины предпочтений избирателей, но не можем наверняка утверждать, что определенная группа избирателей изменила свои предпочтения, так как в двух последовательных опросах мы имеем дело с разными респондентами. Преимуществом оперативных трендовых исследований является возможность «привязки» наблюдаемых изменений к текущим событиям — политическим скандалам, решениям правительственных органов, изменениям в финансово-экономической ситуации, — что облегчает их интерпретацию.
Однако, например, ежегодные исследования занятости и безработицы, проводимые по этому плану, могут привести к трудно интерпретируемым результатам. Если в результате двух таких исследований окажется, что социально-демографические характеристики людей, получающих пособие, почти не изменились, будет большой неосторожностью утверждать, что существует какая-то «типичная» группа людей, постоянно живущая на средства налогоплательщиков. Вполне вероятно, что большинство респондентов, охваченных первым опросом, уже нашли работу.
В качестве особого исследовательского плана иногда рассматривают когортные обследования. Основания для выделения этого плана несколько условны и связаны скорее с теоретической логикой интерпретации (а не сбора) данных. Если в трендовых исследованиях отбор каждый раз производится из общей совокупности — всех избирателей, всех семей и т.п., то, исследуя «когорты» (от лат. cohors (cohortis) — подразделение, видовая группа), мы каждый раз производим отбор из одной специфической совокупности, стремясь проследить перемены в ее поведении, установках и т. п. Пусть, например, мы изучали ценностные ориентации десятиклассников в 1985 году, а в 2011 году нам захотелось снова опросить бывших десятиклассников, так как мы предполагаем, что их ценностные ориентации изменились с переходом в иную стадию жизненного цикла (создание собственной семьи, формирование профессиональной идентичности и т. п.). В этом случае мы будем работать с новой выборкой из прежней специфической совокупности, сравнивая представителей одной и той же «когорты» с большим интервалом, а не десятиклассников 1985 года с десятиклассниками 2011 года (в последнем случае можно было бы говорить о трендовом исследовании десятиклассников).
Самым совершенным воплощением идеи введения временной перспективы в исследовательский план является панельное обследование. Если вернуться к нашей структурированной матрице данных (см. табл. 1), то можно сказать, что панель — это прибавление к двумерной матрице еще одного измерения, превращающего ее в пределе в некий «параллелепипед» данных. Панельные исследования позволяют не только зафиксировать какие-то социальные изменения в установках, поведении и т. п., но и выявить причины и последствия этих изменений на микроуровне, т. е. на уровне отдельных индивидов. Если трендовое исследование показывает, что десятая часть потребителей, предпочитавших отечественные макароны, «переметнулась» к поклонникам спагетти, мы не можем точно определить, кто из респондентов изменил свои предпочтения и, следовательно, каковы общие характеристики «перебежчиков». Таким образом, мы лишены возможности проверить, какие объяснительные переменные позволяют предсказывать динамику предпочтений на микроуровне.
Панельное исследование — это многократное обследование одной и той же выборки из генеральной совокупности в разные моменты времени. Эту многократно используемую выборку и называют панелью. Исследовательский план, использующий панель респондентов, — весьма дорогостоящее предприятие, требующее к тому же очень тщательной проработки всех деталей до начала опроса. В трендовом и когортном исследовании данные нередко сравниваются с данными других опросов, проводившихся ранее иными исследовательскими группами. Этот путь проще и дешевле, однако сравнимость результатов обследований, планировавшихся разными исследовательскими командами и — чаще всего для разных целей, всегда проблематична. Возможность оценки «чистого эффекта» и величины наблюдаемых изменений — большое преимущество панельного плана. Однако эта возможность прямо зависит от величины усилий, предпринятых социологами для сохранения неизменности самой панели и инструментов сбора данных. Если, например, в первой волне панели (волной обычно называют один полный цикл опроса панели, один «замер») социолог позабыл включить в список для ранжирования тяжести преступлений квартирные кражи, то использование дополненного списка во второй и третьей волнах не поправит дела: сопоставимость полученных в панели ранжировок будет ничуть не выше, чем в случае обычных «срезовых» обследований, при более высоких затратах. Поэтому панельные исследования чаще всего используют как очень точное средство проверки конкретных гипотез в отчетливо очерченной предметной области. Выбор панельного плана в случае пилотажных или поисковых исследований совершенно неоправдан.
Панельные исследования незаменимы в проверке причинных гипотез, особенно в тех случаях, когда отсутствует «естественный» критерий для разделения независимой и зависимой переменных во времени. Например, множество «срезовых» исследований может демонстрировать устойчивую высокую корреляцию между систематическим потреблением алкоголя и проявлениями социальной дезадаптации (развод, потеря статуса и т. п.), однако лишь длительное панельное исследование может дать необходимый материал для того, чтобы решить, ведет ли алкоголизм к дезадаптации либо, наоборот, является ее следствием. Панельные исследования незаменимы и для анализа более сложных причинных моделей с отсроченными эффектами (лагами), петлями «обратной связи» и т. п.
Основным преимуществом панельного плана с сугубо статистической точки зрения является возможность отделить реальные изменения показателей от разброса, связанного с ошибкой выборки.
В случае «непанельного» опроса (трендовый опрос, сравнение данных двух независимо проведенных «срезовых» опросов) какое-то различие между двумя последовательно опрошенными выборками, значимое на 5%-м уровне, скажем, различие между 49 и соответственно 54% предпочитающих «сильную руку» институтам представительной демократии с вероятностью, превосходящей 1:20, будет связано с выборочной ошибкой, а не с радикальными переменами в политической атмосфере. Аналогичные данные панельного исследования позволяют говорить о наличии реальных изменений.
Однако не следует считать, что любое реальное изменение, фиксируемое в панельном опросе, также подлежит содержательной интерпретации с использованием теоретически «привлекательных» переменных. Во-первых, наша панель — это всего лишь выборка среди других возможных выборок (других возможных панелей). Используя панельный план, мы уменьшаем влияние ошибки выборки на значимость различий между двумя волнами, но не исключаем ошибку выборки полностью: результаты сравнений для второй (девятнадцатой, двадцатой...) панели могли оказаться иными. Далее, фиксируемые изменения могут быть связаны с низкой надежностью нашего измерительного инструмента, о чем мы еще будем говорить при обсуждении проблем измерения. Наконец, наша интерпретация результатов может оказаться необоснованной из-за изменений в самой панели. Полезно помнить, что панельное исследование по логике анализа результатов ближе всего стоит к простейшему экспериментальному плану типа «до — после». Малоприятным продолжением этого достоинства является подверженность панельного плана тем же угрозам систематического смещения. В частности, эффекты «созревания» участников панельного опроса были неоднократно продемонстрированы даже в таких нейтральных сферах, как изучение семейного бюджета или чтение газет и журналов. После двух-трех волн члены панели достоверно чаще фиксируют свои ежедневные расходы и начинают тратить на чтение газет на 10—15% больше времени. Перемены в политических установках и поведении обычно носят еще более драматический характер: политические симпатии смещаются к крайним полюсам, доля активно участвующих в выборах возрастает. Основным механизмом, отвечающим за этот эффект, является стремление индивидуума к когнитивному балансу, к поддержанию высокой степени согласованности между собственными высказываниями и действиями. Соответственно описываемый тип смещения резче выражен в панелях с маленькими интервалами между волнами. По мере увеличения промежутков между последовательными опросами — по крайней мере, до 1 2 лет — эффект «созревания» уменьшается, так как все сильнее становится влияние направленных в противоположную сторону эффектов «памяти» (вернее сказать, «забывания»): респонденты просто плохо помнят, что они говорили год или десять лет тому назад.
К сожалению, именно в тех случаях, когда панельный план социологического исследования более всего осуществим и его применение возможно и обоснованно — и с точки зрения логики анализа, и по реальным возможностям внеакадемического финансирования, — тактика увеличения интервалов между циклами панели может оказаться неосуществимой. Пример тому — предвыборные опросы, где интервалы бывают равны 1—2 неделям и редко превышают 1—1,5 месяца.
Так, интерпретация классического «Народного выбора», проведенного П. Лазарсфельдом и его соавторами исследования президентских выборов в США в 1940 году, остается неоднозначной, хотя его основные результаты были много раз воспроизведены другими исследователями. Панель Лазарсфельда состояла из семи волн, разделенных месячным интервалом. Столь сложный план требовался для того, чтобы проследить, как меняются предпочтения американского электората в ходе выборной кампании, и какие факторы влияют на изменение решений отдельных избирателей. Самым поразительным результатом исследования оказалось то, что почти половина опрошенных ни разу не меняла свои политические предпочтения на протяжении полугода. Вероятно, немалую роль в формировании столь обширной группы «непоколебимых» сыграли описанные эффекты «созревания» в результате участия в панели.
Самый серьезный и распространенный тип смещения связан, однако, с другой постоянной проблемой всех панельных планов — проблемой «выбывания» из панели (или, что звучит несколько мрачно, со «смертностью», или «истощением», панели). Истощение панели проявляется в увеличении неучастия и «неответов» респондентов от первой волны к последующим. Некоторые респонденты оказываются недоступными для контактов: они меняют место жительства, болеют, умирают. Другие участники панели просто отказываются от следующего интервью. В результате и репрезентативность панели, и эффективный объем параллелепипеда данных, т. е. реальная возможность сравнивать ответы одного респондента в разные моменты времени, резко снижаются от волны к волне (хотя расходы на поддержание панели продолжают расти). Особенно неприятна ситуация, когда «вымирают» определенные социально-демографические группы респондентов, что приводит к непоправимым систематическим смещениям. Эта ситуация возникает не так уж редко. Исследователи, работающие в коммерческих опросных фирмах, неоднократно замечали, что в рыночных исследованиях и исследованиях аудитории газет и журналов самой высокой «смертностью» отличаются молодые участники панели, особенно учащиеся-юноши в возрасте 18—25 лет. Иногда даже увеличение платы за участие в панельном опросе с каждой последующей волной не влияет на выбывание (это должно служить слабым утешением академическим исследователям, лишенным возможности платить респондентам).
В больших общенациональных панелях. Приближающихся к «микропереписям», для борьбы с выбыванием иногда используют метод самовосстановления, особенно в случаях. Когда выборочной единицей является семья, домовладение, организация и т.п. Например, в проводимом с середины 1960-х гг. Мичиганским университетом исследовании бюджета американских семей (PSID) ежегодно опрашивается более 5000 семей. Каждый отделившийся член семьи (например. взрослый сын, решивший жить отдельно от родителей) остается в выборке в качестве новой единицы наблюдения, так что выборка остается репрезентативной по типам семей, возрасту их членов и т.п. Выбывание из этой панели за первые десять лет составило 28% исходной выборки (кстати, это совсем немного для панельного опроса), однако за счет самовозобновления, т.е. включения в выборку «отселившихся» членов семей, абсолютный размер панели за это же время даже вырос с 5000 до 5860 семей.
Очевидно, что панельные исследования ¾ очень сложное, хотя и эффективное, средство проверки социологических гипотез. Вышеприведенные соображения вполне объясняют, почему панельный план используется реже других типов исследовательского плана. Панельный план практически доступен лишь для достаточно крупных исследовательских организаций и требует привлечения значительных материальных и финансовых ресурсов, однако он абсолютно незаменим при исследовании социальных эффектов исторических изменений, сложных причинных моделей индивидуального выбора, процессов социализации и т.п. Многие социологи полагают, что оптимальным решением является использование комбинированных исследовательских планов, сочетающих в себе некоторые черты «срезовых», трендовых и панельных опросов. Самый простой из таких планов ¾ это ретроспективное панельное исследование, когда опрос проводится однократно. Однако включает большое количество вопросов о прошлом респондента. Например, в исследованиях профессиональной мобильности респондентов спрашивают о деталях их карьеры, периодах безработицы, причинах изменения места работы и т.п. Реконструированные таким образом «профессиональные биографии» анализируют так, как если бы они были получены в лонгитюдном обследовании. Возникающие здесь проблемы связаны, в первую очередь, с субъективными погрешностями припоминания, с изменением точки зрения на события прошлого, иногда ¾ с намеренным искажением информации. Так, использование ретроспективного плана в изучении зависимости социально-экономического статуса от образования может вести к неверным выводам: доказано, что большинство людей имеет склонность задним числом «завышать» свои успехи в обучении. Однако этот тип плана может оказаться достаточно эффективным, например при сравнительном изучении динамики занятости замужних и незамужних женщин. Основное достоинство ретроспективного плана ¾ радикальное решение проблемы выбывания.
Более сложные типы комбинированных планов используют в микро-переписях, общенациональных обследованиях занятости и безработицы, преступности и т.п. Очень эффективны циклические планы с замещением, где в каждой последующей волне какая-то доля исходной выборки «отдыхает», будучи замещенной новой эквивалентной подвыборкой. Скажем, если в ежегодном опросе треть панели каждый раз замещается, то каждая из исходных «третей» будет опрошена от одного до трех раз, прежде чем состав участников полностью обновится. «Поперечный» и «продольный» анализ позволит и учесть эффекты участия (при сравнении результатов «кратковременных» и «длительных» респондентов), и дать текущую картину распределения переменных по социальным группам, и зафиксировать резкие изменения. Иногда часть вопросов предъявляется лишь сравнительно небольшой подвыборке, имеющей характеристики «фокусной» группы (например, только матерям-одиночкам, получающим социальные пособия), что позволяет проанализировать динамику поведения и мнений «труднодоступных» популяций. Нередко общую базу данных поддерживает и анализирует одна исследовательская группа, а для анализа «периферийных» тем и специфических подвыборок привлекаются эксперты из других институций. Объективная логика развития регулярных опросов, основанных на комбинированных исследовательских планах, явно ведет к созданию междисциплинарных, многоцелевых проектов и баз данных, имеющих множество источников финансирования (таковы, например, некоторые общенациональные лонгитюдные исследования преступности, здоровья населения). Соответственно все выше ценятся услуги методологов, специализирующихся в планировании исследований, стандартизации показателей, социологическом измерении.
опросник респондент конструирование интервью анкета
3 Концептуализация и измерение: общий обзор
Избрав определенный исследовательский план, социолог может сказать, что он будет рассматривать в качестве «случаев» в структурированной матрице данных (табл. 5.1) и какой будет логика сравнений между случаями на стадии анализа. Теперь ему предстоит решить, какими будут его исследовательские переменные — строки матрицы данных и как будет осуществлен переход от теоретического понятия к измеряемому показателю. Решение этих двух взаимосвязанных проблем — концептуализации и измерения — необходимое условие перехода к разработке анкеты, плана интервью, схемы эксперимента и к сбору данных. Отметим сразу, что речь идет лишь о предварительном решении, так как многие исследовательские задачи, связанные с измерением и истолкованием теоретических конструктов, возникают позднее, на стадии анализа данных (и будут рассмотрены нами в соответствующих разделах).
Понятия социологической теории ¾ скажем, «отчуждение», «культура бедности», «социальный статус» или «коронарный тип личности» — используются в качестве элементов для построения неких теоретических моделей, описывающих отношения между понятиями. Предположения о характере таких отношений — это собственно исследовательские гипотезы.
Сложная структура социологических теорий не позволяет говорить о простой и однозначной их проверяемости. Как говорилось ранее, правдоподобие гипотез оценивается не в каком-то абсолютном смысле, а лишь относительно целой совокупности других вспомогательных гипотез, явно или неявно связанных с теоретическим «ядром». По этой причине сколько-нибудь разработанные теоретические модели оказываются довольно сложными, и их предварительное описание (спецификация) — это необходимое условие любой эмпирической проверки.
Эмпирическое «истолкование» теоретических понятий в качестве переменных в матрице данных (их концептуализация) и перевод этих понятий на язык наблюдаемых признаков, т. е. измерение, могут оказаться довольно сложными процедурами, в чем-то сходными с процедурами построения теоретической модели. На первый взгляд, некоторые типы переменных не создают вовсе никаких проблем для измерения, так как они очень близки к тем способам категоризации, которые мы употребляем в повседневной жизни (например, пол, возраст). Другие же, более абстрактные теоретические конструкты — отчуждение, социально-экономический статус или расовая сегрегация, — явно требуют большего, чем формулировка одного показателя или одного вопроса анкеты. Ясно, что уточнение теоретического понятия и поиск соответствующих индикаторов в этом случае может быть только результатом специальной аналитической работы. Конечная цель такой работы — создание модели измерения, в которой будут определены (специфицированы) все предполагаемые связи между теоретическим конструктом (понятием) и теми эмпирическими показателями, которые мы намерены использовать для его измерения. В этой модели нам придется также сделать некоторые предположения о возможных ошибках измерения (их случайном или систематическом характере). Ведь в действительности даже сравнительно простые и очевидные показатели, фиксируемые с помощью одного стандартного вопроса, могут быть подвержены влиянию не только случайных ошибок, связанных с невнимательностью или погрешностями выборочной процедуры. Может быть, например, незамужние женщины склонны систематически занижать свой возраст? Если обратиться к «случаю Агнессы», можно увидеть, что даже биологический пол в некоторых случаях трудно определить однозначно. Пример столь простого признака, как «пол», позволяет увидеть и другую сторону проблемы: прежде чем искать подходящий показатель, нужно решить, как мы намерены интерпретировать соответствующее понятие в нашей теории. Если мы, к примеру, собираемся проверить гипотезу о влиянии половой идентичности на социальные достижения, то нам недостаточно просто разбить наших респондентов на «муж.» и «жен.»: внутригрупповой разброс показателей успешности наверняка окажется очень велик и вся наша объяснительная схема «поплывет». В действительности нам лучше интерпретировать «половую идентичность» как некий континуум, плавный переход от одного жесткого полоролевого стандарта к другому, от крайней «маскулинности» к «фемининности». Используя соответствующие показатели и шкалы, мы скорее всего обнаружим, что большего социального успеха добиваются люди, не следующие жестким предписаниям традиционной половой роли.
Итак, первый шаг в поиске индикаторов для теоретических понятий — это прояснение самих понятий. Теоретические переменные, в отличие от платоновских идей, не существуют «сами по себе», ожидая когда мы наткнемся на них. Они не имеют какого-то абсолютного, раз и навсегда определенного значения. Их значение определяется контекстом употребления, концептуальной схемой, которую мы используем. Например, если мы используем «религиозность» как понятие, характеризующее роль некой конфессии в политическом укладе национального государства, наибольший интерес для нашего исследования могут представлять агрегированные (т. е. относящиеся к надындивидуальному уровню) переменные, показывающие роль церкви в поддержании нормативной системы общества, в принятии политических решений. Показателями здесь могут быть количество церковных приходов, наличие обязательных уроков закона божьего в государственных школах, участие церковных иерархов в работе законодательной власти и т. п. Если целью нашего анализа является индивидуальная «религиозность», то нас скорее заинтересует широкий спектр поведения и установок от институциональной религиозности, связанной с участием в церковных обрядах, верой в спасение души и т. п. до расплывчатой убежденности в том, что «существуют некие сверхъестественные силы», или даже до устойчивого интереса к астрологическим прогнозам.
Конечно, мы можем заключить, что отсутствие абсолютного, самоочевидного смысла в теоретических понятиях дает нам полную свободу в их определении. Но такое заключение будет ошибочным. Во-первых, теоретическое понятие, неповторимый смысл которого известен только самому теоретику, обладает всеми достоинствами, кроме одного — оно больше не может служить средством коммуникации. Дабы этого не случилось, лучше всего давать определения, понятные не только вам, но и другим: все же наука — это коллективное предприятие. Более того, нужно соотносить собственные определения понятий с теми, которые использовались вашими предшественниками, в том числе и теми, чьи теоретические взгляды противоположны вашим. Ценность теоретического понятия — в его включенности в более широкую сеть теоретических представлений, во множестве связей с другими понятиями. Попытки начать с «нулевой ступени» ни к чему хорошему не ведут. Даже если вам отвратителен марксизм как идеология тоталитаризма, невозможно сказать что-то содержательное и интересное о таких вещах, как «классы» или «отчуждение» без учета того, что сказал о них Маркс.
В работе по уточнению теоретических понятий можно выделить три стадии. На первой стадии нужно составить по возможности полный список существующих определений интересующего нас понятия. Основной путь здесь — анализ литературы. Часто приходится анализировать и те смыслы, которые придаются какому-то понятию в обыденной речи: понятия повседневного языка редко обладают достаточной степенью формальной строгости, но их многозначность иногда позволяет выразить неочевидный и нетривиальный взгляд на вещи. Например, анализ того контекста, в котором употребляются понятия «стресс» или «психологическая травма», открывает широкий диапазон жизненных событий — от развода до потери работы. Если мы изучаем влияние травмирующих жизненных событий на рост хронической заболеваемости, нам не обойтись без анализа субъективного смысла различных событий для разных людей. На этом этапе могут оказаться полезными неформальные глубинные интервью, групповая дискуссия, анализ доступных биографических материалов и т. п. В результате описанной работы по обобщению существующих определений (научных и обыденных) мы получаем возможность исходить из достаточно общего и разделяемого большинством исследователей определения. Так, в работе Дж. Хиллери перечислено 94 определения понятия «сообщество» (community), большая часть которых включает три основных признака: локальная область расселения; общие связи, основанные на чувстве идентичности с группой; социальное взаимодействие.
На второй стадии мы осуществляем и обосновываем свой выбор трактовки понятия. Обоснование необходимо и в том случае, если мы решили использовать общепринятое определение, и тогда, когда нами предложено нечто абсолютно новое. Позднее, в ходе анализа данных, наша теоретическая модель скорее всего будет уточняться, но и в сборе, и в анализе данных мы будем руководствоваться принятым рабочим определением. Так, если мы решим, что социологический смысл понятия «профессия» заключается в способе регуляции рыночных условий в пользу определенной группы, ограничивающей и контролирующей доступ новых членов в свои ряды, мы скорее всего сосредоточим свое внимание на таких аспектах профессионализма, как автономия, контроль над процессом определения «внештатных» ситуаций и приписыванием ответственности, обучение новичков и управление «публичным» образом профессиональной группы. При этом мы, возможно, не уделим того же внимания таким аспектам профессионализма, как отношения с потребителями товаров или услуг, контроль над определенными ресурсами и т. п.
Большинство полученных нами определений будут многомерными, т.е. они будут включать в себя более одного аспекта или измерения. Поэтому на третьей стадии следует отчетливо очертить существующие аспекты понятия и, возможно, выбрать те из них, с которыми мы собираемся работать. Во-первых, выделение отдельных измерений в многомерном теоретическом понятии необходимо для того, чтобы найти соответствующие индикаторы для каждого из измерений. Во-вторых, в социологии мы часто используем категориальные переменные, состоящие из множества взаимосвязанных признаков, т. е. двух, трех или более качественных категорий. Примерами здесь могут служить пол, профессия, семейный статус, религиозная конфессия и т. д. Нередко признаки, составляющие категориальную переменную, могут быть упорядочены по какой-то ординальной шкале. Скажем, социальный статус может быть низким, средним или высоким. Анализ размерности теоретического понятия, представляемого с помощью такой категориальной переменной, позволяет выявить различия между упорядочениями категорий по разным измерениям. Упорядочение религиозных конфессий по престижности будет отличаться от их упорядочения по степени религиозного фундаментализма. Сделав явным это различие между смысловыми измерениями теоретического понятия, мы обезопасим себя от ошибочных выводов о характере взаимосвязей данной переменной с другими, т. е. от ошибок на стадии анализа данных.
Прояснив теоретические понятия, используемые в нашем исследовании, мы переходим к следующей важной задаче — поиску конкретных индикаторов для этих понятий. Нередко эту стадию работы называют стадией операционализации понятий (о том, почему это обозначение является не вполне точным, будет сказано чуть ниже). Если, скажем, в исследовании профессиональной мобильности ученых мы используем понятие «престижность университета», нам необходимо решить, в чем, собственно, выражается престижность: в высоком проходном балле на вступительных экзаменах, в количестве ежегодно проводимых международных конференций, в среднем индексе цитирования для профессоров и преподавателей? Возможно, полезной для определения престижности будет экспертная процедура — например, престижность американских университетов определяется в ходе регулярных опросов ведущих специалистов в разных областях знания. Под операционализацией, таким образом, понимают процесс связывания теоретического понятия с эмпирическими наблюдениями, где последние выступают индикаторами, показателями каких-то свойств, относящихся к данному понятию. Предполагается, что, скажем, результаты оценивания респондентами престижности университетов показывают высокий или низкий престиж данного рода заведений приблизительно так же, как показания стрелки манометра показывают давление. Однако аналогия здесь весьма условна. Измерение в социологии обычно носит непрямой характер: отдельный индикатор может отражать влияние более чем одной переменной, а каждая переменная может иметь множество индикаторов, т. е. операциональные определения теоретических понятий в социологии отличаются от таковых, скажем, в физике.
Многие эмпирические индикаторы могут рассматриваться как взаимозаменяемые. Идея взаимозаменяемости индикаторов была впервые проанализирована П. Ф. Лазарсфельдом. Так как измерение носит непрямой характер, ни один из существующих индикаторов не будет совершенным или безупречным. Хотя в определенной исследовательской ситуации можно указать причины, по которым один индикатор лучше другого, в сущности они взаимозаменяемы. «Истинное значение» переменной — это какая-то функция значений показателя и ошибки измерения. Поэтому измерение значения переменной и проверка гипотез о связях между индикаторами требуют использования множества показателей. На практике социологи чаще всего используют несколько индикаторов для каждой существенной теоретической переменной, объединяя их на стадии анализа в некоторый суммарный показатель (индекс), или строя шкалу. То, как соотносятся индикаторы и теоретическая переменная, описывается с помощью модели измерения. В простейшем случае, когда все индикаторы (обозначаемые прописными латинскими буквами — Х1
, Х2
, X3
, Х4
) являются следствиями, результатами действия латентной, т. е. не наблюдаемой непосредственно переменной X, модель измерения будет выглядеть, как на рис. 2.
Обозначения a, b, с, d относятся к коэффициентам, показывающим влияние латентной переменной на конкретный индикатор (они, как мы увидим позднее, выражают надежность этого индикатора), а е. (т. е. е1
, е2
, е3
. и т. д.) — это ошибка измерения i-гo индикатора.
А bcd
|
|
|
|
Рис. 2. Модель измерения латентной переменной с четырьмя индикаторами
Для ошибок в этой модели предполагается, что они не скоррелированы друг с другом (cov (ei
ej
) = 0) и с истинным значением X, а их средняя равна 0. В модели, представленной на рис. 3, все индикаторы — это так называемые эффект-индикаторы, все они находятся под влиянием X, и сила связей a, b, с, d соответствует «силе» этого влияния.
Модели измерения с латентной переменной и эффект-индикаторами очень популярны в социальных науках. Причина этой популярности в нашей склонности объяснять явные поступки людей, в частности, ответы на вопросы анкеты или выполнение тестовых заданий, неким внутренним свойством, качеством, навыком или предрасположенностью. Латентная переменная может быть, например, интеллектом, измеряемым с помощью индикаторов-тестов. Другой пример: мы можем полагать, что участие в выборах и ежедневное чтение политических новостей в газете — это индикаторы латентной «политической активности» или «вовлеченности в политику».
Однако использование эффект-индикаторов — это не единственная возможность. Например, мы можем использовать такие индикаторы, как потеря работы, развод, болезнь для измерения латентной переменной «жизненный стресс». В этом случае мине предполагаем, что латентная переменная является причиной своих индикаторов, скорее травмирующие жизненные события могут быть причиной стресса. Если мы имеем дело с какой-то из распространенных моделей социально-экономического статуса, в ней тоже будут присутствовать не эффект-индикаторы, а причинные (или формативные) индикаторы, т. е. индикаторы, значения которых детерминируют, определяют значение латентной переменной. На рис. 3 изображена элементарная модель латентной переменной с причинными индикаторами (Yl
— Y4
— это индикаторы, Y— латентная переменная).
Если Y — это социально-экономический статус (СЭС), то Yl
— Y4
могут представлять собой доход, образование, престиж профессии данного человека и «качество» его жилья (стоимость, престижность района и т.п.).
Рис. 3. Модель измерения с латентной переменной и причинными индикаторами
Ясно, что скорее доход является причиной СЭС, чем наоборот. Несмотря на кажущееся сходство моделей измерения, изображенных на рисунках 3 и 4, их «поведение» на стадии анализа будет очень разным. Разными могут оказаться и методы оценки качества индикаторов для этих моделей. Даже без специального анализа можно сказать, что в модели с эффект-индикаторами (рис. 3) всякий «хороший» индикатор должен чутко реагировать на рост или убывание латентной переменной и изменяться «в согласии» с остальными. В модели, изображенной на рис. 4, дело обстоит не так просто: если, скажем, возрастет доход — возрастет и статус, но образование или профессиональный престиж вполне могут не измениться, остаться на прежнем уровне. Другое очевидное отличие связано собственно с отбором индикаторов: для модели на рисунке 3 любой «хороший» эффект-индикатор может заменить любой другой, и их общее число вполне можно сократить: скажем, высокие результаты выполнения одного «хорошего» теста интеллекта будут достаточно надежно предсказывать результаты бесчисленного множества других тестов. Если же мы попытаемся убрать какой-то причинный, формативный индикатор, то изменится не только объем нашей анкеты — изменится сама латентная переменная, которую эти индикаторы собственно и составляют: так, стоит «убрать» доход из числа индикаторов СЭС, как мы уже будем изучать что-то вроде социального, но уж никак не экономического статуса. Приведенные примеры позволяют понять, почему так важно явно задать модель измерения, связывающую индикаторы, которые мы собираемся отобрать, с теоретическими понятиями.
Многие реальные модели измерения еще сложнее только что описанных. Индикаторы могут быть скоррелированы между собой и, что хуже, с ошибками измерения, в число индикаторов могут одновременно входить и эффект-индикаторы, и индикаторы-причины. Часто разработка модели измерения ведет к радикальному прояснению теоретических гипотез и понятий, которые на предыдущих стадиях исследования носили чрезмерно абстрактный и общий характер. Так, социолог, стремящийся найти индикаторы, скажем, «межэтнической напряженности», попытается по меньшей мере разделить «причины» и «эффекты» среди таких показателей напряженности, как поселенческая сегрегация (склонность представителей этнических групп к компактному и раздельному поселению) отсутствие семейных и дружеских связей с представителями «чужого» этноса, число столкновений и вооруженных конфликтов, недоброжелательное освещение «чужаков» в местной прессе и т. п. В ходе такой работы он наверняка сделает более ясными и отчетливо сформулированными свои представления о механизмах возникновения межэтнической напряженности и ее последствиях.
В целом при поиске и отборе индикаторов полезно руководствоваться некоторыми общепринятыми правилами:
I. Используйте индикаторы, применявшиеся в более ранних исследованиях. Существует множество устоявшихся и проверенных индексов (т. е. суммарных показателей) и шкал, свойства которых достаточно известны. При возможности проверьте, насколько хорошо «работают» эти показатели в вашем случае, проведя небольшое разведочное (пилотажное) исследование. Сориентироваться в многообразии существующих показателей и шкал помогают соответствующие справочные издания и тематические обзоры.
2. Если общепринятого способа измерения для какого-то понятия не существует, попытайтесь разработать множество индикаторов для различных определений понятия и проверьте, как различия индикаторов будут в
3. Обычно установки и мнения имеют более сложную структуру и требуют использования большего количества индикаторов, чем, например, поведенческие события. Конечно, решающее слово в определении количества индикаторов (количества вопросов в анкете) принадлежит практическим соображениям. Пилотажные исследования, интервьюирование «фокусных» групп могут оказаться полезными в отборе индикаторов и исключении лишних вопросов. Они также важны для оценки надежности и валидности показателей.
Прежде чем перейти к практическим проблемам конструирования вопросов для анкет и интервью, мы коротко рассмотрим уровни измерения, так как общее представление об уровнях измерения понадобится нам при обсуждении логики построения вопросов и ответов и использования шкал.
4 Уровни измерения
Существует несколько концепций измерения, по-разному определяющих, что может быть названо операцией измерения. В гуманитарных науках — и социология не является исключением — наибольшее влияние имеет репрезентационная концепция измерения, впервые детально обоснованная психофизиком С. С. Стивенсом. В этой концепции всякая операция измерения в конечном счете определяется как приписывание чисел вещам (свойствам, событиям) в соответствии с определенными правилами, так что отношения между числами отражают (или представляют, репрезентируют) отношения между вещами. Таким образом, измерение представляет определенные свойства в виде чисел, поддающихся суммированию, сравнению и т. п. Однако наша возможность измерить какие-то эмпирически наблюдаемые свойства, представить отношения между вещами в виде чисел редко носит абсолютный характер. О некоторых эмпирических свойствах мы можем сказать, что они выражены «больше» или «меньше» для каждого конкретного наблюдения, но не можем указать случаи, когда это свойство абсолютно отсутствует: так, даже если испытуемый не решил ни одной задачи, мы едва ли осмелимся утверждать, что он полностью лишен «интеллекта». Иногда наша способность измерять ограничена лишь возможностью отнести какую-то вещь (наблюдение) к определенному классу, причем между разными классами нельзя задать отношение порядка (больше — меньше). Иными словами, при измерении отношения между числами как-то зависят от отношений между вещами, и, следовательно, существуют ограничения для возможных преобразований чисел: игнорируя эти ограничения, мы теряем право утверждать, что наши числа что-то представляют, репрезентируют. Правила приписывания чисел вещам, используемые нами в каждом конкретном случае, воплощают в себе эти ограничения и определяют достигнутый уровень измерения (номинальный, порядковый, интервальный, абсолютный).
Номинальные измерения.
Номинальным измерением называют процесс отнесения объектов в классы. Все, что мы можем сказать об объектах, сгруппированных в один класс, — это то, что они идентичны в отношении некоторого свойства или признака, т. е. фактическое отношение между объектами — это отношение тождества (или различия). Для обозначения полученных классов могут использоваться и названия свойств, и числовые символы. Скажем, мы можем обозначать символом «0» мужчин, а символом «1» — женщин. Однако нельзя сказать, что признак «является мужчиной» в каком-то отношении меньше признака «является женщиной», или что «сумма одного мужчины и одной женщины равна единице». Хотя номинальные измерения довольно примитивны, они отнюдь не бесполезны, в чем мы убедимся при обсуждении методов анализа данных. Другими примерами номинального измерения могут служить национальность или место жительства.
Порядковые измерения
Измерение на порядковом (ординальном) уровне предполагает, что мы способны упорядочить объекты по степени выраженности свойства или признака, т. е. определить для них отношение «больше-меньше». Например, мы можем говорить о низком, среднем или высоком социальном статусе или низкой, умеренной или высокой коммуникабельности. Однако в случае порядкового измерения мы не можем определить точно, насколько велико расстояние между соседними категориями. Иными словами, мы не можем утверждать, что человек, получивший оценку «3» по шкале популярности, в три раза более популярен, чем получивший оценку «1», или что расстояние между категориями «48» и «45» по порядковой (ординальной) шкале равно расстоянию между категориями «22» и «19». Иными словами, ординальное измерение задает отношение порядка между категориями какого-то свойства, но не позволяет говорить о том, «на сколько» или «во сколько раз» одна категория больше другой, т. е. ни точка отсчета (абсолютный ноль), ни единица измерения здесь не могут быть определены.
Интервальный уровень измерения
Об интервальном уровне измерения можно говорить тогда, когда мы способны не только определить количество интересующего нас свойства в эмпирических наблюдениях, но также определить равные расстояния между категориями, т. е. ввести единицу измерения. Соответственно числовое приписывание становится здесь менее произвольным: объекту (наблюдению) присваивается число, соответствующее количеству измеряемого свойства, т. е. мы можем установить отношения равенства уже не между самими объектами, а между интервалами числовой шкалы: равные разности чисел соответствуют равным разностям значений измеряемого свойства или признака. Классический пример интервального измерения в физических науках — это измерение температуры по шкале Цельсия (или Фаренгейта). Единицы измерения — градусы — равны, однако «0» — это произвольная точка. При 0°С вода замерзает, однако свойство «иметь температуру» отнюдь не исчезает. Если нулевая точка неабсолютна, то бессмысленно утверждать, что 30°С предполагают в три раза больше свойства «температура», чем 10°С.
Шкала температуры Кельвина, как известно, начинается с абсолютного нуля, и этот абсолютный нуль имеет определенный физический смысл (вспомните термодинамику), так что можно даже сказать, что здесь «температура кончается». Шкала Кельвина — это шкала отношений. То же можно сказать и о физическом измерении расстояний, в частности, об измерении роста. Человек, имеющий рост в 2 метра, в два раза выше ребенка, чей рост 1 метр. Возраст человека, доход — другие примеры шкалы отношений.
Зачем учитывать уровень измерения?
Во-первых, отметим, что наше изложение существующих представлений об уровнях измерения — пусть оно и было далеко не полным, позволило заметить, что хотя приписывание чисел объектам возможно практически всегда, далеко не все операции над полученными числами будут иметь какой-то смысл. Соответственно далеко не все методы группировки и статистического анализа данных уместны для номинального или, скажем, интервального уровня измерения (с ними социологам чаще всего приходится иметь дело). Существуют различные техники анализа для разных уровней измерения переменных. Специальные методы построения социологических шкал, о которых будет говориться далее, также основаны на определенных представлениях о метрике переменных, т.е. об уровне их измерения. Все эти соображения должны быть приняты во внимание и при конструировании инструмента сбора данных, например, вопросника. Если мы хотим анализировать переменную «образование» по крайней мере на интервальном уровне, нам, вероятно, лучше использовать показатель «количество лет, затраченных на получение образования» и включить в анкету соответствующие вопросы. Однако если наша цель ¾ всего лишь показать, что лица с высшим образованием или ученой степенью чаще выписывают научно-популярные журналы, достаточно будет использовать привычные «ординальные» категории ¾ неполное среднее, среднее, высшее и т.п. (кстати, при анализе они, возможно, будут рассматриваться как номинальные).
Важно помнить, что каждая переменная может быть измерена на разных уровнях. Выбор определяется практическими соображениями, требованиями к качеству измерения (как правило, существует обратная зависимость между уровнем и качеством измерения, о чем еще будет говориться дальше), предполагаемой стратегией анализа данных. Практически всегда данные, позволяющие получить высокий уровень измерения, могут быть перегруппированы так, что уровень измерения станет ниже (обратное утверждение, к сожалению, неверно). Например, при анализе мы можем разбить наших респондентов на три возрастные категории, хотя в опросе использовали семь. Важно, однако, и то обстоятельство, что исследователь, использующий наши данные для вторичного или сравнительного анализа (возможно, мы и сами захотим к ним вернуться) сможет пользоваться «сырыми» более дробными категориями.
5 Общие правила конструирования опросников
Исследователь может использовать различные техники сбора данных: наблюдение, контент-анализ, анкетный опрос, интервьюирование и т. п. Самой распространенной техникой все же является опрос. Используемые в ходе опроса анкеты могут заполняться самими респондентами или специально обученными интервьюерами. В любом случае каждый из респондентов отвечает на фиксированные вопросы.
Используя стандартный инструмент сбора данных — анкету, опросный лист, социолог получает те сведения, которые позволяют заполнить матрицу данных «респонденты х переменные». Те пропуски в данных, которые возникли из-за неясности вопросов, неопределенной интерпретации ответов или нежелания людей отвечать на предложенный вопрос, обычно нельзя восстановить, вернувшись домой к респонденту. Поэтому так важно продумать заранее, какие вопросы следует задать.
Решающим соображением в выборе вопросов, которые будут заданы респонденту, является осуществленный исследователем выбор индикаторов теоретических понятий (см. выше): например, изучая влияние успехов в учебе на коммуникабельность студентов, мы задаем конкретные вопросы об экзаменационных оценках, числе друзей среди сокурсников, участии в самодеятельности, посещении студенческого бара и т. п. Если наше исследование является скорее объяснительным, чем сугубо описательным, полезно представить себе схематически ту теоретическую модель, которую мы намерены проверить, снабдив каждый теоретический конструкт «его» индикаторами.
Рассмотрим это на примере. Предположим, наша теоретическая модель сводится к простой гипотезе: люди, подвергавшиеся преступным посягательствам или бывшие свидетелями преступлений, т. е. имеющие «опыт жертвы», в большей степени поддерживают применение высшей меры наказания. Схематически наша гипотеза представлена на рис. 4.
Рис. 4. Схема, иллюстрирующая зависимость поддержки смертной казни (ПСК) от «опыта жертвы» (ОЖ)
Естественно, мы постараемся найти достаточное число индикаторов и к независимой («опыт жертвы»), и к зависимой (поддержка смертной казни) переменным. Разрабатывая понятие «опыт жертвы», мы можем решить, например, что здесь существенны не только реальные биографические факты, но и информированность человека об уголовных происшествиях, основанная на общении с друзьями и близкими, устойчивый интерес к соответствующим сообщениям в газетах или теленовостях, а может быть, и некоторые психологические факторы — уровень тревожности, идентификация с жертвой и т. п. Выбирая индикаторы для зависимой переменной, мы должны будем по крайней мере учесть возможные различия в диапазоне и интенсивности выражаемой респондентами поддержки смертной казни, что также приведет нас к целому «вееру» прямых и косвенных показателей. Нельзя не признать, в частности, что существует какое-то различие между людьми, требующими расстрела на месте запорчу телефонного автомата, и теми, кто полагает, что единственным «показанием» к смертной казни может быть убийство при отягчающих обстоятельствах. Возможно, следует также признать существенным различие в силе убеждений между теми, кто поддерживает высшую меру «вообще», и теми, кто при необходимости сам готов пристрелить преступника.
Каркас теоретической модели, изображенной на рис. 5, начнет таким образом обрастать какими-то операциональными индикаторами независимой и зависимой переменных, постепенно превращаясь в конкретную модель измерения (см. рис. 5).
(Отметим, что индикаторы независимой переменной в данном случае это формативные индикаторы, т. е. индикаторы-причины.) Пропуски в схеме, представленной на рис. 5, подразумевают наличие других, не рассмотренных нами показателей. Отсутствие стрелки и вопросительный знак в связи «личностная тревожность — опыт жертвы» отражают не столько неясность направления этой причинной связи, сколько другое важное обстоятельство: в нашей теоретической схеме мы забыли учесть контрольные переменные, которые могут влиять на отношение между зависимой и независимой переменными или даже полностью определять это отношение. В разделе, посвященном анализу данных, мы увидим, как учет контрольной переменной может полностью менять характер наблюдаемой связи.
Рис. 5. Дополненная схема для примера с поддержкой смертной казни
Пока же достаточно заметить, что личностная тревожность может быть опосредующей переменной, т. е. может оказаться, что связь «опыта жертвы» и «поддержки смертной казни» очень высока для высокотревожных опрошенных и совершенно незначима в других группах: действительно, люди с высокой личностной тревожностью склонны к аффективной переоценке даже незначительных происшествий, поэтому, при прочих равных, их «опыт» всегда будет обладать большей субъективной значимостью. Среди других возможных контрольных переменных почти всегда будут фигурировать фоновые социально-демографические факторы, подобные возрасту, образованию, социальному классу и т.д.
В последнем утверждении нет ничего загадочного: принадлежность человека к устойчивой социальной группе — к тому же воспринимаемой другими людьми как таковая — в немалой степени «формирует» его поведение и установки, определяет горизонт нормативных ожиданий и т. п.
Достигнутая ясность теоретической схемы исследования (в нашем вымышленном примере с поддержкой смертной казни — скорее недостаточная) дает нам вполне практический ориентир для отбора анкетных вопросов. Составляя анкету, мы, во-первых, включим в нее вопросы, позволяющие измерить зависимую переменную (переменные) и, во-вторых, постараемся убедиться в том, что все объяснительные, независимые переменные также переведены на язык соответствующих вопросов. В-третьих, мы осуществим поиск вопросов, относящихся к возможным контрольным переменным, не забыв о стандартных «паспортных» вопросах, которые будут касаться пола, возраста, рода занятий, образования, семейного статуса и т. п., т. е. будут измерять фоновые переменные.
До сих пор мы говорили лишь об отборе вопросов, которые составят «ядро» нашего инструмента сбора данных. Теперь нам предстоит обсудить, как эти вопросы могут формулироваться и оцениваться и, кроме того, как из множества вопросов может быть составлен макет анкеты.
Специальные методические исследования показывают, что формулировка вопроса имеет решающее значение для качества данных. Но даже основываясь исключительно на здравом смысле, можно предположить, что вопросы и предлагаемые подсказки (альтернативы ответов) должны быть ясными, недвусмысленными и удобочитаемыми. Каким бы ни был формат вопроса — открытым, полузакрытым или закрытым, — его словесная форма должна гарантировать возможность двусторонней коммуникации между исследователем и респондентом.
Д. де Вос свел те требования, которые обычно предъявляют к словесной формулировке вопроса, в удобный контрольный список, которым можно руководствоваться в практической работе. Мы изложим основные правила формулировки вопросов, руководствуясь этим контрольным списком:
1. В словесной формулировке вопроса следует избегать использования специальных терминов или сленга. Чаще всего специальные термины в вопросах — результат того, что социолог не смог достаточно отчетливо операционализировать исходное понятие, найти его эмпирические эквиваленты в повседневном поведении или высказываниях людей. Вопросы типа «Является ли Ваша семья нуклеарной?» или «Поддерживаете ли Вы либералистскую концепцию роли государства в экономике?» свидетельствуют о том, что ученый пытается решить свою теоретическую проблему посредством прямого опроса общественного мнения. Смешение собственно исследовательского вопроса с вопросом к респонденту допустимо лишь в одном случае — в опросе экспертов, когда целью как раз и является расширение компетентности исследователя путем учета мнений высококвалифицированных специалистов. Использование жаргонных выражений обычно свидетельствует о стремлении социолога быть понятным, «своим», разделяющим проблемы опрашиваемых. Эти похвальные усилия нередко, однако, оказываются бесплодными, так как далеко не все респонденты принадлежат к одной и той же субкультуре, да и не всем придется по душе предложенный неформальный тон. Конечно, часть подростков сразу поймет, что имеется в виду, когда их спросят «Доводилось ли тебе баловаться „травкой"?», но это необязательно сделает их ответы более откровенными. Кроме того, многие могут просто не понять точный смысл вопроса.
2. Стремитесь к коротким формулировкам. При прочих равных, чем меньше слов в вопросе и предложенных альтернативах ответа, тем меньше шансов, что вас неправильно поймут. (Разумеется, и эту рекомендацию не стоит доводить до абсурда: вопросы не должны превращаться в намеки.)
3. Проверьте, не является ли вопрос многозначным, т. е. не содержит ли он в себе двух или более различных по смыслу вопросов, на каждый из которых можно получить независимый ответ. Простой, на первый взгляд, вопрос — «Когда Вы в последний раз читали газету „Известия"?» — в действительности требует двух разных вопросов, первый из которых должен касаться того, читает ли человек данную газету вообще. Вопрос «Как часто Вы и Ваша жена (Ваш муж) посещаете парфюмерный магазин?» следует разделить по крайней мере на два вопроса, относящиеся к самому респонденту и его супруге (супругу).
4. Избегайте «подталкивающих» (или наводящих) вопросов, неявно указывающих респонденту, какой ответ желателен. «Подталкивающий» вопрос заставляет респондента выбирать «правильный» или социально-желательный ответ. Безусловно «подталкивающими» будут, например, вопросы: «Примете ли Вы участие в выборах, если отказ людей участвовать в голосовании приведет к установлению диктатуры?» или «Поддержите ли Вы движение за равные права для сексуальных меньшинств даже в том случае, если будете опасаться, что кто-нибудь сможет развратить Вашего ребенка?». В менее очевидных случаях к «подталкиванию» могут вести прямые ссылки на мнение авторитетных или влиятельных людей (скажем, «Согласны ли Вы с мнением премьер-министра X...?»), использование слов, имеющих явную эмоционально-оценочную нагрузку (например, «безответственные политики» или «рискованные средства»). Еще один способ навязать респондентам собственное мнение — это ограничение числа альтернатив ответа в закрытом вопросе или исключение позиций «другой ответ», «затрудняюсь ответить», «не знаю». Конечно, это значительно облегчает анализ данных, но исследование в этом случае становится просто дорогостоящим средством демонстрации вашей собственной точки зрения.
5. Без крайней необходимости не используйте выражения, содержащие в себе отрицание. Например, спрашивая респондента о согласии или несогласии с утверждением «Нельзя делать профилактические прививки взрослым без их добровольного согласия», мы не сможем уверенно утверждать, что означает ответ «нет» — несогласие с суждением или подтверждение согласия. Подобной путаницы не возникнет, если использовать утвердительную формулировку («Согласны ли Вы с тем, что нужно делать прививки взрослым даже в принудительном порядке?»). Если по каким-то причинам нужно все же сохранить форму отрицания, то выходом становится использование развернутых ответов (например, «Нет, принудительные прививки делать нельзя» и т. п.).
6. Вопросы, требующие особой компетенции или осведомленности о чем-то, нужно задавать лишь тем, кто может на них ответить. Если есть основания считать, что не все респонденты могут ответить на вопрос из-за отсутствия каких-то знаний или опыта, нужно использовать предварительный вопрос-фильтр, чтобы отсеять тех респондентов, которые могут иметь квалифицированное мнение. Бессмысленно спрашивать о святом причастии у мусульманина или о мажоритарной системе голосования — у человека, которой не интересуется политикой и не участвует в выборах. Задавая специальные вопросы без предварительного «просеивания» респондентов, исследователь рискует принять искусственно созданное мнение неосведомленных людей за реальное: люди могут весьма уверенно высказываться не только о малознакомых, но даже и о вымышленных предметах, если будут полагать, что это доставит удовольствие социологу.
7. Избегайте любых многозначных или двусмысленных слов и фраз. Конечно, любое слово в некоторых контекстах может выглядеть двусмысленно, так что предыдущая фраза скорее всего выражает благое пожелание. И все же нужно пытаться находить замену для каждого слова, которое по-разному понимается в разных субкультурных группах (например, выражения «быть безразличным к чему-то», «относиться к чему-то безразлично» могут восприниматься как абсолютно нейтральные рабочими и как слегка негативные оценки — школьными учителями).
8. Учитывайте возможное влияние фактора социальной желательности. Фактор социальной желательности — одна из основных угроз валидности измерения: стремление людей к социальному одобрению, к «престижному» поведению и образу жизни, к самопрезентации может влиять на их ответы на самые разные вопросы: о предпочитаемой марке автомобиля, о сексуальной активности, даже о доходе или образовании. Поскольку фактор социальной желательности начинает определять ответы в той же мере, что и интересующая нас переменная, наше измерение становится невалидным, возникает систематическое смещение, которое в общем случае обозначается как «установка на ответ» (англ. responseset). Бороться с этим видом смещения очень сложно. В некоторых случаях «установку на ответ» можно учесть и оценить ее величину на стадии анализа (для этого применяют модели измерения со множественными индикаторами). Иногда для выявления респондентов, склонных давать социально-желательные ответы, используют специальные шкалы (в психометрике их называют «шкалами лжи»). Такие шкалы состоят из вопросов, провоцирующих конформистские или установочные ответы. Например, если человек утверждает, что ни разу в жизни не солгал или что он никогда не чувствует раздражения, когда кто-нибудь указывает на его промахи, можно предположить, что он испытывает весьма сильную потребность в одобрении. К сожалению, специальные методические исследования показали, что такого рода шкалы в действительности не очень эффективны для идентификации респондентов, особенно подверженных влиянию фактора социальной желательности. Идеального решения этой проблемы просто не существует. Важно, однако, осознавать возможность таких смещений, избегать «подталкивающих» вопросов и провоцирующих «социальное тщеславие» формулировок, а также уделять особое внимание этой проблеме на стадии анализа и интерпретации.
9. В вопросах, касающихся фактического положения дел или поведения людей, следует достаточно конкретно определять временные и пространственные координаты интересующих Вас событий. Трудно ответить на вопросы «Пользуетесь ли Вы общественным транспортом, находясь вдали от дома?» или «Часто ли Вы читаете детективы?». Нужно конкретизировать понятие «вдали» (другой город, другая страна, другой микрорайон?) и указать, какой период времени имеется в виду (например, «Как часто в течение последнего года Вы читали...?»).
10. Не стремитесь к излишней детализации вопросов. Во-первых, респонденту в большинстве случаев легче указать некоторый числовой интервал, чем оценить точное значение признака. Даже такой явно «числовой» признак, как доход, может оцениваться по-разному, в зависимости оттого, какие источники или временные рамки принимаются в расчет. К тому же вы, скорее всего, не сможете полностью использовать полученные точные оценки — даже если допустить, что они абсолютно надежны, — так как другие переменные будут измерены на номинальном или ординальном уровнях.
6 «Сензитивные» вопросы
Эту проблему стоит обсудить отдельно, так как необходимость задать «сензитивные» (иногда — «угрожающие», деликатные) вопросы возникает не так уж редко. «Сензитивными» могут считаться любые вопросы, направленные на получение сведений, которые люди обычно предпочитают утаивать. Ответы на личностные или деликатные вопросы чаще бывают неискренними и соответственно ведут к не связанным с выборкой систематическим ошибкам в данных. Влияние «установки на ответ» на качество таких данных изучалось в целом раде специальных методических исследований. В результате удалось показать, что помимо собственно содержания вопроса на величину смещения влияет его форма. Задавая вопросы, относящиеся к «сензитивным» сферам поведения людей, лучше всего избегать прямых формулировок, подобных вопросу: «Случалось ли Вам попадать в вытрезвитель?». Косвенные формулировки обычно используют прием проекции нестандартного поведения — на «других людей», «всех людей» — и его рутинизации, т. е. подчеркивания его обыденности. Примерами косвенных формулировок могут служить вопросы: «Известно, что каждый взрослый мужчина хотя бы раз в жизни может «упиться в стельку» и попасть в медвытрезвитель. Случалось ли что-нибудь подобное с Вами?», «Есть ли среди Ваших знакомых люди, задушившие своих жен? (Ответ) А Вам самому доводилось это делать?».
В некоторых — скорее редких — случаях уместно применение приема, позаимствованного из психологического тестирования, — метода «вынужденного выбора». Опрашиваемый должен выбрать одно из 4—5 суждений, каждое из которых имеет одинаковую негативную «нагрузку» по факторам моральной оценки или социальной желательности. Его заранее предупреждают о необходимости делать выбор быстро и о невозможности другого ответа («не знаю», «другое» и т. п.). Задачей является выбор суждения, «наиболее близкого» к точке зрения или «лучше характеризующего» респондента. Разумеется, использование этого приема требует специального обучения интервьюеров и очень высокой мотивации к сотрудничеству со стороны опрашиваемых. Оба эти условия довольно трудно реализовать в практике массовых опросов. Ниже приведены примеры:
«Выберите один из ответов, в наибольшей мере соответствующий Вашему поведению:
А. Из наркотических средств я предпочитаю
[ ] кокаин;
[ ] гашиш;
[ ] морфий;
[ ] героин.
Б. Иногда я практикую сексуальные отношения:
[ ] с лицами своего пола;
[ ] с насекомыми;
[ ] с домашними животными;
[ ] с собственной бабушкой»
Этические проблемы, связанные с использованием метода «вынужденного выбора», достаточно очевидны и не требуют комментариев.
Американский социолог С. Уорнер в конце 1950-х гг. предложил использовать для уменьшения смещения в ответах на «сензитивные» вопросы модель случайного ответа. В этом случае респондент отвечает на один из двух случайно выбранных вопросов, а интервьюер не знает, на какой из этих вопросов ответил респондент. Эта модель позднее подвергалась модификациям, в частности, было предложено использовать один «сензитивный» и один нейтральный вопросы. В простейшем случае респондент выбирает случайным образом карточку из колоды (статистическое распределение вопросов на карточках известно исследователю) и, не зачитывая вопрос, отвечает на него. Если предположить, что исследователь знает, как распределяется в генеральной совокупности нейтральный признак — скажем, дата рождения, — он может оценить статистически выборочное значение «сензитивного» признака. Фактически в этой модели заданы следующие параметры:
рs
= истинное значение доли имеющих «сензитивный» признак s;
Р1
= вероятность предъявления респонденту карточки с вопросом о наличии у него признака s;
1 ¾ Р, = вероятность предъявления карточки с вопросом о нейтральном признаке п;
рn
= доля имеющих признак п;
l1
= доля ответов «да».
В этом случае выборочная оценка может быть определена следующим образом:
Техническое воплощение модели случайного ответа может выглядеть, например, так же, как в специальном методическом исследовании, осуществленном Н. Бредберном и С. Судманом.
Респондент пользовался ящичком, содержавшим 70% красных и 30% синих пластиковых шариков. Ящичек был устроен таким образом, что при потряхивании в маленьком окошке, видном только респонденту, появлялся в случайном порядке синий либо красный шарик. Опрашивающий в соответствующей части интервью предъявлял респонденту пару вопросов («сензитивный» и нейтральный), напечатанные соответственно на «красной» и «синей» карточках. Респондент отвечал на тот вопрос, которому соответствовал цвет выпавшего шарика. Разумеется, респонденты были предупреждены, что шарики выпадают случайно, и, следовательно, интервьюер не знает в каждом конкретном случае, на какой из двух вопросов дается ответ. Кроме того, опрашиваемым объясняли, что механизм случайного выбора используется для того, чтобы облегчить ответы на некоторые трудные вопросы. В описанном исследовании использовались, например, такие карточки:
«26... Пожалуйста, встряхните ящичек снова и ответьте на вопрос, цвет которого совпадает с цветом появившегося в окошке шарика. Ответьте „да" или „нет"».
Карточка G. | |
(Красный) | Штрафовали ли Вас за езду на красный свет в течение последних 12 месяцев? |
(Синий) | Родились ли Вы в июле? |
Исследование Бредберна и Судмана показало, что использование модели случайного ответа несколько уменьшает смещение в ответах о социально-осуждаемых поступках (в этом специальном исследовании оценки, полученные в результате опроса, сопоставлялись с объективными данными, которыми располагали полиция и другие учреждения). Однако для многих «угрожающих» вопросов оно все же оставалось значительным: оценка частоты задержаний за управление машиной в состоянии алкогольного опьянения была на 35% ниже объективного показателя, которым располагала дорожная полиция. Мера уверенности респондентов в анонимности, как и их способность попросту понять «правила игры», также варьировали в достаточно широких пределах. Учитывая технические трудности процедуры и необходимость использования больших выборок, следует признать, что модель случайного ответа может иметь довольно ограниченное применение.
Определенное значение для решения проблемы «сензитивности» имеет и избранная исследователем процедура сбора данных: анкеты, заполняемые самим респондентом, несколько лучше, чем телефонные или личные интервью в тех случаях, когда необходимо предотвратить завышение частоты социально-одобряемого поведения. Однако анкетная процедура ведет к более значительным смещениям в оценке неодобряемого поведения, к тому же доля ответивших в анкетном опросе обычно ниже, чем в случае личного или телефонного интервью.
Кроме того, для «сензитивных» вопросов, требующих достаточно детального (не сводящегося к «да» или «нет») ответа, предпочтительно использовать достаточно длинные и состоящие из привычных респонденту слов формулировки, а также открытый или полузакрытый формат вопросов. Важно также спокойное, нейтральное поведение интервьюера (в случае личного или телефонного интервью) и заверения в конфиденциальности, данные в начале беседы.
Довольно полезным приемом является использование вопросов о друзьях или знакомых. Конечно, полученные таким способом данные не могут быть «приписаны» к конкретным выборочным единицам, но они дают довольно правдоподобные оценки для некоторых типов поведения (обратите внимание на то, что речь идет не об использовании проективных вопросов о «других людях», а о вопросах, касающихся реального окружения респондента). Видимо, такие вопросы особенно уместны, когда необходимо оценить распространенность или частоту каких-то поведенческих актов, и сравнительно бесполезны для точной оценки интенсивности поведения или установок. Такой подход может быть проиллюстрирован следующим вопросом: «Представьте себе троих своих ближайших друзей. (Нет нужды называть их имена.) Как много из них, по Вашему мнению, когда-либо употребляло наркотики?»
Наконец, не исключен и подход, описанный в пионерской статье А. Бартона как «метод Кинзи» (имеется в виду известный исследователь сексуального поведения): посмотрите прямо в глаза респонденту и спросите его прямо и спокойно: «Вы когда-нибудь убивали свою жену?»
7 Выбор формата для ответов
Когда исследователь избрал по тем или иным соображениям закрытый или полузакрытый тип вопроса, он должен решить, в какой форме будут представлены категории ответа. Формат ответа — это собственно та задача, которую должен выполнить респондент, отвечая на вопрос.
Преимуществами закрытого вопроса являются простота кодирования и возможность облегчения задачи для тех респондентов, которые затрудняются сформулировать ответ самостоятельно. Кроме того, на закрытые вопросы люди обычно отвечают значительно быстрее. Основной недостаток закрытых вопросов заключается в том, что в ряде случаев они могут вести к созданию ложных, не существующих в действительности мнений либо из-за недостаточного диапазона категорий ответа, либо из-за неявного подталкивания респондентов к выбору «приемлемых» ответов. Поэтому, используя закрытые вопросы, социолог должен уделить особое внимание разработке списка категорий ответа. Этот список должен быть исчерпывающим, согласованным с логической структурой вопроса и содержать в себе категорию ответа, соответствующую отсутствию мнения у респондента («не знаю»). При разработке списка уместны и небольшие пилотажные исследования на группе респондентов, и экспертиза коллег. Дж. Гэллап предложил специальную пятишаговую процедуру для разработки «хороших» закрытых вопросов. Эта процедура отличается трудоемкостью, но ее целесообразно использовать по крайней мере для ключевых исследовательских переменных.
Предлагается включать в опрос последовательно:
1) закрытый вопрос для выявления осведомленности респондента или наличия у него какого-то отношения к данной проблеме;
2) открытый вопрос для оценки общего отношения, обобщенной установки;
3) закрытый вопрос, содержащий описание конкретных аспектов, сторон проблемы;
4) открытый или полузакрытый вопрос, позволяющий респондентам обосновать свое мнение, объяснить, почему они так считают;
5) закрытый вопрос на интенсивность мнения, показывающий, насколько респондент убежден в своей точке зрения.
Наиболее распространенными форматами ответа на простые закрытые вопросы являются: оценочная шкала; контрольный список (меню); выбор между суждениями, выражающими установку или мнение; ранжирование.
В случаях, когда закрытый вопрос является в строгом смысле шкалой или пунктом шкалы (индекса), к его формату обычно предъявляют особые требования, которые мы рассмотрим в разделе, посвященном конструированию шкал. ока же достаточно будет дать общую характеристику форматов ответа.
Типичная оценочная шкала — это шкала согласия с суждением (суждениями). Респонденту предлагается оценить степень своего согласия с некоторым мнением или высказыванием, т. е. расположить самого себя на одномерном континууме, крайними точками которого являются полное согласие и полное несогласие с высказыванием. Обычно предполагается также, что респондент способен осуществить такую оценку по крайней мере на порядковом (ординальном) уровне, т. е. отнести себя к какой-то градации оценочной шкалы («скорее согласен», «совершенно согласен» и т. п.). Оценки могут быть представлены в вербальной или графической форме. Примеры оценочных шкал представлены на рис. 6.
Вербальная
«Большинство людей пользуются правилами вежливости, чтобы прикрыть жестокость конкурентной борьбы»
[ ] совершенно согласен;
[ ] согласен;
[ ] затрудняюсь сказать;
[ ] не согласен;
[ ] совершенно несогласен.
Графическая
Совершенно 1 2 3 4 5 Совершенно
несогласен согласен
¾ 0 +
(Несогласие) (Согласие)
Рис. 6 Примеры оценочных шкал
К оценочным шкалам можно отнести так же те, которые выражают оценку респондентом своего положения на континуумах удовлетворенности чем-либо, значимости какого-то мнения, интенсивности установки. На рис. 7 приведен пример графической оценочной шкалы для оценки значимости высказывания (проблемы) для респондента. Самому большому кружку соответствует максимальная субъективная значимость, наименьшему —минимальная (респонденту даются соответствующие инструкции по заполнению опросника).
Особый тип оценочных шкал — это шкалы категориальной оценки, используемые в методах, подобных «семантическому дифференциалу» (СД). Подробный анализ процедур семантического шкалирования выходит за пределы данного раздела, но общий подход таков: респондент должен многократно оценить некий объект или несколько объектов (личность, товар, профессию и т. п.) по шкалам, каждая из которых задана двумя полюсами, точнее — парой противоположных по смыслу прилагательных (антонимов). Мы назвали СД-подобные шкалы особым типом оценочных шкал, имея в виду их использование для специальных исследовательских задач и довольно сложные методы анализа результатов. Важно, однако, обратить внимание на то обстоятельство, что описанные нами выше оценочные шкалы с большими основаниями могут рассматриваться в качестве частных, «вырожденных» случаев семантического шкалирования — с одним объектом оценивания (например, «Я сам») либо с одной шкалой (скажем, шкалой удовлетворенности). Процедуры, в которых используются СД-подобные шкалы, приводят к заполнению параллелепипеда данных типа «субъект х объект оценивания х переменная-признак», что значительно расширяет возможности анализа. Пример СД-подобного формата ответов приведен ниже.
Рис. 7 Пример графической оценочной шкалы для оценки значимости высказывания для респондента
«Как бы Вы описали психологическую атмосферу в Вашем коллективе?
теплая 1 2 3 4 5 холодная
активная 1 2 3 4 5 пассивная
соревновательная 1 2 3 4 5 дружелюбная»
Вопросы — «меню» требуют от респондента выбора одного или более пунктов из представленного списка. Например, одна из шкал близости межличностных отношений предлагает респонденту отметить в контрольном списке только те виды деятельности, которые обычно осуществляются им совместно с близким человеком. Приведем фрагмент списка:
1. стирка [ ];
2. приготовление еды [ ];
3. просмотр телепередач [ ];
……………………………………..
8. прогулки пешком, поездки [ ];
9. обсуждение личных проблем [ ];
10. посещение музеев, выставок [ ].
Выбор между суждениями, выражающими установку по отношению к некоторому объекту, предполагает, что респондент выберет то суждение, которое отражает степень его благожелательности по отношению к объекту. Упорядоченность суждений вдоль некоторого «установочного» континуума обычно очевидна и для исследователя, и для самого опрашиваемого (о более сложных методах измерения установок вы узнаете из раздела главы 6, посвященного шкалам).
Приведем пример.
«Существуют разные подходы к наказанию за особо тяжкие преступления. Какое из приведенных ниже суждений отражает Вашу точку зрения на смертную казнь как меру наказания:
это наименее приемлемый из всех способов наказания преступников;
это не очень приемлемый метод наказания, однако он не хуже других;
это вполне приемлемое наказание за некоторые виды преступлений;
это вполне приемлемая мера наказания преступников;
другой ответ (напишите, пожалуйста)
«__________________________»
Ранжирование как формат ответа подразумевает, что респондент упорядочивает весь представленный ему список — пунктов, суждений, объектов и т. п.— вдоль одномерного континуума какого-то качества (при этом не отмечая своего собственного положения на континууме). Чаще всего производится ранжирование по предпочтительности, важности, значимости, популярности. В массовых опросах нередко используются упрощенные подходы к ранжированию (скажем, «Назовите трех самых популярных и трех наименее популярных политиков из перечисленных...»). Это позволяет экономить время участников опроса, но значительно сильнее, чем принято думать, снижает качество и сопоставимость данных.
Многие реальные форматы ответов сочетают в себе черты двух или трех описанных типов. Важно, однако, чтобы задача респондента, определяемая избранным форматом ответа, была однозначно понимаемой и логически непротиворечивой.
8 Макет анкеты (опросника)
Общий вид и структура анкеты (опросника) не менее важны, чем содержание и словесное оформление вопросов. Плохое оформление или неясные инструкции часто ведут к невосполнимым пропускам в данных.
Общая рекомендация, равно применимая и к вопросникам, заполняемым в ходе интервью, и к анкетам, заполняемым самим респондентом, заключается в том, что поля и интервалы между вопросами (или блоками вопросов) должны быть достаточно велики. Стремление «ужать» вопросник, сделать его объем небольшим, чтобы не отпугнуть респондентов, на практике приводит к появлению «слепого», путаного и визуально непривлекательного инструмента сбора данных. Вопросы должны печататься только на одной стороне листа. Поля должны быть не меньше 2,5 см., что необходимо для кодирования данных. Альтернативы ответа лучше располагать вертикально, а не горизонтально. (Когда они перечисляются в одной строке, респондент чаще пропускает средние позиции.) Излишне говорить, что наличие нескольких незаполненных строк для ответа положительно сказывается на желании опрашиваемых подробно ответить на открытый вопрос.
Большинство социологов-практиков убеждены, что наиболее удобной формой для фиксации ответа на закрытый вопрос является перечеркивание «квадратика» рядом с избранным ответом (или проставление в нем «галочки»), Возможно также использование квадратных [] или круглых ( ) скобок. Если каждая из позиций ответа имеет заранее присвоенный цифровой код, то можно попросить респондента обвести соответствующие цифры кружком например
05 да,
нет,
07 не знаю.
Последний вариант, однако, менее предпочтителен: во-первых, не все смогут обвести цифры достаточно аккуратно (что приведет к некоторым проблемам при вводе данных), и, во-вторых, обильно усеянная цифрами анкета некоторыми респондентами воспринимается как математическая головоломка. Разумеется, последние два замечания относятся лишь к анкетам, заполняемым респондентами: интервьюеров можно обучить безошибочной работе с цифровыми годами.
Важную роль в структуре анкеты играют вопросы-фильтры (или «отсекающие» вопросы). Они позволяют отобрать группу респондентов, которые могут (в силу своего статуса, опыта, заинтересованности или знаний) ответить на следующие за вопросом-фильтром зависимые вопросы. Для остальных респондентов зависимые вопросы будут попросту нерелевантны. Скажем, спрашивать о том, какое средство контрацепции они предпочитают (зависимый вопрос), имеет смысл у тех респондентов, которые пользовались или пользуются контрацептивами (вопрос-фильтр). Естественно, вопрос-фильтр всегда предваряет зависимые вопросы, которые респонденты, давшие «не тот» ответ, пропускают. Недопустимо, как уже говорилось, сочетать вопрос-фильтр и зависимый вопрос в одном «условном» вопросе: «Если у Вас есть собака, кормите ли Вы ее сухим кормом „Педигри пал"?». Ответ: «нет» дадут и те люди, которые не держат собак, и те, кто не кормят своих собак сухим кормом, и те, кому особенно не нравится «Педигри пал». (Конечно, использование развернутых ответов для каждой из логически возможных альтернатив может помочь в решении проблемы интерпретации, но в этом случае ваш список «подсказок» станет длиннее, чем инструкция по использованию кофемолки.) Очень удобно, когда вопросы-фильтры и зависимые вопросы выделены с помощью графических средств: стрелок, рамок, цвета и т. п. Примером может служить рис. 8
1 . Есть ли у Вас дети?
[ ] Да
[ ] Нет (переходите к вопросу 4)
При ответе «да» на первый вопрос:
2. Сколько у Вас детей? (Напишите) _________
3. Каков возраст самого старшего из Ваших детей? __ лет
Рис. 8. Пример зависимых вопросов
Иногда социологу нужно задать несколько вопросов, имеющих одинаковые категории ответа (в частности, это могут быть вопросы-пункты, входящие в одну шкалу). В этом случае целесообразно использовать табличный вопрос. Использование табличных вопросов делает анкету более компактной и, кроме того, позволяет респонденту увидеть смысловую и логическую организацию однотипных вопросов. Пример табличного вопроса с вербальной оценочной шкалой приведен на рис. 9.
Порядок вопросов в анкете обычно определяется несколькими простыми правилами:
Вопрос анкеты | Ответ | ||||
Совершенно согласен | согласен | Не согласен | Совершенно не согласен | Не знаю | |
Принимая решение, лучше всего опираться на мнение старших, более опытных людей | [] |
[] |
[] |
[] |
[] |
Обществу нужна «сильная рука», насаждающая закон и порядок | [] |
[] |
[] |
[] |
[] |
Адвокаты помогают преступникам и мошенникам «выйти сухими из воды» | [] |
[] |
[] |
[] |
[] |
Рис. 9 Пример табличного представления вопроса
заполняемой анкеты, чтобы это были не «демографические» вопросы о возрасте, национальности и т. п., сразу придающие анкете несколько официальный характер);
2) постарайтесь обеспечить какое-то смысловое соответствие между начальными вопросами и заявленными целями опроса;
3) группируйте вопросы в смысловые блоки, по возможности разделяя их графически: это не только облегчит задачу составления вопросника, но и придаст последнему в глазах опрашиваемых вид упорядоченного целого, а не хаотического и бессвязного нагромождения вопросов;
4) стремитесь всегда двигаться от более простых вопросов к более сложным и от более конкретных — к более абстрактным;
5) избегайте однообразия в конструкции вопросов и выборе формата для ответов, если вопросы следуют друг за другом;
6) не забывайте о возможном влиянии «соглашательской» установки на ответ: меняйте «направленность» вопросов, измеряющих одну и ту же установочную переменную;
7) избегайте слишком резких переходов от конкретных вопросов, относящихся к повседневной жизни и опыту, к мировоззренческим, установочным или «сензитивным» вопросам: трудно предсказать, как отреагирует человек, которого вы внезапно спросите: «Доводилось ли Вам лечиться от венерических болезней?» или «Веруете ли Вы в Бога?» (иногда в практике массовых опросов используют мало информативные или даже вовсе неинформативные «буферные» вопросы, сглаживающие такого рода переход);
8) в некоторых случаях есть смысл использовать небольшие «введения» к каждому блоку вопросов (например, «В следующем разделе нашей анкеты мы хотели бы узнать, что москвичи думают о городском транспорте»);
9) небольшие подсказки и конкретные инструкции по заполнению должны содержаться не только в общем введении к анкете, но и везде, где это необходимо для ясного понимания респондентом сути стоящей перед ним задачи (скажем, «В случае, если ни один из предложенных ответов не соответствует Вашему мнению, впишите Ваш ответ...» или «Напишите „1" рядом с фамилией самого любимого телеведущего...»).
Во введении к анкете должны содержаться сведения о целях исследования, о том, кто проводит данный опрос. Кроме того, уместны заверения в конфиденциальности (анонимности), какие-то объяснения по поводу того, как был выбран данный респондент (скажем, «случайным образом»). Если анкета заполняется самим респондентом, нужно указать, каким образом, когда и кому (по какому адресу) она должна быть возвращена. Практика показывает, что чрезмерно длинные и обстоятельные интродукции не приводят к сколько-нибудь существенному улучшению качества ответов или увеличению мотивации к сотрудничеству. И в случае интервью, и в ситуации, когда респондент сам отвечает на вопросы, лучше перейти к сути дела сразу же, после небольшого введения: все равно опрошенные не уделят должного внимания касающимся вас и вашего проекта деталям, если они (детали) будут представлены до начала опроса. Намного лучше, если, завершив интервью, вы вручите респонденту визитную карточку, памятный значок с символикой института, который вы представляете, и т. п. Желательно также поблагодарить респондента за сотрудничество.
Если составленный вами вопросник будет заполняться в ходе личного интервью, нужно сразу же позаботиться о составлении памятки для интервьюеров. Полезно также использовать внутри вопросника шрифтовые выделения, позволяющие отделить те инструкции и замечания, которые адресованы только интервьюеру, от предназначенных респонденту и зачитываемых интервьюером вслух. Лучше, если все уточняющие реплики, инструкции и вводные фразы, которые интервьюеру предстоит использовать, будут включены непосредственно в текст вопросника (в скобках, с помощью курсивных выделений и т. п.). В ином случае интервьюеру придется заучивать памятку наизусть — от вводных фраз до «До свидания».
Библиографичский список
1. Клюшина Н. А. Причины, вызывающие отказ от ответа // Социологические исследования.2008. № 1. С. 98—104.
2. Методы сбора информации в социологических исследованиях. Кн. 1. Социологический опрос / Отв. ред. В. Г. Андреенков, О. М. Маслова. М.: Наука, 2009.
3. Маслова О. М. Познавательные возможности открытых и закрытых вопросов // Социологические исследования. 2010. № 2. С. 129—138.
4. Ноэль Э. Массовые опросы. М.: Прогресс, 2009. С. 76—120.
5. Рукавишников В. О., Паниотто В. И., Чурилов Н. Н. Опросы населения (методический опыт). М.: Финансы и статистика, 2008.
6. Шуман Г., Прессер С. Открытый и закрытый вопрос // Социологические исследования. 2010. № 3.
7. Ядов В. А. Социологическое исследование: методология, программа, методы. 2-е изд., перераб. и доп. М.: Наука, 2009. С. 130—166.