Лекции по методологии социологических исследований ">2. Бинарное и экстенсивное пространства признаков. Дихотомия — стандартная форма представления данных. Частотные распределения. Эффект эпистемической инверсии. Число измерений и единиц в пространстве признаков. Тип 1 «Много единиц — мало переменных». Тип 2 «Мало единиц — много переменных». Монографические описания. Тип 3 «Достаточное количество единиц — достаточное количество переменных». Концептуальные переменные образуют систему координат, в которой размещается реальность. Нет никаких сомнений, что «скоординированная» таким образом реальность является результатом абстрагирования и дистанцирования от «живой жизни». Она бедна и ущербна, но у нее есть одно исключительное преимущество, заключающееся как раз в силе абстракции: полученная в результате абстрагирования схема воссоздает идею объекта, очищенную от несущественного и случайного. Теорема о соотношении длины радиуса и длины окружности доказывается без обращения к наличествующим в опыте окружностям. Притяжение двух тел описывается формулой Ньютона—Кеплера вне зависимости от того, насколько привлекательна внешность данных тел. Демократический стиль лидерства в малой группе усиливает агрессивную реакцию членов группы на «чужого». Все это — схемы, образованные в пространстве концептуальных переменных. Каждая переменная имеет определенные значения, которые в совокупности исчерпывают диапазон возможных изменений. Количество значений переменной практически бесконечно. Переменная «национальность» включает сколь угодно много позиций — национальностей, «возраст» может фиксироваться самыми маленькими интервалами, «удовлетворенность» при желании идентифицируется в терминах «очень удовлетворен», «не очень удовлетворен», «удовлетворен», «скорее удовлетворен, чем неудовлетворен»... Предположим, что, устанавливая значения переменных в системе «мировых координат», мы стремимся к расширению их диапазона, т. е. к увеличению 5-365 точности измерений. Такая стратегия приводит к экстенсивному пространству переменных, границы которого в принципе не определены. Пространство признаков напоминает ящик, разделенный на множество ячеек. Каждая ячейка — класс, образованный пересечением значений переменных. Предположим, что V1 — возраст, V2 — уровень образования, а Vз — национальность. Тогда одна из ячеек нашего пространства-«ящика» будет отображать, к примеру, группу людей с высшим образованием, 30-летних, украинцев. Иные ячейки будут отличаться значениями переменных. Хотя каждый исследователь стремится к детализации картины мира, он вынужден работать в очень ограниченном пространстве. Спрашивается: каково пространство минимальной размерности? Если значения переменной сводятся к дихотомии, ее диапазон минимизируется. «Да будут слова ваши «да — да», «нет — нет», а что сверх того, то от лукавого», — эта заповедь предписывает сводить переменную «образование» к градациям, предположим, «высшее — не высшее», «национальность» к «русский — не русский», «пол» — к «женщина — не женщина». В конечном счете система координат приобретает вид бинарного пространства переменных — четырехклеточной матрицы. Четырехклеточные матрицы — наименее точная и наиболее надежная форма представления данных. Существует обширный класс статистик, измеряющих интенсивность связи дихотомических переменных. Немаловажное преимущество дихотомий заключается также в том, что к ним сводятся все типы шкал, применяемых в социологии и психологии. Например, успешность карьеры можно измерить в шкале «очень успешная — успешная / средняя / неуспешная / очень неуспешная». Эта шкала относительно легко переводится в дихотомию «успешная — неуспешная» путем сложения соседних градаций. Необходимость укрупнения возникает, как правило, в тех случаях, когда отдельные классы оказываются недостаточно наполненными. Сведение к дихотомиям решает проблему унификации измерений при использовании многомерных классификаций. Пространство признаков, образующее для аналитика систему мировых координат, обладает различной размерностью. Мы можем ограничиться в своем взгляде на мир одной переменной, и тогда он превратится в одномерный, линейный мир. Например, в зондажах общественного мнения можно задать респонденту только один вопрос: за кого он собирается голосовать. Никакого иного измерения, кроме этой «электоральной установки», не существует. В данном случае система мировых координат сводится к одной оси, имеющей два значения и более. Однако сбор социологической информации по одной переменной практикуется крайне редко. Исследователя интересуют и другие параметры, позволяющие дифференцировать объекты. Если нужны не просто сведения, а объяснения переменной, пространство признаков становится многомерным. Предположим, мы намереваемся установить распределение единиц в двумерном пространстве признаков, где каждый признак имеет по три градации. Строится таблица 3x3, подлежащее которой составляет первая переменная, а сказуемое — вторая. Макет частотного распределения обязательно оснащается позициями «Нет данных», даже если их наполнение предполагается незначительным. Как только мы «сформатировали» реальность в двумерной таблице, возникает вопрос: каковы основания судить о том, что первая переменная каким-либо образом связана со второй. Предположим, что первая переменная означает образование, а вторая—доход. Есть люди с высоким образованием и высоким доходом, но немало богатых людей и среди не окончивших среднюю школу. Если мы произведем «обмер» одного-единственного человека и установим у него высокое образование и низкий доход, мы не сможем сказать ничего определенного о взаимосвязи признаков. В данном случае мы имеем дело с сингулярностью (singularis, лат. — отдельный, одиночный). Сингулярности молчат. Одно наблюдение — мало, два наблюдения — тоже мало, мало и трех. Статистический вывод начинает работать тогда, когда единиц исследования достаточно много. «Достаточно много» означает, что при условии равновероятного попадания в каждую клетку пространства признаков наполнение каждой из них составит не менее семи единиц. Тогда единицы начнут образовывать конфигурации в нашем идеальном пространстве признаков и смогут сказать кое-что, к примеру, о взаимосвязи образования и дохода. Мы можем поместить в фокус исследования только один объект — одно общество, одного человека, один регион и описать каждую из этих единиц с помощью тысяч переменных. Можно рассказать о всех мало-мальски значимых событиях в жизни человека, углубиться в его поступки и переживания, перебрать его родственников до седьмого колена и узнать о нем то, что он сам не знает. В общем мы напишем историю жизни, как это сделали У. Томас и Ф. Знанецкий в своем рассказе о судьбе польского крестьянина, попавшего вместе с тысячами других поляков в начале XX в. в Америку. Несмотря на многостраничные описания, остается неясным, что способствует, а что мешает адаптации иммигрантов в Америке и как влияет безотцовщина на преступные наклонности подростков. Сингулярности молчат, несмотря на свою видимую внушительность. Они молчат, даже если их много: один пример, другой, третий остаются отдельными примерами. Только организованные в пространстве признаков наблюдения перестают быть «случаями» и начинают говорить. Они начинают говорить тогда, когда в результате их группировки и типологизации исследователь создает частотные распределения. Из малого количества наблюдений можно получить несоизмеримо больше информации, чем из огромного массива сведений, если эти наблюдения хорошо организованы. Более того, источником нового знания