§ 1. Анализ существующих данных. Контент-анализ

К оглавлению
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 
17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 
34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 
51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 
68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 
85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 
102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 
119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 
136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 
153 154 155 156 157 158 159 160 161 

Большой объем информации, необходимой исследователю

в его работе, содержится в документальных источниках. В социологии

их изучение как вид деятельности или этап исследования

называют анализом существующих данных, или вторичным

анализом данных. В маркетинговых исследованиях часто

употребляют термин «desk research» (исследование за столом).

Анализ содержания документальных источников в ряде случаев

позволяет получить информацию, достаточную для реше-

ния возникшей проблемы или углубить анализ проблемы. Так,

при формулировке проблемы и гипотез исследования социолог

обращается к анализу таких документов, как научные публикации,

отчеты по предшествующим исследованиям, различная

статистическая и ведомственная документация. Именно анализ

документов дает первоначальную информацию и позволяет точно

и целенаправленно использовать другие исследовательские

методы.

Наконец, на стадии анализа и интерпретации результатов

часто возникает необходимость обращения к различным документам,

чтобы сравнить полученные данные с уже имеющимися,

уточнить границы интерпретации полученных результатов,

проконтролировать их надежность.

«Документ» — средство закрепления различным способом

на специальном материале информации о фактах, событиях,

явлениях объективной действительности и мыслительной деятельности

человека. Информация может фиксироваться с помощью

букв, цифр, стенографических и иных знаков, рисунков,

фотографий, звукозаписей и т. д. В зависимости от технических

средств фиксации информации различают следующие

виды документов:

а) письменные документы, т. е. документация на бумажных

носителях или электронных носителях для чтения их с помощью

компьютеров. Среди них традиционные архивные документы

государственных и общественных организаций; литература

(книги, брошюры); пресса (газеты, журналы); личные документы

(письма, дневники);

б) иконографические: видео-, кино- и фотодокументы,

картины, гравюры и т. п.;

в) фонетические: магнитные и подобные им записи, грампластинки.

Все более универсальным техническим способом хранения

и распространения становится представление информации в

цифровой форме на машиночитаемых носителях для компьютеров:

например, исходные данные переписей населения хранятся

в машиночитаемой форме на машинных носителях; исходные

данные социологических исследований хранятся в банках

данных на машинных носителях; некоторые газеты

распространяют тексты электронным способом — на машиночитаемых

носителях, видеоинформация также представляется

в цифровом виде с широкими возможностями ее компьютерной

обработки и передачи.

Наиболее универсальным глобальным средством распространения

информации в последнее время стала «всемирная паутина

» — Интернет.

По содержанию документы можно подразделить на следующие

группы.

1. Различные виды статистических данных — один из наиболее

важных источников информации. Ядром этих данных являются

результаты переписей населения и текущего статистического

учета, которые проводит Госкомстат России. Госкомстат,

как и аналогичные организации в других развитых

странах, накапливает данные по достаточно широкому спектру

экономических и социальных показателей.

Первая и единственная всеобщая перепись населения в

Российской империи была проведена в 1897 г. После революции

1917 г. первая всесоюзная перепись была проведена в

1926 г. Следующая всеобщая перепись населения состоялась в

1937 г., которая была признана неудовлетворительной по качеству

данных и была повторена в 1939 году. Следующая перепись

состоялась лишь в 1959 г. Последующие переписи проходили с

интервалом примерно в 10 лет — в 1970, 1979 и 1989 г.

Статистические данные в социологическом анализе выполняют

несколько функций: могут стать инструментом специального

анализа; использоваться для характеристики исторического

контекста развития изучаемого социального явления или

процесса; обеспечивать концептуальные рамки, внутри которых

реализуется конкретный исследовательский проект. Наличие

соответствующей статистики является важнейшим компонентом

некоторых процедур процесса исследования, например

построения выборки в массовых опросах населения и оценки

репрезентативности получаемых данных.

Система статистических данных, накапливаемых Госкомстатом,

включает в себя текущий учет населения (регистрация

браков, рождений, смертей, перемены места жительства и

многое другое). На его основе публикуются ежегодники «Российский

статистический ежегодник», а также многотомные

издания материалов переписей и микропереписей населения.

Некоторые данные Госкомстат в настоящее время распространяет

также и на магнитных носителях.

Сходная система сбора и публикаций статистических данных

сохранилась и в странах бывшего Союза.

Помимо Госкомстата сбором разнообразных статистических

данных занимаются другие государственные организации, иммиграционная

служба, органы таможни и т. д.

Важнейшим источником информации для политологических

исследований является электоральная статистика. Статистические

сведения о результатах политических предпочтений

избирателей России стали регулярно публиковаться Центральной

избирательной комиссией РФ1. Помимо этих публикаций

существуют электронные базы результатов голосования как на

выборах федерального уровня, так и в субъектах федерации2.

Важной особенностью статистических данных является их

агрегированный характер. Это означает, что единицей анализа,

к которой они относятся, выступает некоторая группа как целостность.

Например, показатель «национальный доход» относится

ко всему государству, «средний душевой доход» — ко

всему населению или определенной социальной группе. Агрегированный

характер большей части статистики предопределяет

специфику и ограничения в ее использовании. Возможна

ситуация, когда свойства, зафиксированные статистикой на

групповом уровне, не отражают соответствующие свойства на

уровне отдельных подгрупп или индивидуальном уровне.

Исследователю часто приходится использовать статистические

данные, которые накоплены, как правило, для решения

иных, чем нужно ему, проблем. В связи с этим перед ним возникает

задача обоснования определенного статистического показателя

как косвенной меры изучаемой характеристики социального

явления или процесса. Наконец, статистика, накопленная

различными ведомствами, в ряде случаев страдает

отсутствием единой методологии сбора и афегирования данных,

что приводит к их несопоставимости. Встречается в определенном

смысле и обратная ситуация (особенно часто при ана-

лизе международной статистики), когда преувеличиваются различия

в методах сбора данных, определении показателей и т. д.

2. Документы текущего делопроизводства различных организаций.

Для этих документов во многих случаях определены сроки

хранения. После истечения этих сроков документация,

предназначенная для постоянного или длительного хранения,

передается в архивы. В России существовала и существует развитая

сеть архивов, включающая региональные архивы (республиканские,

краевые, областные, районные), ведомственные

(отраслевые) архивы, архивы предприятий, учреждений,

ведомств, а также центральные государственные архивы1.

3. Результаты выборочных социологических исследований

представляют собой новый вид статистической информации.

В настоящее время в России отсутствуют какие-либо централизованные

системы сбора, хранения и распространения данных

социологических исследований, поэтому наиболее крупные опросные

центры создали и поддерживают собственные архивы

данных. Большой объем этих данных за период с 1970 по 1990 г.

находится в архиве Института социологии РАН (информацию о

ресурсах архива можно найти в нескольких изданиях каталога

Института «Банк данных социологических исследований»), Институте

социально-политических исследований РАН2, а также

архивах независимых исследовательских центров: Институте

сравнительных социальных исследований (ЦЕССИ), Фонде

«Общественное мнение», ВЦИОМе3 и ряде других. Часть этих

архивов доступна на сайтах этих организаций в Интернете.

Многочисленные социологические исследования, которые

проведены западными социологами в России и других странах

бывшего Союза начиная с конца 80-х гг., разбросаны по всему

миру и хранятся в университетских архивах, государственных

исследовательских центрах. Наиболее известными из университетских

архивов является в США Межуниверситетский кон-

сорциум социальных и политических наук Мичиганского университета

США, Кельнский архив в Германии. Причем данные

многих проектов можно получить, обратившись прямо на сайты

этих центров.

4. Другим традиционным для социологов источником документов

являются СМИ — газеты, радио, телевидение. Направленность

политической пропаганды, рекламные кампании и их

содержание, отражение социальных, политических и экономических

проблем общества — далеко не полный перечень

вопросов, которые решают социологи с помощью анализа подобных

документов.

Методы анализа документов. Традиционные подходы. Каждая

из вышеназванных групп документов предполагает свои специфические

подходы к их обработке.

Особую проблему для исследователей с точки зрения их

анализа представляют документы, которые продуцируются в

первую очередь средствами массовой информации. Традиционный

анализ, или, его еще можно назвать, качественный подход,

представляет собой адаптацию содержания документа к

исследовательской задаче, основанную на интуитивном понимании,

обобщении содержания и логическом обосновании

сделанных выводов Типичным примером анализа текстовых

источников может служить изучение научных публикаций и

отчетов по проблеме, которое обычно проводится социологом

на этапе разработки исследовательской проблемы.

Существуют некоторые приемы опенки качества документального

источника В источниковедении специально выделяются

следующие этапы оценки качества документального источника

(критика источника): выяснение условий, целей и

причин создания документа, установление его авторства, т. е.

факторов, которые могли повлиять на достоверность отражения

в документе действительного положения дел (например,

это ведомственный исследовательский центр или действительно

независимый). Иначе говоря, выясняются факторы достоверности

документального источника применительно к целям

исследования. Установление полноты и достоверности источника

относительно целей исследования — главные параметры

его оценки до начала исследования.

Количественный анализ (контент-анализ). Наиболее существенным

ограничением, связанным с использованием тради-

ционных методов анализа документов, например продуцируемых

СМИ, является возможность субъективных влияний на

результаты анализа, т. е. влияния установок исследователя, его

интересов, сложившихся стереотипных представлений о предмете

анализа. Эти влияния могут не осознаваться, а строгих

критериев для обнаружения подобных влияний при интуитивном

анализе не существует. Другим ограничением в традиционном

анализе являются трудности, связанные с осмыслением

большого количества публикаций за сколько-нибудь длительные

периоды времени.

Данный недостаток преодолевается методиками формализованного

анализа, которые основаны на статистическом учете

различных объективных характеристик текста. Например, частота

публикаций в газете материалов по определенной теме;

число строк, отводимых редакцией отдельным темам, рубрикам,

авторам; частота упоминаний проблем, терминов, имен,

географических названий и т. п.

Контент-анализ — это метод изучения сообщений, создаваемых

в различных сферах социальной коммуникации и

зафиксированных в форме письменного текста (на бумаге)

или записи на каких-либо иных физических носителях. Анализ

основан на единообразных стандартизированных правилах

поиска, учета и подсчета количественных показателей

изучаемых характеристик текста. Потенциальными объектами

исследования могут быть любые документальные источники,

содержащие текст, — книги, газеты, песни, речи,

выступления, письма, дневники, ответы на открытые вопросы

анкет. При этом, конечно, подразумевается, что изучаемая

характеристика существует и распределена в некоторой

массовой совокупности — слов, фраз, параграфов, книг,

журналов, авторов и др.

Задачи, решаемые методом контент-анализа, укладываются

в достаточно простую и очевидную схему: «Кто сказал, что,

кому, как, с какой целью и с каким результатом?»

Суть метода сводится к тому, чтобы найти и использовать

для подсчета такие признаки документа (например, упоминания

названий партий), которые отражали бы определенные

существенные стороны его содержания. Так, тематическую направленность

этой главы данной книги можно определить,

если подсчитать частоту употребления в тексте слова «метод» и

сравнить ее с аналогичной частотой для других глав.

Обычно контент-анализ, как и методы массового опроса,

использует выборочный метод изучения, и лишь единицы анализа

и единицы отбора в них различны. В контент-анализе единицы

отбора — слова, фразы, смысловые единицы, отдельные

статьи; в выборочных опросах — люди.

Принципиальным моментом в разработке методики контент-

анализа является разработка правил соотнесения единиц

текста с перечнем категорий анализа. Эти правила оформляются

в форме кодификатора. В кодификатор включают не только

список наблюдаемых индикаторов, но и данные о самом документе,

которые подвергаются кодированию (например, название

газеты, место издания, дата издания, другие характеристики

газеты — число страниц, формат и т. п.).

Контент-анализ целесообразно использовать при наличии

больших текстовых массивов с четкой структурой, определяемой

коммуникативными намерениями авторов текста. Этот метод

широко используется при изучении сообщений, транслируемых

на массовую аудиторию газетами, радио, телевидением.

При анализе больших массивов текстов приходится решать

проблему обеспечения репрезентативности результатов при отборе

текстов из их общей генеральной совокупности. В большинстве

случаев здесь применимы модели выборки, изложенные

в предыдущей главе. Причем уже на стадии планирования

необходимо продумать, каковы функции информации, полученной

методом контент-анализа, в общей структуре эмпирических

данных, полученных другими методами, которые используются

в исследовании.

Современные технические средства существенно упрощают

ранее представлявшийся крайне трудоемким процесс количественного

анализа большого количества текста. Современные

сканеры с эффективными программами распознавания

текста, позволяют достаточно быстро вводить в ЭВМ

значительные объемы материала. Современные специализированные

программы позволяют автоматизировать процесс подсчета

искомых показателей. Все чаще газеты распространяют

свои метериалы в электронном виде, в частности через Интернет,

что существенным образом упрощает количественный

анализ этих текстов.