Методология и методы исследования

К оглавлению
1 2 3 4 5 6 7 8 9 

Объект исследования. Поскольку вопрос о диагностических возможностях шкал лжи по-прежнему остается открытым, мы решили выяснить, в какой мере данный инструмент соответствует своему функциональному назначению. В качестве объекта для изучения была выбрана L-шкала из опросника ММРI, часто используемого в последнее время в отечественных психологических и педагогических исследованиях, а также в клинической диагностике и психотерапевтической практике.

Данный личностный опросник впервые был предложен в 1943 г. американскими психологами и клиницистами Дж. Маккинли и С. Хатауэем, а в 1989 г. модифицирован Дж. Баттлером и его коллегами (см.: [12, р. 447-449]). Сегодня MMPI насчитывает в общей сложности 567 вопросов и, помимо 10 основных и множества вспомогательных «клинических» шкал, содержит еще 4 «контрольные» шкалы, предназначенных для выявления различных видов искажений в ответах испытуемых: «шкалу неискренности» (L), «надежности» (F), «коррекции» (К) и «неопределенных ответов» (?).

Одной из самых надежных с диагностической точки зрения считается

 

L-шкала, ориентированная на фиксацию и измерение уровня социальной желательности. Она состоит из 15 вопросов-суждений, предполагающих однозначный ответ (по принципу «согласен - не согласен», «верно – неверно» и т.д.) в ситуации, отражающей житейские виды поведения, которые, как может показаться, осуждаемы строгой моралью (приложение 1). Большинство людей обычно легко признают те незначительные слабости и недостатки, которые фиксируются в вопросах, однако индивиды, намеренно стремящиеся подать себя в выгодном свете, отрицают их, отвечая не так, «как есть», а так, «как принято». В результате они получают высокие оценки по шкале, являющиеся основанием для отбраковки вопросников. Подробное описание этой и других «шкал валидности» из ММРI можно найти в специальной литературе [13-16].

Выборка. Методы сбора данных. С целью проведения методологической экспертизы L-шкалы, предполагающей оценку ее надежности и валидности, в марте 2001 г. кафедрой социологии Ивановского государственного энергетического   университета   под    руководством  автора было предпринято специальное исследование экспериментального типа*. Всего в Иванове было опрошено 387 чел., предварительно отобранных на основе экспериментальной выборки и представляющих разные социально-демографические и профессиональные группы взрослого городского населения. В силу методологической направленности данного исследования выборка носила качественный характер. Строго пропорциональной репрезентации различных социальных категорий не требовалось. Поэтому с точки зрения социально-профессионального статуса в ней примерно в равных долях были представлены респонденты из пяти основных групп: рабочие, производственная и непроизводственная интеллигенция, работники торговли и сферы бытового обслуживания, студенты и безработные. По полу выборка точно воспроизводит статистические параметры генеральной совокупности. По возрастным характеристикам оно несколько смещено в сторону большего представительства респондентов молодого и среднего возраста.

Для сбора эмпирических данных использовался метод формализованного персонального интервью. Опросы проходили по месту жительства или работы респондентов. Об экспериментальном характере данного исследования испытуемым не сообщалось. Статистико-математическая обработка информации осуществлялась в SPSS.

Структура вопросника. Основные и дополнительные переменные. Социологическая информация собиралась с помощью специально разработанного вопросника, насчитывающего в общей сложности 69 вопросов и состоящего из четырех условных блоков. Первый блок был представлен 15-ю суждениями L-шкалы, разбросанными в пространстве анкеты в случайном порядке. Полученные ответы затем квалифицировались на предмет достоверности/недостоверности в соответствии с ключами, предусмотренными для данного теста, и сводились в интегральный показатель, названный нами «индексом социальной желательности». Он измерялся в интервальной шкале, в качестве значений которой выступали итоговые баллы, набранные респондентами по всем пунктам теста. С этой целью на стадии компьютерной обработки данных была построена дополнительная искусственная переменная.

 Второй условный блок представлял собой серию из 16 основных и примерно такого же количества контрольных вопросов (проверочных, «ловушек», тестов на знания и др.), ответы на которые после сопоставления и соответствующей квалификации использовались в качестве относительно надежных эталонов достоверности/недостоверности. С учетом этого все респонденты были разделены на две группы: искренних и неискренних. При этом к неискренним мы относили тех испытуемых, которые либо демонстрировали неконсистентность в ответах на два-три сходных по смыслу вопроса, либо выбирали явно несуществующие подсказки в вопросах–«ловушках». Большинство вопросов контрольного блока были специально сформулированы таким образом, чтобы спровоцировать опрашиваемых на неискренние ответы (прил. 2). Режим персонального интервью исключал для респондентов возможность приведения в соответствие ответов на основные и проверочные вопросы. Полученные «эталоны», на базе которых были созданы 16 дополнительных переменных, использовались нами для проверки валидности L-шкалы.

На основе вопросов контрольного блока нами был сконструирован еще один сводный показатель, получивший условное название «эталонного индекса лжи». Он также измерялся в интервальной шкале и фиксировал распределение респондентов по количеству контрольных вопросов, на которые они дали неискренние ответы.

В третьем блоке вопросника присутствовали традиционные социально-демографические вопросы относительно пола, возраста, рода занятий, образования и брачного статуса респондентов. В анкету входили также вопросы функционально-психологического назначения (контактные, буферные, "глушители" и др.).

Методы измерения надежности. Поскольку L-шкала представляет собой классический образец тестовой методики, то для статистической оценки ее надежности мы использовали принятые в тестологии стандартные процедуры.

Во-первых, в ходе нашего исследования проводился анализ интеркорреляций между отдельными пунктами L-шкалы. В связи с тем, что коррелируемые переменные измерены на номинальном уровне и имеют дихотомическую природу («верно-неверно»), то наиболее адекватной мерой корреляции в этом случае мы посчитали коэффициент контингенции, используемый обычно для измерения абсолютной связи в четырехклеточных таблицах [17, с. 223].

Во-вторых, изучались корреляции каждого из 15 пунктов теста с  «индексом социальной желательности», построенным в результате подсчета общей суммы баллов, полученной всеми респондентами по всем вопросам шкалы. Поскольку одна из переменных в данном случае является номинальной, а вторая – интервальной, для характеристики силы связи между ними использовались Еta–коэффициенты как наиболее точно отвечающие природе и специфике измерения.

В-третьих, интересующий нас тест проверялся на внутреннюю консинстентность посредством коэффициента Альфа Кронбаха. Данный коэффициент представляет собой оценку надежности, базирующуюся на гомогенности шкалы или сумме корреляций между ответами испытуемых на вопросы внутри одной и той же тестовой формы. Его расчетная формула принимает во внимание количество вопросов, общую дисперсию оценок индивидов и сумму дисперсий баллов, полученных респондентами по каждому пункту шкалы [18, р. 502]. И, наконец, в четвертых, производилась оценка т.н. надежности-согласованности теста [19, с. 114]. С этой целью осуществлялся расчет коэффициента Спирмена-Брауна в рамках статистической модели «split half». Ретестовая надежность в данном исследовании не проверялась.

Методы валидизации шкалы. Вполне очевидно, что в случае с L-шкалой не может быть и речи о т.н. лицевой валидности ее вопросов-суждений в силу объективного характера теста и латентности цели осуществляемого измерения2. Вряд ли возможно и установление содержательной валидности экспертным путем (например, с использованием метода «параллельных панелей»), поскольку ни один, даже самый опытный эксперт не рискнул бы дать однозначное заключение о степени соответствия или несоответствия того или иного суждения содержанию измеряемой латентной переменной. Тем более, что пункты L-шкалы отбирались ее авторами не на основе логического подхода, т.е. соотнесения содержания суждений со значением заданного свойства, а посредством чисто эмпирических процедур [13, с. 6-7].

В данном случае, скорее всего, есть смысл попытаться установить конструктную валидность данной шкалы и тем самым проверить, в какой мере все ее пункты вместе соответствуют содержанию конструкта в целом. Мы сочли возможным сделать это путем коррелирования «индекса социальной желательности», полученного по L-шкале, с ответами респондентов на целую серию «эталонных» (контрольных) вопросов, также фиксирующих неискренность, но иным, несомненно, более надежным образом. При этом мы исходили из того, что если в результате будут обнаружены высокие значимые корреляции между указанными переменными (по крайней мере, для тех случаев, которые обеспечивают максимально достоверные квалификации ответов), то можно говорить о валидности L-шкалы на уровне измеряемого конструкта.

Некоторые авторы называют такой вид валидности «содержательной (корреляционной) валидностью для конструкта», в том смысле, что ее установление возможно посредством анализа корреляций между ответами испытуемых на близкие по смыслу вопросы [20, р. 81]. П. Каттенс, вслед за

 

Д. Кэмпбелом и Д. Фиске [21],  определяет ее как «конструктную (конвергентную)», не без оснований полагая при этом, что если ответы респондентов по тесту в целом и на вопросы контрольного блока близки («конвергентны»), т.е. характеризуются одной и той же тенденцией, то мы имеем дело именно с конструктной валидностью тестируемой шкалы. «Для нефактуальных вопросов, - пишет автор, - валидация единственно возможна лишь на основе оценки консистентности серии данных, полученных с помощью различных вопросов, каждый из которых имеет целью измерить тот же самый ненаблюдаемый теоретический конструкт, т.е. посредством оценки конструктной (конвергентной) валидности» [22, р. 31].

Вместе с тем ничуть не менее важной задачей в данном исследовании мы считали проверку L-шкалы на т.н. дискриминантную валидность. Если шкала отчетливо дифференцирует группы искренних и неискренних респондентов по числу набранных ими баллов, при этом устойчиво демонстрируя данную способность в целом ряде внетестовых ситуаций, то она без сомнений может считаться высоко валидным инструментом для измерения заданного свойства.

При установлении валидности этого типа мы использовали процедуру

 

t-теста с целью анализа средних оценок, полученных искренними и неискренними респондентами по шкале «социальной желательности», на предмет статистической значимости различий.