5.1. Экспериментальные планы

К оглавлению
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 
17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 
34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 
51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 

5.1.1 Планы для одной независимой переменной

План «истинного» экспериментального исследования отличается от других следующими важнейшими признаками:

1) применением одной из стратегий создания эквивалентных групп, чаще всего — рандомизации;

2) наличием экспериментальной и, как минимум, одной контрольной группы;

3) завершением эксперимента тестированием и сравнением поведения группы, по­лучившей экспериментальное воздействие (X1), с группой, не получившей воз­действия Х0.

Классическим вариантом плана является план для 2 независимых групп. В пси­хологии планирование эксперимента начинает применяться с первых десятилетий XXв.

Существуют три основные версии этого плана. При их описании будем пользо­ваться символизацией, предложенной Кэмпбеллом.

Таблица 5.1

1. Экспериментальная группа

R        Х         О1

2. Контрольная группа

R                    О2

 

Здесь R— рандомизация, Х— воздействие, О1 — тестирование первой группы, О2 — тестирование второй группы.

1) План для двух рандомизированных групп с тестированием после воздей­ствия. Его автор — известный биолог и статистик Р. А. Фишер [Fisher R. A., 1935]. Структура плана показана в табл. 5.1.

Равенство экспериментальной и контрольной групп является совершенно необ­ходимым условием применения этого плана. Чаще всего для достижения эквива­лентности групп применяют процедуру рандомизации (см. гл. 4). Этот план реко­мендуют использовать в том случае, когда нет возможности или необходимости про­водить предварительное тестирование испытуемых. Если рандомизация проведена качественно, то этот план является наилучшим, позволяет контролировать боль­шинство источников артефактов; кроме того, для него применимы различные вари­анты дисперсионного анализа.

После проведения рандомизации или иной процедуры уравнивания групп осуще­ствляется экспериментальное воздействие. В простейшем варианте используется лишь две градации независимой переменной: есть воздействие, нет воздействия.

Если необходимо использовать не 1 уровень воздействия, то применяются пла­ны с несколькими экспериментальными группами (по числу уровней воздействия) и одной контрольной.

Если же нужно контролировать влияние одной из дополнительных переменных, то применяют план с 2 контрольными группами и 1-й экспериментальной. Измере­ние поведения дает материал для сравнения 2 групп. Обработка данных сводится к применению традиционных для математической статистики оценок. Рассмотрим случай, когда измерение проводится интервальной шкалой. Для оценки различия в средних показателях групп используют t-критерий Стьюдента. Оценивание разли­чий в вариации измеряемого параметра между экспериментальной и контрольной группами проводится с помощью критерия F. Соответствующие процедуры подроб­но рассмотрены в учебниках математической статистики для психологов.

Применение плана для 2 рандомизированных групп с тестированием после воз­действия позволяет контролировать основные источники внутренней невалидности (как их определяет Кэмпбелл). Поскольку предварительное тестирование отсут­ствует, исключен эффект взаимодействия процедуры тестирования и содержания экспериментального воздействия и сам эффект тестирования. План позволяет кон­тролировать влияние состава групп, стихийного выбывания, влияние фона и есте­ственного развития, взаимодействие состава группы с другими факторами, позволя­ет также исключить эффект регрессии за счет рандомизации и сравнения данных экспериментальной и контрольной групп. Однако при проведении большинства пе­дагогических и социально-психологических экспериментов необходимо жестко контролировать исходный уровень зависимой переменной, будь то интеллект, тревож­ность, знания или статус личности в группе. Рандомизация — лучшая процедура из возможных, но она не дает абсолютной гарантии правильности выбора. Когда суще­ствуют сомнения в результатах рандомизации, применяют план с предварительным тестированием.

Таблица 5.2

1. Экспериментальная группа

R        О1       Х      О2

2. Контрольная группа

R        О3                О4

 

2) План для двух рандомизированных групп с предварительным и итоговым тестированием. Рассмотрим структуру этого плана (табл. 5.2).

План с предварительным тестированием пользуется популярностью у психоло­гов. Биологи больше доверяют процедуре рандомизации. Психолог прекрасно зна­ет, что каждый человек своеобразен и отличен от других, и подсознательно стре­мится уловить эти различия с помощью тестов, не доверяя механической процедуре рандомизации. Однако гипотеза большинства психологических исследований, осо­бенно в области психологии развития («формирующий эксперимент»), содержит прогноз определенного изменения свойства индивида под влиянием внешнего фак­тора. Поэтому план «тест—воздействие—ретест» с применением рандомизации и контрольной группой очень распространен.

При отсутствии процедуры уравнивания групп этот план преобразуется в квазиэкспериментальный (он будет рассмотрен в разделе 5.2).

Главный источник артефактов, нарушающий внешнюю валидность процеду­ры, — взаимодействие тестирования с экспериментальным воздействием. Напри­мер, тестирование уровня знаний по определенному предмету перед проведением эксперимента по заучиванию материала может привести к актуализации исходных знаний и к общему повышению продуктивности запоминания. Достигается это за счет актуализации мнемонических способностей и создания установки на запоми­нание.

Однако с помощью этого плана можно контролировать другие внешние перемен­ные. Контролируется фактор «истории» («фона»), так как в промежутке между пер­вым и вторым тестированием обе группы подвергаются одинаковым («фоновым») воздействиям. Вместе с тем Кэмпбелл отмечает необходимость контроля «внутригрупповых событий», а также эффекта неодновременности тестирования в обеих группах. В реальности невозможно добиться, чтобы тест и ретест проводились в них одновременно. План превращается в квазиэкспериментальный, например:

R      О1               Х      О2

R              О3               О4

Обычно контроль неодновременности тестирования осуществляют два экспери­ментатора, проводящие тестирование двух групп одновременно. Оптимальной счи­тается процедура рандомизации порядка тестирования: тестирование членов экспе­риментальной и контрольной групп производится в случайном порядке. То же самое делается и с предъявлением — не предъявлением экспериментального воздействия. Разумеется, такая процедура требует наличия значительного числа испытуемых в экспериментальной и контрольной выборках (не менее 30-35 человек в каждой).

Естественное развитие и эффект тестирования контролируются за счет того, что они одинаково проявляются в экспериментальной и контрольной группах, а эффек­ты состава групп и регрессии [Кэмпбелл, 1980] контролируются при помощи проце­дуры рандомизации.

Результаты применения плана «тест—воздействие—ретест» представлены в таблице.

При обработке данных обычно используются параметрические критерии t и F (для данных в интервальной шкале). Вычисляются три значения t: сравнение 1) О1 и О2 ; 2) О3 и О4; 3) О2 и О4. Гипотезу о значимом влиянии независимой переменной на зависимую можно принять в том случае, если выполняются два условия: а) раз­личия между О1 и О2 значимы, а между О3 и О4 — незначимы и б) различия между О2 и О4 значимы. Гораздо удобнее сравнивать не абсолютные значения, а величины прироста показателей от первого тестирования ко второму (δ(i)). Вычисляются δ(i12) и δ(i34) и сравниваются по t-критерию Стьюдента. В случае значимости различий принимается экспериментальная гипотеза о влиянии независимой переменной на зависимую (табл. 5.3).

Рекомендуется также применять ковариационный анализ по Фишеру. При этом показатели предварительного тестирования берутся в качестве дополнительной пе­ременной, а испытуемые разбиваются на подгруппы в зависимости от показателей предварительного тестирования. Тем самым получается следующая таблица для об­работки данных по методу MANOVA (табл. 5.4).

Применение плана «тест—воздействие—ретест» позволяет контролировать вли­яние «побочных» переменных, нарушающих внутреннюю валидность эксперимента.

Внешняя валидность связана с возможностью переноса данных на реальную си­туацию. Главным же моментом, отличающим экспериментальную ситуацию от ре­альной, является введение предварительного тестирования. Как мы уже отметили, план «тест—воздействие—ретест» не позволяет контролировать эффект взаимо­действия тестирования и экспериментального воздействия: предварительно тести­руемый испытуемый «сенсибилизируется» — становится более чувствительным к воздействию, так как мы измеряем в эксперименте именно ту зависимую перемен­ную, на которую собираемся воздействовать с помощью варьирования независимой переменной.

Таблица 5.5

Предварительное тестирование

Воздействие

Да

Нет

Есть

О2

О4

Нет

О5

О6

 

Для контроля внешней валидности используется план Р. Л. Соломона, который был предложен им в 1949 г.

3) План Соломона используется при проведении эксперимента на четырех груп­пах:

1. Эксперимент1:                                R             О1            Х            О2

2. Контроль 1:                                      R             О3                           О4

3. Эксперимент 2:                               R                             X             О5

4. Контроль 2:                                      R                                             О6

План включает исследование двух экспериментальных и двух контрольных групп и по сути является мультигрупповым (типа 2 х 2), но для удобства изложения он рассматривается в этом разделе.

План Соломона представляет собой объединение двух ранее рассмотренных пла­нов: первого, когда не производится предварительное тестирование, и второго — «тест—воздействие—ретест». С помощью «первой части» плана можно контроли­ровать эффект взаимодействия первого тестирования и экспериментального воздей­ствия. Соломон с помощью своего плана выявляет эффект экспериментального воз­действия четырьмя разными способами: при сравнении 1) О2  — О1 ; 2) О2  — О4 ; 3) О5  — О6  и 4) О5  — О3 .

Если провести сравнение О6 с О1 и О3, то можно выявить совместное влияние эффектов естественного развития и «истории» (фоновых воздействий) на зависи­мую переменную.

Кэмпбелл, критикуя предложенные Соломоном схемы обработки данных, пред­лагает не обращать внимания на предварительное тестирование и свести данные к схеме 2 х 2, пригодной для применения дисперсионного анализа (табл. 5.5).

Сравнение средних по столбцам позволяет выявлять эффект экспериментально­го воздействия — влияние независимой переменной на зависимую. Средние по стро­кам показывают эффект предварительного тестирования. Сравнение средних по ячейкам характеризует взаимодействие эффекта тестирования и эксперименталь­ного воздействия, что свидетельствует о мере нарушения внешней валидности.

В том случае, когда эффектами предварительного тестирования и взаимодей­ствия можно пренебречь, переходят к сопоставлению О4 и О2 методом ковариацион­ного анализа. В качестве дополнительной переменной берутся данные предвари­тельного тестирования по схеме, приведенной для плана «тест—воздействие—ретест».

Наконец, в некоторых случаях необходимо проверить сохранение во времени эф­фекта воздействия независимой переменной на зависимую: например, выяснить, приводит ли новый метод обучения к долгосрочному запоминанию материала Для этих целей применяют следующий план:

1 Эксперимент 1                 R             О1           Х            О2  

2 Контроль 1       R             О3                          О4

3 Эксперимент 2                 R             О5           Х                            О6

4 Контроль 2       R             О7                                          О8

5.1.2 Планы для одной независимой переменной и нескольких групп

Иногда сравнения двух групп недостаточно для подтверждения или опровержения экспериментальной гипотезы. Такая проблема возникает в двух слу­чаях: а) при необходимости контроля внешних переменных; б) при необходимости выявления количественных зависимостей между двумя переменными.

Для контроля внешних переменных используются различные варианты фактор­ного экспериментального плана. Что касается выявления количественной зависи­мости между двумя переменными, то необходимость ее установления возникает при проверке «точной» экспериментальной гипотезы. В эксперименте с участием двух групп в лучшем случае можно установить факт причинной связи между независи­мой и зависимой переменными. Но между двумя точками можно провести бесконеч­ное множество кривых. Для того чтобы убедиться в наличии линейной зависимости между двумя переменными, следует иметь хотя бы три точки, соответствующие трем уровням независимой переменной. Следовательно, экспериментатор должен выде­лить несколько рандомизированных групп и поставить их в различные эксперимен­тальные условия. Простейшим вариантом является план для трех групп и трех уровней независимой переменной:

Эксперимент 1:                   R             Х1           О1

Эксперимент 2:  R             Х2           О2

Контроль:                             R                             О3

Контрольная группа в данном случае — это третья экспериментальная группа, для которой уровень переменной Х = 0.

При реализации этого плана каждой группе предъявляется лишь один уровень независимой переменной. Возможно и увеличение числа экспериментальных групп соответственно числу уровней независимой переменной. Для обработки данных, по­лученных с помощью такого плана, применяются те же статистические методы, что были перечислены выше.

Простые «системные экспериментальные планы», как ни удивительно, очень редко используются в современных экспериментальных исследованиях. Может быть, исследователи «стесняются» выдвигать простые гипотезы, помня о «сложно­сти и многомерности» психической реальности? Тяготение к использованию пла­нов с многими независимыми переменными, более того — к проведению многомер­ных экспериментов, не обязательно способствует лучшему объяснению причин че­ловеческого поведения. Как известно, «умный поражает глубиной идеи, а дурак — размахом строительства». Лучше предпочесть простое объяснение любому сложно­му, хотя регрессионные уравнения, где все всему равняется, и запутанные кор­реляционные графы могут произвести впечатление на некоторые диссертационные советы.

5.1.3 Факторные планы

Факторные эксперименты применяются тогда, когда необходимо проверить сложные гипотезы о взаимосвязях между переменными. Общий вид по­добной гипотезы: «Если А1, А2,..., Аn, то В». Такие гипотезы называются комплексными, комбинированными и др. При этом между независимыми переменными могут быть различные отношения: конъюнкции, дизъюнкции, линейной независимости, аддитивные или мультипликативные и др. Факторные эксперименты являются част­ным случаем многомерного исследования, в ходе проведения которого пытаются ус­тановить отношения между несколькими независимыми и несколькими зависимы­ми переменными. В факторном эксперименте проверяются одновременно, как пра­вило, два типа гипотез:

1) гипотезы о раздельном влиянии каждой из независимых переменных;

2) гипотезы о взаимодействии переменных, а именно — как присутствие одной из независимых переменных влияет на эффект воздействия на другой.

Факторный эксперимент строится по факторному плану. Факторное планирова­ние эксперимента заключается в том, чтобы все уровни независимых переменных сочетались друг с другом. Число экспериментальных групп равно числу сочетаний уровней всех независимых переменных.

Сегодня факторные планы наиболее распространены в психологии, поскольку простые зависимости между двумя переменными в ней практически не встречаются.

Существует множество вариантов факторных планов, но на практике применя­ются далеко не все. Чаще всего используются факторные планы для двух незави­симых переменных и двух уровней типа 2х2. Для составления плана применяет­ся принцип балансировки. План 2х2 используется для выявления эффекта воздей­ствия двух независимых переменных на одну зависимую. Экспериментатор манипу­лирует возможными сочетаниями переменных и уровней. Данные приведены в простейшей таблице (табл. 5.6).

Реже используются четыре независимые рандомизированные группы. Для обра­ботки результатов применяется дисперсионный анализ по Фишеру.

Так же редко используются другие версии факторного плана, а именно: 3х2 или 3х3. План 3х2 применяется в тех случаях, когда нужно установить вид зависимо­сти одной зависимой переменной от одной независимой, а одна из независимых переменных представлена дихотомическим параметром. Пример такого плана — эксперимент по выявлению воздействия внешнего наблюдения на успех решения интеллектуальных задач. Первая независимая переменная варьируется просто: есть наблюдатель, нет наблюдателя. Вторая независимая переменная — уровни трудно­сти задачи. В этом случае мы получаем план 3х2 (табл. 5.7).

Вариант плана 3х3 применяется в том случае, если обе независимые перемен­ные имеют несколько уровней и есть возможность выявить виды связи зависимой переменной от независимых. Этот план позволяет выявлять влияние подкрепления на успешность выполнения задании разной трудности (табл. 5.8).

Таблица 5.6

2-я переменная

1-я переменная

Есть

Нет

Есть

1

2

Нет

3

4

 

Таблица 5.7

1-я переменная

2-я переменная

Легкая

Средняя

Трудная

Есть наблюдатель

1

2

3

Нет наблюдателя

4

5

6

 

Таблица 5.8

Уровень сложности задачи

Интенсивность стимуляции

Низкая

Средняя

Высокая

Низкий

1

2

3

Средний

4

5

6

Высокий

7

8

9

 

В общем случае план для двух независимых переменных выглядит как N х М. Применимость таких планов ограничивается только необходимостью набора боль­шого числа рандомизированных групп. Объем экспериментальной работы чрезмер­но возрастает с добавлением каждого уровня любой независимой переменной.

Планы, используемые для исследования влияния более двух независимых пере­менных, применяются редко. Для трех переменных они имеют общий вид L х М х N.

Чаще всего применяются планы 2х2х2: «три независимые переменные — два уровня». Очевидно, добавление каждой новой переменной увеличивает число групп. Общее их число 2, где п — число переменных в случае двух уровней интенсивности и К — в случае К-уровневой интенсивности (считаем, что число уровней одинаково для всех независимых переменных). Примером этого плана может быть развитие предыдущего. В случае, когда нас интересует успешность выполнения эксперимен­тальной серии заданий, зависящая не только от общей стимуляции, которая произ­водится в форме наказания — удара током, но и от соотношения поощрения и нака­зания, мы применяем план 3х3х3.

Таблица 5.9

 

 

L1

L2

L3

М1

A1

В2

С3

М2

В2

С3

А1

м3

С3

А1

В2

 

Упрощением полного плана с тремя независимыми переменными вида L х М х N является планирование по методу «латинского квадрата». «Латинский квадрат» применяют тогда, когда нужно исследовать одновременное влияние трех перемен­ных, имеющих два уровня или более. Принцип «латинского квадрата» состоит в том, что два уровня разных переменных встречаются в экспериментальном плане только один раз. Тем самым процедура значительно упрощается, не говоря о том, что экспе­риментатор избавляется от необходимости работать с огромными выборками.

Предположим, что у нас есть три независимые переменные, с тремя уровнями каждая:

1. L1,L2,L3

2. М1,М2,М3

3. А, В, С

План по методу «латинского квадрата» представлен в табл. 5.9.

Такой же прием используется для контроля внешних переменных (контрбалан­сировка). Нетрудно заметить, что уровни третьей переменной N (А, В, С,) встреча­ются в каждой строке и в каждой колонке по одному разу. Комбинируя результаты по строкам, столбцам и уровням, можно выявить влияние каждой из независимых переменных на зависимую, а также степень попарного взаимодействия переменных.

«Латинский квадрат» позволяет значительно сократить число групп. В частно­сти, план 2х2х2 превращается в простую таблицу (табл. 5.10).

Применение латинских букв в клеточках для обозначения уровней 3-й перемен­ной (А — есть, В — нет) традиционно, поэтому метод назван «латинский квадрат».

Более сложный план по методу «греко-латинского квадрата» применяется очень редко. С его помощью можно исследовать влияние на зависимую переменную четырех независимых. Суть его в следующем: к каждой латинской группе плана с тремя переменными присоединяется греческая буква, обозначающая уровни четвер­той переменной.

Рассмотрим пример. У нас четыре переменные, каждая из которых имеет три уровня интенсивности. План по методу «греко-латинского квадрата» примет такой вид (табл. 5.11).

Для обработки данных применяется метод дисперсионного анализа по Фишеру. Методы «латинского» и «греко-латинского» квадрата пришли в психологию из агро­биологии, но большого распространения не получили. Исключением являются не­которые эксперименты в психофизике и психологии восприятия.

Главная проблема, которую удается решить в факторном эксперименте и невоз­можно решить, применяя несколько обычных экспериментов с одной независимой переменной, — определение взаимодействия двух переменных.

Таблица 5.10

2-я переменная

1-я переменная

Есть

Нет

Есть

А

В

Нет

В

А

 

Таблица 5.11

 

 

L1

L2

L3

М1

Аa

Вb

Сg

М2

Вb

Сg

Аa

М3

Сg

Аa

Вb

 

Рассмотрим возможные результаты простейшего факторного эксперимента 2х2 с позиций взаимодействий переменных. Для этого нам надо представить результаты опытов на графике, где по оси абсцисс отложены значения первой независимой пе­ременной, а по оси ординат — значения зависимой переменной. Каждая из двух пря­мых, соединяющих значения зависимой переменной при разных значениях первой независимой переменной (А), характеризует один из уровней второй независимой переменной (В). Применим для простоты результаты не экспериментального, а кор­реляционного исследования. Условимся, что мы исследовали зависимость статуса ребенка в группе от состояния его здоровья и уровня интеллекта. Рассмотрим вари­анты возможных отношений между переменными.

Первый вариант: прямые параллельны — взаимодействия переменных нет (рис. 5.1).

Больные дети имеют более низкий статус, чем здоровые, независимо от уровня интеллекта. Интеллектуалы имеют всегда более высокий статус (независимо от здо­ровья).

Второй вариант: физическое здоровье при наличии высокого уровня интеллекта увели­чивает шанс получить более высокий статус в группе(рис 5.2).

В этом случае получен эффект расходяще­гося взаимодействия двух независимых пере­менных. Вторая переменная усиливает влия­ние первой на зависимую переменную.

Третий вариант: сходящееся взаимо­действие — физическое здоровье уменьшает шанс интеллектуала приобрести более высо­кий статус в группе. Переменная «здоровье» уменьшает влияние переменной «интеллект» на зависимую переменную. Есть и другие случаи этого варианта взаимодействия:

переменные взаимодействуют так, что увеличение значения первой приводит к уменьшению влияния второй с изменением знака зависимости (рис. 5.3).

У больных детей, обладающих высоким уровнем интеллекта, меньше шанс полу­чить высокий статус, чем у больных детей с низким интеллектом, а у здоровых — связь интеллекта и статуса позитивная.

Теоретически возможно представить, что больные дети будут иметь больший шанс получить высокий статус при высоком уровне интеллекта, чем их здоровые низкоинтеллектуальные сверстники.

Последний, четвертый, возможный вариант наблюдаемых в исследованиях отно­шений между независимыми переменными: случай, когда между ними существует пересекающееся взаимодействие, представленное на последнем графике (рис. 5.4).

Итак, возможны следующие взаимодействия переменных: нулевое; расходя­щееся (с различными знаками зависимости); пересекающееся.

Оценка величины взаимодействия проводится с помощью дисперсионного ана­лиза, а t-критерий Стьюдента используется для оценки значимости различий груп­повых `X. 

Во всех рассмотренных вариантах планирования эксперимента применяется спо­соб балансировки: различные группы испытуемых ставятся в разные эксперимен­тальные условия. Процедура уравнивания состава групп позволяет производить сравнение результатов.

Однако во многих случаях требуется планировать эксперимент так, чтобы все его участники получили все варианты воздей­ствия независимых переменных. Тогда на по­мощь приходит техника контрбалансировки.

Планы, в которых воплощается стратегия «все испытуемые — все воздействия», Мак-Колл [McCall W. А., 1923] называет ротацион­ными экспериментами, а Кэмпбелл — «сба­лансированными планами». Чтобы не было путаницы между понятиями «балансировка» и «контрбалансировка», будем использовать термин «ротационный план».

Ротационные планы строятся по методу «латинского квадрата», но, в отличие от рассмотренного выше примера, по строкам обозначены группы испытуемых, а не уровни переменной, по столбцам — уровни воздействия первой независимой пере­менной (или переменных), в клеточках таблицы — уровни воздействия второй не­зависимой переменной.

Пример экспериментального плана для 3 групп (А, B, С) и 2 независимых пере­менных (X,Y) с 3 уровнями интенсивности (1-й, 2-й, 3-й) приводим ниже. Нетрудно заметить, что этот план можно переписать и так, чтобы в клеточках сто­яли уровни переменной Y (табл. 5.12).

Кэмпбелл включает этот план в число квазиэкспериментальных на основании того, что неизвестно, контролируется ли с его помощью внешняя валидность. Дей­ствительно, вряд ли в реальной жизни испытуемый может получить серию таких воздействий,как в эксперименте.

Что касается взаимодействия состава групп с другими внешними переменными, источниками артефактов, то рандомизация групп, согласно утверждению Кэмпбелла, должна минимизировать влияние этого фактора.

Суммы по столбцам в ротационном плане свидетельствуют о различиях в уровне эффекта при разных значениях одной независимой переменной (X или Y), а суммы по строкам должны характеризовать различия между группами. Если группы рандомизированы удачно, то межгрупповых различий быть не должно. Если же состав группы является дополнительной переменной, возникает возможность ее проконт­ролировать. Схема контрбалансировки не позволяет избежать эффекта тренировки, хотя данные многочисленных экспериментов с применением «латинского квад­рата» не позволяют делать такой вывод.

Таблица 5.12

Группа

Уровни 1-й переменной

X1

X2

X3

А

Y1

Y2

Y3

В

Y2

Y3

Y1

С

Y3

Y1

Y2

 

Подводя итог рассмотрению различных вариантов экспериментальных планов, предлагаем их классификацию. Экспериментальные планы различаются по таким основаниям:

1. Число независимых переменных: одна или больше. В зависимости от их числа применяется либо простой, либо факторный план.

2. Число уровней независимых переменных: при 2 уровнях речь идет об установле­нии качественной связи, при 3 и более — количественной связи.

3. Кто получает воздействие. Если применяется схема «каждой группе — своя ком­бинация», то речь идет о межгрупповом плане. Если же применяется схема «все группы — все воздействия», то речь идет о ротационном плане. Готтсданкер на­зывает его кросс-индивидуальным сравнением.

Схема планирования эксперимента может быть гомогенной или гетерогенной (в зависимости от того, равно или не равно число независимых переменных числу уровней их изменения).

5.1.4 Планы экспериментов для одного испытуемого

Эксперименты на выборках с контролем переменных — ситуация, которую широкого стали использовать в психологии с 1910-1920-х гг. Особое рас­пространение экспериментальные исследования на уравненных группах получили после создания выдающимся биологом и математиком Р. А. Фишером теории пла­нирования экспериментов и обработки их результатов (дисперсионный и ковариа­ционный анализы). Но психологи применяли эксперимент задолго до появления тео­рии планирования исследования выборок. Первые экспериментальные исследова­ния проводились с участием одного испытуемого — им являлся сам эксперимента­тор либо его ассистент. Начиная с Г. Фехнера (1860), в психологию пришла техника экспериментирования для проверки теоретических количественных гипотез.

Классическим экспериментальным исследованием одного испытуемого стала ра­бота Г. Эббингауза, которая была проведена в 1913 г. Эббингауз исследовал явле­ние забывания с помощью заучивания бессмысленных слогов (изобретенных им же). Он заучивал серию слогов, а затем пытался их воспроизвести через определенное время. В итоге была получена классическая кривая забывания: зависимость объема сохраненного материала от времени, прошедшего с момента заучивания (рис. 5.5).

В эмпирической научной психологии взаимодействуют и борются три исследо­вательские парадигмы. Представители одной из них, традиционно идущей от есте­ственнонаучного эксперимента, считают единственно достоверным знанием только то, которое добывается в экспериментах на эквивалентных и репрезентативных вы­борках. Основной аргумент сторонников этой позиции — необходимость контроля внешних переменных и нивелирования индивидуальных различий для нахождения общих закономерностей.

Представители методологии «экспериментального анализа поведения» критику­ют сторонников статистического анализа и планирования экспериментов на выбор­ках. По их мнению, нужно проводить исследования с участием одного испытуемого и с применением определенных стратегий, которые позволят в ходе эксперимента редуцировать источ­ники артефактов. Сторонниками этой методологии являются такие известные исследователи, как Б. Ф. Скиннер, Г. А. Мюррейидр.

Наконец, классическое идиографическое исследование проти­вопоставляется как эксперимен­там с участием одного испытуемо­го, так и планам, изучающим пове­дение в репрезентативных выбор­ках. Идиографическое исследова­ние предусматривает изучение индивидуальных случаев: биогра­фий или особенностей поведения отдельных людей. Примером являются замеча­тельные работы Лурии «Потерянный и возвращенный мир» и «Маленькая книжка о большой памяти».

Во многих случаях исследования, проводимые с участием одного испытуемого, являются единственно возможным вариантом. Методология исследования одного испытуемого разрабатывалась в 1970—1980-е гг. многими авторами: А. Кезданом, Т. Кратохвиллом, Б. Ф. Скиннером, Ф.-Дж. МакГиганом и др.

В ходе эксперимента выявляются два источника артефактов: а) ошибки в страте­гии планирования и в проведении исследования; б) индивидуальные различия.

Если создать «правильную» стратегию проведения эксперимента с одним испы­туемым, то вся проблема сведется лишь к учету индивидуальных различий. Экспе­римент с одним испытуемым возможен тогда, когда: а) индивидуальными различия­ми можно пренебречь в отношении переменных, изучаемых в эксперименте, все ис­пытуемые признаются эквивалентными, поэтому возможен перенос данных на каждого члена популяции; б) испытуемый уникален, и проблема прямого переноса данных неактуальна.

Стратегия экспериментирования с одним испытуемым разработана Скиннером для исследования процесса обучения. Данные в ходе исследования представляются в форме «кривых обучения» в системе координат «время» — «общее число ответов» (кумулятивная кривая). Кривая обучения первоначально анализируется визуально; рассматриваются ее изменения во времени. Если функция, описывающая кривую, изменяется при изменении воздействия А на В, то это может свидетельствовать о наличии причинной зависимости поведения от внешних воздействий (А или В).

Исследование по схеме «один испытуемый» (single-subject research) называется также планированием временных серий. Основным показателем влияния независи­мой переменной на зависимую при реализации такого плана является изменение характера ответов испытуемого от воздействия на него изменения условий экспери­мента во времени. Существует ряд основных схем применения этой парадигмы. Про­стейшая стратегия — схема А—В. Испытуемый первоначально выполняет деятель­ность в условиях А, а затем — в условиях В (см. рис. 5.8).

При использовании этого плана возникает закономерный вопрос: а сохранила бы кривая ответов прежний вид, если бы не было воздействия? Проще говоря, эта схема не контролирует эффект плацебо. Кроме того, неясно, что привело к эффекту: может быть, воздействие оказала не переменная В, а какая-либо иная переменная, не учтенная в эксперименте.

Поэтому чаще применяется другая схема: А—В—А. Первоначально регистриру­ется поведение испытуемого в условиях А, затем условия изменяются (В), а на тре­тьем этапе происходит возвращение прежних условий (А). Изучается изменение функциональной связи между независимой и зависимой переменными. Если при из­менении условий на третьем этапе восстанавливается прежний вид функциональ­ной зависимости между зависимой и зависимой переменными, то независимая пе­ременная считается причиной, которая может модифицировать поведение испытуе­мого (рис. 5.9).

Однако и первый, и второй варианты планирования временных серий не позво­ляют учесть фактор кумуляции воздействий. Возможно, к эффекту приводит соче­тание — последовательность условий (А и В). Неочевидно и то, что после возврата к ситуации В кривая примет тот же вид, каким он был при первом предъявлении условий В.

Примером плана, который дважды воспроизводит один и тот же эксперименталь­ный эффект, является схема А—В—А—В. Если при 2-м переходе от условий А к условиям В будет воспроизведено изменение функциональной зависимости отве­тов испытуемого от времени, то это станет доказательством экспериментальной ги­потезы: независимая переменная (А, В) влияет на поведение испытуемого.

Рассмотрим простейший случай. В качестве зависимой переменной выберем об­щий объем знаний студента. В качестве независимой — занятия физкультурой по утрам (например, гимнастикой у-шу). Предположим, что комплекс у-шу благопри­ятно влияет на общее психическое состояние студента и способствует лучшему за­поминанию (рис. 5.10).

Очевидно, что занятие гимнастикой благоприятно отразилось на обучаемости.

Существуют различные варианты планирования по методу временных серий. Различают схемы регулярного чередования серий (АВ-АВ), серии стохастических последовательностей и схемы позиционного уравнивания (пример: АВВА). Моди­фикациями схемы А—В—А—В являются схема А—В—А—В—А или более дли­тельная: А— В— А— В— А— В— А.

Применение более «длинных» временных планов увеличивает гарантию обнару­жения эффекта, но приводит к утомлению испытуемого и другим кумулятивным эф­фектам.

Кроме того, план А—В—А—В и его различные модификации не снимают три важ­нейшие проблемы:

1. Что было бы с испытуемым, если бы никакого воздействия не было (эффект плацебо)?

2. Не является ли последовательность воздействий А—В сама по себе еще одним воздействием (побочной переменной)?

3. Какая причина привела к эффекту: если на месте В не было бы воздействия, по­вторился бы эффект?

Для контроля эффекта плацебо в серию А—В—А—В включают условия, «имити­рующие» либо воздействие А, либо воздействие В. Рассмотрим решение последней проблемы. Но сначала проанализируем такой случай: допустим, студент постоянно занимается у-шу. Но периодически на стадионе или в спортивном зале появляется симпатичная девушка (просто зритель) — воздействие В. План А— В— А— В выявил повышение эффективности учебных занятий студента в периоды появления пере­менной В. Что является причиной: присутствие зрителя как такового или конкретной симпатичной девушки? Для проверки гипотезы о наличии конкретной причины эксперимент строится по следующей схеме: А—В—А—С—А. Например, в четвер­тый временной период на стадион приходит другая девушка или скучающий пенсио­нер. Если эффективность занятий значительно снизится (не та мотивация), то это будет свидетельствовать о конкретной причине ухудшения обучаемости. Возможен и вариант проверки воздействия условия А (занятия у-шу без зрителей). Для этого надо применить план А—В—С—В. Пусть студент какое-то время в отсутствие де­вушки прекратит занятия. Если же повторное появление ее на стадионе приведет к тому же эффекту, что и в первый раз, то причина повышения успеваемости — в ней, а не только в занятиях у-шу (рис. 5.11).

Прошу не принимать пример всерьез. В действительности происходит как раз все наоборот: увлечение девушками резко снижает успеваемость студентов.

Существует множество приемов проведения исследований с участием одного ис­пытуемого. Примером развития плана А—В является «план альтернативных воздей­ствий». Воздействия А и В рандомизированно распределяются во времени, напри­мер по дням недели, если речь идет о разных способах избавления от курения. Затем определяются все моменты, когда было воздействие А; строится кривая, соединяю­щая соответствующие последовательные точки. Выделяются все моменты времени, когда было «альтернативное» воздействие В, и в порядке следования во времени также соединяются; строится вторая кривая. Затем сравниваются обе кривые и вы­является, какое воздействие более эффективно. Эффективность определяется по величине роста или падения кривой (рис. 5.12).

Синонимами термина «план альтернативных воздействий» являются: «план срав­нения серий», «план синхронизированных воздействий», «план множественных рас­писаний» и т.д.

Другой вариант — реверсивный план. Он применяется для исследования двух альтернативных форм поведения. Первоначально регистрируется базовый уровень проявления обеих форм поведения. Первое поведение может актуализироваться с помощью специфического воздействия, а второе, несовместимое с ним, провоциру­ется одновременно другим типом воздействия. Эффект двух воздействий оценива­ется. Через определенное время сочетание воздействий реверсируется так, что пер­вая форма поведения получает воздействие, которое инициировало вторую форму поведения, а вторая — воздействие, релевантное первой форме поведения. Такой план используется, например, при исследовании поведения маленьких детей (рис.5.13).

В психологии обучения применяют метод смены критериев, или «план возраста­ния критериев». Суть его состоит в том, что регистрируется изменение поведения испытуемого в ответ на прирост (фазы) воздействия. Увеличение регистрируемого параметра поведения фиксируется, и следующее воздействие осуществляется лишь после выхода испытуемого на заданный уровень критерия. После стабилизации уровня исполнения испытуемому предъявляют следующую градацию воздействия. Кривая успешного эксперимента (подтверждающего гипотезу) напоминает сбитую каблуками лестницу, где начало ступени совпадает с началом уровня воздействия, а конец ее — с выходом испытуемого на очередной критерий.

Способом, позволяющим нивелировать «эффект последовательности», является инверсия последовательности воздействий — план А—В—В—А. Эффекты последо­вательности связаны с влиянием предшествующего воздействия на последующее (иное название — эффекты порядка, или эффекты переноса). Перенос может быть положительным или отрицательным, симметричным или асимметричным. Последо­вательность А—В—В—А называется позиционно уравненной схемой. Как отмечает Готтсданкер, воздействие переменных А и В обусловлено эффектами раннего или позднего переноса. Воздействие А связано с поздним переносом, а В — с ранним. Кроме того, если присутствует кумулятивный эффект, то два идущих подряд воз­действия В могут влиять на субъекта как единое суммарное воздействие. Экспери­мент может быть удачным лишь в том случае, если эти эффекты незначительны. Рассмотренные выше варианты планов с регулярным чередованием или со случай­ными последовательностями чаще всего очень длинны, поэтому их трудно реали­зовать.

Если подвести краткий итог, можно сказать, что схемы предъявления воздей­ствия применяются в зависимости от возможностей, которые есть у эксперимен­татора.

Случайная последовательность воздействий получается путем рандомизации за­даний. Ее применяют в экспериментах, требующих большого числа проб. Случай­ное чередование воздействий гарантирует от проявления эффектов последователь­ности.

При малом числе проб рекомендуется схема регулярного чередования типа А— В—А—В. Следует обратить внимание на периодичность фоновых воздействий, ко­торые могут совпадать с действием независимой переменной. Например, если да­вать один тест на интеллект утром, а второй — всегда вечером, то под влиянием утомления эффективность выполнения второго теста будет понижаться.

Позиционно уравненная последовательность может быть пригодна лишь тогда, когда число воздействий (заданий) мало и влияние раннего и позднего переноса не­существенно.

Но ни одна из схем не исключает проявления дифференцированного асиммет­ричного переноса, когда влияние предшествующего воздействия А на эффект от воз­действия В больше, чем влияние предшествующего воздействия В на эффект от воз­действия А (или же наоборот).

Разнообразные варианты планов для одного испытуемого обобщили Д. Барлоу и М. Херсен в монографии «Экспериментальные планы для единичных случаев» (Single case experimental designs, 1984)(табл. 5.13).

Таблица 5.13

Основные артефакты в исследовании на одном испытуемом практически не­устранимы. Трудно представить, как можно устранить эффекты, связанные с нео­братимостью событий. Если эффекты порядка или взаимодействия переменных в какой-то мере поддаются контролю, то уже упомянутый эффект асимметричности (дифференцированного переноса) неустраним.

Не меньше проблем возникает и при установлении изначального уровня интен­сивности регистрируемого поведения (уровня зависимой переменной). Исходный уровень агрессивности, который мы зарегистрировали у ребенка в лабораторном эк­сперименте, может быть нетипичным для него, поскольку вызван недавними пред­шествующими событиями, например ссорой в семье, подавлением его активности сверстниками или воспитателями в детском саду.

Главная же проблема — возможности переноса результатов исследования одно­го испытуемого на каждого из представителей популяции. Речь идет об учете значи­мых для исследования индивидуальных различий. Теоретически возможен следую­щий ход: представление индивидуальных данных в «безразмерном» виде; при этом индивидуальные значения параметра нормируются на величину, равную разбросу значений в популяции.

Рассмотрим пример. В начале 1960-х гг. в лаборатории Б. Н. Теплова возникла проблема: почему все графики, описывающие изменения времени реакции в зависи­мости от интенсивности раздражителя, у испытуемых различны В. Д. Небылицын [Небылицын В. Д., 1966] предложил предъявлять испытуемым сигнал, который из­меняется не в единицах физической интенсивности, а в единицах предварительно измеренного индивидуального абсолютного порога («один порог», «два порога» и т.д.). Результаты эксперимента блестяще подтвердили гипотезу Небылицына: кривые зависимости времени реакции от уровня воздействия, измеренного в едини­цах индивидуального абсолютного порога, оказались идентичными у всех испы­туемых.

Аналогичная схема применяется и при интерпретации данных. В Институте пси­хологии РАН А. В. Дрынков проводил исследования процесса формирования про­стых искусственных понятий. Кривые научения показывали зависимость успешнос­ти от времени. Они оказались различными у всех испытуемых: описывались степен­ными функциями. Дрынков предположил, что нормировка индивидуальных показателей на величину начального уровня обученности (по оси Y) и на индивиду­альное время достижения критерия (по оси X) позволяет получить функциональ­ную зависимость успешности от времени, одинаковую для всех испытуемых. Это подтвердилось: показатели изменения индивидуальных результатов испытуемых, представленные в «безразмерном» виде, подчинялись степенному квадратному за­кону.

Следовательно, выявление общей закономерности путем нивелирования инди­видуальных различий решается каждый раз на основе содержательной гипотезы о влиянии дополнительной переменной на интериндивидуальную вариацию резуль­татов эксперимента.

Остановимся еще раз на одной особенности экспериментов с участием одного испытуемого. Результаты этих экспериментов очень зависят от предубеждений экспериментатора и отношении, которые складываются между ним и испытуемым. При проведении длительной серии последовательных воздействии эксперимента­тор может неосознанно или осознанно действовать так, чтобы у испытуемого актуа­лизировалось поведение, подтверждающее экспериментальную гипотезу. Вот поче­му в подобного рода исследованиях рекомендуют применять «слепые опыты» и «двойной слепой опыт». При первом варианте экспериментатор знает, а испытуе­мый не знает, когда последний получает плацебо, а когда — воздействие. «Двойной слепой опыт» состоит в том, что эксперимент проводит исследователь, незнакомый с гипотезой и не знающий, когда испытуемый получает плацебо или воздействие.

Эксперименты с участием одного испытуемого играют важную роль в психофи­зиологии, психофизике, психологии научения, когнитивной психологии. Методоло­гия таких экспериментов проникла в психологию программированного обучения и социального управления, в клиническую психологию, особенно — в поведенческую терапию, главным пропагандистом которой выступает Айзенк[Айзенк Г. Ю., 1999].