Выбор и установление связей

Проблемный ящик Скиннера

Большинство ранних исследований животных Скиннер проводил в маленькой камере для исследований, известной как проблемный ящик Скиннера. Он является прямым потомком проблемных ящиков, применявшихся Торндайком. В проблемном ящике Скиннера обычно присутствует решетчатый пол, свет, рычаг и кормушка. Он устроен таким образом, что, когда животное приводит в действие рычаг, активизируется механизм подачи корма, и в кормушке появляется небольшое количество пищи. Типичный проблемный ящик Скиннера показан на рис. 5.1.

Совокупная регистрация

Скиннер вел совокупную регистрацию поведения животного в проблемном ящике. Совокупная регистрация — совершенно иной, отличный от других, способ графического представления данных в экспериментах с научением. Время отмечается на оси X, а общее число реакций — на оси У. Кривая совокупной регистрации

Рис. 5.1. Типичный проблемный

ящик Скиннера (с разрешения Time Life Syndication)

никогда не снижается, она либо возрастает, либо остается параллельной оси X. Давайте, например, узнаем, как часто животное нажимает на рычаг. Когда совокупная регистрация представлена линией, параллельной оси X, это означает отсутствие реакции, т. е. что животное не нажимает на рычаг. Когда животное дает реакцию, нажимая на рычаг, кривая ползет немного вверх и остается на этом же уровне до следующей реакции животного. Если, например, животное нажимает на рычаг сразу же после помещения в проблемный ящик, кривая пойдет немного вверх и останется там до следующей реакции животного, в момент которой она еще немного возрастет и т. д. Если животное реагирует очень быстро, то так же резко будет возрастать и кривая. Скорость, с которой возрастает кривая, указывает на скорость реакции; резко выросшая линия говорит нам об очень быстром реагировании, а кривая, параллельная оси X, — об отсутствии реакции. Если в какой-то момент времени вы захотите узнать общее число реакций животного, вам необходимо всего лишь измерить расстояние между линией кривой и осью X, и это легко превратить в общее число реакций. Пример обобщенной записи показан на рис. 5.2.

Обусловливание реакции нажатия рычага

Обычно обусловливание реакции приведения рычага в действие включает следующие шаги.

1. Депривация. Подопытное животное помещается в режим депривации. Если подкрепляющим стимулом является пища, то животное лишается пищи на 23 часа за несколько дней до начала эксперимента или же животное получает лишь 80% своего обычного рациона. Если вода является подкрепляющим стимулом, то тогда животное лишают воды на 23 часа в течение

Основные теоретические положения 89

Рис. 5.2. Совокупная регистрация. Отметьте, что чем круче кривая, тем выше скорость реагирования. Линия, параллельная оси X, указывает на отсутствие реакции

нескольких дней до начала эксперимента. (Некоторые проблемные ящики сконструированы так, чтобы подавать животному маленькие порции еды, а некоторые — несколько капель воды.) Скиннер не говорит о том, что эти процедуры «мотивируют» животное, он даже не решается утверждать, что они производят состояние потребности. Депривация просто является совокупностью процедур, которые имеют отношение к тому, как организм проявит себя при выполнении определенной задачи.

Обучение с автокормушкой. После того как животное пробудет в режиме депривации несколько дней, его помещают в проблемный ящик. Используя внешний ручной переключатель, экспериментатор периодически приводит в действие механизм кормушки (также называемой автокормушкой), делая это тогда, когда животное не находится вблизи кормушки (иначе оно научится постоянно находиться рядом с ней). Когда механизм подачи корма приводится в действие ручным переключателем, он издает довольно громкий щелчок перед тем, как порция еды подается в кормушку. Со временем животное научается связывать щелканье механизма с появлением порции еды. В этот момент щелчок становится вторичным подкрепляющим стимулом посредством его связи с первичным подкрепляющим стимулом — пищей (мы обсудим вторичный подкрепляющий стимул в следующем разделе). Щелчок также выступает в роли подсказки или сигнала, указывающего животному на то, что, если, отреагировав, оно подойдет к кормушке, то подкрепление будет произведено.

Нажатие на рычаг. Теперь животное в проблемном ящике Скиннера можно предоставить самому себе. В конце концов оно нажмет на рычаг, приводящий в действие кормушку, звук которой подкрепляет нажатие на рычаг, а также является для животного сигналом подойти к кормушке, где оно

90 Глава 5. Бэррас Фредерик Скиннер

Время —*-

Рис. 5.3. Типичная совокупная регистрация, отражающая приобретение реакции нажатия рычага

получает подкрепление пищей. Согласно принципам оперантного обусловливания реакция нажатия рычага при подкреплении будет повторяться, и при повторении она снова получит подкрепление, что еще больше увеличит вероятность повторения реакции нажатия рычага, и т. д. Типичная совокупная регистрация, полученная в результате помещения животного в проблемный ящик Скиннера после обучения с автокормушкой, показана на рис. 5.3.

Моделирование

Процесс оперантного обусловливания, который мы описали, занимает довольно много времени. Как уже упоминалось, один из способов обучения нажатию рычага — это поместить животное в состоянии депривации в ящик Скиннера и просто оставить там. Экспериментатор должен лишь время от времени сверяться с совокупной регистрацией, чтобы увидеть, произошло ли научение этой реакции. При этих условиях животное либо научается, либо умирает.

Существует другой подход к оперантному обусловливанию, который не требует столько времени. Снова животное оказывается в режиме депривации и подвергается обучению с автокормушкой, и снова экспериментатор использует ручной переключатель, для того чтобы извне запустить механизм подачи пищи. На этот раз, однако, экспериментатор приводит в действие механизм кормушки только лишь тогда, когда животное находится на той половине проблемного ящика, где расположен рычаг. Когда животное получит подкрепление за присутствие вблизи рычага, оно будет склонно оставаться в этой части проблемного ящика. Теперь, когда животное остается неподалеку от рычага, экспериментатор дает ему подкрепление, только когда оно находится еще ближе к рычагу. Затем оно получает подкрепление только когда прикасается к рычагу, затем только когда надавливает на него и в конечном итоге — когда животное надавливает на него самостоятельно.

Эта процедура очень похожа на детскую игру «горячо — холодно», в которой один ребенок что-то прячет, а другие дети пытаются найти спрятанное. Когда они приближаются к спрятанному предмету, ребенок, спрятавший предмет, говорит: «Теплее, совсем тепло, ужасно горячо, просто пекло». Когда же они отдаляются от предмета, ребенок говорит: «Становится холодно, очень холодно, можно окоченеть». Когда в эту игру играют в лаборатории, ее называют формирование. В опи-

Основные теоретические положения 91

санной процедуре моделирования реакцию нажимания на рычаг скорее смодели-ршвали, чем ждали ее появления.

Моделирование имеет два компонента: дифференциальное подкрепление, означающее, что одни реакции подкрепляются, а другие — нет, и последователь-ное приближение, которое показывает, что подкрепляются лишь реакции, отве-чающие замыслу экспериментатора. В нашем примере только те реакции, которые последовательно приближались к реакции нажатия рычага, были дифференци-ально подкреплены. Недавно было обнаружено, что при определенных обстоятельствах ранее суще-ющие или случайные, неожиданно возникшие взаимоотношения между явле-в среде и реакцией животного автоматически формируют поведение. Этот с называется автомоделированием, и его мы обсудим далее в этой главе.

Угасание

Как и при классическом обусловливании, когда мы извлекаем подкрепляющий стимул из ситуации оперантного обусловливания, мы создаем угасание. В процессе приобретения реакции животное получает порцию еды каждый раз, когда нажимает на рычаг. При этих обстоятельствах животное научается нажимать на рычаг и продолжает это делать до тех пор, пока не насытится. Если механизм по-дачи пищи будет выведен из строя, то связь между нажатием рычага и получением пищи разомкнётся, и можно будет заметить, что кривая совокупной регистрации постепенно станет более ровной и со временем станет параллельной оси X, указывая на отсутствие реакции нажатия на рычаг. В этот момент мы скажем, что произошло угасание.

Мы будем не совсем точны, если скажем, что после угасания реакция больше не производится, более точным будет сказать, что после угасания данные по реакция становятся такими же, как были до введения подкрепления. Уровень базовой линии графика показывает частоту, с которой реакция естественно появляется в жизни животного без привлечения подкрепления. Это называется оперантным уровнем этой реакции. Если мы извлечем подкрепление из экспериментальной ситуации, как в случае угасания, то реакция может вернуться к своему оперантному уровню.

Спонтанное восстановление

Если после угасания животное на какое-то время вернется обратно в свою клетку, а затем снова попадет в экспериментальную ситуацию, то через некоторое время оно снова начнет нажимать на рычаг без какого-либо дополнительного обучения.

Этот процесс известен как спонтанное восстановление. Совокупная регистрация,
демонстрирующая и угасание, и спонтанное восстановление, показана на рис. 5.4.

Суеверное поведение

В предыдущем обсуждении оперантного обусловливания мы кратко упомянули об условном подкреплении. Подкрепление, следующее за реакцией нажатия на рычаг, является примером условного подкрепления, так как подкрепляющий стимул зависит от реакции. Однако что бы произошло, если бы ситуация была организована таким образом, что механизм подачи пищи срабатывал бы сам по себе, независимо от поведения животного? Другими словами, мы хотим создать такую

Время —»

Рис. 5.4. Совокупная регистрация, которая изображает угасание и спонтанное восстановление реакции нажатия на рычаг

ситуацию, в которой механизм подачи корма подавал бы пищу редко, вне зависимости от того, что делает животное.

Согласно принципам оперантного обусловливания мы можем предсказать, что любое занятие животного в момент действия механизма подачи корма будет подкреплено, и животное будет склонно к повторению подкрепленного поведения. Когда механизм подачи корма будет приведен в действие, через какое-то время подкрепленное поведение вновь будет продемонстрировано, а реакция усилится. Таким образом, животное будет склонно развивать странные ритуалистические реакции: оно может качать головой, вертеться по кругу, вставать на задние лапы или же демонстрировать серию действий в соответствии с теми движениями, которое животное выполняло в момент работы механизма подачи корма. Это ритуальное поведение называют суеверным поведением, которого придерживается животное, как если бы оно верило, что его действия влияют на появление еды. Так как положительный стимул в этой ситуации является независимым по отношению к поведению животного, его называют безусловным подкреплением.

Каждый может привести множество примеров суеверного человеческого поведения. Например, много примеров этому можно найти в спорте. Представьте, что произойдет с футбольным игроком, который, после того как ступит на поле, определенным образом поправит свои гетры и станет забивать голы до самого конца матча. У него будет большая склонность поправлять свои гетры подобным образом в следующий раз, когда он окажется на поле.

<Классическое (павловское) обусловливание>

Эмпирические наблюдения Возникновение условного рефлекса

Точное значение психического, или условного, рефлекса раскрывается в следующем утверждении Павлова (Pavlov, 1955).

Я упомяну два простых эксперимента, которые успешно могут выполнить все. Мы вливаем в пасть собаки слабый раствор какой-нибудь кислоты; кислота вызывает обычную защитную реакцию у животного: оно энергичными движениями пасти избавляется от раствора, и в то же время избыток слюны начинает поступать сначала в пасть, а затем за

Эмпирические наблюдения "| 69

ее пределы, смывая кислоту и очищая слизистую оболочку ротовой полости. Теперь давайте обратимся ко второму эксперименту. Прежде чем влить тот же раствор в пасть собаки, мы неоднократно действуем на животное некоторым внешним агентом, скажем, определенным звуком. Что происходит тогда? Собаке хватает просто повторения звука, и та же самая реакция полностью воспроизводится: те же движения пасти и то же выделение слюны (р. 247).

Компоненты, необходимые для обусловливания, это: 1) безусловный стимул БС), который вызывает естественную и автоматическую реакцию организма; 2) безусловная реакция (БР), естественная и автоматическая реакция, вызываемая БС, и 3) условный стимул (УС), нейтральный стимул, не вызывающий естественной и автоматической реакции организма. Когда эти компоненты сочетаются определенным образом, имеет место условная реакция (УР). Для того чтобы произошла УР, необходимо несколько раз сочетать УС и БС. Сначала предъявляется УС, а затем БС. Порядок предъявления очень важен. Каждый раз, когда имеет место БС, происходит БР. Со временем УС может быть предъявлен один, и это вызовет реакцию, подобную БР. Когда это происходит, возникает УР. Этот процесс можно изобразить следующим образом.

Процесс обучения: УС →БС →БР

Демонстрация обусловливания: УС → УР

В примере Павлова БС служила кислота, БР было слюноотделение (вызванное кислотой), а УС служил звук. Обычно звук не вызывает у собаки выделение

юны, но в сочетании с кислотой у звука появляется способность вызывать секрецию слюны. Выделение слюны как результат слышания звука и есть УР.

Павлов считал, что БР и УР — всегда один и тот же вид реакции; если БР — слюноотделение, то и УР тоже должна быть слюноотделением. Однако УР всегда меньше по силе, чем БР. Например, Павлов измерял силу реакции, считая капли слюны. При этом он обнаружил, что при БС выделяется больше капель, чем при УС. Когда дальше в этой главе мы будем рассматривать последние исследования ло классическому обусловливанию, мы увидим, что заявление Павлова, что УР — зто уменьшенный вариант БР, признано некорректным, по крайней мере в некоторых случаях.

Экспериментальное угасание

Возникновение УР зависит от БС, и именно поэтому о БС говорят как о подкреп-тении. Очевидно, что без БС у УС никогда не появилась бы способность вызывать УР. Аналогично если постоянно предъявлять УС без следующего за ним БС с осле того, как УР уже была выработана, УР будет постепенно исчезать. Когда УС 'ольше не вызывает У Р, считается, что происходит экспериментальное угасание. Еще раз угасание происходит, когда УС предъявляется испытуемому без подкрепления. В классических учениях об обусловливании подкрепление — это БС. Термины обусловливание по Павлову и классическое обусловливание — синонимы.

Спонтанное восстановление

Если через некоторое время после угасания животному снова предъявить УС, УР снова появится на некоторое время. УР «спонтанно восстанавливается», даже ес-ти в дальнейшем больше не производится сочетание УС и БС. С другой стороны, если через какой-то период времени после угасания предъявить испытуемому

УС, то он будет вызывать УР.

Эмпирические наблюдения 171

Генерализация

Чтобы проиллюстрировать феномен генерализации, мы вернемся к основному лроцессу обусловливания. Мы будем использовать звук мощностью в 2000 Гц в качестве УС и мясной порошок в качестве БС. После множества сочетаний звук сам по себе будет вызывать выделение слюны у животного, и таким образом будет вырабатываться УР. Если цель достигнута, мы переходим к завершающей стадии эксперимента, только на этот раз предъявим животному иные звуки, чем тот, реа-лфовать на который оно было обучено. Некоторые из новых звуков будут иметь частоту выше, чем 2000 Гц, а другие — более низкую. Используя количество капель слюны как меру величины УР, мы видим, что самая большая УР появляется при предъявлении звука частотой 2000 Гц, но УР также вырабатывается под злиянием других звуков. Величина УР, вызываемой другими звуками, зависит от их сходства со звуком, на величине которого животное было обучено; в этом случае чем больше сходство со звуком частотой 2000 Гц, тем сильнее УР. Пример генерализации показан на рис. 7.4.

Звуки с частотой УС Звуки с частотой

значительно ниже 2000 Гц например, намного выше 2000 Гц

2000 Гц; звук

Рис. 7.4. Идеализированная кривая генерализации стимулов, показывающая, что

по мере того как стимулы все более и более отличаются от использованного во время

обучения в качестве УС, сила УР уменьшается

Существует связь между концепцией генерализации Павлова и объяснением переноса научения Торндайка. Поскольку между тестовыми ситуациями и ситуациями обучения есть много общего, при генерализации существует высокая вероятность появления одной и той же реакции в обоих случаях. Это утверждение

172 Глава 7. Иван Петрович Павлов

легко могло бы быть отнесено к теории переноса Торндайка, которую он назвал: теорией «идентичных элементов». Аналогично и генерализация и перенос объясняют, как мы можем получить выученную реакцию в ситуации, с которой мы I когда не сталкивались прежде. То есть мы реагируем на новую ситуацию так, как мы отреагировали бы на ситуацию, уже нам знакомую.

Важно отметить различия между распространением эффекта Торндайка и генерализацией Павлова. Распространение эффекта рассматривает влияние подкрепления на реакции, близкие к подкрепляемой, независимо от их сходства с последней. При распространении эффекта важна смежность реакций. Генерализация же описывает возрастающую способность вызывать УР стимулами, связанными со стимулами, фактически предшествовавшими подкреплению. При генерализашш важным является сходство, а не близость.

Дифференцирование

Противоположность генерализации — дифференцирование. Как мы видели ранее, генерализация определяется как склонность реагировать на множество стимулов, связанных со стимулом, который действительно использовался во время обучения. Дифференцирование, с другой стороны, определяется как склонность реагировать на очень ограниченный диапазон стимулов или только на стимул, используемый во время обучения.

Дифференцирование может быть вызвано двумя способами: длительным обучением и дифференцированным подкреплением. Сначала, если сочетать УС 1 БС много раз, склонность реагировать на связанные с УС, но не идентичные е\г} стимулы уменьшается. Другими словами, если используется минимально необходимое для развития УР число сочетаний УС и БС, то существует довольно сильная вероятность реагирования во время угасания УР на стимулы, связанные I УС, т. е. имеет место сильная генерализация. Однако если продлить обучен склонность к проявлению реакции на стимулы, связанные с УС во время угасания, уменьшается. Таким образом, есть возможность управлять генерализацией контролируя продолжительность обучения: чем дольше обучение, тем меньше генерализация.

Второй путь возникновения дифференцирования лежит через дифференцированное подкрепление. Этот процесс в вышеупомянутом примере включает в сем? предъявление звука частотой 2000 Гц наряду со множеством других звуков, которые встречаются в течение угасания. Только звук частотой 2000 Гц сопровождается подкреплением. После такого обучения, когда животному в течение угасания УР предъявляются звуки другой частоты, оно на них не реагирует. Таким образом, можно проиллюстрировать дифференцирование. Попытка Павлова дать физиологическое объяснение генерализации и дифференцирования будет рассмотрена ниже.

Отношения между условным и безусловным стимулами

Необходимо упомянуть о двух общих соображениях касательно классической: обусловливания. Во-первых, по-видимому, существует некий интервал времен? между предъявлением УС и БС, оптимальный для того, чтобы обусловливание произошло наиболее быстро. Многие исследователи обнаружили, что если предъявить УС на полсекунды раньше БС, обусловливание проходит наиболее эффек-

Теоретические объяснения обусловливания 173

тивно. Самая стандартная методика заключается в предъявлении и поддержании УС до предъявления БС. Если время между этими двумя событиями больше или меньше 0,5 с, обусловливание произвести сложнее. Однако это объяснение нужно считать упрощенным, потому что оптимальный для обусловливания интервал между началом УС и началом БС зависит от многих факторов, и это — предмет множества исследований. Например, когда позднее в этой главе будут рассматри-ваться исследования по вкусовой аверсии, мы увидим, что явление классического бусловливания имеет место даже тогда, когда перерыв между УС и БС составляет несколько часов. К тому же, как уже отмечалось в этой главе, существуют условия,, при которых УС предшествует БС на оптимальный интервал времени, и все же никакого обусловливания не происходит.

Второй вопрос связан с первым. При использовании традиционных классических методик обусловливания обычно оказывалось, что обусловливание чрезвы-чайно трудно, если вообще возможно, произвести, если УС появляется после предъявления БС. Это явление определяется как обратное обусловливание. Од-но из объяснений редкого появления обратного обусловливания заключается в том, что до того, как оно произойдет, УС уже должен нести информацию для испытуемого. Очевидно, УС, который появляется уже после предъявления БС, не может использоваться организмом для предсказания появления БС.

Это справедливо не только в ситуации обратного обусловливания, но также и три избыточных или ненадежных УС. Доказательства этой точки зрения предоставлены Эггером и Миллером (Egger & Miller, 1962,1963), которые обнаружили, что: 1) если два сигнала надежно предсказывают БС, предъявляемый первым станет условным, а второй, который является избыточным, — нет; 2) если два сигнала предшествуют БС, но один из них всегда сопровождается БС, а второй — толь-го иногда, более надежный сигнал становится условным в большей степени, чем ненадежный. Очевидно, стимулы, появляющиеся после БС, или избыточные, или ненадежно связанные с БС стимулы не могут использоваться испытуемым, чтобы предсказать появление первичного подкрепления; то есть они не представляют никакой информативной ценности. В итоге Эггер и Миллер сделали вывод, что, для того чтобы классическое обусловливание имело место, организм должен быть в состоянии использовать УС для предсказания характера подкрепления. 06-щий вывод Эггера и Миллера до сих пор всеми принимается, но последние ис-

следования классического обусловливания неизбежно влекут за собой изменение мнений как об обратном обусловливании, так и об условиях, при которых УС информативен. Позже в этой главе мы обсудим известное исследование, которое показывает, что УС, предъявляемые после БС, так же информативны, как и УС, предъявляемые до БС, и поэтому обратное обусловливание не только возможно, но и при определенных условиях так же легко производится, как и прямое обусловливание.
1 86 Глава 7. Иван Петрович Павлов

<предыдущая страница | следующая страница>