Flatik.ru

Перейти на главную страницу

Поиск по ключевым словам:

страница 1страница 2страница 3страница 4

Проблемный ящик Скиннера

Большинство ранних исследований животных Скиннер проводил в маленькой камере для исследований, известной как проблемный ящик Скиннера. Он являет­ся прямым потомком проблемных ящиков, применявшихся Торндайком. В про­блемном ящике Скиннера обычно присутствует решетчатый пол, свет, рычаг и кор­мушка. Он устроен таким образом, что, когда животное приводит в действие ры­чаг, активизируется механизм подачи корма, и в кормушке появляется небольшое количество пищи. Типичный проблемный ящик Скиннера показан на рис. 5.1.



Совокупная регистрация

Скиннер вел совокупную регистрацию поведения животного в проблемном ящи­ке. Совокупная регистрация — совершенно иной, отличный от других, способ гра­фического представления данных в экспериментах с научением. Время отмечает­ся на оси X, а общее число реакций — на оси У. Кривая совокупной регистрации





Рис. 5.1. Типичный проблемный

ящик Скиннера (с разрешения Time Life Syndication)



никогда не снижается, она либо возрастает, либо остается параллельной оси X. Давайте, например, узнаем, как часто животное нажимает на рычаг. Когда совокупная регистрация представлена ли­нией, параллельной оси X, это означает отсутст­вие реакции, т. е. что животное не нажимает на рычаг. Когда животное дает реакцию, нажимая на рычаг, кривая ползет немного вверх и остается на этом же уровне до следующей реакции животно­го. Если, например, животное нажимает на рычаг сразу же после помещения в проблемный ящик, кривая пойдет немного вверх и останется там до следующей реакции животного, в момент которой она еще немного возрастет и т. д. Если животное реагирует очень быстро, то так же резко будет воз­растать и кривая. Скорость, с которой возраста­ет кривая, указывает на скорость реакции; резко выросшая линия говорит нам об очень быстром реагировании, а кривая, параллельная оси X, — об отсутствии реакции. Если в какой-то момент вре­мени вы захотите узнать общее число реакций животного, вам необходимо всего лишь измерить расстояние между линией кривой и осью X, и это легко превра­тить в общее число реакций. Пример обобщенной записи показан на рис. 5.2.

Обусловливание реакции нажатия рычага

Обычно обусловливание реакции приведения рычага в действие включает сле­дующие шаги.



1. Депривация. Подопытное животное помещается в режим депривации. Ес­ли подкрепляющим стимулом является пища, то животное лишается пищи на 23 часа за несколько дней до начала эксперимента или же животное по­лучает лишь 80% своего обычного рациона. Если вода является подкреп­ляющим стимулом, то тогда животное лишают воды на 23 часа в течение

Основные теоретические положения 89


Рис. 5.2. Совокупная регистрация. Отметьте, что чем круче кривая, тем выше ско­рость реагирования. Линия, параллельная оси X, указывает на отсутствие реакции

нескольких дней до начала эксперимента. (Некоторые проблемные ящики сконструированы так, чтобы подавать животному маленькие порции еды, а некоторые — несколько капель воды.) Скиннер не говорит о том, что эти процедуры «мотивируют» животное, он даже не решается утверждать, что они производят состояние потребности. Депривация просто является сово­купностью процедур, которые имеют отношение к тому, как организм про­явит себя при выполнении определенной задачи.



Обучение с автокормушкой. После того как животное пробудет в режиме депривации несколько дней, его помещают в проблемный ящик. Используя внешний ручной переключатель, экспериментатор периодически приводит в действие механизм кормушки (также называемой автокормушкой), делая это тогда, когда животное не находится вблизи кормушки (иначе оно на­учится постоянно находиться рядом с ней). Когда механизм подачи корма приводится в действие ручным переключателем, он издает довольно гром­кий щелчок перед тем, как порция еды подается в кормушку. Со временем животное научается связывать щелканье механизма с появлением порции еды. В этот момент щелчок становится вторичным подкрепляющим стиму­лом посредством его связи с первичным подкрепляющим стимулом — пи­щей (мы обсудим вторичный подкрепляющий стимул в следующем разде­ле). Щелчок также выступает в роли подсказки или сигнала, указывающего животному на то, что, если, отреагировав, оно подойдет к кормушке, то под­крепление будет произведено.

Нажатие на рычаг. Теперь животное в проблемном ящике Скиннера мож­но предоставить самому себе. В конце концов оно нажмет на рычаг, приво­дящий в действие кормушку, звук которой подкрепляет нажатие на рычаг, а также является для животного сигналом подойти к кормушке, где оно

90 Глава 5. Бэррас Фредерик Скиннер



Время —*-

Рис. 5.3. Типичная совокупная регистрация, отражающая приобретение реакции нажатия рычага

получает подкрепление пищей. Согласно принципам оперантного обуслов­ливания реакция нажатия рычага при подкреплении будет повторяться, и при повторении она снова получит подкрепление, что еще больше увеличит вероятность повторения реакции нажатия рычага, и т. д. Типичная сово­купная регистрация, полученная в результате помещения животного в про­блемный ящик Скиннера после обучения с автокормушкой, показана на рис. 5.3.



Моделирование

Процесс оперантного обусловливания, который мы описали, занимает довольно много времени. Как уже упоминалось, один из способов обучения нажатию рыча­га — это поместить животное в состоянии депривации в ящик Скиннера и просто оставить там. Экспериментатор должен лишь время от времени сверяться с сово­купной регистрацией, чтобы увидеть, произошло ли научение этой реакции. При этих условиях животное либо научается, либо умирает.

Существует другой подход к оперантному обусловливанию, который не требу­ет столько времени. Снова животное оказывается в режиме депривации и подвер­гается обучению с автокормушкой, и снова экспериментатор использует ручной переключатель, для того чтобы извне запустить механизм подачи пищи. На этот раз, однако, экспериментатор приводит в действие механизм кормушки только лишь тогда, когда животное находится на той половине проблемного ящика, где расположен рычаг. Когда животное получит подкрепление за присутствие вблизи рычага, оно будет склонно оставаться в этой части проблемного ящика. Теперь, когда животное остается неподалеку от рычага, экспериментатор дает ему подкре­пление, только когда оно находится еще ближе к рычагу. Затем оно получает под­крепление только когда прикасается к рычагу, затем только когда надавливает на него и в конечном итоге — когда животное надавливает на него самостоятельно.

Эта процедура очень похожа на детскую игру «горячо — холодно», в которой один ребенок что-то прячет, а другие дети пытаются найти спрятанное. Когда они приближаются к спрятанному предмету, ребенок, спрятавший предмет, говорит: «Теплее, совсем тепло, ужасно горячо, просто пекло». Когда же они отдаляются от предмета, ребенок говорит: «Становится холодно, очень холодно, можно окоче­неть». Когда в эту игру играют в лаборатории, ее называют формирование. В опи-

Основные теоретические положения 91

санной процедуре моделирования реакцию нажимания на рычаг скорее смодели-ршвали, чем ждали ее появления.

Моделирование имеет два компонента: дифференциальное подкрепление, означающее, что одни реакции подкрепляются, а другие — нет, и последователь-ное приближение, которое показывает, что подкрепляются лишь реакции, отве-чающие замыслу экспериментатора. В нашем примере только те реакции, которые последовательно приближались к реакции нажатия рычага, были дифференци-ально подкреплены. Недавно было обнаружено, что при определенных обстоятельствах ранее суще-ющие или случайные, неожиданно возникшие взаимоотношения между явле-в среде и реакцией животного автоматически формируют поведение. Этот с называется автомоделированием, и его мы обсудим далее в этой главе.

Угасание

Как и при классическом обусловливании, когда мы извлекаем подкрепляющий стимул из ситуации оперантного обусловливания, мы создаем угасание. В про­цессе приобретения реакции животное получает порцию еды каждый раз, когда нажимает на рычаг. При этих обстоятельствах животное научается нажимать на рычаг и продолжает это делать до тех пор, пока не насытится. Если механизм по-дачи пищи будет выведен из строя, то связь между нажатием рычага и получением пищи разомкнётся, и можно будет заметить, что кривая совокупной регистрации постепенно станет более ровной и со временем станет параллельной оси X, указывая на отсутствие реакции нажатия на рычаг. В этот момент мы скажем, что произошло угасание.

Мы будем не совсем точны, если скажем, что после угасания реакция больше не производится, более точным будет сказать, что после угасания данные по реак­ция становятся такими же, как были до введения подкрепления. Уровень базовой линии графика показывает частоту, с которой реакция естественно появляется в жизни животного без привлечения подкрепления. Это называется оперантным уровнем этой реакции. Если мы извлечем подкрепление из экспериментальной ситуации, как в случае угасания, то реакция может вернуться к своему оперантному уровню.

Спонтанное восстановление

Если после угасания животное на какое-то время вернется обратно в свою клетку, а затем снова попадет в экспериментальную ситуацию, то через некоторое время оно снова начнет нажимать на рычаг без какого-либо дополнительного обучения.

Этот процесс известен как спонтанное восстановление. Совокупная регистрация,
демонстрирующая и угасание, и спонтанное восстановление, показана на рис. 5.4.

Суеверное поведение

В предыдущем обсуждении оперантного обусловливания мы кратко упомянули об условном подкреплении. Подкрепление, следующее за реакцией нажатия на рычаг, является примером условного подкрепления, так как подкрепляющий стимул зависит от реакции. Однако что бы произошло, если бы ситуация была организована таким образом, что механизм подачи пищи срабатывал бы сам по себе, независимо от поведения животного? Другими словами, мы хотим создать такую





Время —»

Рис. 5.4. Совокупная регистрация, которая изображает угасание и спон­танное восстановление реакции нажатия на рычаг

ситуацию, в которой механизм подачи корма подавал бы пищу редко, вне зависи­мости от того, что делает животное.

Согласно принципам оперантного обусловливания мы можем предсказать, что любое занятие животного в момент действия механизма подачи корма будет под­креплено, и животное будет склонно к повторению подкрепленного поведения. Когда механизм подачи корма будет приведен в действие, через какое-то время подкрепленное поведение вновь будет продемонстрировано, а реакция усилится. Таким образом, животное будет склонно развивать странные ритуалистические реакции: оно может качать головой, вертеться по кругу, вставать на задние лапы или же демонстрировать серию действий в соответствии с теми движениями, ко­торое животное выполняло в момент работы механизма подачи корма. Это риту­альное поведение называют суеверным поведением, которого придерживается животное, как если бы оно верило, что его действия влияют на появление еды. Так как положительный стимул в этой ситуации является независимым по отно­шению к поведению животного, его называют безусловным подкреплением.

Каждый может привести множество примеров суеверного человеческого по­ведения. Например, много примеров этому можно найти в спорте. Представьте, что произойдет с футбольным игроком, который, после того как ступит на поле, определенным образом поправит свои гетры и станет забивать голы до самого конца матча. У него будет большая склонность поправлять свои гетры подобным образом в следующий раз, когда он окажется на поле.


<Классическое (павловское) обусловливание>

Эмпирические наблюдения Возникновение условного рефлекса

Точное значение психического, или условного, рефлекса раскрывается в следу­ющем утверждении Павлова (Pavlov, 1955).

Я упомяну два простых эксперимента, которые успешно могут выполнить все. Мы вли­ваем в пасть собаки слабый раствор какой-нибудь кислоты; кислота вызывает обычную защитную реакцию у животного: оно энергичными движениями пасти избавляется от раствора, и в то же время избыток слюны начинает поступать сначала в пасть, а затем за

Эмпирические наблюдения "| 69



ее пределы, смывая кислоту и очищая слизистую оболочку ротовой полости. Теперь да­вайте обратимся ко второму эксперименту. Прежде чем влить тот же раствор в пасть собаки, мы неоднократно действуем на животное некоторым внешним агентом, скажем, определенным звуком. Что происходит тогда? Собаке хватает просто повторения зву­ка, и та же самая реакция полностью воспроизводится: те же движения пасти и то же выделение слюны (р. 247).

Компоненты, необходимые для обусловливания, это: 1) безусловный стимул БС), который вызывает естественную и автоматическую реакцию организма; 2) безусловная реакция (БР), естественная и автоматическая реакция, вызыва­емая БС, и 3) условный стимул (УС), нейтральный стимул, не вызывающий естественной и автоматической реакции организма. Когда эти компоненты сочетаются определенным образом, имеет место условная реакция (УР). Для того чтобы произошла УР, необходимо несколько раз сочетать УС и БС. Сначала предъявляется УС, а затем БС. Порядок предъявления очень важен. Каждый раз, когда имеет место БС, происходит БР. Со временем УС может быть предъявлен один, и это вызовет реакцию, подобную БР. Когда это происходит, возникает УР. Этот про­цесс можно изобразить следующим образом.





Процесс обучения: УС →БС →БР

Демонстрация обусловливания: УС → УР

В примере Павлова БС служила кислота, БР было слюноотделение (вызван­ное кислотой), а УС служил звук. Обычно звук не вызывает у собаки выделение

юны, но в сочетании с кислотой у звука появляется способность вызывать сек­рецию слюны. Выделение слюны как результат слышания звука и есть УР.

Павлов считал, что БР и УР — всегда один и тот же вид реакции; если БР — слюноотделение, то и УР тоже должна быть слюноотделением. Однако УР всегда меньше по силе, чем БР. Например, Павлов измерял силу реакции, считая капли слюны. При этом он обнаружил, что при БС выделяется больше капель, чем при УС. Когда дальше в этой главе мы будем рассматривать последние исследования ло классическому обусловливанию, мы увидим, что заявление Павлова, что УР — зто уменьшенный вариант БР, признано некорректным, по крайней мере в неко­торых случаях.

Экспериментальное угасание

Возникновение УР зависит от БС, и именно поэтому о БС говорят как о подкреп-тении. Очевидно, что без БС у УС никогда не появилась бы способность вызы­вать УР. Аналогично если постоянно предъявлять УС без следующего за ним БС с осле того, как УР уже была выработана, УР будет постепенно исчезать. Когда УС 'ольше не вызывает У Р, считается, что происходит экспериментальное угасание. Еще раз угасание происходит, когда УС предъявляется испытуемому без подкре­пления. В классических учениях об обусловливании подкрепление — это БС. Термины обусловливание по Павлову и классическое обусловливание — синонимы.



Спонтанное восстановление

Если через некоторое время после угасания животному снова предъявить УС, УР снова появится на некоторое время. УР «спонтанно восстанавливается», даже ес-ти в дальнейшем больше не производится сочетание УС и БС. С другой стороны, если через какой-то период времени после угасания предъявить испытуемому

УС, то он будет вызывать УР.



Эмпирические наблюдения 171

Генерализация

Чтобы проиллюстрировать феномен генерализации, мы вернемся к основному лроцессу обусловливания. Мы будем использовать звук мощностью в 2000 Гц в качестве УС и мясной порошок в качестве БС. После множества сочетаний звук сам по себе будет вызывать выделение слюны у животного, и таким образом будет вырабатываться УР. Если цель достигнута, мы переходим к завершающей стадии эксперимента, только на этот раз предъявим животному иные звуки, чем тот, реа-лфовать на который оно было обучено. Некоторые из новых звуков будут иметь частоту выше, чем 2000 Гц, а другие — более низкую. Используя количество ка­пель слюны как меру величины УР, мы видим, что самая большая УР появляет­ся при предъявлении звука частотой 2000 Гц, но УР также вырабатывается под злиянием других звуков. Величина УР, вызываемой другими звуками, зависит от их сходства со звуком, на величине которого животное было обучено; в этом слу­чае чем больше сходство со звуком частотой 2000 Гц, тем сильнее УР. Пример ге­нерализации показан на рис. 7.4.






Звуки с частотой УС Звуки с частотой

значительно ниже 2000 Гц например, намного выше 2000 Гц

2000 Гц; звук



Рис. 7.4. Идеализированная кривая генерализации стимулов, показывающая, что

по мере того как стимулы все более и более отличаются от использованного во время

обучения в качестве УС, сила УР уменьшается



Существует связь между концепцией генерализации Павлова и объяснением переноса научения Торндайка. Поскольку между тестовыми ситуациями и ситуа­циями обучения есть много общего, при генерализации существует высокая ве­роятность появления одной и той же реакции в обоих случаях. Это утверждение

172 Глава 7. Иван Петрович Павлов

легко могло бы быть отнесено к теории переноса Торндайка, которую он назвал: теорией «идентичных элементов». Аналогично и генерализация и перенос объяс­няют, как мы можем получить выученную реакцию в ситуации, с которой мы I когда не сталкивались прежде. То есть мы реагируем на новую ситуацию так, как мы отреагировали бы на ситуацию, уже нам знакомую.

Важно отметить различия между распространением эффекта Торндайка и гене­рализацией Павлова. Распространение эффекта рассматривает влияние подкреп­ления на реакции, близкие к подкрепляемой, независимо от их сходства с послед­ней. При распространении эффекта важна смежность реакций. Генерализация же описывает возрастающую способность вызывать УР стимулами, связанными со стимулами, фактически предшествовавшими подкреплению. При генерализашш важным является сходство, а не близость.



Дифференцирование

Противоположность генерализации — дифференцирование. Как мы видели ра­нее, генерализация определяется как склонность реагировать на множество сти­мулов, связанных со стимулом, который действительно использовался во время обучения. Дифференцирование, с другой стороны, определяется как склонность реагировать на очень ограниченный диапазон стимулов или только на стимул, ис­пользуемый во время обучения.

Дифференцирование может быть вызвано двумя способами: длительным об­учением и дифференцированным подкреплением. Сначала, если сочетать УС 1 БС много раз, склонность реагировать на связанные с УС, но не идентичные е\г} стимулы уменьшается. Другими словами, если используется минимально необхо­димое для развития УР число сочетаний УС и БС, то существует довольно силь­ная вероятность реагирования во время угасания УР на стимулы, связанные I УС, т. е. имеет место сильная генерализация. Однако если продлить обучен склонность к проявлению реакции на стимулы, связанные с УС во время угаса­ния, уменьшается. Таким образом, есть возможность управлять генерализацией контролируя продолжительность обучения: чем дольше обучение, тем меньше ге­нерализация.

Второй путь возникновения дифференцирования лежит через дифференциро­ванное подкрепление. Этот процесс в вышеупомянутом примере включает в сем? предъявление звука частотой 2000 Гц наряду со множеством других звуков, кото­рые встречаются в течение угасания. Только звук частотой 2000 Гц сопровождает­ся подкреплением. После такого обучения, когда животному в течение угасания УР предъявляются звуки другой частоты, оно на них не реагирует. Таким обра­зом, можно проиллюстрировать дифференцирование. Попытка Павлова дать фи­зиологическое объяснение генерализации и дифференцирования будет рассмот­рена ниже.



Отношения между условным и безусловным стимулами

Необходимо упомянуть о двух общих соображениях касательно классической: обусловливания. Во-первых, по-видимому, существует некий интервал времен? между предъявлением УС и БС, оптимальный для того, чтобы обусловливание произошло наиболее быстро. Многие исследователи обнаружили, что если предъ­явить УС на полсекунды раньше БС, обусловливание проходит наиболее эффек-

Теоретические объяснения обусловливания 173

тивно. Самая стандартная методика заключается в предъявлении и поддержании УС до предъявления БС. Если время между этими двумя событиями больше или меньше 0,5 с, обусловливание произвести сложнее. Однако это объяснение нужно считать упрощенным, потому что оптимальный для обусловливания интервал между началом УС и началом БС зависит от многих факторов, и это — предмет множества исследований. Например, когда позднее в этой главе будут рассматри-ваться исследования по вкусовой аверсии, мы увидим, что явление классического бусловливания имеет место даже тогда, когда перерыв между УС и БС составля­ет несколько часов. К тому же, как уже отмечалось в этой главе, существуют условия,, при которых УС предшествует БС на оптимальный интервал времени, и все же никакого обусловливания не происходит.

Второй вопрос связан с первым. При использовании традиционных классиче­ских методик обусловливания обычно оказывалось, что обусловливание чрезвы-чайно трудно, если вообще возможно, произвести, если УС появляется после предъявления БС. Это явление определяется как обратное обусловливание. Од-но из объяснений редкого появления обратного обусловливания заключается в том, что до того, как оно произойдет, УС уже должен нести информацию для ис­пытуемого. Очевидно, УС, который появляется уже после предъявления БС, не может использоваться организмом для предсказания появления БС.

Это справедливо не только в ситуации обратного обусловливания, но также и три избыточных или ненадежных УС. Доказательства этой точки зрения предо­ставлены Эггером и Миллером (Egger & Miller, 1962,1963), которые обнаружили, что: 1) если два сигнала надежно предсказывают БС, предъявляемый первым ста­нет условным, а второй, который является избыточным, — нет; 2) если два сигна­ла предшествуют БС, но один из них всегда сопровождается БС, а второй — толь-го иногда, более надежный сигнал становится условным в большей степени, чем ненадежный. Очевидно, стимулы, появляющиеся после БС, или избыточные, или ненадежно связанные с БС стимулы не могут использоваться испытуемым, чтобы предсказать появление первичного подкрепления; то есть они не представляют никакой информативной ценности. В итоге Эггер и Миллер сделали вывод, что, для того чтобы классическое обусловливание имело место, организм должен быть в состоянии использовать УС для предсказания характера подкрепления. 06-щий вывод Эггера и Миллера до сих пор всеми принимается, но последние ис-

следования классического обусловливания неизбежно влекут за собой изменение мнений как об обратном обусловливании, так и об условиях, при которых УС ин­формативен. Позже в этой главе мы обсудим известное исследование, которое по­казывает, что УС, предъявляемые после БС, так же информативны, как и УС, предъявляемые до БС, и поэтому обратное обусловливание не только возможно, но и при определенных условиях так же легко производится, как и прямое обуслов­ливание.
1 86 Глава 7. Иван Петрович Павлов


<предыдущая страница | следующая страница>


Выбор и установление связей

Торндайка, но основная идея оставалась одной и той же: животное должно было произвести определенное действие, которое позволит ему покинуть ящик

705.44kb.

25 09 2014
4 стр.


Программа «Профилактика правонарушений и безнадзорности среди подростков»

Закон РФ об основах системы профилактики безнадзорности правонарушений несовершеннолетних от 24. 06. 99, №120 как девиантное поведение и детская безнадзорность, установление причин

958.79kb.

03 09 2014
6 стр.


Литература: Овчарова Р. В. «Справочная книга школьного психолога»

Домики разные: дворец (I выбор), квартира (II выбор), изба (III выбор), шалаш (IV выбор). Психолог заносит данные в таблицу, используя цифры

14.27kb.

11 10 2014
1 стр.


Внеклассное мероприятие по информатике. А проведем его в виде состязания наших участников. Если участники не справляются с заданием, то болельщики могут дать ответ

Цели: установление межпредметных связей, стимулирование познавательной деятельности учащихся, развитие интереса к предмету, воспитание внимания, расширение кругозора и развитие лог

77.61kb.

25 12 2014
1 стр.


«Установление Советской власти на Кубани. Гражданская война»

Цель урока: Показать установление Советской власти на Кубани и развитие событий, связанных с гражданской войной

29.79kb.

02 10 2014
1 стр.


Swot – это акроним слов Strengts (силы), Weaknesses (слабости), Opportunities (благоприятные возможности) и Тhreats (угрозы). Внутренняя обстановка фирмы отражается в основном в s и W, а внешняя – в о и Т

Методология swot-анализа предполагает, во-первых, выявление внутренних сильных и слабых сторон фирмы, а также внешних возможностей и угроз, и, во-вторых, установление связей между

104.51kb.

09 10 2014
1 стр.


Перечень побратимских и партнерских связей Саратовской области

Договор об установлении побратимских связей между городом Саратовом

48.47kb.

17 12 2014
1 стр.


Вопросы к экзамену Понятие объекта и предмета науки. Предмет и объект теории связей с общественностью

Подходы к пониманию категории связей с общественностью. Базовая дефиниция. Петербургская школа pr

32.08kb.

23 09 2014
1 стр.