Оперантное поведение это: Оперантное поведение | это… Что такое Оперантное поведение?

Содержание

Оперантное поведение и оперантное обуславливание. Свойства оперантного обуславливания

Оперантное поведение — это активные действия, акции, которые направлены на достижение желаемой цели.

Реагируя (при выполнении условного рефлекса), животное играет пассивную роль: хозяин дал команду — собака сделала. Активное начало поведения — у человека. В оперантном поведении, наоборот, источник активности — животное: собака совершает действие для того, чтобы ее поощрилиПринято рассматривать любое движение живого существа как реакцию. Это слово заимствовано из исследований, посвященных изучению рефлексов. Оно означает действие, которое наступает в ответ на предшествующее событие — стимул. Но мы можем сделать событие зависимым от поведения без определения предшествующего стимула. Мы не изменяем среду обитания голубя для того, чтобы вызвать поднятие головы. Вероятно, нельзя показать, что любой простой стимул неизменно предшествует этому движению. Такое поведение может оказаться под контролем стимулов, но при этом отсутствуют отношения по типу «одно порождает другое», поэтому термин «реакция» не вполне адекватен, но он настолько укоренился, что далее мы будем его использовать. Конечно, нельзя предсказать и проконтролировать реакцию, которая уже произошла. Можно только предсказать, что похожие реакции будут наблюдаться в будущем. Поэтому единицей науки о прогнозировании является не реакция, а класс реакций. Для его описания будет использоваться слово «оперантный». Данный термин показывает, что поведение «воздействует» (operates) на среду, генерируя последствия. Следствия определяют свойства, по которым устанавливается сходство реакций. Он будет использоваться и как прилагательное (оперантное поведение), и как существительное, обозначающее поведение, определенное данным следствием. Поднятие голубем головы один раз в определенный момент является реакцией. Это прошлое и его можно рассматривать со всех точек зрения, которые представляют для нас интерес.

Поведение, называемое «поднятием головы», которое происходит независимо от определенных обстоятельств (instances), является оперантным. Рефлексы, как условные, так и всякие другие, главным образом связаны с внутренними физиологическими процессами в организме. Однако чаще всего нас интересует такое поведение, которое имеет определенное воздействие на окружающий мир. Оно возникает в результате столкновения человека с необходимостью решать задачи, выдвигаемые жизнью. Кроме того, его специфические характеристики также представляют интерес для теории. Последствия поведения могут играть роль обратной связи для организма. В этом случае они изменяют вероятность осуществления поведения, породившего их. В английском языке много слов, имеющих отношение к данному эффекту, например «поощрение» и «наказание», но ясное представление о нем мы можем получить только в результате проведения эксперимента.

Теория инструментального или оперантного обусловливания связана с именами Э.Торндайка (E. L. Thorndike) и Б.Скиннера (B.F. Skinner).

Оперантное обусловливание — форма научения, сама по себе имеющая разные формы. В оперантном обусловливании подкрепляется то спонтанное поведение, которое признается желательным.

Обусловливать (в соответствии с нормами русского языка допускаются обе формы — и обусловливать, и обуславливать) — подкреплять поведение теми или иными УСЛОВИЯМИ окружения.

Типа «это не я тебя награждаю или наказываю, а жизнь такая».

«Оперантное» — от слова «операция» (имеющее последствие воздействие на среду). В этом методе подкрепляют не реакции, а акции, свободные и спонтанные действия, где есть авторство.

Оперантное обусловливание — это процесс, посредством которого характеристики реакции детерминируются последствиями этой реакции.

Виды оперантного обусловливания

Оперантное обусловливание имеет две основные формы: инструментальное научение и творческое научение.

В инструментальном научении подкрепляется просто случайное поведение, нужное нам или находящееся на пути к нужному нам. Подкрепление производится в простейшей форме, методом наград и наказаний (вариант — методом элементарного положительного и отрицательного подкрепления), и научение происходит за счет примитивных форм нервной деятельности, без включения разума.

В творческом научении подкрепляется в первую очередь включение разума, поисковой творческой активности в нужном направлении, для чего используются сложные и творческие методы подкрепления, существенно отличающиеся от простого метода наград и наказаний.

Приучение

Оперантное обусловливание — основа приучения, которое происходит через повторение с позитивным подкреплением. Чтобы приучать к чему-либо более эффективно, полезно знать следующие правила: образец или четкая инструкция, смысл или неотвратимость, легкое начало, позитивный фон, экологичная система подкреплений, методичность.

В 1898 г. Э. Л. Торндайком была предпринята одна из первых серьезных попыток изучить изменения, обусловливаемые последствиями поведения. Его эксперименты возникли на основе дискуссии, которая впоследствии заинтересовала многих ученых. Ч. Дарвин, настаивавший на преемственности видов, подверг сомнению уникальность человека и его способность думать. В печати распространилось большое количество анекдотов, в которых говорилось о проявлении животными «силы разума». Но распространение особенностей, ранее характеризующих только поведение человека на поведение животных, привело к постановке новых вопросов. Указывали ли наблюдаемые факты на психические процессы или эти очевидные проявления мышления могут быть объяснены иначе? В конце концов отпала необходимость в представлении о внутренних мыслительных процессах. Должно было пройти много лет, прежде чем тот самый вопрос о специфичности поведения человека не возник вновь, но эксперименты Торндайка и его» объяснение мышления (reasoning) животных явились важным шагом в этом направлении.

Кривые научения показывают, как различные виды поведения, порождаемые в сложных ситуациях, отбираются, закрепляются и реорганизуются. Базисный: процесс запечатления отдельного акта осуществляет это изменение, но в самом изменении он прямо не отражен.

Количественные свойства по Скиннеру

Совсем не просто получить кривую научения. Мы не можем полностью изолировать оперант и устранить все случайные помехи. Можно было бы построить кривую и показать, как частота поднятия головы на определенную высоту изменяется в зависимости от времени или количества подкреплений, но дело в том, что общий эффект больше. Происходит смещение в более крупной схеме поведения, и для того чтобы его полностью описать, необходимо проследить все движения головой. Даже в этом случае мы не исчерпаем всей проблемы. Высота поднятия головы была выбрана произвольно, и эффект подкрепления зависит от нее. Если подкрепить высоту, которая достигается редко, изменение в схеме будет гораздо больше, чем в случае, когда выбирается высота, на которую голубь обычно поднимает голову.

Для адекватного объяснения необходимо получить набор кривых, описывающих все случаи. Если заставить голубя поднимать голову все выше и выше, появляется еще один произвольный элемент, так как можно использовать различные графики подкрепления. Каждый график дает свою кривую, и картину можно считать исчерпывающей, только если будут использованы все графики подкрепления.

Мы не можем обойти эти проблемы, выбрав реакцию, которая более строго определяется свойствами среды, например открытие двери. Определенный механический индикатор поведения, разумеется, предпочтительнее, поскольку, например, он позволяет организовать постоянное представление подкрепления. Можно регистрировать высоту поднятия голубем головы с помощью фотоэлемента, но легче выбрать такую реакцию, которая производит изменение в среде и которую легче регистрировать. Если птица научается нажимать на небольшой рычаг, находящийся на стене экспериментального ящика, можно сконструировать рычаг таким образом, чтобы он замыкал электрическую цепь, что позволит предъявлять поднос с пищей и регистрировать реакции.

Думается, что такая реакция отличается от реакции поднятия головы тем, что она имеет характеристику «все или ничего». Но ниже будет видно, что «реакция», которая не так произвольна, как реакция поднятия головы, не определяется механическими свойствами движения «нажатия на рычаг».

Нет необходимости иметь совершенное экспериментальное устройство для того, чтобы получить важные количественные данные об оперантном обусловливании. Мы уже можем оценивать много факторов. Важность обратной связи ясна. Организм можно стимулировать последствием его поведения, если имеет место обусловливание. Например, при обучении шевелить ушами необходимо знать, когда уши двигаются, если мы хотим подкреплять двигательные реакции. При переучивании больного пользоваться частично парализованной конечностью можно с помощью специальных приспособлений или другого человека усиливать обратную связь при слабых движениях. Глухонемой научается говорить, только если он получает обратную связь о . своем поведении, что можно сравнить со стимуляцией, которую он получает от других говорящих людей.

Одной из функций педагога является обеспечение произвольных (иногда ложных) последствий с целью получения обратной связи. Обусловливание также зависит от вида, количества и момента предъявления подкрепления, а также от многих других факторов.

Отдельное подкрепление может иметь значительный эффект.

При благоприятных условиях один какой-нибудь резкий шаг может привести к увеличению частоты появления реакции в дальнейшем. В обычных случаях такое значительное увеличение наблюдается уже после одного подкрепления, и дальнейший дополнительный прирост величины продолжается по мере предъявления последующих подкреплений. Это наблюдение ни в коей мере нельзя объяснить мгновенным изменением в сторону максимальной вероятности, поскольку не выделен оперант в чистом виде. Увеличение частоты можно интерпретировать с точки зрения других поведенческих характеристик ситуации. Тот факт, что обусловливание организма может быть быстрым у животных такого «низкого уровня развития», как крысы и голуби, приводит к интересным выводам.

Различия в том, что обычно называют интеллектом, до некоторой степени объясняются различиями в скорости научения. Но не может существовать более быстрого научения, чем мгновенное увеличение вероятности реакции. Следовательно, специфичность человеческого поведения определяется какими-то другими факторами.

.

Оперантное обусловливание

3.02.2012

Теория инструментального, или оперантного обусловливания связана с именами Э. Л. Торндайка (Е. L. Thorndike) и Б. Ф. Скиннера (В. Е Skinner). Скиннер и Торндайк — виднейшие представители бихевиоризма — показали, что воздействие окружающей среды определяет поведение человека. Они рассматривают в качестве главного фактора формирования человеческого поведения культуру, содержание которой выражается в определенном наборе комплексов подкреплений. С их помощью можно создавать и модифицировать человеческое поведение в нужном направлении. На таком понимании основаны методы модификации поведения, использующиеся не только в психотерапевтической практике, но и, например, при воспитательных воздействиях.

Термины «инструментальное научение» и «оперантное обусловливание» означают, что реакция организма, которая формируется по методу проб и ошибок, является инструментом для получения поощрения и предполагает оперирование средой, то есть поведение есть функция его последствий.

Согласно принципу оперантного обусловливания, поведение контролируется его результатом и последствиями. Модификация поведения осуществляется за счет влияния на его результаты и последствия. В соответствии со схемой оперантного обусловливания экспериментатор, наблюдая поведение, фиксирует случайные проявления желательной, «правильной», реакции и сразу же подкрепляет ее. Таким образом, стимул следует после поведенческой реакции, используется прямое подкрепление через поощрение и наказание. Результатом подобного научения является оперантное научение, или оперант. В этом случае подкрепляется не стимул, а реакция организма, именно она вызывает подкрепляющий стимул, поэтому такое научение обозначается как научение типа R. Оперантное, или инструментальное, поведение (поведение типа R) — это поведение, вызванное подкреплением, следующим за поведением. Скиннер, подчеркивая различия между респондентным и оперантным поведением, указывает, что респондентное поведение вызвано стимулом, предшествующим поведению, а оперантное поведение — стимулом, следующим за поведением. Иными словами, в классическом обусловливании стимул предшествует поведенческой реакции, а в оперантном — следует за ней.

Необходимо обратить внимание на соотношение таких понятий, как позитивное и негативное подкрепление и наказание, различать наказание и негативное подкрепление. Позитивное или негативное подкрепление усиливает поведение, наказание — ослабляет. Позитивное подкрепление основано на предъявлении стимулов (наград), которые усиливают поведенческую реакцию. Негативное подкрепление заключается в усилении поведения за счет удаления негативных стимулов. То есть всякое подкрепление (и позитивное, и негативное) усиливает частоту реакции и поведение, наказание же, напротив, уменьшает частоту реакции, ослабляет поведение. (Например, позитивное подкрепление: животное находит выход из лабиринта и получает пищу; негативное подкрепление: животное находит выход из лабиринта, где действует электрический ток, и ток выключают; наказание: животное в лабиринте упирается в тупик, и ток включают. Таким образом, первые два вида воздействия экспериментатора усиливают реакцию, поскольку являются подкреплением, а третий — уменьшает, являясь наказанием.)

Для различения стимула классического условного рефлекса и стимула оперантного условного рефлекса Скиннер предложил обозначать первый как Sd (дискриминантный стимул), а второй — как Sr (респондентный стимул). Дискриминантный стимул по времени предшествует определенной поведенческой реакции, респондентами стимул, подкрепляющий определенную поведенческую реакцию, следует за ней.

Итак, сравнительные характеристики классического и оперантного обусловливания:
Классическое обусловливание S—R. Научение типа S. Классическая парадигма Павлова. Реакция возникает только в ответ на воздействие какого-либо стимула. Стимул предшествует реакции. Подкрепление связано со стимулом. Респондентное поведение — поведение, вызванное определенным стимулом, ему предшествующим.

Оперантное обусловливание R—S. Научение типа R. Оперантная парадигма Скиннера. Желательная реакция может появиться спонтанно. Стимул следует за поведенческой реакцией. Подкрепление связано с реакцией. Оперантное поведение — поведение, вызванное подкреплением, за ним следующим.

Ключевые слова: Научение

Источник: Соловьева С.Л., Психотерапия

Материалы по теме

Представление о нейрофизиологических механизмах научения

Виды научения

Творогова Н.Д., Общая и социальная психология

Психологические и биологические теории научения

. ..

Научение и память

Крылов А.А., Психология

Системная психофизиология научения. Проблема элементов индивидуального опыта

Сущность понятий «усвоение», «учение», «научение», «учебная деятельность»

Мандель Б.Р., Педагогическая психология

Теория научения

Проблемы мотивации в психологии научения и активации

Общая психология: учебник / Л А. Вайнштейн, В А. Поликарпов, И.А. Фурманов. — Минск: Соврем…

Что такое оперантное поведение и как его изучать

Перейти к основному содержанию Поведение и анатомия Оперант

Для ссылки на эту статью

Что такое оперантное поведение и как его изучать, Инженеры лабиринта (2022).
doi.org/10.55157/ME2022127

Оперантное поведение описывает тип произвольных целенаправленных действий у животных, основанных на последствиях предыдущих событий. Он развивается, когда животные учатся конкретно реагировать на повторяющиеся ситуации, основываясь на результатах своего прошлого опыта.
Американский психолог Б. Ф. Скиннер первым использовал оперант для описания поведения, которое он наблюдал в своих знаковых экспериментах на лабораторных животных. Оперантное поведение и обусловленность уточняют нюансы между сознательными и бессознательными поведенческими реакциями, которые влияют на психологию и прикладной анализ поведения, и улучшают наше понимание зависимости, зависимости от психоактивных веществ, развития ребенка и принятия решений.

  • Что такое оперантное поведение?
  • История оперантного поведения
  • Оперантное поведение и оперантное обусловливание
  • Как изучать оперантное поведение
  • Выводы
  • Список литературы

Что такое оперантное поведение?

Животные, включая людей, могут развивать новые наборы действий в ответ на события или раздражители. Поведение может развиваться в результате процессов обучения, когда животные связывают два или более инцидента после того, как они неоднократно происходили одновременно.

Оперантное поведение — тип научаемого поведения, при котором животные связывают конкретное событие или стимул с его последствием и добровольно меняют свое поведение. Ассоциация возникает после того, как животные неоднократно сталкивались с одним и тем же исходом действия, что выражается в изменении склонности животных к выполнению определенного действия.

Другими словами, оперантное поведение возникает как адаптивная стратегия после осознания последствий конкретного действия. Животные учатся изменять свое поведение, чтобы достичь благоприятных результатов или избежать нежелательных последствий, которым они научились из прошлого опыта.

Например, дрессировщики могут научить животное сидеть, показав ему лакомство перед тем, как дать ему физический (жест «сидеть») или словесный (команда «сидеть») сигнал. Как только животные садятся, дрессировщики дают им лакомства. Когда упражнение повторяется несколько раз, животных приучают сидеть, когда они видят жест или слышат команду, потому что они связывают ее с желаемым последствием.[1-2]  

Грызун узнаёт, что нажатие на рычаг приводит к удару током после повторного выполнения одного и того же действия.

Вы ищете оперантные устройства для своих исследований?

История изучения оперантного поведения

Слово оперант впервые было введено американским психологом и бихевиористом Б. Ф. Скиннером в конце 1930-х годов. Идея была построена на законе эффекта , который описывает, как некоторые виды поведения усваиваются и проявляются у животных.

Закон эффекта Торндайка показывает, как животные учатся на своих действиях 

Закон эффекта был предложен американским психологом Эдвардом Торндайком в 1898 году. Он был основан на его эксперименте с коробкой-головоломкой, который продемонстрировал, как животные усваивают новые задачи.

В эксперименте Торндайка с головоломкой кошек по отдельности помещали в коробку-головоломку, откуда они могли выбраться, выполняя такие действия, как нажатие на рычаг или дергая за веревку. После того, как его поместили внутрь, кошку убедили сбежать из коробки еда снаружи.

Когда кошка впервые оказалась в ловушке в коробке, она смутилась и смогла выполнить задание на авария. После нескольких испытаний кошка стала менее неуравновешенной, а время, необходимое для выполнения задачи побега, сократилось, что привело Торндайка к выдвижению идеи о том, что животные могут повторять поведение, приводящее к полезным последствиям, но с меньшей вероятностью повторяют поведение, которое привело к нежелательным последствиям.[1,3]

В экспериментах Скиннера кошки научились нажимать на рычаги, чтобы выбраться из клеток.

Знаменитые эксперименты Скиннера демонстрируют, как можно обучать поведению 

Идея о том, что последствия могут влиять на поведенческие реакции, была продемонстрирована в знаковых экспериментах Скиннера с животными в оперантной камере, также называемой ящиком Скиннера .

Скиннер по отдельности помещал животных, таких как крысы и голуби, в камеру, где они могли взаимодействовать с прижимным рычагом (или клюющим диском для голубей). Взаимодействие может привести к раздаче пищи внутри камеры или удалению шумов или света.

В своих экспериментах Скиннер первым сформировал животное в клетке, чтобы оно нажимало на рычаг, раздавая пищу каждый раз, когда животное приближалось к рычагу. Как только животное научилось выполнять целевое поведение (нажимать на рычаг), регистрировали частоту, с которой животное нажимало на рычаг, когда оно подвергалось различным последствиям. Впоследствии он обнаружил, что животное было склонно нажимать на рычаг, когда действие приводило к полезным последствиям, таким как еда в дозаторе или удаление шума из камеры, чем когда это приводило к нежелательным последствиям, таким как тревожный шум. [1,2]. ]

Оперантное поведение и оперантное обусловливание

Поведение, наблюдаемое в экспериментах Торндайка и Скиннера, резко контрастировало с поведением респондентов , отраженным в эксперименте Павлова с собаками.

В частности, животные в экспериментах Торндайка и Скиннера проявляли свои поведенческие реакции сознательно . Они учатся на прошлых последствиях в подобных ситуациях и сознательно ведут себя, чтобы удовлетворить свои потребности. Другими словами, животные могут контролировать свои действия, в отличие от собаки в павловской «девятке».0034 классическое обусловливание эксперимент.[1,3] 

Оперантное обусловливание достигается путем подкрепления или наказания

Оперантное поведение может формироваться и модулироваться с помощью оперантного обусловливания , которое награждает животных следствием определенного поведения. Награда, поощряющая целевое поведение, называется подкреплением ; тогда как награда, препятствующая этому, называется наказанием.  

Усиление может быть положительным , когда благоприятные стимулы, такие как пища, доставляются животным вскоре после того, как они выполняют желаемое поведение. Они могут быть отрицательными , когда неприятные стимулы, такие как громкий шум, удаляются после того, как животные демонстрируют желаемое поведение.

В том же духе наказание может быть положительным , когда аверсивные стимулы даются животным после того, как они проявляют нежелательное поведение. Это может быть отрицательное , когда желаемые стимулы исчезают вскоре после того, как животные проявляют нежелательное поведение.

График подкрепления — это инструмент оперантного обусловливания

Оперантное поведение обратимо и требует графика подкрепления , чтобы оно не исчезло. Иными словами, как только приобрел , оперантное поведение должно время от времени подкрепляться или наказываться, чтобы животные сохраняли целевое поведение. В противном случае животное перестанет демонстрировать целевое поведение даже при наличии того же триггера, подкрепления или наказания.

График подкрепления — это узнаваемый образец того, как применяются подкрепления и/или наказания , который учит связи между поведением и его последствиями. [1-2] 

Его можно составить следующим образом: Расписание, основанное на времени

Этот протокол основан на времени между стимуляцией вербальной или физической подсказки перед введением подкрепления животному. Это самый популярный тип графика подкрепления, в котором делается упор на временном контроле оперантного поведения с использованием стимула в качестве маркера времени для связанного поведения.

График подкрепления на основе времени может быть разработан как:
  • Фиксированный интервал (FI) или внутреннее подкрепление   графики подкрепления на основе времени, предоставление подкреплений и/или наказаний в предсказуемое время после запуска и целевого поведения.

Дрессировка животных — классический пример графика подкрепления FI. Считается, что это самая простая форма, но наиболее подверженная исчезновению.[1,4]  

  • Переменный интервал: также известен как 9.0034 пробное время до подкрепления или пиковые процедуры , где время между получением стимула и подкреплением или наказанием является переменным. [1]

Оба подхода могут быть объединены в процедуре пикового интервала (PI) . Здесь животные подвергаются графику FI, чтобы построить связь между отметкой времени, целевым поведением и наградой. После этого награда удерживается до введения фиксированной задержки для маркера времени, целевого поведения и его последствий. Этот тип расписания обычно используется для изучения внутреннего времени и ожидания вознаграждения.

График соотношений

График соотношений использует количество ответов в качестве маркера для предоставления поощрений или наказаний, которые могут быть организованы как фиксированные или переменные.

В расписании с фиксированным соотношением четко определено количество раз, когда животные выполняют целевое поведение, прежде чем им будет назначено последствие. Например, продавец должен достичь ожидаемого количества продаж, прежде чем будет начислен бонус за продажу.

В расписании с переменным соотношением вознаграждение дается за целевое поведение после неопределенного количества показов. Другими словами, животные учатся ассоциировать целевое поведение с вознаграждением, но не знают, как часто они должны выполнять задание, прежде чем вознаграждение будет реализовано. Этот тип графика подкрепления считается наиболее конструктивным и наименее подверженным угасанию.[1]

Хорошей иллюстрацией схемы с переменным коэффициентом являются азартные игры. Игроки знают о вознаграждении, связанном с этой деятельностью, хотя они не знают, сколько раз им нужно сделать ставку, прежде чем они получат вознаграждение.[1]

Как изучать оперантное поведение

Изучение оперантного поведения можно проводить с помощью оперантных камер. Животных помещают в камеру, где они подвергаются подкреплению, наказанию и другим соответствующим стимулам. Основная идея состоит в том, чтобы манипулировать поведением животного в неволе с помощью протокола тестирования, который воплощает в себе график подкрепления, специально разработанный для решения определенного поведения или рассматриваемого вопроса. [5]

Особенности операционных камер

В основном оперативные камеры обычно состоят из:

  • Пластиковой коробки , в которой находится животное во время испытания и в которой есть поощрения, наказания и соответствующие стимулы.

Как правило, пластиковый бокс должен быть достаточно большим, чтобы в нем могли разместиться животные, и чтобы его можно было ежедневно обслуживать, например удалять фекалии, без необходимости выносить животное из бокса. Внутренняя часть бокса должна иметь достаточную освещенность в течение дня, чтобы у животного мог быть установлен цикл день/ночь.

В большинстве камер, если не во всех, есть кормушка и управляемый дозатор корма на одной стороне стены, который может быть оснащен записывающей головкой для автоматической записи количества подходов животного к кормушке. В некоторых камерах помимо кормушки и дозатора могут быть лампочки, динамик или электрические провода. Эти компоненты являются поощрителями или карателями, в зависимости от протокола тестирования.

Кроме того, пластиковый бокс должен быть изготовлен из звуконепроницаемого материала, чтобы только звук, который стимулирует содержащееся в неволе животное, был преднамеренным и не исходил из окружающей среды за пределами камеры.

  • Оперативники — это компоненты внутри камеры, которые формируются в неволе и обучены манипулировать ими. Взаимодействие с такими оперантами, как тычок носом, нажатие на рычаг, струну и клюющий диск, приводит к определенному последствию, которое продиктовано протоколом тестирования.

В настоящее время операнты связаны с датчиками, которые реализуют график подкрепления и автоматически фиксируют поведение содержащегося в неволе животного.

  • Программное обеспечение контролирует оперативные камеры в соответствии с выбранным протоколом. Часто сопровождает аппаратную (оперантную камеру). В большинстве случаев программное обеспечение также предоставляет один или несколько стандартных протоколов, совместимых с соответствующей камерой (камерами). Некоторые могут позволить пользователям настраивать график подкрепления.
  • В настоящее время многие программы позволяют управлять одним или несколькими наборами операционных камер. Эта возможность позволяет исследователям проводить несколько исследований параллельно или проводить разные протоколы одновременно, экономя общее время, необходимое для исследования.

Примеры модифицированных операционных камер и протоколов

Современные стандартные операционные камеры смоделированы по образцу оригинального ящика Скиннера с дополнительным автоматическим сбором данных и регулируемыми условиями, включая дополнительные утыкания носа и рычаги, которые усложняют задачу. Модификации позволяют изучать изменение стратегии и обратное обучение в дополнение к когнитивным навыкам и навыкам обучения.

Большинство современных камер модифицируются, чтобы приспособиться к протоколам, разработанным для определенных условий.

Например, 

  • Палата самоуправления специально предназначена для расследования зависимостей, зависимости от психоактивных веществ и оперантного обусловливания. Камера имеет ударный пол и систему шприцев в дополнение к компонентам стандартных оперативных камер.
  • Понижающий аппарат для избегания содержит приподнятую вибрирующую платформу в центре камеры. Он предназначен для экспериментов по тестированию аверсивной памяти и контекстуального обучения.

В заключение

Оперантное поведение и обусловливание помогают нам понять, почему и как определенное поведение проявляется у животных и людей. В частности, они обеспечивают основу для понимания того, как прошлый опыт может повлиять на процесс принятия решений и превратить определенное поведение в привычки или склонности. Они также являются отправной точкой для нейробиологических исследований, изучающих, как определенные действия или химические вещества влияют на мозг и влияют на когнитивные способности. Чтобы глубже погрузиться в эти темы, ознакомьтесь с нашими статьями о положительном подкреплении с использованием оперантного обусловливания, отрицательном подкреплении с использованием оперантного обусловливания, положительном наказании с использованием оперантного обусловливания, препаратах, которые блокируют оперантное обусловливание, и усилении оперантного обусловливания с помощью наркотиков.

Экспериментально оперантное поведение и обусловливание можно оценить с помощью оперантных камер, которые были модифицированы для протоколов, посвященных конкретным вопросам или состояниям. Если вы ищете универсальную оперантную камеру для исследований поведенческой адаптации и когнитивной нейробиологии, ознакомьтесь с нашими стандартными комплектами оперантных камер с настраиваемыми условиями выталкивания носа, рычага и экспозиции!

Ссылки

  1. Spielman, R.M., Dumper, K., Jenkins, W., и др. «Глава 6.3 Оперантное обусловливание» Психология , OpenStax, 2014, https://openstax.org/books/psychology/pages/6-3-operant-conditioning
  2. Стаддон, Дж.Э.Р. и Черутти, Д. Т. «Оперантное обусловливание» Annual Review in Psychology , 2003: 54(1), стр. 115-144
  3. Шанс, П. «Коробки-головоломки Торндайка и истоки экспериментального анализа поведения» Journal of the Experimental Analysis of Behavior , 1999: 72, стр. 433-440
  4. Балджи, Ф. и Фристоун, Д. «Процедура интервального пика у грызунов: инструмент для изучения нейробиологической основы временного интервала и его изменений в моделях заболеваний человека» Биопротокол , 2020: 10(17): e3735 
  5. Росси, М. и Инь, Х. Х. «Методы изучения привычного поведения у мышей» Текущий протокол в неврологии, 2012
Закрыть меню

Имя

Электронная почта

Учреждение

Чем мы можем быть полезны?

25 Примеры оперантного обусловливания в повседневной жизни

Что такое оперантное обусловливание

Оперантное обусловливание, также известное как инструментальное обусловливание, является типом ассоциативного обучения. При оперантном обусловливании за поведением следуют поощрения или наказания в качестве последствий. Когда поведение неоднократно сочетается с последствием, формируется ассоциация для создания нового поведения.

Напр. дрессировщик дает своей собаке лакомство каждый раз, когда собака поднимает левую лапу. Собака узнает, что поднятие левой лапы может принести ей пищевое вознаграждение. Он будет снова и снова поднимать лапу, чтобы получить больше лакомства.

Классическое обусловливание как основа бихевиоризма

Мы можем проследить происхождение оперантного обусловливания до его предшественника, классического обусловливания.

Классическое обусловливание, также известное как обусловливание по Павлову, также включает обучение новому поведению посредством процесса ассоциации. ​2​  

Русский физиолог Иван Павлов впервые экспериментировал с классическим обусловливанием в конце 1800-х годов. Он заметил, что у его собак выделялась слюна всякий раз, когда он входил в комнату, чтобы их покормить.

В своем эксперименте по оперантному обусловливанию Павлов звонил в колокольчик каждый раз, когда кормил своих собак. Со временем собаки научились выделять слюну, когда слышали звук колокольчика, даже когда еды не было.

Пища, способная вызвать естественное слюноотделение, является безусловным раздражителем. Звук колокольчика, который начинал вызывать слюноотделение после приема пищи, был условным раздражителем.

Когда безусловный раздражитель (еда) и условный раздражитель (звук) ассоциировались, условный раздражитель мог вызвать одинаковую реакцию. Эта недавно выученная реакция стала условной реакцией. Это форма обучения через ассоциации.

Павловское обусловливание стало основой бихевиоризма, ведущей области психологии того времени. Бихевиористы считают, что поведение — это реакция на внешние стимулы, и люди учатся только через ассоциации, а не через мысли, чувства или внутренние психические события.

Закон эффекта и оперантное обусловливание

Позже психолог Эдвард Торндайк выдвинул концепцию инструментального обусловливания , когда он наблюдал влияние подкрепления в экспериментах с коробкой-головоломкой с кошками, пытающимися сбежать. Он назвал этот процесс обучением методом проб и ошибок.

Торндайк предложил Закон Эффекта 3 , который гласил, что если при наличии стимула за реакцией следует удовлетворяющее событие (подкрепление), то связь между стимулом и реакцией усиливается. И наоборот, если за ответным стимулирующим событием следовало неудовлетворяющее событие (каратель), связь ослаблялась.

В начале 1900-х годов психолог-бихевиорист Б. Ф. Скиннер, также известный как отец оперантного обусловливания, опираясь на концепции подкрепления и наказания, создал теорию оперантного обусловливания (теория подкрепления).

Скиннер считал, что павловское обусловливание слишком просто, чтобы полностью объяснить сложное человеческое поведение. Он считал, что лучший способ понять оперантное поведение — это наблюдать его причины и последствия ​1​ .

В парадигме оперантного обусловливания Скиннера наблюдаемым поведением можно манипулировать, если за ним следует подкрепление или наказание.

Для изучения оперантного обусловливания Б. Ф. Скиннер изготовил камеру, названную Ящиком Скиннера , и поместил внутрь небольшое животное. В экспериментах с оперантным обусловливанием каждый раз, когда животное нажимало на рычаг или планку, оно получало пищу или воду в качестве подкрепления 4 .

В отличие от классического обусловливания, которое включает бессознательное рефлекторное поведение, оперантное поведение — это поведение, находящееся под сознательным контролем.

Основной целью оперантного обусловливания является поощрение желательного поведения с помощью вознаграждения и уменьшение нежелательного поведения с помощью наказания. Применение подкрепления и наказания создает преднамеренный и сознательный процесс оперантного обучения.

4 типа оперантного обусловливания

Четыре типа оперантного обусловливания: положительное подкрепление, отрицательное подкрепление, положительное наказание и отрицательное наказание.

Поощрение усиливает целевое поведение, а наказание снижает его.

С помощью своих экспериментов Скиннер выделил два типа последствий, которые могут повлиять на новое обучение: подкрепление и наказание.

Подкрепление

Существует два типа подкрепления – положительное подкрепление и отрицательное подкрепление.

В психологии под позитивом понимается добавление стимула, а под негативным — удаление.

Положительное подкрепление  добавляет вознаграждающее последствие в качестве положительного подкрепления к поведению, тем самым усиливая или увеличивая вероятность того, что желаемое поведение появится снова.

Отрицательное подкрепление устраняет неприятный стимул для усиления желаемого поведения в будущем.

Наказание

Наказание противоположно поощрению. Он направлен на снижение плохого поведения.

Как и поощрение, наказание бывает двух видов: позитивное и негативное.

Положительное наказание добавляет неприятный стимул для ослабления или устранения поведения. Позитивное наказание — это обычно то, что мы называем «наказанием» в повседневной жизни.

Негативное наказание удаляет приятный стимул, чтобы остановить нежелательное поведение.

Примеры оперантного обусловливания в повседневной жизни

Вот примеры различных типов оперантного обусловливания.

Пример положительного подкрепления

  • Родитель дает ребенку дополнительное пособие (поощрение) за мытье посуды (желаемое поведение)
  • Менеджер предлагает бонусы (подкрепление) своим работникам за своевременное завершение проекта (желаемое поведение).
  • Учитель дает ученикам золотые звездочки (поощрение) за то, что они поднимают руки перед тем, как говорить (хорошее поведение).
  • Вы получаете аплодисменты публики (подкрепление) после игры на пианино (разыскиваемое поведение) на сольном концерте.
  • Маленькие дети гладят собаку по голове (поощрение), когда она спокойно сидит перед ними (желаемое поведение).
  • Игроки получают денежное вознаграждение (поощрение) за непрерывную игру в игровые автоматы (поощрение поведения).

Пример отрицательного подкрепления

  • Ребенку не нужно убирать со стола (неприятное событие) после еды, если он съел свой овощ (желаемое поведение.)
  • Вынос мусора (желаемое поведение) устраняет гнилой запах (неприятный стимул) на кухне.
  • Чистка зубов (желаемое поведение) предотвращает кариес (неприятное событие)
  • На рабочих не будут кричать (неприятный стимул), если они придут на работу вовремя (желаемое поведение).
  • Подросток убирает свою комнату (желаемое поведение), чтобы его телефон не отобрали (неприятное событие.)
  • Аккуратно убирать игрушки (желаемое поведение), и родитель не будет их выбрасывать (неприятное событие.)

Пример положительного наказания

  • Родитель поручает ребенку дополнительные обязанности (неприятные последствия) за то, что он слишком много играет в видеоигры (плохое поведение).
  • Учитель дает учащемуся дополнительную домашнюю работу (аверсивный стимул) за шум в классе (нежелательное поведение).
  • Родители шлепают детей (неприятный раздражитель) за пропуск занятий (нежелательное поведение).
  • Ребенка ругают (неприятное событие) за игнорирование домашнего задания (нежелательное поведение.)
  • Родитель дает ребенку тайм-аут (неприятное последствие) за истерику (нежелательное поведение).
  • Полиция выписывает водителю штраф (неприятный стимул) за превышение скорости (нежелательное поведение).

Пример отрицательного наказания

  • Родитель отбирает телефон у ребенка (приятный стимул) за просмотр слишком большого количества видео (плохое поведение)
  • Полиция лишает водительских прав (приятный раздражитель) за безрассудное вождение (нежелательное поведение).
  • Учащиеся теряют время на перемене (приятный стимул) из-за слишком большого шума (нежелательное поведение).
  • Подросток не может пойти в торговый центр (приятный стимул) за нарушение комендантского часа (плохое поведение).
  • Мальчик теряет время, проведенное за планшетом (приятный стимул), из-за издевательств над другими в школе (нежелательное поведение).
  • Воры лишаются свободы (приятный стимул) за воровство (плохое поведение).

Использование оперантного обусловливания широко распространено. Вы можете видеть это повсюду. Его используют родители, учителя, компании и правительство.

См. также: Психология формирования

Графики подкрепления — ключевой компонент

Изменение поведения с использованием подкреплений и наказаний требует постоянного применения, чтобы оставаться эффективным. Как только подкрепление или наказание прекращаются, усвоенное поведение постепенно ослабевает и, наконец, исчезает в процессе, называемом угасанием.

Что удивительно даже для Скиннера, так это то, что частота и характер применения подкрепления могут влиять на то, насколько быстро работает подкрепление и насколько устойчивым остается обучение ​5​ .

Существует два типа графиков подкрепления: графики на основе интервалов и графики соотношений.

Графики на основе интервалов: подкреплений доставляются через определенный период. Период может быть фиксированным (график с фиксированным интервалом) или переменным (график с переменным интервалом).

Расписания на основе соотношения : подкрепление доставляется после определенного количества ответов. Количество ответов может быть фиксированным (график с фиксированным соотношением) или переменным (график с переменным соотношением).

Исследования показали, что поведение, усвоенное с помощью графиков с переменным соотношением, является наиболее устойчивым и наименее подверженным исчезновению.

Это важное открытие, потому что теперь мы можем эффективно использовать подкрепление и наказание в различных ситуациях.

при использовании вознаграждений для подкрепления желаемого поведения мы теперь знаем, что должны давать их только изредка (расписание с переменным соотношением).

Когда малыш закатывает истерику на рынке, мы теперь знаем, что ни в коем случае не должны покупать конфеты. Иногда уступая, вы сделаете так, что избавиться от привычки будет гораздо труднее.

Заключительные мысли об оперантном обусловливании

Оперантное обусловливание — это то, что мы часто видим вокруг себя. Иногда мы делаем это намеренно, но иногда нет. Признание плюсов и минусов этого типа модификации поведения может помочь нам избежать ловушек и достичь наилучших результатов.

См. также: Оперативное и классическое обусловливание


Ссылки

  1. 1.

    Staddon JER, Cerutti DT. Оперантного кондиционирования. Анну Рев Психол . Февраль 2003 г .: 115–144. doi:10.1146/annurev.psych.54.101601.145124

  2. 2.

    Staats AW, Staats CK. Установки, установленные классическим обусловливанием.

About the Author

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Related Posts