Что такое оперантное научение? — Практическая психология на Aboutyourself.ru
Автор Evgeniy в . Опубликовано Бихевиоризм Последнее обновление: 09/12/2018
Оператное научение включает в себя систему поощрений и наказаний с целью усилить или прекратить определенный тип поведения.
Оперантное научение – это метод обучения, который происходит посредством вознаграждения и наказания за определенный тип поведения. Суть оперантного научения заключается в том, чтобы установить ассоциативную связь между поведением и следствием этого поведения.
Идея оперантного научения принадлежит бихевиористу Берресу Фредерику Скиннеру, поэтому часто этот метод обучения называют методом Скиннера. Скиннер считал, что невозможно объяснить поведение внутренними мыслями и мотивацией. Вместо этого он предложил обратить внимание на внешние причины, влияющие на поведение человека.
Скиннер использовал термин «оперантный» для описания любого поведения, которое под влиянием внешних факторов выливается в определенные последствия.
Примеры оперантного научения
На самом деле, примеров оперантного научения вокруг нас множество: школьник, который делает домашнее задание, чтобы получить награду от родителей, или сотрудники, которые работают над проектом ради повышения зарплаты или продвижения по службе.
Эти примеры показывают нам, что перспектива награды способствует выполнению задания, но оперантное научение также может использоваться, чтобы отучить человека от чего-либо посредством наказания или лишения желаемого. Например, детей можно отучить разговаривать в классе, если лишить их за это возможности играть на большой перемене.
Компоненты оперантного научения
Подкрепление – это любое действие, которое будет влиять на развитие определенной модели поведения. Существует два вида подкрепления:
Позитивное подкрепление – это вознаграждение, которое используется для поощрения желаемого поведения: например, похвала или награда.
Негативное подкрепление — это неприятные действия или результаты, которые прекращаются или снижаются для поощрения желаемого поведения.
Оба вида подкрепления используются, чтобы поощрять определенную модель поведения.
Наказание – это неприятные действия, которые предпринимаются для того, чтобы прекратить нежелательную модель поведения.
Существует два вида наказаний:
- Позитивное наказание подразумевает использование нежелательного действия, чтобы ослабить последующую за ним реакцию.
- Негативное наказание подразумевает собой прекращение желаемого действия или лишение желаемого предмета в случае проявления поведения, от которого необходимо отучить.
Оба вида наказания направлены на то, чтобы ослабить нежелательную модель поведения.
Теги: бихевиоризм, наказание, научение, Оперантное научение
Есть что сказать? Оставть комментарий!:
Теория оперантного обусловливания
1. 05.2011
Теория оперантного обусловливания связана с именами Эдварда Ли Торндайка (E.L. Thorndike) и Берреса Скиннера (B.F. Skinner). В отличие от принципа классического обусловливания (S->R), они разработали принцип оперантного обусловливания (R->S), согласно которому поведение контролируется его результатами и последствиями. Основной путь воздействия на поведение, исходя из этой формулы, — влияние на его результаты.
Как уже и говорилось ранее, респондентное поведение — это версия Б.Ф. Скиннера павловского представления о поведении, которое он называл обусловливанием типа S, чтобы подчеркнуть важность стимула, который появляется до реакции и выявляет ее. Однако Скиннер полагал, что в целом поведение животных и человека нельзя объяснять в терминах классического обусловливания. Скиннер делал акцент на поведении, не связанном с какими-либо известными стимулами. Он утверждал, что в основном на ваше поведение воздействуют стимульные события, которые наступят после него, а именно — его последствия.
Так как этот тип поведения предполагает, что организм активно воздействует на окружение с целью изменить события каким-то образом, Скиннер определил его как оперантное поведение. Он также называл его обусловливание типа Я., чтобы подчеркнуть воздействие реакции на будущее поведение.Итак, ключевая структурная единица бихевиористского подхода в целом и скиннеровского подхода в особенности — это реакция. Реакции можно ранжировать от простых рефлекторных реакций (например, слюноотделение на пищу, вздрагивание на громкий звук) до сложного паттерна поведения (например, решение математической задачи, скрытые формы агрессии).
Реакция — это внешняя, наблюдаемая часть поведения, которую можно связать с событиями окружающей среды. Сущность процесса научения — это установление связей (ассоциаций) реакций с событиями внешней среды.
В своем подходе к научению Скиннер проводил различие между реакциями, которые вызываются четко определенными стимулами (например, мигательный рефлекс в ответ на дуновение воздуха), и реакциями, которые нельзя связать ни с одним стимулом. Эти реакции второго типа порождаются самим организмом и называются операн-тами. Скиннер считал, что стимулы среды не принуждают организм вести себя определенным образом и не побуждают его действовать. Исходная причина поведения находится в самом организме.
Оперантное поведение (вызванное оперантным научением) определяется событиями, которые следуют за реакцией. То есть за поведением идет следствие, и природа этого следствия изменяет тенденцию организма повторять данное поведение в будущем. Например, катание на роликовой доске, игра на фортепиано, метание дротиков и написание собственного имени — это образцы оперант-ной реакции, или операнты, контролируемые результатами, следующими за соответствующим поведением. Это произвольные приобретенные реакции, для которых не существует стимула, поддающегося распознаванию. Скиннер понимал, что бессмысленно рассуждать о происхождении оперантного поведения, так как нам неизвестны стимул или внутренняя причина, ответственная за его появление. Оно происходит спонтанно.
Если последствия благоприятны для организма, тогда вероятность повторения операнта в будущем усиливается. Когда это происходит, говорят, что последствия подкрепляются, и оперантные реакции, полученные в результате подкрепления (в смысле высокой вероятности его появления), обусловились. Сила позитивного подкрепляющего стимула таким образом определяется в соответствии с его воздействием на последующую частоту реакций, которые непосредственно предшествовали ему.
И напротив, если последствия реакции не благоприятны и не подкреплены, тогда вероятность получить оперант уменьшается. Скиннер полагал, что, следовательно, оперантное поведение контролируется негативными последствиями. По определению, негативные, или аверсивные последствия, ослабляют поведение, порождающее их, и усиливают поведение, устраняющее их.
Оперантное научение можно представить как процесс обучения, основанный на связи раздражитель-реакция-подкрепление, в рамках которой поведение формируется и поддерживается в силу тех или иных его последствий.
Примером оперантного поведения служит ситуация, встречающаяся почти в каждой семье, где есть маленькие дети, а именно — оперантное научение поведению плача. Как только маленькие дети испытывают боль, они плачут, и немедленная реакция родителей — выразить внимание и дать другие позитивные подкрепления. Так как внимание является подкрепляющим фактором для ребенка, реакция плача становится естественно обусловленной. Однако плач может возникать и тогда, когда боли нет. Хотя большинство родителей утверждают, что они могут различать плач от расстройства и плач, вызванный желанием внимания, все же многие родители упорно подкрепляют последний.
Ключевые слова: не указаны
Источник: Т.Л. Рыжковская. Основы психологии и педагогики — Минск.: Изд-во МИУ, 2010
Что это и как это и как это работает
, написанный Сирусом Уэхоме
Медицинский анализ Poonam Sachdev 27 апреля 2022 г.
В этой статье
- Оперант
- Теория оперантов
- Положительный доклад
- отрицательный отрицательный. Поощрение
- Графики поощрения
- Наказание
- Экономия жетонов
Оперантное обусловливание, иногда называемое инструментальным обусловливанием, представляет собой метод обучения, использующий вознаграждение и наказание для изменения поведения. Благодаря оперантному обусловливанию вознаграждаемое поведение, скорее всего, будет повторяться, а наказуемое поведение встречается редко.
Например, когда вы на работе получаете бонус за исключительную работу, вы будете склонны продолжать работать на более высоком уровне в надежде получить еще один бонус в будущем. Поскольку за этим поведением последовал положительный результат, оно, вероятно, будет повторяться.
Оперантное поведение
При оперантном поведении стимулы могут быть аппетитными или отталкивающими. Аппетитные стимулы — это те, к которым вы приближаетесь добровольно, в то время как аверсивные стимулы — это те, которые вы пытаетесь избежать или избежать. Ответы на такие стимулы могут быть как положительными, так и отрицательными. В данном случае положительное и отрицательное не означает хорошее или плохое. Вместо этого положительное подкрепление означает введение стимула для увеличения вероятности повторения поведения, в то время как отрицательное подкрепление включает устранение стимула для поощрения хорошего поведения.
Теория оперантного обусловливания
Оперантное обусловливание впервые было описано бихевиористом Б. Ф. Скиннером. Его теория основывалась на двух предположениях. Во-первых, причиной поведения человека является что-то в его окружении. Во-вторых, последствия поведения определяют возможность его повторения. Поведение, за которым следуют приятные последствия, с большей вероятностью будет повторяться, а поведение, за которым следуют неприятные последствия, повторится с меньшей вероятностью.
Хотя Скиннер был пионером теории оперантного обусловливания, его идеи основывались на законе эффекта Торндайка. Скиннер также считал, что у нас есть разум. Поэтому было более продуктивно изучать наблюдаемое поведение, а не внутренние психические события.
Скиннер также был образцовым изобретателем. Среди его гаджетов была коробка Скиннера, которая использует такие объекты, как крысы и голуби, для записи поведения животных в сжатые сроки.
В ходе своих экспериментов Скиннер определил три типа реакций, которые следуют за поведением:
Нейтральные реакции. Это реакции окружающей среды, которые не производят никаких стимулов, кроме концентрации внимания. Они не увеличивают и не уменьшают вероятность повторения поведения.
Усилители. Это реакции окружающей среды, которые увеличивают вероятность повторения поведения. Они могут быть как положительными, так и отрицательными.
Каратели. Это отрицательные операнты, которые снижают вероятность поведения. Наказание ослабляет поведение.
Положительное подкрепление
Положительное подкрепление включает в себя предъявление аппетитного стимула для увеличения вероятности того, что поведение произойдет в будущем. Например, если ваш ребенок занимается домашними делами без просьбы, вы можете вознаградить его, отведя в парк или вручив лакомство.
Скиннер использовал голодную крысу в ящике Скиннера, чтобы показать, как работает положительное подкрепление. В коробке сбоку был рычаг, и когда крыса двигалась по коробке, она случайно сталкивала рычаг. Сразу после этого в контейнер рядом с рычагом падала пищевая гранула. Последствие получения пищи каждый раз, когда крыса нажимала на рычаг, гарантировало, что животное повторяло действие снова и снова.
Положительное подкрепление не обязательно должно включать материальные предметы. Вместо этого вы можете положительно подкрепить своего ребенка с помощью:
- Похлопать в ладоши
- Аплодисменты
- Обнять или похлопать по спине
- Поднять большой палец вверх
- Предложить особое занятие, например поиграть в игру или вместе почитать книгу
- Рассказать другому взрослому, как вы гордитесь поведение вашего ребенка, пока ваш ребенок слушает
- Похвала
- Дай пять
Отрицательное подкрепление
При отрицательном подкреплении что-то неприятное прекращается в ответ на стимул. Со временем поведение усиливается с ожиданием того, что аверсивный стимулятор исчезнет. Если, например, ребенок отказывается есть овощи во время обеда, а родитель в ответ убирает овощи, удаление овощей является негативным подкреплением.
Графики подкрепления
График подкрепления — это компонент оперантного обусловливания, в котором указывается, какие примеры поведения будут подкрепляться. Он включает в себя набор правил, определяемых временем и количеством ответов, необходимых для предъявления или удаления поощрения.
Различные модели подкрепления по-разному влияют на скорость обучения. Графики армирования включают:
Армирование с фиксированным соотношением. Награды зависят от определенного количества повторений поведения. Например, ребенку аплодируют после правильного написания 10 слов.
Армирование с фиксированным интервалом. Награды выдаются в определенное время. Например, еженедельная зарплата. Другой пример: ребенок получает вознаграждение раз в неделю, если посуда вымыта.
Армирование с переменным соотношением сторон. Это подкрепление непредсказуемо и дает большое количество ответов. Например, азартные игры могут предлагать выигрыши после нескольких непредсказуемых попыток.
Армирование с переменным интервалом. Ответы вознаграждаются по прошествии непредсказуемого количества времени. Примером могут служить непредсказуемые проверки санитарным инспектором.
Непрерывное армирование. Это подкрепление поведения каждый раз, когда оно происходит. Примером может служить вознаграждение малыша каждый раз, когда он использует горшок.
Наказание
При оперантном обусловливании наказание определяется как любое изменение в окружающей среде, которое снижает вероятность повторения реакции или поведения. Наказание может работать либо путем непосредственного применения неприятного стимула, такого как ругань , либо путем устранения потенциально полезного стимула, такого как вычет чьего-то суточного содержания для наказания за нежелательное поведение.
Хотя наказание эффективно снижает нежелательное поведение, оно связано со многими проблемами, такими как:
- Повышенная агрессия
- Наказуемое поведение скорее подавляется, чем забывается.
- Страх
- Наказание не обязательно ведет к хорошему поведению
- Наказание может легко превратиться в жестокое обращение фальшивые деньги, еда, наклейки, покерные фишки или кнопки, которые впоследствии обмениваются на вознаграждения. Например, в условиях больницы вознаграждение в виде символических денег может предлагаться в обмен на еду, доступ к телевидению и другие бонусы.
Экономика жетонов доказала свою эффективность не только в лечении психически больных, но и в школе. Эта система может быть использована в классах для уменьшения деструктивного поведения и повышения академической вовлеченности.
Что такое оперантное обусловливание? I Psych Central
Что такое оперантное обусловливание? Мы изучим эту теорию обучения и то, как ее различные методы можно использовать в повседневных и клинических условиях.
Оперантное обусловливание, также известное как инструментальное обусловливание или скиннеровское обусловливание, представляет собой теорию обучения в поведенческой психологии. Его можно использовать для увеличения или уменьшения частоты определенного поведения за счет введения последствий.
Использование оперантного обусловливания для изменения человеческого поведения может быть положительным или отрицательным, в зависимости от намерения человека, использующего технику. Принципы оперантного обусловливания можно использовать для эгоистичного формирования поведения, не отвечающего интересам других.
Однако, «когда намерения доброжелательны, оперантное обусловливание имеет большой потенциал для пользы как для отдельного человека, так и для общественного здоровья», — говорит Дженнифер Хеттема, доктор философии, клинический психолог и старший клинический директор LifeStance Health в Альбукерке, Нью-Мексико.
Психолог Эдвард Торндайк впервые разработал «Закон эффекта» в 1898 году. Это концепция, согласно которой поведение с большей вероятностью будет повторяться, если оно связано с чувством удовлетворения.
В 1937 году бихевиорист Б. Ф. Скиннер расширил теорию Торндайка. Он придумал термин «оперантное обусловливание» и описал его в своей книге «Схемы подкрепления», которую он написал в соавторстве с психологом Чарльзом Б. Ферстером.
Однако его не следует путать с классическим обусловливанием. Итак, в чем же разница между классическим обусловливанием и оперантным обусловливанием?
В то время как классическое обусловливание основано на модели стимулов и реакций, оперантное обусловливание включает поведение и последствия. Основное различие здесь в том, что один приводит к бессознательному эффекту (классический), а другой предполагает сознательный выбор (оперант).
В эксперименте, известном как «ящик Скиннера», Скиннер поместил крысу в ящик с рычагом, который выпускал еду в ящик. После того, как крыса случайно нажала на рычаг достаточное количество раз, она в конце концов поняла, что ее поведение (дергание за рычаг) привело к определенному последствию (получению пищи).
Эта модель воздействия на поведение животных теперь используется и для модификации поведения людей. По сути, это стало частью основы того, что мы сегодня знаем как когнитивно-поведенческую терапию.
Психология оперантного обусловливания состоит из множества рабочих частей, включая различные типы, принципы и факторы планирования.
Подкрепление и наказание
Два основных типа поведенческих модификаторов в оперантном обусловливании называются подкрепляющими и наказывающими. Подкрепление и наказание также можно разделить на два подтипа: положительное и отрицательное.
Четыре типа методов оперантного обусловливания включают:
- Положительное подкрепление: добавление вознаграждения
- Отрицательное подкрепление: снятие наказания
- Положительное наказание 90 Отрицательные каратели: устранение вознаграждения
«При оперантном обусловливании мы, скорее всего, усилим поведение, за которым следует вознаграждение, и уменьшим количество поведения, за которым следует наказание», — говорит Хеттема.
Проще говоря: «Поощрения — это последствия, повышающие вероятность того или иного поведения», — объясняет она. «Каратели — это последствия, которые уменьшают вероятность поведения».
Она отмечает, что мы также можем определить поощрения или наказания на основе следующих факторов:
- когда они применяются в связи с поведением (например, немедленно или с задержкой)
- независимо от того, применяются ли они в зависимости от частоты поведения или течение времени
- независимо от того, постоянны ли эти паттерны или изменчивы
Графики подкрепления
Различные графики подкрепления при оперантном обусловливании включают:
- Непрерывный: подкреплений каждый раз, когда происходит поведение
- Схемы с фиксированным интервалом: поощрение после определенного поведения в течение определенного периода времени
- Схемы с переменным соотношением: случайное подкрепление после того, как поведение повторяется непредсказуемое количество раз
- Графики с переменным интервалом: случайное подкрепление после того, как поведение происходит в течение непредсказуемого периода времени
Эти графики предполагают, что предсказуемость поведения зависит от частоты и постоянства армирования.
Если есть всегда конкретное последствие, поведение, вероятно, будет подкрепляться сильнее. Это может быть полезно, когда вы хотите поощрять более высокую частоту желаемого поведения.
«Мы узнали, что поощрения, возникающие сразу после различного количества попыток поведения, очень важны», — добавляет Хеттема.
Согласно исследованию 2018 года, успех этих заученных реакций можно объяснить высвобождением «гормона счастья» — дофамина.
Если последствия поведения представляются случайным образом, последовательность поведенческой реакции может быть разнообразной и более неустойчивой. И когда поведение не подкрепляется и не вознаграждается в течение длительного периода времени, это может в конечном итоге привести к исчезновению этой реакции.
«Принципы оперантного обусловливания можно применять в любом контексте, в котором человек надеется повлиять на поведение других», — говорит Хеттема.
Вот несколько примеров того, как можно использовать оперантное обусловливание для изменения поведения в повседневной жизни.
Воспитание детей
«Родители применяют принципы оперантного обусловливания, чтобы научить своих детей правилам безопасности и сделать их здоровыми и продуктивными членами общества», — говорит Хеттема.
Родители могут использовать оперантное обусловливание со своими детьми:
- хвалить их, когда они делают что-то хорошее
- давать им конфеты, когда они убирают свою комнату
- разрешать им играть в видеоигры после того, как они сделают домашнее задание
- отправлять их в свою комнату в качестве наказания
- окончание
Школа
Учителя могут использовать оперантное обусловливание в классе, чтобы влиять на поведение учащихся:
- использовать наклейки, чтобы получить большую награду
- лишение права на перемену, если учащийся плохо себя ведет
- организация вечеринки с пиццей, если 15 учащихся получают высокие оценки за контрольную работу или контрольную работу
- игнорирование учащегося, который кричит и не поднимает руку, чтобы ответить на вопрос
- предоставление задержание студентов, если они слишком много раз опаздывают на занятия
Работа
Оперантное обусловливание можно использовать даже на рабочем месте для повышения производительности и влияния на моральный дух сотрудников путем:
- предоставления сотруднику подарочной карты для пяти положительных клиентов отзывы
- предоставление выходного дня за дополнительную усердную работу в течение недели
- премирование за выполнение квартального плана продаж
- отстранение сотрудника от работы за слишком много прогулов
- похвала сотруднику за постоянную отличную работу
Отношения
Любой человек может использовать методы оперантного обусловливания, чтобы поощрять или препятствовать определенному поведению в своих отношениях.
- комплимент вашему другу за то, как он справился с ситуацией
- приготовление любимого ужина вашего партнера после того, как он пропылесосил дом три раза подряд
- преподнесение подарка вашему соседу по комнате в благодарность за выполнение одной из ваших обязанностей по дому
Принципы оперантного обусловливания могут быть использованы для лечения люди, живущие с определенными психическими расстройствами, а также.
Терапия оперантного обусловливания является основным компонентом когнитивно-поведенческой терапии — формы психотерапии.
Если вы страдаете психическим заболеванием, специалисты в области психического здоровья могут ввести поощрения или наказания, чтобы помочь изменить нежелательное поведение на более желательное.
Техники оперантного обусловливания в поведенческой терапии могут помочь улучшить симптомы определенных психических расстройств, таких как:
- обсессивно-компульсивное расстройство (ОКР)
- фобии
- расстройства настроения
- тревожные расстройства
- панические расстройства
«Те же самые принципы применимы к [ОКР], когда люди проявляют нездоровое повторяющееся поведение, чтобы уменьшить чувство стресса, связанное с негативными мыслями», — добавляет она, отмечая, что «разрушение подкрепляющих элементов навязчивого поведения является ключом к успеху лечения. ”
Оперативное кондиционирование также может быть полезным для людей, живущих с расстройствами, связанными с алкоголем или психоактивными веществами.
«Людям с расстройством, связанным с употреблением алкоголя, можно ежедневно принимать лекарство под названием дисульфирам, которое взаимодействует с алкоголем, вызывая сильную тошноту и рвоту, чтобы удержать людей от употребления алкоголя», — говорит Хеттема.
Оперантное обусловливание, предложенное Б. Ф. Скиннером в 1930-х годах, представляет собой теорию обучения, которая описывает, как поведение может формироваться с помощью конкретных последствий, называемых подкреплением и наказанием.