Оперантные реакции человека это реакции: Оперантное поведение — Психологос

Содержание

Оперантное поведение — Психологос

Оперантное поведение — это активные действия, акции, которые направлены на достижение желаемой цели.

Б. Скиннер так писал о различии рефлексов и оперантном поведении: «Рефлексы, как условные, так и всякие другие, главным образом связаны с внутренними физиологическими процессами в организме. Однако чаще всего нас интересует такое поведение, которое имеет определенное воздействие на окружающий мир. Оно возникает в результате столкновения человека с необходимостью решать задачи, выдвигаемые жизнью».

А также: «Принято рассматривать любое движение живого существа как реакцию. Это слово заимствовано из исследований, посвященных изучению рефлексов. Оно означает действие, которое наступает в ответ на предшествующее событие — стимул. Но мы можем сделать событие зависимым от поведения без определения предшествующего стимула. Мы не изменяем среду обитания голубя для того, чтобы вызвать поднятие головы. Вероятно, нельзя показать, что любой простой стимул неизменно предшествует этому движению. Такое поведение может оказаться под контролем стимулов, но при этом отсутствуют отношения по типу «одно порождает другое», поэтому термин «реакция» не вполне адекватен, но он настолько укоренился, что далее мы будем его использовать. Конечно, нельзя предсказать и проконтролировать реакцию, которая уже произошла. Можно только предсказать, что похожие реакции будут наблюдаться в будущем. Поэтому единицей науки о прогнозировании является не реакция, а класс реакций. Для его описания будет использоваться слово «оперантный». Данный термин показывает, что поведение «воздействует» (operates) на среду, генерируя последствия. Следствия определяют свойства, по которым устанавливается сходство реакций. Он будет использоваться и как прилагательное (оперантное поведение), и как существительное, обозначающее поведение, определенное данным следствием. Поднятие голубем головы один раз в определенный момент является реакцией. Это прошлое и его можно рассматривать со всех точек зрения, которые представляют для нас интерес. Поведение, называемое «поднятием головы», которое происходит независимо от определенных обстоятельств (instances), является оперантным». Скиннер Б. Ф. ОПЕРАНТНОЕ ПОВЕДЕНИЕ. История зарубежной психологии. Тексты. М., 1986. С. 60-95.http://intellectus.su/lib/00028.htm

Реагируя (при выполнении условного рефлекса), животное играет пассивную роль: хозяин дал команду — собака сделала. Активное начало поведения — у человека. В оперантном поведении, наоборот, источник активности — животное: собака совершает действие для того, чтобы ее поощрили.

Б. Скиннер об оперантном поведении

Фрагменты из книги Б. Скиннера «Оперантное поведение». Кривые научения. Оперантное обусловливание. Количественные свойства. Управление оператным поведением. Оперантное угашение. Условные подкрепления. Почему подкрепление подкрепляет? Непредвиденные обстоятельства и «суеверное» поведение. Цели, намерения и другие конечные причины поведения. См.→

Оперантное поведение и дрессировка

Традиционная дрессировка учит условным рефлексам, а не оперантному поведению.

Такому сложному и интересному поведению, когда животное само ищет возможности достичь желаемой цели, учит особый вид обучения животных: обучение с подкреплением. Это похоже на дрессировку, это действительно дрессировка, но это дрессировка не обычная, не традиционная. В этой дрессировке другие технологии (использование кликера) и другие результаты. Такая дрессировка (обучение с подкреплением) в руках умелого дрессировщика обучает творческому поведению.

Интересное наблюдение из жизни: собака, воспитанная в традиционных условиях, не понимает, что она может быть источником активности. Такая собака ждет команды. Более того, она честно не спускает глаз с хозяина. Хозяин должен дать команду. Только тогда возможна активность. Собака, воспитанная обучением с подкреплением — живая и активная. Она ищет возможности получить награду и перебирает возможные способы этого добиться, начиная свою активность до команды хозяина. Такие собаки быстрее решают задачи, связанные с деятельностью мышления, с ними чаще случаются инсайты (внезапное нахождение решения без предыдущих проб и ошибок или предыдущего обучения).

Оперантное обусловливание Скиннера как технология формирования личности

20 столетие было богатым на научные открытия в области психологии. Разные направления и подходы исследования человека всячески пытались ответить на вопрос, что собой представляет человечество. На волне увлечения позитивизмом и поиска точных методов исследования самой популярной психологической концепцией долгое время считался бихевиоризм, который подразумевал идею того, что человек – это всегда творение окружающих обстоятельств, и полностью исключал важность сознания и внутренних особенностей индивида.

Именно в духе бихевиоризма была сформулирована теория оперантного обусловливания американским психологом Берресом Скиннером, который утверждал: человеческое поведение детерминировано и поэтому предсказуемо.

В этой статье мы более подробно рассмотрим самую выдающуюся концепцию Скиннера, которую неоднократно критиковали за манипулирование человеческим поведением, но в тоже время ее сторонники плодотворно использовали ее для внедрения новых черт характера.

Скиннер и критика традиционной психологии

Беррес Фредерик Скиннер (1904-1990) – один из самых известных представителей бихевиоризма, основатель необихевиоризма, а также очень противоречивая фигура в истории американской психологии ХХ столетия.

Перед тем как стать выдающимся психологом, Скиннер мечтал о карьере писателя, но после знакомства с научными работами Павлова и Джона Уотсона он поступил в Гарвард и начал изучать психологию.

Еще будучи студентом психологии в университете, Скиннер вслед за Павловым утверждал, что человек не отличается от других животных, поэтому и анализировать его стоит в тех же научных категориях что и другие живые организмы. Этим своим знаменитым мнением он бунтовал против известной концепции в психологии, согласно которой формирование человека и его поступков – это отражение внутренних переживаний, мыслей, эмоций.

Такими утверждениями о предмете психологии Скиннер остро критиковал популярный тогда психоанализ Фрейда, а также вслед за позитивистским духом в точных и естественных науках он хотел переосмыслить методологию психологии. Разделив психологию на «донаучные» концепции и бихевиористов, Скиннер пытался ее реформировать и сформулировать собственный научный метод, создать новую экспериментальную психологию.

Критикуя психологию, Скиннер пытался доказать: фундаментальная ошибка современной психологии в том, что причины человеческого поведения находятся не внутри человека, а в окружении. Он утверждал: хотя человечество перестало верить в средневековых духов и бесов, но оно до сих пор пытается описать какие-то метафорические «скрытые силы» сознания, которые нельзя доказать или подтвердить экспериментально. Эти аргументы против изучения внутреннего мира были обоснованы тем, что люди не имеют доступа к сознанию человека, поэтому психология должна заниматься только наблюдением.

Благодаря численным экспериментам в лаборатории (большое количество которых он проводил на голубях и крысах), а также своему писательскому таланту, сегодня Скиннер считается самым ярким представителем бихевиоризма. Его научный вклад в развитие психологии оказал сильное воздействие на последующие поколения психологов, которые работали в этом же направлении.

Предпосылки оперантного поведения

В психологии Скиннера главный акцент сделан на то, что свой выбор человек совершает под воздействием каких-либо событий в прошлом. Скиннер утверждал: окружающие факторы приводят нас к определенному решению и поступкам. Центральный источник нашего поведения – не люди сами по себе (их чувства, разум, планы или цели), а их ответная реакция на влияние со стороны окружения. Чтобы понять, почему мы поступаем именно так, а не иначе, согласно Скиннеру, нужно знать обстоятельства, которые стимулируют нас к действиям.

Именно поэтому окружающий мир формирует из нас тех, кем мы являемся: наши действия зависят от знания, что хорошо, а что плохо, и, хотя мы верим, что это наше внутреннее решение, именно внешняя среда сформировала наше понимание, что такое хорошо, а что плохо. Люди – это результат адаптации каждого человека к внешней среде, в которой он родился.

Согласно философии Скиннера, нет необходимости тратить так много энергии на моральное развитие индивида, ведь «черты характера» – это аккумуляция реакций на определенные внешние условия окружения.

Поэтому результат будет намного лучше, если мы будем больше сил и внимания уделять исследованиям внешней среды и условий, от которых и зависит индивид. Таким образом, если мы создадим лучшие окружающие условия, мы получим лучших индивидов.

В экспериментальной психологии принято выделять два процесса, ответственных за выработку и закрепление форм реакции на любые потребности:

  • обучение – акцент сделан на форме обучения обучающего;
  • учение, научение – здесь важны условия обучения, которые включают три разных способа воздействия на организм (человека или животного): реактивное поведение, когнитивное научение и оперантное поведение (или научение в результате оперантного обусловливания).

Сегодня теория оперантного поведения – это, пожалуй, самый известный вклад Скиннера в развитие экспериментальной психологии. Скиннер утверждал, что люди – это не больше, чем думающие машины, которые могут изменять свои действия.

Теория оперантного поведения

Согласно теории поведенческой психологии бихевиоризма, внешняя среда – это самый важный фактор формирования навыков, а ключевую роль играют ассоциативные связи, которые организм создает в результате жизненного опыта.

Если Павлов вывел закономерность формирования условных рефлексов, то Скиннер пошел еще дальше: он описал свои научные наблюдения и возможные способы влияния на поведение организма, и назвал их «оперантное обусловливание» (или оперантный бихевиоризм) – процесс формирования ассоциаций между поведением и его последствиями. Согласно Скиннеру, существует три вида поведения человека:

  • безусловно-рефлекторное;
  • условно-рефлекторное;
  • оперантное.

Именно идея оперантного обусловливания состоит в изучении формирования поведения человека. Сначала она была сформулирована по аналогии наблюдения за реакцией животных в лабораторных условиях. Поэтому «обусловливание» – это создание необходимых условий, которые дают возможность управлять человеческим поведением.

Обусловить – это обдуманный пошаговый процесс, который позволяет создать нужные подконтрольные условия, из-за воздействия которых меняется состояние человека, его поведение и реакции на последующие обстоятельства. «Оперантное» (от слова «операция») означает действие, имеющее воздействие на среду. Поэтому под оперантным обусловливанием Скиннер подразумевал форму обучения, в которой спонтанное поведение воспринимается как желательное. Главный акцент в оперантном обусловливании Скиннер делал не на реакции человека, а на акции – действии, которое воздействует на человека.

Поэтому принцип оперантного обусловливания можно обозначить тем, что человеческое поведение контролируется его последствиями: позитивный многоразовый опыт в прошлом формирует модель реакции на похожую ситуацию в будущем.

Как пример действия оперантного обусловливания можно представить такую ситуацию:

Джулиан вместе со своей дочерью Энн пошли в кино. Джулиан купил пакетик с разными леденцами. Он протянул пакетик Энн, и та перебрала их все, пока не нашла синий, который тут же вытащила и сунула в рот. Одно из объяснений ее выбора состоит в том, что в результате прошлого опыта она отождествила синий цвет леденца с приятным вкусом.

Развивая свою интерпретацию того, какой должна быть психология, Скиннер пытался доказать, что человеческое поведение всегда зависит от внешней среды: выбрать фильм, открыть дверь в ответ на звонок, держать партнера за руку, когда он просит – все это примеры оперантного поведения.

В свое время Скиннер обосновал закономерности, которые назвал законом оперантного обусловливания и законом субъективной оценки вероятности последствий. Этим заявлением Скиннер предлагал свое решение современных социальных проблем, создание технологии поведения, которая бы позволяла манипулировать негативным поведением людей и помогала бы создавать положительные реакции. Он предлагал изменить такие черты как гордость, стремление к власти, агрессия, наполнить людей четким пониманием смысла и целей.

Сегодня оперантное обусловливание рассматривается психологами в двух основных формах:

  1. Инструментальное научение – ему свойственно подкрепление случайного поведения путем наград и наказаний. Воздействие на человека происходит за счет активизации нервной деятельности.
  2. Творческое научение – нацелено на воздействие разума и активизацию творческих способностей в нужном направлении.

Правила эффективного оперантного обусловливания:

  1. Простая инструкция.
  2. Легкое начало.
  3. Позитивный процесс обучения.
  4. Регулярная система подкреплений.
  5. Четкая методичность процесса обучения.

Одна из ключевых идей в концепции Скиннера – это подкрепление или «последовательное наведение на нужную реакцию». Он описывал четыре режима подкрепления в зависимости от необходимой формы реагирования:

  • с постоянным соотношением;
  • с постоянным интервалом;
  • с вариативным соотношением;
  • с вариативным интервалом.

Особенно важным в формировании нужной реакции Скиннер считал использование подкрепляющих стимулов, которые разделил на три типа:

  1. Первичные подкрепления – вода, пища, секс и т.
     п.
  2. Вторичные (условные) подкрепления – привязанность, внимание, деньги, похвала и т. п. – оказывающие сильное влияние на поведение человека;
  3. Позитивные и негативные подкрепления (аверсивные) и наказания.

Также в оперантном обусловливании выделяют три типа научения:

  • метод проб и ошибок;
  • формирование автоматизированной реакции;
  • подражание путем наблюдения и воспроизведения нужной модели поведения (бывает двух форм – чистое подражание и викарное, то есть повторение с пониманием).

Таким образом, во время оперантного научения человек воздействует на внешнюю среду, и, получая желаемый результат, усиливает вероятность повторного поведения. И также наоборот: если во время воздействия результат был негативным, человек будет стремиться избегать подобного опыта.

Критика Скиннера и его научный вклад в развитие психологии

Несмотря на широкое одобрение научного вклада Скиннера бихевиористами, с его позицией не соглашались многие известные психологи – Эрих Фромм, Ноам Хомский, Стивен Пинкер. Они критиковали Скиннера за пренебрежение человеческими чувствами, когнитивными способностями и ролью человеческих влечений. Поэтому «психология» Скиннера для Фромма, например, была наукой о манипулировании поведением человека.

Однако невзирая на острую критику, научные результаты Скиннера также принесли и немало плодов. Ведь не зря в 1972 году Американская ассоциация психологов внесла Скиннера в число самых выдающихся психологов ХХ столетия. Его идеи и наблюдения многократно подтверждались в разных областях применения, где самыми успешными сферами стали обучение навыкам общения, тренировка навыков уверенности, самоконтроля, а также лечение тревоги, мигрени, артериальной гипертензии и мышечного напряжения.

Кстати, о формировании полезных привычек. Если вы хотите понять как можно эффективно справляться со стрессом, тревогой и страхами, обратите внимание на нашу онлайн-программу «Психическая саморегуляция». С ее помощью за 6 недель можно освоить эффективные способы сохранять ясность ума и справляться с трудными ситуациями на работе, в университете и личных отношениях.

Что же касается оперентного обусловливания Скиннера, то относиться к нему можно по-разному, и это личный выбор каждого. Но все же хочется верить в то, что человек – это не просто животный материал, руководимый лишь реакциями, а осознанное существо, способное всегда и везде опираться на разум, принимать обдуманные решения и действовать самым лучшим образом.

Желаем вам успехов и ждем на наших уроках!

Ключевые слова:1Психорегуляция

Оперантное обусловливание – Введение в психологию – 1-е канадское издание

Глава 8. Обучение

Цели обучения

  1. Изложить принципы оперантного обусловливания.
  2. Объясните, как можно формировать обучение с помощью графиков подкрепления и вторичных подкреплений.

При классическом обусловливании организм учится связывать новые стимулы с естественными биологическими реакциями, такими как слюноотделение или страх. Организм не учится чему-то новому, а начинает выполнять существующее поведение при наличии нового сигнала. Оперантное обусловливание , с другой стороны, представляет собой обучение, которое происходит на основе последствий поведения и может включать обучение новым действиям. Оперантное обусловливание происходит, когда собака переворачивается по команде, потому что ее хвалили за это в прошлом, когда школьный хулиган угрожает своим одноклассникам, потому что это позволяет ему добиться своего, и когда ребенок получает хорошие оценки, потому что родители угрожают ему. наказать ее, если она этого не сделает. При оперантном обусловливании организм учится на последствиях собственных действий.

Как поощрение и наказание влияют на поведение: исследование Торндайка и Скиннера

Психолог Эдвард Л. Торндайк (1874–1949) был первым ученым, систематически изучавшим оперантное обусловливание. В своем исследовании Торндайк (1898 г.) наблюдал за кошками, которых поместили в «коробку-головоломку», из которой они пытались выбраться («Видеоклип: Коробка-головоломка Торндайка»). Сначала кошки царапались, кусались и шлепали как попало, не зная, как выбраться. Но в конце концов и случайно они нажали на рычаг, который открыл дверь и вышел к их призу, кусочку рыбы. В следующий раз, когда кошку загнали в коробку, она предприняла меньше неэффективных ответов, прежде чем совершить успешный побег, и после нескольких попыток кошка научилась почти сразу же делать правильный ответ.

Наблюдение за этими изменениями в поведении кошек привело Торндайка к разработке своего закона эффекта , принципа, согласно которому реакции, создающие обычно приятный результат в конкретной ситуации, с большей вероятностью повторятся в аналогичной ситуации, в то время как реакции, вызывающие типично неприятный исход с меньшей вероятностью повторится в ситуации (Thorndike, 1911). Суть закона эффекта заключается в том, что успешные ответы, поскольку они доставляют удовольствие, «отпечатываются» опытом и, таким образом, происходят чаще. Неудачные ответы, вызывающие неприятные переживания, «заштамповываются» и впоследствии встречаются реже.

Когда Торндайк поместил своих кошек в коробку с головоломками, он обнаружил, что после каждого испытания они быстрее научились совершать важные побеги. Торндайк описал обучение, которое следует за подкреплением, с точки зрения закона эффекта.

Смотреть: «Коробка-головоломка Торндайка» [YouTube]: http://www.youtube.com/watch?v=BDujDOLre-8

Влиятельный психолог-бихевиорист Б. Ф. Скиннер (1904–1990) расширил идеи Торндайка, разработав более полный набор принципов для объяснения оперантного обусловливания. Скиннер создал специально разработанную среду, известную как 9.0017 оперантных камер (обычно называемых ящиками Скиннера ) для систематического изучения обучения. Ящик Скиннера (операционная камера) представляет собой структуру, которая достаточно велика, чтобы вместить грызуна или птицу, и которая содержит стержень или ключ, который организм может нажимать или клевать, чтобы высвободить пищу или воду. Он также содержит устройство для записи ответов животного (рис. 8.5).

Самый основной из экспериментов Скиннера был очень похож на исследование Торндайка с кошками. Крыса, помещенная в камеру, реагировала, как и следовало ожидать, суетясь вокруг коробки, обнюхивая и царапая пол и стены. В конце концов крыса случайно наткнулась на рычаг, который она нажала, чтобы выпустить шарики пищи. В следующий раз крысе потребовалось немного меньше времени, чтобы нажать на рычаг, и при последующих попытках время, необходимое для нажатия на рычаг, становилось все короче и короче. Вскоре крыса нажимала на рычаг так быстро, как только могла есть появившуюся еду. Как и предсказывал закон следствия, крыса научилась повторять действие, которое приводило к еде, и прекращать действия, которые этого не приводили.

Скиннер подробно изучил, как животные меняют свое поведение посредством подкрепления и наказания, и разработал термины, объясняющие процессы оперантного обучения (таблица 8. 1, «Как положительное и отрицательное подкрепление и наказание влияют на поведение»). Скиннер использовал термин поощрение для обозначения любого события, которое усиливает или увеличивает вероятность поведения, и термин наказание для обозначения любого события, которое ослабляет или снижает вероятность поведения . И он использовал термины положительный и отрицательный для обозначения того, было ли подкрепление представлено или удалено соответственно. Таким образом, положительное подкрепление усиливает реакцию, предъявляя после ответа что-то приятное, и отрицательное подкрепление усиливает реакцию, уменьшая или удаляя что-то неприятное . Например, похвала ребенка за выполнение домашнего задания представляет собой положительное подкрепление, тогда как прием аспирина для уменьшения головной боли представляет собой отрицательное подкрепление. В обоих случаях подкрепление повышает вероятность повторения поведения в будущем.

Рис. 8.5 Блок Скиннера. Б. Ф. Скиннер использовал ящик Скиннера для изучения оперантного обучения. Коробка содержит планку или клавишу, которую организм может нажимать, чтобы получить пищу и воду, и устройство, записывающее реакции организма.
Таблица 8.1. Влияние положительного и отрицательного подкрепления и наказания на поведение.
[Пропустить таблицу]
Оперантное обусловливание термина Описание Результат Пример
Положительное подкрепление Добавить или увеличить приятный стимул Поведение усилено Вручение учащемуся приза после того, как он или она получит пятерку за тест
Отрицательное подкрепление Уменьшить или удалить неприятный раздражитель Поведение усилено Прием обезболивающих, устраняющих боль, повышает вероятность того, что вы снова будете принимать обезболивающие
Положительное наказание Предъявите или добавьте неприятный раздражитель Поведение ослаблено Дополнительная домашняя работа учащегося после того, как он плохо себя ведет в классе
Отрицательное наказание Уменьшить или удалить приятный стимул Поведение ослаблено Отнятие компьютера у подростка после того, как он пропустил комендантский час

Подкрепление, как положительное, так и отрицательное, работает, увеличивая вероятность поведения. Наказание , с другой стороны, относится к любому событию, которое ослабляет или снижает вероятность поведения . Положительное наказание   ослабляет реакцию , представляя что — то неприятное после ответа , тогда как отрицательное наказание   ослабляет реакцию , уменьшая или удаляя что — то приятное . Ребенок, которого наказывают после ссоры с братом или сестрой (позитивное наказание) или который теряет возможность пойти на перемену после плохой оценки (негативное наказание), с меньшей вероятностью повторит такое поведение.

Хотя различие между подкреплением (которое усиливает поведение) и наказанием (которое его ослабляет) обычно ясно, в некоторых случаях трудно определить, является ли подкрепление положительным или отрицательным. В жаркий день прохладный ветерок можно рассматривать как положительное подкрепление (потому что он приносит прохладный воздух) или отрицательное подкрепление (потому что он удаляет горячий воздух). В других случаях подкрепление может быть как положительным, так и отрицательным. Сигарету можно курить как потому, что она приносит удовольствие (положительное подкрепление), так и потому, что она устраняет тягу к никотину (отрицательное подкрепление).

Также важно отметить, что подкрепление и наказание не являются просто противоположностями. Использование положительного подкрепления для изменения поведения почти всегда более эффективно, чем применение наказания. Это связано с тем, что положительное подкрепление заставляет человека или животное чувствовать себя лучше, помогая создать позитивные отношения с человеком, предоставляющим подкрепление. Типы положительного подкрепления, которые эффективны в повседневной жизни, включают словесную похвалу или одобрение, присвоение статуса или престижа и прямую финансовую оплату. Наказание, с другой стороны, с большей вероятностью вызовет лишь временные изменения в поведении, потому что оно основано на принуждении и обычно создает негативные и враждебные отношения с человеком, дающим подкрепление. Когда человек, который наказывает, покидает ситуацию, нежелательное поведение, скорее всего, вернется.

Создание сложного поведения посредством оперантного обусловливания

Возможно, вы помните, как смотрели фильм или были на представлении, в котором животное — может быть, собака, лошадь или дельфин — делало удивительные вещи. Дрессировщик дал команду и дельфин поплыл на дно бассейна, подобрал кольцо на носу, выпрыгнул из воды через обруч в воздухе, снова нырнул на дно бассейна, подобрал еще одно кольцо, а затем отнес оба кольца тренеру на краю бассейна. Животное обучали выполнять трюк, и для его обучения использовались принципы оперантного обусловливания. Но эти сложные формы поведения далеки от простых отношений стимул-реакция, которые мы рассматривали до сих пор. Как можно использовать подкрепление для создания сложного поведения, подобного этому?

Одним из способов расширения использования оперантного обучения является изменение графика применения подкрепления. До сих пор мы обсуждали только график непрерывного подкрепления , в котором желаемая реакция подкрепляется каждый раз, когда она возникает ; например, всякий раз, когда собака переворачивается, она получает печенье. Непрерывное подкрепление приводит к относительно быстрому обучению, но также и к быстрому исчезновению желаемого поведения после исчезновения подкрепления. Проблема в том, что поскольку организм привык получать подкрепление после каждого поведения, ответчик может быстро сдаться, если его не появляется.

Большинство реальных подкреплений не являются непрерывными; они происходят по частичному (или прерывистому) графику подкрепления графику, в котором реакции иногда подкрепляются, а иногда нет . По сравнению с непрерывным подкреплением, схемы частичного подкрепления приводят к более медленному начальному обучению, но они также приводят к большей устойчивости к угасанию. Поскольку подкрепление не появляется после каждого поведения, обучаемому требуется больше времени, чтобы определить, что вознаграждение больше не приходит, и, следовательно, угасание происходит медленнее. Четыре типа графиков частичного подкрепления приведены в таблице 8.2, «Схемы подкрепления».

Таблица 8.2 Графики армирования.
[Пропустить таблицу]
График усиления Пояснение Пример из реальной жизни
Фиксированное соотношение Поведение подкрепляется после определенного количества ответов. Заводские рабочие, оплата труда которых зависит от количества произведенной ими продукции
Переменное соотношение Поведение подкрепляется после среднего, но непредсказуемого количества ответов. Выплаты в игровых автоматах и ​​других азартных играх
С фиксированным интервалом Поведение подкрепляется за первую реакцию по прошествии определенного времени. Люди, которые получают месячную зарплату
Переменный интервал Поведение подкрепляется первой реакцией по прошествии среднего, но непредсказуемого количества времени. Лицо, проверяющее электронную почту на наличие сообщений

Схемы частичного подкрепления определяются тем, предоставляется ли подкрепление на основе времени, прошедшего между подкреплением (интервал), или на основе количества реакций организма (отношение), а также в зависимости от того, происходит ли подкрепление по регулярному (фиксированному) или непредсказуемому (переменном) графику. В расписании с фиксированным интервалом , подкрепление происходит за первую реакцию, сделанную после того, как прошло определенное количество времени . Например, при одноминутном расписании с фиксированным интервалом животное получает подкрепление каждую минуту, при условии, что оно проявляет поведение по крайней мере один раз в течение минуты. Как вы можете видеть на рис. 8.6, «Примеры паттернов реакции животных, обученных по разным схемам частичного подкрепления», животные с фиксированными интервалами имеют тенденцию замедлять свою реакцию сразу после подкрепления, но затем снова усиливают поведение по мере того, как время подкрепления увеличивается. следующее подкрепление приближается. (Большинство студентов готовятся к экзаменам одинаково.)0015 график с переменным интервалом , подкрепления появляются в интервальном графике, но время варьируется в зависимости от среднего интервала, что делает фактическое появление подкрепления непредсказуемым . Примером может служить проверка вашей электронной почты: вы получаете подкрепление, получая сообщения, которые приходят в среднем, скажем, каждые 30 минут, но подкрепление происходит только в случайное время. Графики интервального подкрепления, как правило, вызывают медленные и устойчивые темпы реагирования.

Рис. 8.6. Примеры моделей реакции животных, обученных по разным схемам частичного подкрепления. Расписания, основанные на количестве ответов (типы соотношения), вызывают большую скорость ответов, чем расписания, основанные на прошедшем времени (типы интервалов). Кроме того, непредсказуемые расписания (переменные типы) дают более сильные ответы, чем предсказуемые расписания (фиксированные типы).

В расписании с фиксированным соотношением , поведение подкрепляется после определенного количества ответов . Например, поведение крысы может быть подкреплено после того, как она нажмет клавишу 20 раз, или продавец может получить бонус после того, как он или она продаст 10 товаров. Как вы можете видеть на рис. 8.6, «Примеры паттернов реакции животных, обученных по разным схемам частичного подкрепления», как только организм научился действовать в соответствии с графиком фиксированного соотношения, он будет лишь ненадолго останавливаться, когда происходит подкрепление, прежде чем вернуться к высокий уровень отзывчивости. А график с переменным соотношением   обеспечивает поощрение после определенного, но среднего количества ответов . Выигрыш денег в игровых автоматах или в лотерейном билете — это пример подкрепления, которое происходит по графику с переменным соотношением. Например, игровой автомат (см. рис. 8.7, «Игровой автомат») может быть запрограммирован на получение выигрыша в среднем каждые 20 раз, когда пользователь дергает ручку. Расписания соотношения, как правило, дают высокую скорость реагирования, потому что поощрение увеличивается по мере увеличения количества ответов.

Рисунок 8.7 Игровой автомат. Игровые автоматы являются примерами графика подкрепления с переменным соотношением.

Сложное поведение также создается посредством формирования , процесса направления поведения организма к желаемому результату посредством использования последовательного приближения к конечному желаемому поведению . Скиннер широко использовал эту процедуру в своих коробках. Например, он мог научить крысу дважды нажимать на перекладину, чтобы получить пищу, сначала давая пищу, когда животное приближалось к перекладине. Когда это поведение было усвоено, Скиннер начинал давать еду только тогда, когда крыса касалась перекладины. Дальнейшее формирование ограничивало подкрепление только тогда, когда крыса нажимала на планку, когда она нажимала на планку и касалась ее во второй раз, и, наконец, только когда она нажимала на планку дважды. Хотя это может занять много времени, таким образом оперантное обусловливание может создавать цепочки поведения, которые подкрепляются только после их завершения.

Поощрение животных, если они правильно различают похожие стимулы, позволяет ученым проверить способность животных к обучению, а различия, которые они могут делать, иногда поразительны. Голубей научили различать образы Чарли Брауна и других персонажей Peanuts (Cerella, 1980), а также разные стили музыки и искусства (Porter & Neuringer, 1984; Watanabe, Sakamoto & Wakita, 1995).

поведения также можно тренировать с помощью вторичные усилители . В то время как первичное подкрепление  включает стимулов, которые естественным образом предпочтительны или доставляют удовольствие организму, например, пища, вода и облегчение боли , вторичное подкрепление  (иногда называемое условным подкреплением ) является нейтральным событием, которое стал ассоциироваться с первичным подкреплением посредством классического обусловливания . Примером вторичного подкрепления может быть свист дрессировщика, который со временем стал ассоциироваться с первичным подкреплением — едой. Примером повседневного вторичного подкрепления являются деньги. Нам нравится иметь деньги не столько из-за самого стимула, сколько из-за основного подкрепления (то, что можно купить за деньги), с которым оно связано.

Key Takeaways

  • Эдвард Торндайк разработал закон эффекта: принцип, согласно которому реакции, создающие обычно приятный результат в конкретной ситуации, с большей вероятностью повторятся в аналогичной ситуации, в то время как реакции, приводящие к обычно неприятному результату, менее вероятны. вновь возникнуть в ситуации.
  • Б. Ф. Скиннер расширил идеи Торндайка, разработав набор принципов для объяснения оперантного обусловливания.
  • Положительное подкрепление усиливает реакцию, представляя что-то обычно приятное после ответа, в то время как отрицательное подкрепление усиливает реакцию, уменьшая или удаляя то, что обычно неприятно.
  • Положительное наказание ослабляет реакцию, представляя что-то обычно неприятное после ответа, тогда как отрицательное наказание ослабляет реакцию, уменьшая или удаляя что-то обычно приятное.
  • Армирование может быть частичным или непрерывным. Схемы частичного подкрепления определяются тем, предоставляется ли подкрепление на основе времени, прошедшего между подкреплениями (интервал), или на основе количества реакций, в которые вовлечен организм (отношение), и того, происходит ли подкрепление на основе времени, которое проходит между подкреплениями (интервал). регулярный (фиксированный) или непредсказуемый (переменный) график.
  • Сложное поведение может быть создано посредством формирования, процесса направления поведения организма к желаемому результату посредством использования последовательного приближения к конечному желаемому поведению.

Каталожные номера

Церелла, Дж. (1980). Голубиный анализ картинок. Распознавание образов, 12 , 1–6.

Кассин, С. (2003). Основы психологии. Река Аппер-Сэдл, Нью-Джерси: Прентис-холл. Получено с веб-сайта Essentials of Psychology Prentice Hall Companion: http://wps.prenhall.com/hss_kassin_essentials_1/15/39.33/1006917.cw/index.html

Портер Д. и Нойрингер А. (1984). Музыкальная дискриминация голубей. Журнал экспериментальной психологии: процессы поведения животных, 10 (2), 138–148.

Торндайк, Э. Л. (1898 г.). Интеллект животных: экспериментальное исследование ассоциативных процессов у животных.  Вашингтон, округ Колумбия: Американская психологическая ассоциация.

Торндайк, Э. Л. (1911). Интеллект животных: экспериментальные исследования.  Нью-Йорк, штат Нью-Йорк: Macmillan. Получено с http://www.archive.org/details/animalintelligen00thor 9.0005

Ватанабэ С., Сакамото Дж. и Вакита М. (1995). Дискриминация голубями живописи Моне и Пикассо. Журнал экспериментального анализа поведения, 63 (2), 165–174.

Атрибуты изображения

Рисунок 8. 5: «Ящик Скиннера» (http://en.wikipedia.org/wiki/File:Skinner_box_photo_02.jpg) находится под лицензией CC BY SA 3.0 (http://creativecommons.org/licenses/by -sa/3.0/deed.ru). «Схема коробки Скиннера» Андреаса1 (http://en.wikipedia.org/wiki/File:Skinner_box_scheme_01.png) находится под лицензией CC BY SA 3.0 (http://creativecommons.org/licenses/by-sa/ 3.0/deed.ru)

Рисунок 8.6: Адаптировано из Kassin (2003).

Рисунок 8.7:  «Игровые автоматы в казино Hard Rock» Теда Мерпи (http://commons.wikimedia.org/wiki/File:HardRockCasinoSlotMachines.jpg) распространяется под лицензией CC BY 2.0. (http://creativecommons.org/licenses/by/2.0/deed.en).

Оперантное обусловливание: определение, Скиннер, примеры

Что общего между дельфином, прыгающим через обруч, собакой, притворяющейся мертвой, и кошкой, дающей пять? Это оперантное обусловливание! В этом разделе будет рассмотрено оперантное обусловливание Б. Ф. Скиннера, его теория и некоторые примеры.

  • Что такое оперантное обусловливание?
  • Как Скиннер проводил свой эксперимент с оперантным обусловливанием?
  • Каковы свойства арматуры?
  • Каковы некоторые примеры оперантного обусловливания?
  • Чем оперантное обусловливание отличается от классического обусловливания?

Определение оперантного обусловливания

Б. Ф. Скиннер считал, что поведение можно изучать с научной точки зрения. Он также думал, что поведение является добровольным и имеет цель: воздействовать на окружающую среду . Это поведение, которое он назвал оперантным поведением , является центром оперантного обусловливания.

Скиннер описывает оперантное поведение как поведение, на которое влияют его результаты.

Другими словами, человек воздействует на свое окружение для достижения желаемых результатов. Итак, что же такое оперантное обусловливание?

Оперантное обусловливание — это метод обучения или изменения поведения, при котором последствие реакции, положительное или отрицательное, влияет на повторение действия.

Рис. 1. Собака переворачивается за угощением

Предположим, вы даете собаке угощение, когда она переворачивается. Собака учится ассоциировать действие с наградой посредством оперантного обусловливания.

Оперативное обусловливание утверждает, что каждое действие, которое мы предпринимаем при взаимодействии с окружающей средой, имеет последствия. Мы с большей вероятностью будем повторять действия с положительными результатами, чем действия с отрицательными результатами. Получив наказание как следствие поведения, мы, скорее всего, никогда не повторим это поведение.

Теория оперантного обусловливания

В своем научном исследовании Скиннер разделил поведение на три части: дискриминативный стимул , оперантная реакция и подкрепление или наказание . Эти три представляют собой трехчленную непредвиденную ситуацию, которая иллюстрирует связь между оперантной реакцией и следствием (подкреплением или наказанием).

Давайте определим эти три термина:

  • A дискриминативный стимул служит антецедентом поведения, например событий или ситуаций, в которых происходит поведение.
  • Поощрения — это реакции, повышающие вероятность поведения, которому они следуют.
  • Каратели — это ответы, уменьшающие вероятность поведения, за которым следует.

Приближается экзамен (различительный стимул), и вы хорошо рассмотрели и приложили все усилия при подготовке к экзамену. Пришли результаты, и вы заработали высокий балл. Твои родители были горды и отвели тебя в любимый ресторан (подкрепление). Если вы целый день играли в видеоигры и провалили экзамен, ваши родители отругали вас за безответственность (каратель).

Случайность с тремя терминами послужила основой исследования Скиннера об оперантном обусловливании. В своем анализе он также определил несколько типов оперантного обусловливания.

Типы оперантного обусловливания

Скиннер разработал четыре типа оперантного обусловливания: положительное подкрепление , отрицательное подкрепление , положительное наказание и отрицательное наказание .

Положительное подкрепление

Мы уже упоминали, что оперантное обусловливание включает поощрение или наказание.

В положительном подкреплении благоприятный результат следует за поведением, чтобы увеличить его повторение.

Когда вы применяете положительное подкрепление, вы хотите усилить реакцию (например, с точки зрения частоты или вероятности) с помощью оперантного подкрепления. В данном случае положительное подкрепление.

Джон заметил, что его друг Люк выглядит грустным, поэтому решил пошутить, чтобы подбодрить его. Люк рассмеялся, что положительно укрепило поведение Джона. Так что в следующий раз, когда Люк расстроится, Джон, скорее всего, повторит это поведение.

Отрицательное подкрепление

Положительное подкрепление усиливает поведение, поэтому отрицательное подкрепление ослабляет его. Верно? Отрицательное подкрепление также может усиливать поведение. Этот тип подкрепления относится к оперантному аверсивному обусловливанию.

Отрицательное подкрепление возникает, когда вы удаляете неприятное событие (отрицательный стимул или отрицательное подкрепление) после поведения.

Вы едете и вдруг слышите визг, когда нажимаете на тормоз. Испытывая беспокойство, вы привели свою машину к механику и обнаружили, что тормозные колодки нуждаются в замене. Механик заменил их, и визг исчез. Устранение визжащего шума негативно укрепило поведение при доставке автомобиля к механику.

Существует два типа отрицательного подкрепления: избегание и бегство .

Избегая, ученик предотвращает возникновение неприятного события. Если неприятное событие уже произошло, устранение отрицательного подкрепления происходит посредством поведения избегания.

Избегание: Когда вы оставляете посуду в раковине, вы слышите, как ваша мать возвращается из бакалейной лавки и паркует машину на подъездной дорожке. Ты бросился мыть посуду до того, как она вошла в дом, чтобы не придираться.

Побег: Но что, если твоя мама придет и увидит посуду в раковине раньше, чем ожидалось? Твоя мать начинает тебя пилить, а ты моешь посуду, чтобы она перестала ворчать.

Позитивное наказание

Наказание – это еще одна форма оперантного аверсивного обусловливания, целью которого является ослабление поведения. Когда поведение ослабевает, это означает, что происходит уменьшение частоты, продолжительности и интервалов.

Наказание относится к негативным последствиям (аверсивным стимулам) после поведения.

Положительное наказание возникает, когда за реакцией следует неприятный стимул (что-то, чего вы не хотите).

Группе учеников грозит задержание после того, как они отказались следовать за своим учителем.

Неблагоприятные последствия неправильного поведения должны быть незамедлительными и последовательными, чтобы учащийся связывал последствие поведения с более высокой вероятностью его прекращения.

Негативное наказание

Негативное наказание предполагает удаление чего-то ценного (объекта или действия) после ответа.

Человек лишен водительских прав после многочисленных нарушений правил дорожного движения.

Психологи предупреждают, однако, о чрезмерном наказании, поскольку наказание говорит вам, чего не следует делать; это может не привести к желаемому поведению. Наказания могут сделать ученика агрессивным, потому что это механизм выживания (для решения жизненных проблем).

Проще говоря, положительное наказание (+) добавляет отрицательное последствие, а отрицательное наказание (-) что-то убирает.

Свойства арматуры

Ранее мы определили, что такое подкрепление, положительное и отрицательное подкрепление поведения. В оперантном обусловливании Скиннер определил свойства подкрепления, такие как различные типы подкрепления и графики подкрепления.

Типы подкрепления

Первичные подкрепления — это подкрепления, имеющие для нас биологическое значение, такие как пища, вода и сон. Это подкрепление является универсальным, а значит, может возникнуть у каждого.

Вторичные подкрепления , также известные как приобретенные или условные подкрепления , изначально нейтральны, но могут усиливать поведение в сочетании с первичным подкреплением. Примеры включают жетоны, баллы и наклейки.

Графики подкрепления

Графики подкрепления описывают способ и время предоставления подкрепления учащемуся. Существует два типа графиков армирования: непрерывный и частичный .

Непрерывное подкрепление относится к подкреплению каждый раз, когда учащийся совершает целевое поведение.

Учитель дает золотую звезду каждый раз, когда ученик участвует в уроке.

Частичное поощрение , с другой стороны, предполагает предоставление поощрений на основе целевого количества желаемых действий (графики соотношений) или времени (графики интервалов).

Схемы с фиксированным соотношением требуют определенного количества ответов, прежде чем произойдет подкрепление.

Менеджер по продажам выплачивает сотруднику надбавку к зарплате за достижение целевых показателей продаж в течение шести месяцев подряд.

Графики с фиксированным интервалом включают подкрепление желаемого поведения после определенного периода. Этот график приводит к увеличению количества ответов по мере приближения подкрепления.

Алиса готовится к экзамену на получение лицензии. У нее было три месяца на подготовку к экзамену, но в первые два месяца она не тратила столько времени на повторение. По мере приближения экзамена она провела последний месяц подготовки к экзамену, изучая уроки, чтобы убедиться, что она сдала экзамен (закрепление).

Схемы с переменным соотношением относятся к подкреплению желательного поведения без определенного количества ответов.

Наиболее распространенным примером графика подкрепления с переменным соотношением являются игровые автоматы. Непредсказуемость подкрепления способствует азартному поведению.

Графики с переменным интервалом относятся к подкреплению желательного поведения в непредсказуемые промежутки времени.

Непредсказуемость получения сообщения (подкрепления) через систему обмена мгновенными сообщениями может способствовать проверке уведомлений в разное время в течение дня.

Принципы оперантного обусловливания

Мы видели, как происходит подкрепление и какие типы подкрепления даются. Теперь мы рассмотрим три основных принципа оперантного обусловливания.

Принцип безотлагательности

Принцип безотлагательности подчеркивает время доставки подкрепления. Если подкрепление происходит сразу после поведения, тем сильнее оно влияет на ученика. Чем менее незамедлительны, тем менее эффективны последствия.

Принцип непредвиденных обстоятельств

Принцип непредвиденных обстоятельств относится к тому, насколько последовательно последствие следует за поведением. Этот принцип подчеркивает важность надежной передачи ответа для повышения эффективности последствий.

Принцип насыщения

Принцип насыщения говорит нам, что если у обучающегося нет аппетита к определенному стимулу (например, вознаграждению), последствия будут не такими эффективными; однако, если есть потребность в конкретном стимуле, эффект последствия возрастает.

Оперантное обусловливание Скиннера: Эксперимент

При проверке своей теории Б. Ф. Скиннер провел эксперименты по оперантному обусловливанию на животных, наблюдая за их поведением в ящике Скиннера. Скиннер разработал коробку Скиннера или камеру оперантного кондиционирования , которая записывала поведение организма в определенный период времени. Животное либо получает награду (поддон с едой), либо наказание (неприятные удары током), когда оно демонстрирует определенное поведение, например, нажимает на рычаг для крыс или клюет ключи для голубей.

Рис. 2 Ящик Скиннера

Когда крыса перемещалась по ящику, она случайно нажала на рычаг, соединенный с поддоном для еды. Поддон с едой автоматически бросал еду в дозатор (положительное подкрепление). Крыса научилась этому полезному поведению быстро после того, как ее поместили в ящик Скиннера всего несколько раз.

Скиннер тестировал отрицательное подкрепление, подвергая крысу неприятному электрошоку, когда она находилась внутри коробки. Когда крыса двигалась внутри коробки, она случайно нажимала на рычаг, и удары током сразу прекращались (негативное подкрепление). После того как ее несколько раз поместили в коробку, крыса быстро научилась этому поведению. В следующий раз, когда крысу поместили в коробку, она тут же поспешила нажать на рычаг, чтобы избежать неприятных ощущений от ударов током.

Примеры и применение оперантного обусловливания

Существует несколько примеров применения оперантного обусловливания в повседневной жизни. Оперантное обусловливание Скиннера способствовало развитию методов лечения, таких как экономика токенов и формирование поведения .

Родители и учителя используют экономию жетонов для подкрепления желательного поведения с помощью жетонов, таких как наклейки, купоны, деньги или баллы, которые ребенок может обменять на вознаграждения, такие как еда, занятия или привилегии. Экономика токенов помогает научить детей следовать правилам дома и в школе.

Рис. 3 Дрессировка цирковых животных

Формирование поведения включает в себя получение ответов путем упрощения желаемого поведения до небольших управляемых шагов, за которыми следует вознаграждение, когда учащийся завершает каждый шаг.

Например, дрессировщики используют формирование поведения для обучения сложным трюкам цирковых животных.

В поведенческой терапии психологи используют оперантное обусловливание и его принципы для изменения поведения и лечения психологических состояний, таких как депрессия, расстройства пищевого поведения и обсессивно-компульсивное расстройство (ОКР).

Классическое и оперантное обусловливание

Мы понимаем, что и классическое, и оперантное обусловливание являются формами ассоциативного обучения. Но какая разница? Давайте посмотрим на эту таблицу, чтобы сравнить два типа кондиционирования.

Классическое обусловливание

Оперантное обусловливание

Поведение непроизвольное.

Поведение является добровольным.

Обучение происходит до появления реакции (предъявление безусловного раздражителя после условного).

Обучение происходит после того, как имеет место реакция (посредством подкрепления или наказания).

Обучаемый пассивен.

Обучаемый активен.

Обучаемый связывает нейтральный стимул с безусловным стимулом, вызывая реакцию.

Обучаемый связывает реакцию с последующим последствием, влияющим на повторение поведения.

About the Author

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Related Posts