Метод поощрения и наказания: Тема урока: «Поощрение и наказание»

Содержание

Поощрение и наказание как методы воспитания. | Статья на тему:

Поощрение и наказание как методы воспитания.

Определение «поощрение» и его антагонист «наказание»

Поощрение и наказание следует рассматривать (изучать) одновременно, так как они являются методами педагогического стимулирования. Основные определения:

Поощрение ^[1] – метод мотивации, противоположный наказанию; содействие развитию чего-либо; похвала или награда.

Поощрение ^[2] – метод воспитания, стимулирующий деятельность обучаемого. Поощрение вызывает положительные эмоции, способствовавшее возникновению уверенности обучающегося в свои силы. Поощрение осуществляется в виде благодарности, похвалы, награды, подарка и т.д.

Поощрение ^[3] – метод воспитания, предназначенный для стимулирования личного роста и развития. Поощрение – это положительная оценка учения, труда, поведения.

Наказание ^[4] – вид моральной санкции, применяемой в случае нарушения принятых установлений правил и заключающейся в ограничении возможностей и понижении социального статуса (лишение прав, имущества, свободы) виновного в этом.

Наказание ^[5] – применение каких-либо, правовых или неправовых, неприятных или нежелательных мер в отношении человека, животного или их групп в ответ на неповиновение или на неугодное или морально неправильное поведение.

Наказание ^[6] – средство управления, состоящее в сознательном причинении неприятностей подвластному существу, с целью изменения нежелательного поведения или образа мыслей.

Эффективное и неэффективное поощрения в педагогическом общении.

Таблица по П. Массену, Дж. Конджеру.

Поощрение – это метод позитивного отношения к личности человека. В моём случае – воспитанника, так как являюсь педагогом в ДОУ. В педагогическом общении метод поощрения может и должен применяться.

Существует система вербальных воздействий педагогов высокого и низкого уровня деятельности, отличающихся не только количественно, но и качественно. Педагоги высокого уровня используют следующие формы словесного воздействия (в порядке значимости): инструктирование, повышение интонации, называние фамилии, поощрение, юмор. Преподаватели низкого уровня деятельности также часто повышают голос или обращаются к ученикам по фамилии, но к юмору и поощрению прибегают крайне редко. Еще менее характерно для них инструктирование, поскольку такие педагоги больше дисциплинируют, чем организуют учеников. Педагог должен создавать предпосылки для ребенка к тому, чтобы он становился способным, дисциплинированным, коммуникабельным. Подобное отношение поможет воспитаннику самостоятельно социально адаптироваться в будущем (в школе, в институте, во дворе и дома).

Представляю таблицу «эффективного и неэффективного поощрения^[7]» (о которой узнала из учебника по детской психологии), где под эффективностью понимается способность достигать необходимого результата. К примеру: в процессе формирования у детей дошкольного возраста навыков или развития умений, эффективным действием со стороны педагога (обучающего) будет то, которое приведёт к овладению навыка или умения.

№	Эффективное поощрение	Неэффективное поощрение
1	Осуществляется постоянно	Осуществляется от случая к случаю
2	Сопровождается объяснением, что именно достойно поощрения	Делается в общих чертах
3	Педагог проявляет заинтересованность в успехах воспитанника	Педагог проявляет минимальное формальное внимание к успехам воспитанника
4	Педагог поощряет достижение определенных результатов	Педагог отмечает участие в работе вообще
5	Сообщает воспитаннику о значимости достигнутых результатов	Дает воспитаннику сведения о его достижениях, не подчеркивая их значимость
6	Ориентирует воспитанника на умение организовать работу с целью достижения хороших результатов	Ориентирует воспитанника на сравнение своих результатов с результатами других, на соревнование
7	Педагог дает сравнение прошлых и настоящих достижений воспитанника	Достижения воспитанника оцениваются в сравнении с успехами других
8	Поощрение для данного воспитанника соразмерно затраченным этим воспитанником усилиям	Поощрение независимо от усилий, затраченных воспитанником
9	Воспитатель воздействует на мотивационную сферу личности воспитанника, опираясь на внутренние стимулы: воспитанник с удовольствием выполняет задание, потому что оно интересное или хочет развить соответствующее умение, т. е. получает удовлетворение от самого процесса поручения	Воспитатель опирается на внешние стимулы: воспитанник старается лучше выполнить задание, чтобы заслужить похвалу педагога или победить в соревновании, получить награду и т.д.
10	Способствует проявлению заинтересованности в новой работе, когда прежнее задание выполнено	Вторгается в процесс работы, отвлекает от необходимости постоянной работы

В любом случае, использование метода поощрения способствует формированию у воспитанников положительных эмоций, качеств и стимулирует их к действию.

«Поддержи ребёнка словом!»

В воспитательных моментах, чаще всего, я использую одобрение, похвалу или благодарность. Как это можно сделать:

Правильно! Хорошо! Прекрасно! Отлично! Замечательно! Превосходно! Чудно! Великолепно! Необыкновенно! Совершенно!
Ты делаешь это очень хорошо. Ты делаешь это сегодня значительно лучше. Хорошая работа! Ещё немного времени, и у тебя это получится. С каждым днём у тебя получается лучше. Я знал(а), что ты можешь сделать это. Твоя работа принесла мне много радости.
Это лучше всего! Ещё лучше! Это лучше, чем всегда. Так держать! Ты это сможешь! Ты смелее, умнее, сильнее!
Поздравляю! Мои поздравления! Я очень горжусь тобой. Это уже успех! Это твоя победа. Сердечно рад(а) за тебя.
Молодец! Умница! Ты быстро учишься. Это, то что надо! Ты прав!
Большое тебе спасибо. Ты хороший (ая)! Ты – чудо!

Позитивное и негативное наказание по Б.Ф.Скиннеру. Дж. Аронфрид о наказании.

Наказание может использоваться для формирования у индивидуума социально приемлемой модели поведения и социальных поступков. Цель наказания – побудить человека не вести себя определенным образом. Как и поощрение, наказание также является методом контролируемого поведения.

По Б.Ф.Скиннеру наказание за неодобренное поведение осуществляется двумя способами:

Позитивное наказание	Негативное наказание
Это применение аверсивного стимула для устранения какого-либо поведения. Форма физического наказания: поставить в угол, телесное наказание, лишение свободы, раздражение поведением и ругань.	Это устранение положительного стимула, лишение награды, подкрепляющей это поведение. Форма морального наказания: запретить что-либо ребёнку делать, убрать игрушки, не разрешать есть сладкого, не отпустить гулять.

Б.Ф.Скиннер утверждает, что не раскрывает сути того, как следует поступать. Наказание указывает на то, что нельзя делать. В отличии от наказания, не имеющего мгновенного и продолжительного эффекта, поощрение (за хорошее поведение) и одобрение, имеют длительное влияние и не вызывают отрицательных эмоций.

Дж. Аронфрид ставит под сомнение утверждение Скиннера о том, что успешная социализация ребенка может обойтись без наказаний, и его также не удовлетворяют идеи психоанализа о травмирующем воздействии наказаний на детей. Аронфрида интересовал вопрос о том, как формируется у ребенка внутренний контроль за порицаемым поведением. Для ответа на него была проведена тестирующая серия эксперимента. Оказалось, что испытуемые, получавшие порицание в самом начале выбора, в тестовой ситуации совершали меньше проступков, чем те, которых наказывали уже после проступка. С точки зрения Аронфрида, время подачи наказания имеет особенно важное значение. Если ребенка наказывают перед самым началом проступка, то внутренние моторные или познавательные корреляты действия в этот момент становятся фокусом тревожности, вызываемой наказанием. Формы наказания неравноценны по своему влиянию на социализацию, но механизм их действия, по мнению Аронфрида, один и тот же.

Заключение.

В педагогической практике поощрение, вопреки наказанию, наиболее результативный метод воспитания ребенка. Позитивное отношение, выражающееся в стимулировании и поддержании положительного поведения воспитанников, способствует развитию нравственных качеств и моральной устойчивости. Качественный уровень деятельности педагога определяется использованием форм словесного воздействия как эффективного поощрения. Как это можно сделать:

Оценивать соотношение поощрений и наказаний, чтобы быть уверенным в том, что поощрений в количественном отношении больше. Это необходимо для положительного фона воспитания.
Использовать минимальные вознаграждения, поскольку они оставляют место для тех ощущений радости, которое сопровождают успех и достижения ребёнка.
Давать особо почётные поручения. Когда ребёнку доверяется, поручается нечто большее, чем обычно.
Поощрять не только за результат, но и за попытку ребёнком достигнуть результата, за старание сделать хорошо, помочь.

[1] Википедия

[2] Э.Г.Азимов «Новый словарь методических терминов и понятий». М.: Изд. ИКАР 2009г.

[3] В.С.Безрукова «Основы духовной культуры (энциклопедический словарь педагога)». Екатеринбург. 2000г.

[4] http://dic.academic.ru/dic.nsf/enc_philosophy/8722

[5] Википедия

[6] Автор: Педагог-психолог НОУ-школы «Экология и диалектика» Заложнова Т.А.

[7] по П. Массену, Дж. Конджеру и др. Массен (Mussen) Пауль (род. 21 марта 1922) — американский психолог, профессор университета Беркли в Калифорнии (с 1956). Основные работы Массена посвящены исследованию развития ребёнка, отношений между детьми и родителями, а также проблеме культура и личность. Соч.: Child Development and Personality (совм. с J. Conger, J. Kagan). Конгер (Conger) Джон (род. 27 февраля 1921) — американский психолог, профессор Колорадского университета (с 1957). Известен своими работами в области психопатологии, психосоматики, развития личности детей и подростков, Соч.: Adolescence and youth: psychological development in changing world. N. Y., 1973; Child development and personality (совм. с Р. Mussen), 4-th ed. N. Y., 1974.

Поощрение и наказание

«Наказывать ребенка лучше,
лишая его хорошего, чем
делая ему плохое»
Ю. Гиппенрейтер

Поощрение и наказание – это две стороны одной медали, имя которой «воспитание».

Поощрение — это проявление положительной оценки поведения ребёнка.

Наказание — это отрицательная оценка поведения ребёнка в случае нарушения им норм нравственности.

Наказание. Существует немало способов демонстрации взрослыми своего отрицательного отношения к поступкам сына или дочери: холодный взгляд, нахмуренные брови, предостерегающий жест, гневное слово и т. д. «Не ожидала от тебя», — говорит грустно мама, и для ребёнка это уже является наказанием, ибо из уст самого родного человека прозвучала отрицательная оценка его поведения. Но надо помнить, чем больше родители используют такие авторитарные методы воздействия, как приказы, нагоняи, придирки, ворчание, крики, брань, тем меньше это оказывает влияние на поведение их детей. Если же вдобавок взрослые разгневаны, раздражены, настроены враждебно или вовсе впадают в истерику, то не следует ожидать положительного результата. Разумеется, не следует увлекаться наказаниями. Но в то же время нельзя снисходительно, примиренчески относиться к серьёзным недостаткам в поведении ребёнка и допускать безнаказанность. А.С.Макаренко правильно указывал: «Разумная система взысканий не только законна, но и необходима. Она помогает оформиться крепкому человеческому характеру, воспитывает чувство ответственности, тренирует волю, человеческое достоинство. Умение сопротивляться соблазнам и преодолевать их».

Надо стремиться к тому, чтобы наказание не унижало личность ребёнка, не оскорбляло его человеческое достоинство.

Наказание не достигает цели, если налагается в состоянии раздражения. Сознательную дисциплину невозможно установить путём грубых окриков. Порицание нужно делать кратко, ясно, твёрдо и требовательно, но без запальчивости и раздражения.

Наказания не должны быть слишком частыми. Но в то же время нельзя снисходительно относиться к серьёзным недостаткам в поведении ребёнка и допускать безнаказанность.

Особого подхода требуют легко возбудимые дети. Процессы возбуждения у них преобладают над процессами торможения. Поэтому нередко в отношениях с другими детьми, а иногда и взрослыми, они проявляют резкость, грубость, развязность. Запрещения и замечания взрослых, особенно если делаются в резкой форме, не всегда положительно влияют на таких детей. Здесь полезно предъявлять требования в виде просьбы, совета.

Наказание не должно вредить здоровью – ни физическому, ни психическому. Не унижайте ребенка. Нельзя наказывать лишением еды. Ребенок не должен панически бояться наказания. Он должен знать, что в определенных случаях наказание неотвратимо.

Если есть сомнения: наказывать или не наказывать – не наказывайте.

Ребенок должен знать, за какой поступок его наказывают.

Не стоит наказывать трудотерапией – после этого любая работа будет восприниматься, как наказание.

За один проступок – одно наказание. Если проступков совершено сразу много, наказание может быть суровым, но только одно наказание, за все проступки.

Недопустимо запоздалое наказание.

Определить необходимое наказание и его меру очень трудно. Ребёнок очень чувствителен к справедливости наказания. Пожалуйста, помните следующее:

— вы можете ошибаться.

— имейте мужество извиниться перед ребёнком, если наказали его незаслуженно.

— контролируйте поведение ребёнка, старайтесь предупредить возможные отрицательные поступки.

Но и, конечно, есть небольшие советы по поводу того, как сделать наказание эффективным, если соблюдать следующее условия:

Наказывать как можно реже, только в том случае, когда без наказания нельзя обойтись, когда оно явно целесообразно.

Наказание не должно восприниматься ребёнком как месть или произвол. При наложении наказания взрослый ни в коем случае не должен демонстрировать сильный гнев или раздражение. О наказании сообщается спокойным тоном; при этом особо подчёркивается, что наказывается поступок, а не личность.

После наказания проступок должен быть «предан забвению». О нем больше не напоминают точно так же, как не вспоминают и наказание.

Необходимо, чтобы наказания не лились целыми потоками, одно за другим. В этом случае они не приносят никакой пользы, только нервируют ребёнка, а вследствие своего большого количества, даже не могут быть приведены в исполнение.

Наказание должно в некоторых случаях отменяться, если ребёнок заявляет, что он готов в будущем исправить своё поведение, не повторять своих ошибок.

Ребенка ни в коем случае нельзя наказывать, когда он болеет; перед сном и сразу после него; во время еды; во время работы и игры; непосредственно после душевной или физической травмы; когда ребенок искренне старается что-то сделать, но у него не получается; когда родитель находится в плохом настроении.

Не наказания должен бояться ребенок, не гнева, а вашего огорчения.

Поощрение. Существует много способов выразить ребёнку свою положительную оценку. Это и ласковый взгляд, и поощрительный, легкий кивок головы, и одобряющий жест, и доброе слово, и похвала, и подарок.

Поощрение ребенка, за что — то хорошее, примерное поведение, укрепляет у него веру в свои силы, вызывает желание и в дальнейшем вести себя лучше, проявить себя с хорошей стороны.

Особенно важно поощрять ребёнка за умение находить и выполнять дела, нужные и полезные для семьи. Например, ребёнок, не дожидаясь указания родителей, по своей инициативе оказал помощь престарелым родственникам, самостоятельно прополол огород, принёс воды. Эти факты положительного поведения ребёнка следует одобрить, используя следующие высказывания — «Ты стал совсем взрослым», или же «какой ты молодец» и т. д.

Не всегда и не всё нужно поощрять. То, что вошло в жизнь и быт, превратилось в привычку, стало традицией, не требует поощрения. Поощрять надо лишь за действительные, а не за мнимые заслуги. Поощрение следует применять с учетом индивидуальных особенностей ребёнка.

Следите за тем, чтобы похвала не была преувеличенной. Такую похвалу тотчас хочется «поставить на место», проявить свою истинную натуру. Ребенок, словно чувствуя сомнение, а такой ли он «чудесный, милый, незаменимый», пытается опровергнуть похвалу своим поведением. Ребенок оценит искреннюю похвалу, и в следующий раз будет искренне рад сделать вам приятное.

Похвала должна быть направлена на поступок ребенка, а не на его личность. Ребенок может почувствовать тревогу, ведь он далеко не такой идеальный, как о нем говорят. А внимая бесконечным восклицаниям: «Какой замечательный ребенок! Ну и умница» — малыш рискует вырасти самовлюбленным эгоцентриком.

Не выражайте свое одобрение в финансовом эквиваленте за помощь по хозяйству или творческую деятельность. Человек успешно занимается тем, что выбирает искренне, по внутренним мотивам. Если же ребенок знает, что вслед за действием последует оплата, то в корне поменяет характер поведения – из «творческого делания» его активность превратится в «зарабатывание денег».

В семьях, где есть несколько детей, родители должны следить, чтобы поощрение одного ребенка не вызывало у остальных чувства зависти или обиды.

Однозначно исключите метод поощрения – конфеткой или шоколадкой. Дети, конечно, очень любят полакомиться, но создавать культ из еды и воспитывать чрезмерный интерес к ней не стоит. Конечно, проще купить ребенку конфету, чем заняться с малышом. Проще, но далеко не лучше.

Поощрение должно следовать за хорошим поступком, а не обещаться заранее. Ваш ребенок должен научиться получать удовлетворение от самого труда, а не стараться ради награды. В жизни не все дела награждаются, и не надо приучать всегда ожидать ее.

Учите своего ребенка быть благодарным за любые знаки внимания, проявленные к нему.

Главный метод воспитания — это убеждение. А для этого говорите со своим ребёнком, общайтесь с ним, ищите примеры положительного подтверждения ваших мыслей, будьте тактичны, убеждая его. Только в таком случае ваши мысли станут его мыслями, ваши стремления станут его стремлениями.

Подготовлено психологом ОСЗС С.А. Сытиной
с использованием Интернет- ресурсов

Система поощрений и наказаний.

Главная \ Информация \ Родителям \ Советы психолога \ Система поощрений и наказаний.

Система поощрений и наказаний

Возможно ли воспитывать ребенка без наказания? Попробуйте дать определение слову — поощрение и наказание. Вот какое определения этим двум понятиям даёт детский психолог Д.Фонтенель. По его мнению, поощрением может служить все, что приятно данному ребенку, а наказание — это лишение ребенка того, что для него важно и будет воспринято им как ощутимая потеря. Слово «наказание» для многих ассоциируется с агрессией, физическим насилием, детскими криками и слезами. Такая расправа над ребенком — не является наказанием, а демонстрацией своего превосходства над слабым и беззащитным. Наказание из древних времен произошло от слова «наказ» и подразумевает наставление, назидание и вразумление. Наказание детей всегда необходимо сопровождать сочувствием, поддержкой, прощением и обучением. Цель как поощрения, так и наказания всегда состоит в том, чтобы помочь детям в приобретении знаний, умений и навыков для использования их в своей жизни. Применять поощрение и наказание, в процессе воспитания детей, необходимо разумно, осознанно и помнить о том, что оба метода влияют на самооценку ребенка.

Давайте вместе обдумаем неприемлемые и приемлемые методы наказания.

Физическое наказание.

Конвенция о защите прав детей и другие законодательные акты в нашей стране запрещают физическое насилие по отношению к ребенку с чьей бы то ни было стороны. Применение физических наказаний в педагогической практике свидетельствует о некомпетентности взрослого, который не способен контролировать свои чувства и поведение.

Вербальное наказание.

Также неэффективной формой наказания является вербальное, когда взрослый повышает голос на ребенка, упрекает, говорит унизительные слова, либо читает нотации. В такой ситуации у ребенка часто срабатывает психологическая защита, они отключают внимание, чтобы не воспринимать гнев взрослого направленный на него. Таким образом, мы совместно пришли к выводу о том, что физическое и вербальное наказание неприемлемы в педагогической практике. Однако, можно избежать физического наказания, используя множество эффективных методов взаимодействия с детьми и достигнуть воспитательной цели.

Потеря привилегий.

Данная форма наказания подразумевает, что дошкольник лишается определенных, важных для него поручений за совершенный проступок. Это эффективная форма наказания, однако необходимо соблюдать некоторые условия.

1. Заранее четко определить недопустимое поведение.

2. Обозначить цену провинности.

3. Последовательное применение.

Запрет на приятные для ребенка занятия.

Эта форма наказания зарубежными психологами была обозначена как «Тайм-аут». Таким наказанием ребенок на определенное время лишается приятного для него занятия, увлечения. Используя «Тайм-аут», также необходимо соблюдать ряд условий.

1. Обозначить для ребенка, за какую провинность последует его наказание.

2. Перед наказанием ребенку должно быть сделано 1-2 предупреждение.

3. Заранее сказать ребенку, на какой период ему будет запрещено любимое занятие и что он должен сделать, чтобы выйти из тайм-аута.

4. У взрослого должен быть спокойный, без эмоций, невозмутимый вид.

5. Последовательность действий.

Лишение поощрения.

Такая форма наказания может быть использована родителем, если в семье применяется определенная система поощрений. Лишение награды является действенным способом наказания. Отечественные и зарубежные психологи рекомендуют родителям в процессе взаимодействия с детьми использовать позитивный подход и переключить свое внимание с плохих поступков дошкольников на хорошие. Позитивный подход включает в себя: поощрения, награды и демонстрацию одобрительного отношения к ребенку. Теперь давайте задумаемся над неприемлемыми и приемлемыми методами поощрения. Эффективными и приемлемыми методами в педагогической практике являются материальные и социальные поощрения, а также поощрения, связанные с различными видами детской деятельности.

Материальные поощрения — вещи, имеющие для ребенка ценность: наклейки, значки отличия, сладости, игрушки и другие.

Социальные поощрения — один из эффективных типов поощрения, может быть выражен родителем ребенку в похвале, доброжелательных словах, рукопожатии, улыбке, похлопывании по спине. Психологи отмечают стимулирующее действие тактильного прикосновения к ребенку для формирования правильного поведения.

Поощрения, связанные с различными видами детской деятельности. Педагоги и психологи отмечают, что использование поощрений в воспитательно-образовательном процессе помогает добиться от ребенка положительных результатов.

Оперантное обусловливание (теория наказания и вознаграждения)

Что такое оперантное обусловливание?

Оперантное обусловливание — это метод обучения, который реализуется посредством вознаграждения и наказания за поведение, другими словами, это тип обучения, при котором поведение человека модифицируется его последствиями или реакцией на поведение. Поведение может меняться по форме, частоте или силе.

Этот термин был введен Б. Ф. Скиннером, который считал, что у нас есть такая вещь, как разум, но просто более продуктивно изучать наблюдаемое поведение, а не внутренние психические события.

Оперантное и классическое обусловливание

Оперантное обусловливание пытается изменить поведение, которое обычно носит произвольный характер и может поддерживаться последствиями или реакциями, в отличие от классического обусловливания, которое имеет дело с обусловливанием автоматического или рефлекторного поведения, которое не поддерживается последствиями.

Типы оперантов/ответов на поведение:

Скиннер выделил три типа ответов или оперантов, которые могут следовать за поведением.

Нейтральные операнты — это реакции окружающей среды, которые не увеличивают и не уменьшают вероятность повторения поведения.
Поощрение, усиливающее поведение — это реакция или последствие, вызывающее более частое проявление поведения. Подкрепление может быть положительным или отрицательным.
Наказание, ослабляющее поведение — это реакция или последствие, в результате которого поведение проявляется реже. Как и в случае с подкреплением, наказание может быть двух видов: положительное и отрицательное.

Основные инструменты оперантного обусловливания:

Положительные подкрепления – это благоприятные события или результаты, которые представляются после поведения. Это положительное подкрепление усиливает поведение, обеспечивая последствия, которые человек находит полезным. Например, если ваш учитель дает вам рупий. 100 (вознаграждение) каждый раз, когда вы выполняете домашнее задание (поведение), вы с большей вероятностью будете повторять это поведение в будущем, тем самым усиливая поведение, связанное с выполнением домашнего задания.
Отрицательные подкрепления как инструмент оперантного обусловливания включают удаление неблагоприятных событий или результатов после демонстрации поведения. В этих ситуациях реакция усиливается удалением того, что считается неприятным. Например, скажем, вы должны дать своему учителю рупий. 100 каждый день (неблагоприятный исход). Но в те дни, когда вы выполняете домашнее задание, вам не нужно платить учителю (удаление нежелательного результата). Вы выполните домашнее задание, чтобы сэкономить рупий. 100, тем самым усиливая поведение при выполнении домашнего задания.
Положительное наказание относится к неблагоприятному последствию или ответной реакции на поведение, которое приводит к уменьшению этого поведения. Например, каждый раз, когда вы опаздываете (поведение), вы получаете пощечину (последствие). Это последствие получения пощечины демотивирует вас опаздывать, тем самым ослабляя поведение.
Негативное наказание: также известное как наказание удалением, происходит, когда благоприятное событие или результат устраняется после совершения поведения. Например, каждый раз, когда ребенок просыпается поздно (поведение) утром, у него отнимают видеоигру (последствие) на этот день. Отказ от видеоигры после нежелательного поведения приводит к уменьшению этого поведения.

Примечание об инструментах оперантного обусловливания:

Здесь термины «положительный» и «отрицательный» используются не в обычном смысле, а скорее: положительный относится к сложению, а отрицательный — к вычитанию.

То, что добавляется или вычитается, может быть как подкреплением, так и наказанием. Следовательно, термин «позитивное наказание» иногда сбивает с толку, поскольку он обозначает «добавление» раздражителя или увеличение интенсивности раздражителя, вызывающего отвращение (например, порка или поражение электрическим током).

Вкратце:

Оперантное обусловливание — это тип научения, при котором поведение усиливается (то есть происходит чаще), когда за ним следует подкрепление, и ослабляется (происходит реже), когда за ним следует наказание . Он основан на простой предпосылке: на поведение влияют последующие последствия. Когда вас поощряют за что-то, вы с большей вероятностью сделаете это снова. Когда вас наказывают за что-то, вы с меньшей вероятностью сделаете это снова.

Если вы являетесь практикующим специалистом в области психического здоровья и хотели бы изучить передовые методы, основанные на гипнозе, НЛП и метафорической терапии, чтобы использовать принцип оперантного обусловливания в своей терапевтической практике, ознакомьтесь с дипломом по когнитивной гипнотической психотерапии®. Если вы коуч, который хочет улучшить свои навыки и внедрить различные типы кондиционирования, чтобы помочь клиентам изменить свое поведение и привычки, то вам обязательно нужно пройти курс Когнитивного Гипнотического Коучинга®.

Оперативное обусловливание – вознаграждать или наказывать?

Английский

Наградить или наказать?

Оперантное обусловливание, разработанное Б. Ф. Скиннером, представляет собой способ обучения с помощью поощрений и наказаний. Этот тип обусловленности предполагает, что определенное поведение и следствие, будь то вознаграждение или наказание, связаны между собой, что приводит к обучению.

Откройте для себя еще 30 статей по этой теме

Не пропустите эти статьи по теме:

Когнитивное обучение
Социальное обучение
Обучение
Социализация
Социальное развитие

Исследования классического обусловливания привели к появлению других теорий, которые могут объяснить поведение и обучение, и одной из них является оперантное обусловливание. Оперантное обусловливание пытается опровергнуть веру в то, что внутренние мысли и простые мотивы приведут к обучению поведению. Как бихевиорист, Скиннер считал, что следует рассматривать только внешние причины поведения.

Термин «оперант» был использован Скиннером, чтобы дать нам хороший обзор его теории. Под этим термином он подразумевал, что этот тип обусловленности включает только внешние факторы, влияющие на поведение и его последствия.

A. Поощрение

Поощрение – это процесс увеличения частоты или скорости поведения посредством предъявления стимула вскоре после проявления поведения. Событие, которое увеличивает вероятность повторения поведения, называется подкреплением. Существует два типа подкрепления:

Положительные подкрепления — это благоприятные стимулы, которые даются после демонстрации поведения. Положительное подкрепление усиливает вероятность поведения посредством добавления чего-либо.
Пример: Вы усердно учились и получили пятерку на экзамене по математике. Твоя мама награждает тебя, угощая в любимый ресторан. После этого ты снова усердно учишься, а также получаешь пятерку на экзамене по истории. Ваша мама награждает вас тем, что идет с вами на фильм, который вам нравится. Для ваших следующих экзаменов вы еще раз усердно учитесь.
Отрицательные подкрепления , с другой стороны, удаление неблагоприятных стимулов после демонстрации поведения. При отрицательном подкреплении поведение или реакция усиливается удалением чего-либо.
Пример: Вы выходите из дома в 8 утра, чтобы поехать на работу, и всегда сталкиваетесь с интенсивным движением. Вы выходите из дома раньше на следующий день, избегая пробок. Вы выходите из дома раньше 8 утра в течение следующих дней и продолжаете избегать интенсивного движения. Это означает, что ваше поведение, когда вы уходите из дома раньше 8 утра, усиливается тем, что вы избегаете пробок.

Как при положительном, так и при отрицательном подкреплении поведение усиливается.

B. Наказание

В отличие от подкрепления, наказание представляет собой процесс, при котором стимул предъявляется после проявления поведения и вызывает снижение вероятности повторения поведения. Существует два типа наказаний:

Положительное наказание — это добавление чего-то, что приводит к уменьшению повторения проявленного поведения. Негативное наказание, также известное как наказание удалением, происходит, когда благоприятное событие или результат устраняются после совершения поведения.
Пример: Ребенок дразнил свою сестру, отчего она так громко плакала. Мать отшлепала его по ягодицам из-за этого. Ребенок больше никогда не дразнил свою сестру.
Негативное Наказание, с другой стороны, является удалением чего-то благоприятного, чтобы уменьшить вероятность повторения поведения.
Пример: Подросток пойман на списывании на экзамене. Затем его родители запрещают ему пользоваться своей машиной, а также уменьшают его пособие. Подросток больше не списывает на своих нынешних экзаменах.

Для лучшего понимания этих концепций, вот таблица, которая обобщает характеристики положительного/отрицательного подкрепления и положительного/отрицательного наказания: поведение Добавление Положительное наказание Положительное подкрепление Удаление Отрицательное наказание Отрицательное подкрепление

Полная ссылка:

Вам разрешено копировать текст

Текст в этой статье находится под лицензией Creative Commons-License Attribution 4.0 International (CC BY 4. 0).

Это означает, что вы можете свободно копировать, распространять и адаптировать любые части (или весь) текста в статье, если вы указываете соответствующий кредит и предоставляете ссылку/ссылку на это страница.

Вот и все. Вам не нужно наше разрешение для копирования статьи; просто включите ссылку/ссылку обратно на эту страницу. Вы можете использовать его свободно (с какой-либо ссылкой), и мы также согласны с тем, что люди перепечатывают его в таких публикациях, как книги, блоги, информационные бюллетени, учебные материалы, статьи, википедия и презентации (с четким указанием авторства).

Статьи по теме

Связанные страницы:

Классическое обусловливание

Оперантное обусловливание

maricopa.edu

Хотите быть в курсе? Подписывайтесь на нас!

Подписаться на @ExplorableMind

Влияние вознаграждения и наказания на обучение навыкам зависит от требований задачи

Введение

Поощрение и наказание, включая биологические подкрепления, такие как пища, вода или боль, являются важными мотиваторами поведения как людей, так и животных. Большинство исследований в области неврологии сосредоточено на изучении влияния вознаграждения и наказания на принятие решений ^1,2,3 . Однако в последние годы резко возрос интерес к использованию поощрений и наказаний для улучшения обучения двигательным навыкам.0205 4,5,6,7,8,9 повышение заманчивой возможности того, что валентная обратная связь может быть реализована в реабилитационных учреждениях для улучшения результатов физиотерапии ^10,11,12,13 . Однако различия в методологиях, показателях производительности и сроках хранения, используемых в разных исследованиях, затрудняют установление общих принципов.

В настоящем исследовании изучается влияние поощрения и наказания на две разные задачи обучения навыкам: последовательное задание времени реакции (SRTT), последовательное задание, в котором участники нажимают кнопки в ответ на стимул, появляющийся на экране ¹⁴ ; и задача отслеживания силы (FTT) ^15,16,17, двигательная задача, в которой участники сжимают датчик силы, чтобы следовать за курсором на экране (фиг. 1A-D). Две задачи были реализованы как можно более похожим образом, чтобы облегчить их сравнение. На начальной тренировочной сессии участники тренировались либо по SRTT, либо по FTT и получали валентную обратную связь (денежное вознаграждение, денежное наказание или мотивированный контроль [см. методы]) на основе их результатов (рассчитываемых как [среднее время реакции/точность на блок] для SRTT; среднее расстояние от цели на блок в FTT). В обоих заданиях до и после обучения предъявлялись пробные пробы, при которых стимулы предъявлялись либо в фиксированном, либо в случайном порядке. Общее обучение навыкам оценивалось путем сравнения исходной производительности с производительностью после тренировки, независимо от типа пробного блока. Обучение навыкам, специфичным для последовательности, отличалось от общего обучения навыкам путем сравнения производительности на фиксированных и случайных блоках проб. Затем оценивали сохранение навыков при отсутствии обратной связи через 1 час, 24 часа и 30 дней после завершения обучения.

Рисунок 1

( A ) Экспериментальный дизайн. Семьдесят два участника были разделены между двумя задачами обучения навыкам: задачей, которая требует интеграции нескольких систем памяти, последовательной задачей времени реакции (SRTT) и задачей, которая изучается в первую очередь двигательной сетью, задачей отслеживания силы (FTT). ). В рамках каждой задачи участники были случайным образом распределены по трем различным группам обратной связи (поощрение, наказание, контроль). ( B ) Экспериментальная временная шкала. Для каждой задачи испытания были сгруппированы в блоки испытаний. Участники не знали, что во время некоторых блоков («блоков с фиксированной последовательностью») стимул появлялся в соответствии с повторяющимся шаблоном. В остальные периоды появление стимула определялось случайным образом («блоки случайной последовательности»). После блоков ознакомления участников обучали выполнению задания с валентной обратной связью. Чтобы оценить знание последовательности, обучение было забронировано ранними и поздними пробами, в которых участники выполняли три блока, расположенных случайным образом — последовательность — случайным образом. Затем участников тестировали на знание последовательности без обратной связи через 1 час, 24 часа и 30 дней после обучения. ( C ) Последовательная задача времени реакции. Участникам были представлены четыре места на экране, обозначенные буквами «О». Суд начался, когда один «О» сменился на «Х». Участников просили как можно быстрее и точнее нажимать соответствующую кнопку на контроллере. Через 800 мс буква X снова сменилась на O, и участники получили валентную обратную связь за их работу в этом испытании. Производительность в SRTT основывалась на времени реакции и точности нажатия кнопки. Если участники были точны и быстрее, чем они выполняли свои предыдущие 96 испытаний, участник получит положительную обратную связь (поощрение или отсутствие наказания) в этом испытании. Если бы они были медленнее или неточнее, то получили бы отрицательный результат (либо наказание, либо отсутствие награды). ( D ) Задача отслеживания силы. Участники держали датчик силы в правой руке и видели черный круг (начальное положение), синий круг (цель) и белый круг (курсор). Участникам было предложено сжимать датчик силы, чтобы держать курсор как можно ближе к центру мишени. Мишень непрерывно двигалась во время испытания (12 секунд) с последующим 2-секундным перерывом между испытаниями. Расстояние от курсора до цели было мерой производительности. Если участник был ближе к центру мишени, чем в предыдущих 8 испытаниях, он получал положительную обратную связь. Во время блоков последовательности цель следовала по одной из шести траекторий (D, слева), тогда как во время случайных блоков цель следовала по случайной траектории.

Изображение в полный размер

Участники смогли успешно выучить обе задачи, и полученные навыки почти полностью сохранялись через 30 дней. В целом, мы увидели незначительное влияние вознаграждения как на обучение, так и на удержание. Наказание не повлияло на сохранение навыков, но оказало существенное влияние на обучение в зависимости от задачи. В наказании SRTT улучшена скорость с минимальным влиянием на точность. Напротив, наказание ухудшило результаты теста FTT. Эти результаты показывают, что эффект обратной связи варьируется в зависимости от приобретаемого навыка, и, хотя обратная связь влияет на производительность в Интернете, польза вознаграждения, о которой сообщается для удержания, может быть менее надежной, чем было показано ранее.

Результаты

Наказание улучшает онлайн-производительность последовательной задачи времени реакции

Мы исследовали влияние вознаграждения и наказания на изучение последовательности SRTT тремя различными способами. Во-первых, мы сравнили знание последовательности во время тестов на знание последовательности либо на раннем этапе обучения (сразу после ознакомления, когда впервые была введена валентная обратная связь), либо на позднем этапе обучения (в конце сеанса обучения) (см. рис. 1). Во время этих тестов мы оценивали знание последовательности, вычисляя разницу во времени реакции (ВР) между фиксированными и случайными блоками (рис. 2). Повторные измерения ANOVA с группой (вознаграждение, наказание, контроль), последовательностью (фиксированная, случайная) и моментом времени (ранний, поздний) в качестве факторов выявили значительное трехстороннее взаимодействие между группой, последовательностью и моментом времени (F _(2,33) = 5,370, p < 0,01). Последующий анализ показал, что группы с наказанием и поощрением приобрели больше знаний о навыках во время проверки знаний о ранней последовательности, чем контрольная группа (F _(2,33) = 5,213, p < 0,05; наказание по сравнению с контрольной группой: t ₍₂₂₎ = 3,455, p < 0,005, награда v контроль: t ₍₂₂₎ = 2,545, p < 0,02), но не отличались друг от друга (награда v наказание: t ₍₂₂₎ = 0,707, p = 0,48). Кроме того, контрольная группа продемонстрировала больший прирост знаний о последовательности от раннего к позднему тесту знания последовательности по сравнению с вознаграждением (t ₍₂₂₎ = 2,884, p < 0,01), хотя это сравнение не было значимым для контроля и наказания при поправке на множественные сравнения (t ₍₂₂₎ = 2,075, p = 0,05), отчасти отражая преимущества обратной связи к раннему обучению. Эти результаты свидетельствуют о том, что обратная связь способствует быстрому обучению последовательности на SRTT.

Рисунок 2

Наказание повышает эффективность SRTT.

Во время периода обучения группа наказания была значительно быстрее, чем контрольная группа в целом (верхняя вставка; Группа основного эффекта: F _(2,33) = 3,286, p < 0,05; t ₍₂₂₎ = 2,884, p < 0,012). Не было разницы между вознаграждением и контролем (t ₍₂₂₎ = 0,480, p = 0,636) или вознаграждением и наказанием (t ₍₂₂₎ = 1,757, p = 0,093) в период обучения. Группа вознаграждения показала большее снижение среднего RT от до до и после тренировки, чем контрольная [Взаимодействие группы x временной точки: F _(2,33) = 5,370, p < 0,01; Награда против контроля: t ₍₂₂₎ = 3,730, p < 0,001; Наказание против контроля: t ₍₂₂₎ = 2,199, p = 0,039, не значимо с учетом множественных сравнений (α: 0,05/3 = 0,0167)]. Также имело место значительное взаимодействие Группа x Момент времени x Последовательность (F _(2,33) = 5,370, p < 0,01). И наказание, и вознаграждение приобрели больше знаний о навыках во время проверки знаний о ранней последовательности, чем контроль (F _(2,33) = 5,213, p < 0,05; наказание против контроля: t ₍₂₂₎ = 3,455, p < 0,005, вознаграждение v контроль: t ₍₂₂₎ = 2,545, p < 0,02), но не отличались друг от друга (награда v наказание: t ₍₂₂₎ = 0,707, р = 0,487). Группа вознаграждения продемонстрировала меньшее обучение последовательности в тесте после обучения, чем в тесте перед обучением (t ₍₂₂₎ = 2,884, p < 0,01), возможно, из-за преимущества вознаграждения в течение раннего периода обучения. Группа наказания не отличалась от контроля при поправке на множественные сравнения [t ₍₂₂₎ = 2,075, p = 0,05 (α: 0,05/3 = 0,0167)]. Обратная связь не влияла на удержание в любой момент времени (нижняя правая панель). На главной панели показано среднее значение ± SEM. Коробчатые диаграммы показывают медиану, кресты показывают выбросы внутри группы. Звездочками обозначены периоды со значительным влиянием обратной связи (p < 0,05).

Изображение в натуральную величину

Во-вторых, чтобы изучить влияние валентной обратной связи на скорость обучения, мы сравнили медианное время реакции в шести последовательных обучающих блоках последовательностей сразу после проверки знаний о ранней последовательности, используя повторные измерения ANOVA с блоком (1– 6) и Группа как факторы. Участники показали улучшение в ходе обучения (основной эффект блока: F _(5,33) = 11,224, p < 0,001). Мы также обнаружили главный эффект группы (F _(2,33) = 3,286, p < 0,05), а последующие тесты показали, что группа наказания в целом была значительно быстрее, чем контрольная (наказание по сравнению с контролем: t ₍₂₂₎ = 2,884, p < 0,012), но было отсутствие разницы между вознаграждением и контролем (t ₍₂₂₎ = 0,480, p = 0,636) или вознаграждением и наказанием (t ₍₂₂₎ = 1,757, p = 0,093, двусторонний) в период обучения. Отсутствие значительного взаимодействия «Группа по последовательности» в пост-зонде подчеркивает, что это общее, а не специфичное для последовательности улучшение.

Наконец, мы изучили влияние валентной обратной связи на удержание. Все группы продемонстрировали сохранение знаний о последовательности во все моменты времени (последовательность основного эффекта: F _(1,33) = 100,245, p < 0,001; t ₍₃₅₎ = 10,036, p < 0,001). Не было влияния группы обратной связи на удержание.

В совокупности эти результаты показывают, что как поощрение, так и наказание улучшают раннее обучение последовательности, а наказание дополнительно оказывает заметное влияние на производительность во время обучения.

Наказание ухудшило выполнение задачи отслеживания силы

Мы провели те же три анализа данных FTT (рис. 3A, B). Описание результатов испытаний в тесте FTT доступно в дополнительных материалах. Во-первых, знание последовательности в течение периода обратной связи оценивали путем сравнения среднеквадратичной ошибки во время последовательности и случайных блоков в ранних и поздних пробах знания последовательности с использованием повторных измерений ANOVA (момент времени x последовательность x группа). Было значительное взаимодействие между временной точкой и группой (F _(2,33) = 3,526, p < 0,05), но, в отличие от SRTT, нет трехстороннего взаимодействия с Sequence (F _(2,33) = 1,212, p = 0,310). Последующий анализ показал, что только вознаграждение улучшилось по сравнению с моментом времени до и после обучения (до и после исследования, t-критерий с 1 выборкой, вознаграждение: t ₍₁₁₎ = 4,250, p < 0,001, наказание : t ₍₁₁₎ = 0,100, p = 0,922, контроль: t ₍₁₁₎ = 2,292, p = 0,043 [NS с поправкой на множественные сравнения]). Наказание показало значительно меньшее улучшение, чем в группе вознаграждения, от пробы до тренировки до пробы после тренировки (t=9).0239 (35) = 2,372, p < 0,03), но не был значительно хуже контроля (t ₍₃₅₎ = 1,206, p = 0,241). Не было разницы между вознаграждением и контролем (t ₍₃₅₎ = 1,688, p = 0,106). В отличие от SRTT, не было значительного взаимодействия «время-точка x последовательность x группа», что позволяет предположить, что обратная связь модулировала общее, а не специфичное для последовательности обучение в FTT.

Рисунок 3

Наказание ухудшает результаты теста FTT.

По сравнению с поощрением наказание ухудшало общее улучшение производительности по сравнению с пробой до и после тренировки (взаимодействие пробы x группы (F _(2,33) = 3,526, p < 0,05; t ₍₃₅₎ = 2,372, p < 0,03). Поощрение не было полезным по сравнению с контролем (t ₍₃₅₎ = 1,688, p = 0,106. Наказание не ухудшило производительность по сравнению с контролем (t ₍₃₅₎ = 1,206, p = 0,241). В отличие от SRTT, обратная связь имела никакого влияния на конкретные знания последовательности (внизу слева) или производительность в течение периода обучения (вставка).Как было обнаружено в SRTT, обратная связь не влияла на производительность во время проб удержания (внизу справа).На главной панели показано среднее значение ± SEM. показывает медиану, крестики показывают внутригрупповые выбросы. Звездочками отмечены периоды со значительным влиянием обратной связи (p < 0,05). Один выброс от наказания в период после обучения не показан на диаграмме кв. обр.]

Изображение в натуральную величину

Во-вторых, мы изучили производительность в течение шести последовательных тренировочных блоков последовательности, используя повторные измерения ANOVA с Блоком и Группой в качестве факторов. Все группы обратной связи показали улучшение в течение периода обучения (основной эффект блока: F _(5,165) = 8,478, p < 0,001; S2 по сравнению с S7: t ₍₃₅₎ = 2,836, p < 0,01). Хотя поощрение имело тенденцию преобладать над наказанием во время обучения, группа не влияла на скорость обучения в FTT (группа x блок: F _{(10 165)} = 1,186, р = 0,156).

Наконец, мы исследовали влияние валентной обратной связи на удержание в FTT. Пять участников не завершили исследования удержания из-за расписания. В результате у нас осталось 10 участников контроля, 9 участников вознаграждения и 11 участников наказания для анализа удержания. Все группы продемонстрировали сохранение знаний о последовательности во все моменты времени (основной эффект последовательности, F (1, 27) = 86,387, p < 0,001; t ₍₃₅₎ = 9,030, p < 0,001). Не было никакого основного влияния или взаимодействия с Группой обратной связи на удержание.

В совокупности эти результаты показывают, что основной эффект обратной связи в FTT заключался в том, что наказание ухудшало обучение от контрольных точек до и после тренировки.

Обсуждение

Целью этого исследования было определить, распространяется ли влияние поощрения и наказания на различные типы обучения двигательным навыкам, реализованные с помощью последовательной задачи времени реакции (SRTT) и задачи отслеживания силы (FTT). Мы обнаружили, что наказание оказывает противоположное влияние на выполнение двух навыков. Во время выполнения SRTT тренировка с наказанием привела к общему улучшению времени реакции с минимальным ущербом для точности. Напротив, наказание ухудшило выполнение FTT. Эти эффекты присутствовали только во время обратной связи; не было никакого влияния обучения с обратной связью на общее или специфичное для последовательности запоминание, измеренное через 1 час, 24 часа и 30 дней в любой задаче. Наши результаты опровергают любую простую модель взаимодействия между обратной связью и производительностью. Вместо этого мы показываем, что влияние обратной связи зависит от тренировочной среды и приобретаемого навыка.

Может быть несколько причин для этого зависящего от задачи эффекта обратной связи. Хотя обе задачи основаны на последовательном обучении, они отличаются механизмом улучшения. Мотивационная значимость наказания (например, неприятие потерь) может объяснить улучшение производительности, наблюдаемое в SRTT, где было высказано предположение, что дополнительное внимание, вызванное наказанием, задействует дополнительные нейронные ресурсы для улучшения производительности SRTT ^8,18 . Однако чисто мотивационное объяснение не может объяснить пагубное влияние наказания на производительность на FTT. Следовательно, нам необходимо рассмотреть альтернативные объяснения, которые могут объяснить различные эффекты вознаграждения и наказания при выполнении этих двух задач.

Эти две задачи также различаются по двигательным требованиям. В частности, в нашей реализации производительность FTT зависит от более точного управления двигателем, чем SRTT. В двигательной системе другие исследователи сообщили, что дофаминергическая активность, связанная с вознаграждением, снижает моторный шум ¹⁹ , в то время как дофаминергическая активность, связанная с наказанием, приводит к увеличению моторной изменчивости, то есть шума ²⁰ . Мы обнаружили, что наказание ухудшает общую (то есть не связанную с последовательностью) производительность в FTT. Через час во время теста на запоминание без обратной связи группа наказания показала такие же результаты, как и группа вознаграждения и контрольная группа. Мы думаем, что наши результаты согласуются с гипотезой о том, что наказание может усиливать двигательный шум, что могло привести к ухудшению результатов в группе наказания во время обучения. Поскольку в нашей реализации SRTT повышенная двигательная вариабельность не измерялась напрямую, участников не наказывали за какие-либо изменения в движении, которые не влияли напрямую на время реакции. Если бы оценка моторной изменчивости учитывалась при оценке производительности SRTT, можно было бы обнаружить, что наказание ухудшает этот аспект производительности. Наша реализация SRTT и FTT не имеет прямого измерения двигательной изменчивости, и мы не можем явно решить эту проблему в настоящем исследовании. Будущая работа должна изучить этот вопрос.

Используемые здесь реализации задач также различались информативностью данного экземпляра обратной связи. Обычно обучение на SRTT основывается на положительной ошибке предсказания, закодированной в стриатуме, которая возникает при испытаниях с фиксированной последовательностью ^8,21 . Вознаграждение или наказание в SRTT может увеличить эту положительную ошибку предсказания и способствовать производительности и обучению. Напротив, обратная связь от момента к моменту, выдаваемая на FTT, не связана с мгновенным положительным сигналом ошибки прогнозирования. Скорее, наша реализация FTT похожа на прерывистые двигательные задачи, которые полагаются на мозжечок и, следовательно, могут не получать пользы от мгновенной обратной связи ²² (но также см. Galea, et al. ⁴ для дополнительной информации об обучении мозжечка с обратной связью). Наконец, хотя информационное содержание не подвергалось преднамеренным манипуляциям, это различие может также изменить эффект вознаграждения и наказания в этих задачах.

В отличие от предыдущих исследований, мы не увидели преимущества вознаграждения в удержании ^4,7,8,10 . В большинстве исследований, в которых изучалось вознаграждение и наказание при обучении навыкам, рассматривалось только непосредственное припоминание 90–205 4,8,10 , и только одно исследование показало преимущество вознаграждения в долгосрочном сохранении двигательного навыка ⁷ . В своем исследовании Abe, et al. ⁷ заметили, что контрольная группа и группа наказания показали снижение производительности через 30 дней по сравнению с их периодом времени после обучения. Важно отметить, что Абэ, и др. ⁷ также обнаружили, что группа вознаграждения показала офлайн-прирост с момента непосредственного времени до 24 часов после тренировки, и этот эффект сохранялся в течение 30 дней. Таким образом, в то время как в нашем исследовании группа наказания и контроля не продемонстрировала забывания от 24 часов до 30 дней, что потенциально ограничивало нашу чувствительность к эффекту вознаграждения, группа вознаграждения в нашем исследовании также не показала каких-либо преимуществ в автономном режиме. Таким образом, мы уверены в нашем выводе, что вознаграждение не повлияло на удержание.

Хотя Эйб и его коллеги подробно не обсуждали это, их группа наказания показала значительно худшие результаты во время обучения, что позволяет предположить, что участники этой группы не так эффективно усвоили этот навык. Поэтому неясно, можно ли объяснить разницу в памяти, наблюдаемую в их исследовании, преимуществом вознаграждения перед консолидацией или неэффективным приобретением при обучении с наказанием. Дизайн нашего исследования отличался от реализации, использованной Эйбом и его коллегами 9.0205 7 в отношении устройства ввода (сила захвата всей рукой в нашем исследовании, сила точного зажима Эйба и его коллег), времени обратной связи и продолжительности испытания. Однако наш результат ставит под сомнение надежность вывода о том, что вознаграждение способствует сохранению навыков. Мы максимизировали наш дизайн, чтобы он был чувствителен к различиям в онлайн-обучении, а не в запоминании, и в будущих исследованиях следует изучить другие факторы, влияющие на влияние обратной связи на сохранение памяти о навыках.

Что касается SRTT, стоит учесть, что наши участники продемонстрировали меньше обучения, специфичного для последовательности, чем некоторые другие, в версиях этого задания без вознаграждения, где разница между последовательными и случайными испытаниями может достигать 80 мс ^23,24,25 . Тем не менее, существует значительная вариабельность в различиях между последовательными и случайными испытаниями SRTT, о которых сообщалось в литературе, и некоторые группы сообщили, что эффекты обучения, специфичные для последовательности, на SRTT составляют от 10 до 30 мс ^26,27 . Разница, о которой сообщили после обучения группы контроля, вознаграждения и наказания в нашем исследовании, примерно равна разнице для группы вознаграждения, о которой сообщил Wachter, et al. ⁸ (~30 мс) и более, чем наблюдалось в их контрольной и штрафной группах. Это свидетельствует о значительно меньшем количестве знаний, специфичных для последовательностей, чем мы наблюдали в нашем исследовании, и поэтому мы уверены, что участники смогли изучить и выразить знания, специфичные для последовательностей, во всех трех условиях обратной связи.

Наконец, мы понимаем, что сравнивать производительность разных задач сложно. Поскольку используемые здесь задачи различаются по результатам производительности (время отклика в SRTT, ошибка отслеживания в FTT), их количественное сравнение невозможно. Однако диссоциация эффекта наказания в этих контекстах убедительно свидетельствует о том, что эффект действительно зависит от задачи. Кроме того, наше исследование объединяет ранее разрозненную литературу, изучающую влияние вознаграждения и наказания на обучение навыкам. Этот результат проливает свет на проблему экстраполяции одного эксперимента в конкретном контексте на более общий подход к обучению навыкам.

В целом, мы продемонстрировали, что наказание модулирует производительность в сети в зависимости от задачи, и в нашем исследовании мы обнаружили, что ни вознаграждение, ни наказание не модулируют долговременное сохранение воспоминаний о навыках. Эти результаты ставят под сомнение широко распространенную гипотезу о том, что вознаграждение повсеместно полезно для памяти, и предполагают, что взаимодействие между обратной связью и обучением следует лучше понять, прежде чем обратную связь можно будет полностью использовать в клинических ситуациях.

Материалы и методы

Дизайн исследования был одинаковым для обеих задач (рис. 1А). Участники обучались либо последовательной задаче времени реакции (SRTT), либо задаче отслеживания силы (FTT). Для обеих задач испытания были представлены более чем в 15 блоках. Каждый блок испытаний отделялся 30-секундным перерывом (минимум). Участники не знали, что во время некоторых блоков («блоков с фиксированной последовательностью») стимул появлялся в соответствии с повторяющимся шаблоном (описанным ниже для каждого задания). В остальные периоды появление стимула определялось случайным образом («блоки случайной последовательности»).

Ознакомительно-тренировочные блоки проводились в канале МРТ. Чтобы акклиматизировать участников к заданию и установить их базовый уровень производительности, задание началось с трех блоков случайной последовательности без обратной связи («блоки ознакомления»). Во время ознакомительных блоков участники не знали о предстоящей манипуляции с обратной связью. Затем начался период обратной связи, начиная с предтренировочной пробы (три блока случайный – фиксированный – случайный), затем обучающих блоков (шесть последовательных блоков фиксированной последовательности) и, наконец, посттренировочной пробы (три блока, случайный – фиксированный – случайный). Разница в производительности между средним значением двух случайных блоков по сравнению с блоком с фиксированной последовательностью во время тестов использовалась для индексации знаний о последовательности ²⁸ .

Чтобы проверить влияние вознаграждения и наказания на обучение навыкам, участники были рандомизированы в одну из 3 групп обратной связи: вознаграждение, наказание или неинформативность (контроль). В течение периода обратной связи участник получал вознаграждение, наказание или контрольную обратную связь в зависимости от текущей работы участника. Парадигма обратной связи для каждой задачи описана ниже отдельно.

Участникам давали ретенционные датчики через 1 час, 24–48 часов и 30 дней после тренировки. Никакой обратной связи не было доставлено во время проб удержания. Вторая проба всегда происходила после хотя бы одной ночи сна.

Первоначальный визит (ознакомление, раннее исследование, обучение и позднее исследование) имел место, когда участники проходили МРТ-сканирование.

Участники

В этом эксперименте приняли участие 78 участников (47 женщин, средний возраст = 25 лет ± 4,25 станд.). Все участники были правшами, не имели неврологических нарушений и имели нормальное или скорректированное до нормального зрение. Все участники дали информированное согласие, и исследование было проведено с одобрения Наблюдательного совета Национального института здравоохранения в соответствии с Хельсинкской декларацией (9). 3-М-0170, NCT00001360). Данные от шести человек были удалены из исследования из-за невнимательности (определяемой как невосприимчивость или неточность в более чем 50% испытаний во время обучения) или невозможности завершить тренировочный сеанс.

Задача последовательного времени реакции (SRTT)

Используемая здесь версия SRTT добавляет обратную связь к традиционной реализации. В начале каждого блока участникам предъявлялись четыре буквы «О», расположенные в линию в центре экрана. Эти стимулы были представлены белым цветом на сером фоне (рис. 1Б). Судебный процесс начался, когда одна из букв «О» сменилась на «Х». Участников проинструктировали реагировать как можно быстрее и точнее, используя соответствующую кнопку на четырехкнопочном ответном устройстве, которое они держат в правой руке. «X» оставался на экране в течение 800 мс независимо от того, ответил ли участник, после чего следовал фиксированный интервал между попытками в 200 мс, в течение которого отображались четыре «О».

Блок состоял из 96 испытаний. Во время блоков с фиксированной последовательностью стимулы появлялись в соответствии с фиксированной последовательностью из 12 элементов, повторяемой 8 раз (например, 3–4–1–2–3–1–4–3–2–4–2–1). Каждый фиксированный блок начинался с уникальной позиции в последовательности, чтобы помочь предотвратить появление явных знаний о последовательности ²⁹ . В случайных блоках стимулы появлялись в случайно сгенерированной последовательности, без повторов на последовательных пробах, поэтому, например, триплеты 1–1–2 участники никогда не увидят.

Между каждым блоком участники видели фразу «Отличная работа, отдохните». Через пять секунд на экране появился черный фиксационный крест на 25 секунд. За пять секунд до начала следующего блока крестик стал синим, чтобы показать участникам, что блок вот-вот начнется.

Во время тестов удержания участники выполняли три блока (случайный – фиксированный – случайный на 15-дюймовом Macbook Pro, используя блок кнопок, идентичный тому, который использовался во время обучения. Во время этих тестов удержания следующее испытание начиналось через 200 мс после того, как участник инициировали свой ответ. Во время блоков удержания обратной связи не было. Реакцией участника считалось первое нажатие кнопки после предъявления стимула. В анализ включались все ответы. Любая пропущенная попытка считалась ошибкой, учитывались только правильные попытки. для анализа РЦ

Задача отслеживания силы

В задаче отслеживания силы (FTT) участники непрерывно модулировали усилие захвата, чтобы оно соответствовало целевому выходному усилию ^16,17 . В традиционной реализации участники подвергаются единому образцу модуляции силы, повторяемому в каждом испытании. Эта конструкция не позволяет проводить различие между общим улучшением (т. е. ознакомлением с задачей и/или датчиком силы) и улучшением, характерным для отработанной последовательности модуляции силы. Поэтому мы решили адаптировать традиционный метод FTT, чтобы привести его в соответствие с традиционным для SRTT дизайном эксперимента, т. е. путем включения блоков случайной последовательности.

Данное испытание состояло из 14-секундной непрерывной модели модуляции захвата. В начале испытания участникам предъявлялись три круга на сером фоне, спроецированные на экран: белый круг (курсор, диаметр 0,5 см), синий круг (мишень, диаметр 1,5 см) и черный круг (нижний круг). экрана диаметром 2 см с указанием положения, соответствующего минимальному давлению; рис. 1С). Участники держали датчик силы (Current Designs, Inc., Филадельфия, Пенсильвания) в правой руке между четырьмя пальцами и ладонью (рис. 1D, справа). Участникам было предложено сжимать датчик силы (увеличивая силу, перемещая курсор вверх), чтобы держать курсор как можно ближе к центру цели, когда цель перемещается вертикально на экране. Во время фиксированных блоков участникам случайным образом назначали одну из шести последовательностей (рис. 1D, слева). Во время случайных блоков цель следовала по траектории, генерируемой линейной комбинацией четырех сигналов с периодами от 0,01 до 3 Гц. Эти формы сигналов должны были иметь одинаковую среднюю амплитуду (целевую высоту), а количество и значение локальных максимумов и минимумов были постоянными для случайных блоков.

Для анализа данных квадрат расстояния от курсора до цели рассчитывался при каждом обновлении кадра (60 Гц). Первые 10 кадров были удалены из каждого испытания. Среднее значение оставшихся временных точек было рассчитано для определения производительности, а испытания были усреднены по блокам.

Обратная связь

Всем участникам было выплачено базовое вознаграждение в размере 80 долларов США за участие в исследовании. В начале периода обратной связи участников проинформировали, что они могут заработать больше денег в зависимости от их результатов.

Во время периода обратной связи участники получали либо вознаграждение, либо наказание, либо управляющую обратную связь. Наличие поощрения или отсутствие наказания зависело от выступления участника. Как в SRTT, так и в FTT был определен начальный критерий, основанный на медиане результатов участника во время заключительного блока ознакомления. По мере прохождения участниками обучения этот критерий пересматривался после каждого блока, чтобы способствовать постоянному совершенствованию. В группе вознаграждения обратная связь показала, что производительность участника улучшилась при выполнении задания. В группе наказаний обратная связь указывала на то, что им становилось хуже. Поскольку частота событий обратной связи различалась между группами поощрения и наказания (поощрение от высокого к низкому по мере развития обучения, наказание от низкого к высокому), контрольная группа была разделена на две разные подгруппы (контрольная поощрение и контрольная группа). контроль-наказание). Контрольные группы получали обратную связь с частотой, которая соответствовала частоте соответствующей группы обратной связи, но не была связана с их работой. Участникам контрольной группы сообщили, что обратная связь не имеет смысла. Мы рассматривали контрольные группы вознаграждения и наказания вместе при анализе, что типично для этих исследований 9. 0205 7,8 .

В SRTT производительность определялась как точность (правильная или неправильная) и время реакции (ВР) данного испытания. Обратная связь была дана на пробной основе (рис. 1C). На это указывалось участнику, когда белая рамка вокруг стимула менялась на зеленую (поощрение) или красную (наказание). В группе вознаграждения участникам давали обратную связь, если их ответ был точным и их RT был быстрее, чем их критерий RT, что указывало на то, что они заработали деньги (0,05 доллара США от начальной точки в 0 долларов США) в этом испытании. В группе наказаний участникам давали обратную связь, если они были неправы или их RT был медленнее, чем их критерий, что указывало на то, что они потеряли деньги (0,05 доллара вычтены из начальной точки в 55 долларов) в этом испытании. Участники групп контроль-вознаграждение и контроль-наказание видели изменения красного или зеленого цвета соответственно с частотой, соответствующей наказанию и вознаграждению соответственно. Участникам контрольной группы сказали, что им будут платить в зависимости от их скорости и точности. Важно отметить, что для контроля мотивационных различий между выигрышем и проигрышем участникам не сообщали точную ценность того или иного испытания. Это позволило нам оценить гедонистическую ценность обратной связи, а не уровень функции воспринимаемой ценности. Между блоками для групп вознаграждения и наказания отображалась текущая сумма заработка (например, «Вы заработали 5,00 долларов США»). Участники контроля видели фразу «Вы заработали деньги». Критерий RT рассчитывали как медиану успеваемости в первом ознакомительном блоке. После каждого блока рассчитывали медиану + стандартное отклонение производительности и сравнивали с критерием. Если этот критерий теста был быстрее (SRTT) или точнее (FTT), чем предыдущий критерий, критерий обновлялся. Во время СРТТ при установлении критерия времени реакции учитывались только правильные ответы.

Обратная связь в FTT основывалась на расстоянии курсора от цели (рис. 1C). Для группы вознаграждения участники начали с 0 долларов. Когда участники выполняли задание, их курсор менял цвет с белого на зеленый, когда расстояние от цели было меньше их критерия. Это указывало на то, что в то время они зарабатывали деньги. В группе наказания участники начинали с 45 долларов, и курсор становился красным, если он находился за пределами критерия дистанции. Это указывало на то, что они теряли деньги. Для контроля вознаграждения и контроля наказания курсор менялся на зеленый или красный соответственно, но это не имело отношения к их эффективности. Для контроля продолжительность каждого экземпляра обратной связи, а также совокупная обратная связь, данная в каждом испытании, была согласована с соответствующей группой. Между каждым блоком участникам показывался их совокупный заработок. Участники контроля видели фразу «У вас есть деньги».

Статистический анализ

В обеих задачах шесть обучающих блоков сравнивались с использованием дисперсионного анализа с повторными измерениями для установления различий в скорости обучения (блок x группа). Обучение было проиндексировано путем сравнения производительности (RT и точность отдельно для SRTT; квадрат расстояния от цели [квадрат ошибки] для FTT) в блоках последовательности со средним значением двух случайных блоков в моменты времени до и после обучения с использованием повторяющихся — измеряет ANOVA (момент времени x последовательность x группа). Память для последовательности оценивали путем сравнения фиксированного блока со средним значением двух случайных блоков в каждый момент времени удерживания с использованием дисперсионного анализа с повторными измерениями (момент времени x последовательность x группа). Для апостериорного анализа применялась поправка Бонферрони для корректировки множественных сравнений. При нарушении сферичности применялась поправка Хена-Фельдта.

Дополнительная информация

Как цитировать эту статью : Сталь, A. и др. Влияние вознаграждения и наказания на обучение навыкам зависит от требований задачи. науч. Респ. 6 , 36056; doi: 10.1038/srep36056 (2016).

Примечание издателя: Springer Nature остается нейтральной в отношении юрисдикционных претензий в опубликованных картах и институциональной принадлежности.

Ссылки

Мэддокс, В. Т., Эшби, Ф. Г. и Бохил, С. Дж. Влияние отсроченной обратной связи на обучение на основе правил и информации-интеграции. Журнал экспериментальной психологии. Обучение, память и познание 29, 650–662 (2003).
Артикул пабмед Google ученый
Франк, М. Дж. Динамическая модуляция дофамина в базальных ганглиях: нейрокомпьютерный отчет о когнитивном дефиците при медикаментозном и немедикаментозном паркинсонизме. Журнал когнитивной нейробиологии 17, 51–72, doi: 10.1162/089892
80093 (2005).
Артикул пабмед Google ученый
Фридберг, М., Гласс, Б., Филотео, Дж. В., Хазелтин, Э. и Мэддокс, В. Т. Сравнение эффектов положительной и отрицательной обратной связи в обучении по категории «информация-интеграция». Память и познание, doi: 10.3758/s13421-016-0638-3 (2016).
Галеа, Дж. М., Маллиа, Э., Ротвелл, Дж. и Дидрихсен, Дж. Диссоциальное влияние наказания и вознаграждения на двигательное обучение. Nature neuroscience 18, 597–602, doi: 10.1038/nn.3956 (2015).
КАС Статья пабмед Google ученый
Гайда К. , Зульценбрюк С. и Хойер Х. Финансовые стимулы усиливают адаптацию к сенсомоторной трансформации. Экспериментальные исследования мозга, doi: 10.1007/s00221-016-4688-3 (2016).
Хассон, С. Дж., Манчуровски, Дж. и Йен, С. С. Подход к обучению походке с подкреплением улучшает запоминание. Front Hum Neurosci 9, 459, doi: 10.3389/fnhum.2015.00459 (2015).

Артикул пабмед ПабМед Центральный Google ученый
Абэ, М. и др. Вознаграждение улучшает долгосрочное сохранение двигательной памяти за счет индукции прироста автономной памяти. Curr Biol 21, 557–562, doi: 10.1016/j.cub.2011.02.030 (2011).
КАС Статья пабмед ПабМед Центральный Google ученый
Вахтер, Т., Лунгу, О.В., Лю, Т., Уиллингем, Д.Т. и Эш, Дж. Дифференциальное влияние вознаграждения и наказания на процедурное обучение. Журнал неврологии: официальный журнал Общества неврологии 29, 436–443, doi: 10. 1523/JNEUROSCI.4132-08.2009 (2009).
КАС Статья Google ученый
Ван дер Койдж, К. и Овервлит, К. Э. Поощрение несовершенной двигательной активности снижает адаптивные изменения. Экспериментальное исследование мозга 234, 1441–1450, doi: 10.1007/s00221-015-4540-1 (2016).

КАС Статья пабмед ПабМед Центральный Google ученый
Wilkinson, L. et al. Онлайн-обратная связь способствует ранней консолидации обучения двигательным последовательностям и устраняет дефицит воспоминаний при транскраниальной стимуляции моторной коры. кора; журнал, посвященный изучению нервной системы и поведения 71, 134–147, doi: 10.1016/j.cortex.2015.06.012 (2015).
Артикул пабмед ПабМед Центральный Google ученый
Терриен, А. С., Вулперт, Д. М. и Бастиан, А. Дж. Эффективное обучение с подкреплением после повреждения мозжечка требует баланса между исследованием и двигательным шумом.
Мозг 139, 101–114, doi: 10.1093/brain/awv329 (2016).
Артикул пабмед Google ученый
Цензор Н., Саги Д. и Коэн Л. Г. Общие механизмы перцептивного и двигательного обучения человека. Обзоры природы. Neuroscience 13, 658–664, doi: 10.1038/nrn3315 (2012).
КАС Статья пабмед ПабМед Центральный Google ученый
Даян, Э. и Коэн, Л. Г. Нейропластичность, обеспечивающая обучение двигательным навыкам. Нейрон 72, 443–454, doi: 10.1016/j.neuron.2011.10.008 (2011).
КАС Статья пабмед ПабМед Центральный Google ученый
Ниссен, М. Дж. и Буллемер, П. Требования к вниманию при обучении — данные по показателям производительности. Когнитивная психология 19, 1–32, doi: Doi 10.1016/0010-0285(87)
-8 (1987).
Артикул Google ученый
Флойер-Ли, А. и Мэтьюз, П. М. Изменение сетей мозга для зрительно-моторного контроля с повышением автоматизма движений. J Neurophysiol 92, 2405–2412, doi: 10.1152/jn.01092.2003 (2004).
КАС Статья пабмед Google ученый
Флойер-Ли, А. и Мэтьюз, П. М. Различаемые сети активации мозга для краткосрочного и долгосрочного обучения двигательным навыкам. J Нейрофизиол 94, 512–518, doi: 10.1152/jn.00717.2004 (2005).
КАС Статья пабмед Google ученый
Floyer-Lea, A., Wylezinska, M., Kincses, T. & Matthews, P.M. Быстрая модуляция концентрации ГАМК в сенсомоторной коре человека во время двигательного обучения. J Neurophysiol 95, 1639–1644, doi: 10.1152/jn.00346.2005 (2006).
КАС Статья пабмед Google ученый
Тверски А. и Канеман Д. Обрамление решений и психология выбора. Наука 211, 453–458 (1981).
КАС Статья ОБЪЯВЛЕНИЯ MathSciNet МАТЕМАТИКА пабмед Google ученый
Manohar, S.G. et al. Вознаграждение оплачивает стоимость уменьшения шума в двигательном и когнитивном контроле. Curr Biol 25, 1707–1716, doi: 10.1016/j.cub.2015.05.038 (2015).
КАС Статья пабмед ПабМед Центральный Google ученый
Галеа, Дж. М., Руге, Д., Буйджинк, А., Бестманн, С. и Ротвелл, Дж. К. Поведенческая и нейрофизиологическая изменчивость, вызванная наказанием, показывает дофамин-зависимый выбор кинематических параметров движения. Журнал неврологии: официальный журнал Общества неврологии 33, 3981–3988, doi: 10.1523/JNEUROSCI.1294-12.2013 (2013).

КАС Статья Google ученый
Уилкинсон Л., Хан З. и Джаханшахи М. Роль базальных ганглиев и их корковых связей в обучении последовательностям: данные неявного и явного обучения последовательностям при болезни Паркинсона. Нейропсихология 47, 2564–2573, doi: 10.1016/j.neuropsychologia.2009.05.003 (2009).
Артикул пабмед Google ученый
Спенсер Р. М., Желязник Х. Н., Дидрихсен Дж. и Иври Р. Б. Нарушение синхронизации прерывистых, но не непрерывных движений из-за поражений мозжечка. Science 300, 1437–1439, doi: 10.1126/science.1083661 (2003).
КАС Статья ОБЪЯВЛЕНИЯ пабмед Google ученый
Робертсон, Э. М., Паскуаль-Леоне, А. и Пресс, Д. З. Осознание изменяет пользу сна для обучения навыкам. Curr Biol 14, 208–212, doi: 10.1016/j.cub.2004.01.027 (2004).

КАС Статья пабмед Google ученый
Тунович С., Пресс Д. З. и Робертсон Э. М. Физиологический сигнал, препятствующий улучшению двигательных навыков во время консолидации. Журнал неврологии: официальный журнал Общества неврологии 34, 5302–5310, doi: 10. 1523/JNEUROSCI.3497-13.2014 (2014).
КАС Статья Google ученый
Шанкс, Д. Р., Уилкинсон, Л. и Ченнон, С. Связь между праймингом и распознаванием в детерминированном и вероятностном обучении последовательностей. Журнал экспериментальной психологии. Обучение, память и познание 29, 248–261 (2003).
Артикул пабмед Google ученый
Витт, Дж. К., Эш, Дж. и Уиллингем, Д. Т. Эгоцентрическая система отсчета в неявном обучении двигательным последовательностям. Психологические исследования 72, 542–552, doi: 10.1007/s00426-007-0129-з (2008).
Артикул пабмед Google ученый
Сонг, С. и Коэн, Л. Г. Практика и сон формируют разные аспекты мастерства. Nature Communications 5, 3407, doi: 10.1038/ncomms4407 (2014).
КАС Статья ОБЪЯВЛЕНИЯ пабмед Google ученый
Робертсон, Э.