Стимул реакция: Недопустимое название — Циклопедия

Содержание

Свобода, стимул, реакция (бихевиоризм в утопиях О. Хаксли и Б. Ф. Скиннера) Текст научной статьи по специальности «Языкознание и литературоведение»

И. В. Головачева

СВОБОДА, СТИМУЛ, РЕАКЦИЯ

(БИХЕВИОРИЗМ В УТОПИЯХ О. ХАКСЛИ И Б. Ф. СКИННЕРА)

Неприятие Олдосом Хаксли классического бихевиоризма и необихевиоризма кажется очевидным — об этом на первый взгляд свидетельствуют многочисленные острополемические пассажи в его романах и эссе, в частности его знаменитый «Дивный Новый Мир». Пристальное чтение его поздних текстов вносит неожиданные коррективы в наши представления. Так, например, выясняется, что последняя утопия Хаксли «Остров», написана не без влияния скиннеровской утопии «Уолден Два».

I. Golovacheva

FREEDOM, STIMULUS, REACTION: BEHAVIORISM IN THE UTOPIAS OF A.

HUXLEY AND B. F. SKINNER

Aldous Huxley’s negative assessment of behaviorism seems undisputable, as one can judge by his numerous critical remarks in both fiction and non-fiction, including «Brave New World». However, rapt reading of his late writing gives us a new, revised view on the issue. For example, rereading of Huxley’s last utopia «Island» reveals the influence of B. F. Skinner’s «Walden Two».

Неприятие Олдосом Хаксли (1894—1963) классического бихевиоризма и необихевиоризма кажется очевидным — об этом на первый взгляд свидетельствуют многочисленные острополемические пассажи в его романах и эссе. На наш вопрос о его отношении к бихевиоризму и, в частности, к самому знаменитому необихевио-ристу Б. Ф. Скиннеру (1904—1990), вдова писателя, Лаура Арчера Хаксли недовольно поморщилась и безапелляционно заявила: «Терпеть не мог!»1. Мы, однако, этим ответом не ограничились. Данные заметки — результат нашей собственной проверки.

В романе «Дивный Новый Мир» (1932), который, на наш взгляд, следует считать главной утопией ХХ в., Олдос Хаксли щедро наделил героев именами властителей интеллектуальной моды первой трети ХХ в.:

Ленин, Маркс, Гельмгольц, Бакунин, Энгельс, Морган, Ротшильд, а также Форд, Мальтус, Троцкий и Фрейд. Есть там и имя Уотсон, также выбранное неслучайно. Хаксли полагал, что цель Джона Уотсона, родоначальника бихевиоризма, как и цель И. П. Павлова, которого писатель считал «придворным большевистским ученым», состояла в том, чтобы, поняв поведенческие механизмы, научиться ими управлять, «обусловливать» и «предсказывать» поведение. Эти слова стали знаковыми после выхода в свет манифеста Уотсона «Психология как ее видит бихевиорист» (Psychology As the Behaviorist Views It, 1913). Уотсон создал науку управления поведением, применив открытый И. П. Павловым механизм формирования условных рефлексов к человеку.

Классический бихевиоризм реду-

цировал сложнейшие явления психики, сводя их к знаменитой формуле «стимул — реакция». Именно в недрах бихевиоризма родилась мысль о возможности успешного манипулирования человеком в смысле тренировки необходимого набора поведенческих реакций. Девизом бихевиоризма стали слова: «контроль и предсказание».

Называя «Дивный Новый Мир» «бихевиористской утопией», Б. Ф. Скиннер был прав. Так, уже во второй главе романа Олдос Хаксли почти буквально воспроизводит знаменитый уотсоновский эксперимент с младенцами и кроликами, во время которого младенцам предъявляли кроликов, что сопровождалось грохотом и воем. Иногда применялись и слабые разряды тока. Эксперимент, как и было задумано, формировал у младенцев аффективный комплекс. Действие второй главы романа происходит в Зале Неопавловского Формирования Рефлексов. Ученые и няни проводят тренинг с цветами и книгами, модифицируя интуитивное поведение младенцев, положительно подкрепляя желательные реакции и отрицательно — нежелательные.

«В младенческом мозгу книги и цветы уже опорочены, связаны с грохотом, электрошоком, а после двухсот повторений того же или сходного урока связь эта станет нерасторжимой. Что человек соединил природа разделить бессильна»2.

Хаксли весьма остроумно критиковал бихевиоризм во многих публицистических работах. Так, в сочинении 1937 г. «Цели и средства» (Ends and Means) он находит изъян в теоретических основах бихевиоризма и разрушает его фундамент средствами самой бихевиористской логики: «Если разум — всего лишь эпифеномен материи, если сознание полностью обусловлено физическими изменениями, тогда нет ровно никаких оснований полагать, что какая-либо теория, порожденная таким аппаратом, безусловно, правомерна. Следовательно, если бихевиоризм прав, то нет никаких оснований видеть превосходство той или

иной позиции, в том числе и бихевиористской. Другими словами, если бихевиоризм прав, то, скорее всего, он не прав <. ..>»3.

«Дивный Новый Мир» описывает новые свойства психики у жертв бихевиористского редукционизма. В этом смысле текст Хаксли продолжает уэллсовскую и замя-тинскую традицию изображения жертв психиатрического воздействия, подхваченную в дальнейшем Кеном Кизи в «Полете над гнездом кукушки» (1962) и Энтони Бер-джессом в «Заводном апельсине» (1962).

Бихевиоризм, как представлялось Ол-досу Хаксли, одержим «Волей к Порядку», стремлением к аккуратности, противостоящей дикому ошеломляющему разнообразию личностей, которому он предпочитает единообразие культуры»4. Однако Хаксли периодически возвращался к обсуждению бихевиористских методов воспитания, очевидно, отдавая должное некоторым их преимуществам. Так, в частности, ему было известно утверждение Уотсона: не изменив фундаментально среду, нельзя сформировать новые модели поведения. Уотсон, кроме того, предлагал довольно простые методы решения как личностных, так и межличностных проблем, пригодные также для изменения общественных отношений.

Методика Уотсона при последовательном ее использовании, и в самом деле, могла бы сотворить Нового Адама Американского мифа, создать новых людей, счастливых и добродетельных из-за того, что им нравится делать все, что им поручено делать. Бихевиоризм служил и во многом продолжает служить, как о том мечтал Уот-сон, «лабораторией нового общества».

В 1957 г. Хаксли пишет хвалебный отзыв о крайне тенденциозной книге британского психиатра Уильяма Сарджента (1907—1988) «Борьба за сознание. Механизмы идеологической обработки, промывания мозгов и контроля над мыслями» (Battle for the Mind)5. Книга «Борьба за сознание» анализирует взаимосвязь павловских открытий с переменами в религии, политике, которые привели, по мнению автора, к открытию

особых способов «промывания мозгов», дознания и пропагандистского одурманивания. По иронии судьбы, и сам Сарджент имел непосредственное отношение к разработке некоторых методов контроля сознания, о чем Хаксли, правда, мог и не знать. Дело в том, что Сарджент не просто пропагандировал электрошоковую и инсулино-вую терапии и психохирургию в качестве наиболее эффективных методов в терапии психических заболеваний, но и основал лабораторию для проведения опытов по контролю над сознанием в Психиатрическом отделении лондонской Больницы Св. Фомы. Кроме того, Сарджент консультировал британские спецслужбы. Очевидно, что, несмотря на то, что он знал предмет «изнутри», он не имел морального права осуждать универсальные, по всей видимости, методы «промывании мозгов» иностранными спецслужбами, так или иначе использующими открытия в области психофизиологии. Несмотря на все сказанное, именно книга Сар-джента подтолкнула писателя к очередному страшному прогнозу: «Теперь, когда диктаторы вооружены систематическими знаниями о способах возбуждения мозговых функций с целью изменения и переформирования рефлексов, я реально не вижу, что может спасти несчастное человечество»6.

Но, продолжая критиковать бихевиори-стов за упрощенное понимание человеческой природы, постоянно говоря о том, что каждая личность биологически уникальна, Хаксли то и дело возвращался к обсуждению положительного воздействия их методов в области образования, педагогики и психотерапии.

Обратим внимание на то, что во второй утопии, в «Острове» (1963), Хаксли комментирует очевидные достижения скинне-ровского необихевиоризма. По всей видимости, писатель, несмотря на нелюбовь к бихевиоризму, все же находил здравое зерно в стремлении научно изменить личность, изменив окружение. Б. Ф. Скиннер, чья концепция оперантного обусловливания по-прежнему очень влиятельна в Соединенных

Штатах, полагал, что замещение нежелательных поведенческих стереотипов повторяющимися желательными (положительными) реакциями на специфические стимулы является эффективной терапией.

Таким способом можно изменить неправильное поведение и сформировать положительные навыки общения. Он надеялся, что таким образом — через обусловливание, связанное с положительными или, напротив, нежелательными последствиями поступков, а также с положительными или отрицательными ожиданиями — будет утверждаться и контролироваться поведенческая этика.

Нет сомнений в том, что Хаксли был осведомлен о теориях Скиннера: он читал главные его работы и говорил о них в эссе и письмах7. Проблема этического аспекта «контроля за поведением» занимала писателя всю жизнь. Подыскивая наилучшую систему воспитания и обучения детей на острове Пала в своем последнем романе «Остров», он не обошел вниманием и скин-неровские методы. Надо заметить, что в критике этот источник философии романа полностью игнорируется. Под влиянием написанного в 1948 г. «Уолдена Два» (Walden Two), знаменитой практической утопии Скиннера, Хаксли использует и в собственной утопии контроль над внешней средой и положительное подкрепление для формирования совершенно «добровольного» поведения — такого, которое приемлемо для общества в целом и не противоречит интересам индивидуума.

Между тем достижения рефлексологии и бихевиоризма непосредственно постулируются в тексте «Острова» в описании кормления младенца в окружении диких зверей: «Поглаживайте ребенка, когда вы его кормите: это доставит ему двойное удовольствие. Потом, пока он сосет и его ласкают, познакомьте его с животным или человеком, к которому вам бы хотелось расположить его. Пусть и они прикоснуться к ребенку, пусть он почувствует их физическое тепло. В это же время повторяйте: «добрый», «хороший». <…> Пища плюс ласка плюс тепло плюс слово «хороший»

равняется любовь. <…> Чистейший Павлов. — Павлов — во имя целей, дружбы, доверия, сочувствия. А у вас Павлов используется для промывки мозгов, для распространения водки, сигарет и патриотизма»8.

Скиннер, и в самом деле, создал очень стройную, непротиворечивую и во многом привлекательную концепцию. Думается, что «Уолден Два» был написан в качестве протеста против постфрейдистской и, в частности, экзистенциальной психологии. В самом деле, разве приведенные ниже слова Скиннера не выражают недовольство этими мировоззренческими системами? «Я вообще отрицаю существование свободы. Я должен отрицать свободу — в противном случае моя программа становится абсурдной. Нельзя создать науку о предмете, который столь капризно ускользает от вас»9. Действительно, свободный, ничем не обусловленный выбор и стремление противопоставить самореализацию личности давлению социума, по скиннеровской логике, либо вовсе не стоят внимания, так как выпадают из необихевиористской парадигмы, либо должны получить удовлетворительное объяснение в терминах «стимул — реакция».

Уникальность скиннеровской утопии состоит в том, что она написана не профессиональным литератором, а всемирно известным ученым. Его научная утопия целиком вписана в проект Просвещения. В самом деле, описанная им коммуна построена на рациональных началах, на упрощенном, несколько механистическом понимании человеческой природы и на убеждении, что построение разумного общества возможно на основе научных представлений о поведении. Роман Скиннера, помноженный на колоссальный авторитет этого ученого, создает иллюзию практической осуществляемости всего, что в нем описано, ибо предлагает подробную программу создания идеальной среды для воспитания нормальных людей и для успешной поведенческой терапии любого «сбоя в программе». Лишь эффективное манипулирование стимулами и реакциями приведет к

совершенному, управляемому, бесконфликтному миру, в котором попросту не останется места для поведенческих нарушений: «Дайте мне инструкции по обращению с человеком, и я дам вам человека»10.

Неврозы, психические расстройства, болезни и связанное с ними асоциальное поведение, согласно Скиннеру, порождены не природой человека как таковой, а пороками среды и, в частности, воспитания. Коммуна Уолден Два построена так, чтобы каждый чувствовал себя удовлетворенным собой и жизнью.

Фундамент этого общества — рациональная организация. Руководители (менеджеры) несут ответственность за то, чтобы любой работник получал необходимые позитивные подкрепления за исполнение нужных для общества работ. Эти подкрепления могут быть условно-материальными (credit hours)11 или психологическими. Группа планирования (Planners) разрабатывает распорядок жизни, не вызывающий раздражение, тревогу и прочие негативные эмоции. Группа планирования следит за расписанием обеденных смен, за количеством необходимой техники и за своевременным выполнением работ, избавляя, таким образом, всех остальных от любых стрессовых ситуаций. Ученые (Scientists) исследуют тенденции общественного развития и разрабатывают прогрессивные модели благоустройства. Очевидно, что акцент в этой специфической цивилизации сделан не на развитии личности, а на приспособлении к идеальной жизни социума.

Предполагается, что жители Уолдена Два не нуждаются в психотерапии (ее место занято адаптивным воспитанием). Скиннер, в сущности, справедливо отмечает, что превентивные меры гораздо эффективней борьбы с последствиями. Невроз в таком свете трактуется как закрепившийся механизм неверной адаптации.

Нельзя не обратить внимание на то, что в трех рассматриваемых нами утопиях отсутствует семья в ее привычном варианте. Новый Мир множит детей в пробирках, а

затем помещает в Младопитомник для последующего формирования обусловленных рефлексов. Уолденские дети практически с самого рождения живут без родителей. Их помещают в общественные ясли, где содержат в специально сконструированных удобных кондиционированных контейнерах (baby boxes)12. По замыслу автора, эти устройства должны ограждать ребенка от возможного негативного влияния, обеспечивая всем необходимым. Материнская нежность и забота замещены вниманием специально обученного персонала. Аргументом в пользу такого воспитания служит следующий довод: вместо невротической, порой безумной, разрушительной любви родителей ребенок получает любовь всей общины. Что касается родителей, то подобное взращивание, разумеется, обеспечивает им значительную свободу, а также — что немаловажно — предохраняет от раздражения, неизменно испытываемого по отношению к ребенку, чье поведение зачастую не соответствует завышенному уровню их ожиданий. Эти устройства, прозванные heir conditioners по созвучию с hair conditioners, к счастью, не получили распространения.

Что касается последней утопии Хаксли, то в «Острове» семья не упразднена, но расширена до «групп взаимного усыновления». Замечательно, что причины такого усовершенствования, по существу, те же самые, что у Скиннера. Однако и это очевидное сходство «Уолдена Два» и «Острова» оставлено хакслеведами без внимания.

Отдавая должное теории Скиннера, О. Хаксли неизменно критиковал его трактовку человеческой природы и указывал на то, что последняя не сводится к совокупности поведенческих тактик. Отмечая полное безразличие Скиннера к тому, что Уильям Джеймс называл «физиологическими силами», и к генетическим факторам, Хаксли указывал и на отсутствие в трудах необихевиориста даже намека на открытия конституциональной психологии: «Само по себе изучение поведения практически ничего не дает для понимания тела-созна-

ния индивидуума и его поведения в каждом конкретном случае. <…> Из опыта и наблюдений мы знаем, что различия в телесознании индивидов могут влиять и действительно оказывают глубокое влияние на их социальное окружение»13.

В одном Хаксли безусловно соглашается со Скиннером: предотвращение асоциального поведения путем превентивного воздействия на психику человека оказывается не только гуманнее, но и результативнее наказания за проступки. Однако Хаксли никогда не согласился бы с тем, что ради блага человека всю ответственность следует переложить на среду, ведь отсутствие ответственности будет означать и отсутствие свободы. У Скиннера вся система «целей и средств» смещена не в сторону самоактуализации, на непреложной ценности которой настаивала, в частности, экзистенциальная психотерапия, а в сторону этико-биологической адаптации.

Но вернемся к «Острову» Хаксли. Как и в «Уолдене Два», в «Острове» нет места наказанию. Жизнь на Пале организована так, чтобы у человека не возникало ни возможности, ни — главное — необходимости поступать плохо. Но вот что любопытно: основная перипетия в «Острове» построена именно на «сбое в поведенческой программе». Примером подобного сбоя является Муруган, юный наследный принц Палы, не поддавшийся паланезийскому воспитанию. Он оказал стойкое сопротивление любым положительным воздействиям. Думается, что и финал «Острова» является в той или иной мере сознательным откликом на «Уолден Два». Мирный демократический строй Палы свергнут в результате взаимодействия двух факторов. Первый фактор очевиден: это наличие по соседству с Палой милитаристского государства с деспотической формой управления, жаждущего политической и экономической власти над богатой нефтяными залежами Палой. Второй фактор не менее интересен и, возможно, более важен. Речь идет об очевидной педагогической и психотерапевтиче-

ской неудаче паланезийских воспитателей наследного принца, играющего роль политической марионетки при диктаторе соседней державы. Характер и семейная история Муругана оказались не разрешимыми проблемами для местных психологов, применивших, вероятно, почти весь спектр воспитательно-терапевтических методик, но, скорее всего, недооценивших действенность разработанных Скиннером приемов.

Немаловажно и то, что паланезийские правители, хотя и предвидели такой исход для своего идеального государства, тем не менее намеренно не стали налаживать производство оружия или закупать его за границей. Население Палы также совершенно не готово к сопротивлению захватчикам. Следовательно, власти Палы сознательно шли на риск, полагая, что, поступив иначе, нарушили бы буддистский принцип «недеяния», непротивления злу насилием, и пожертвовали бы идеей пацифизма —

Хаксли, как известно, много десятилетий был активным противником любой войны.

Как мы видим, избрав для романа весьма реалистический конец — военную интервенцию на остров и крушение райской жизни, Хаксли продемонстрировал критическое отношение к собственному утопическому построению, к идеализированной картине здорового общества. Это, однако, не означает, что Хаксли предпочел бы вышеописанную скиннеровскую модель, возможно, более надежную и научно выверенную, вместо гуманистической терапии, торжествующей на Пале. Напротив, писатель поддержал главный аргумент оппонентов Скиннера: психические сбои возможны и при успешном адаптивном воспитании. В самом деле, в системе необихевиоризма невозможно найти ответ на вопрос, почему так много великолепно приспособившихся к социуму людей страдают от комплексов и неврозов. Почему они, по существу, глубоко несчастны?

ПРИМЕЧАНИЯ

1 Лаура Арчера Хаксли, вторая жена Олдоса Хаксли, любезно согласилась дать мне интервью в Голливуде в июне 2004 г. в том самом доме, где последние годы жил и умер писатель. Лаура скончалась на 96 году жизни 13 декабря 2007 г.

2 Хаксли О. О Дивный новый мир// О Дивный Новый Мир. Английская антиутопия. Романы. — М., 1990. — С. 321.

3 Цит. по: Complete Essays of Aldous Huxley / Ed. Robert S. Baker and James Sexton. — Chicago, 2000. — Vol. IV. — P. 358.

4 Huxley A. Letters/ Ed. Grover Smith. — New York; Evanston, 1969. — P. 847.

5 Sargant W. Battle for the Mind: The Mechanics of Indoctrination, Brainwashing & Thought Control. — Garden City, New York, 1957.

6 Huxley A. Letters. P. 847.

7 Хаксли читал скиннеровскую монографию 1953 г. «Наука и поведение человека» (Skinner B.F. Science and Human Behavior. London: Macmillan, 1953,). На нее он ссылается в книге «Снова в Дивном Новом Мире». Кроме того, Хаксли была известна (см. Complete Essays of Aldous Huxley, Vol. VI. P. 280) публикация в журнале Science дискуссии Скиннера с Карлом Роджерсом на ежегодном заседании Американской психиатрической ассоциации (Rogers C., Skinner B.F. Some Issues Concerning Human Behavior: A Symposium // Science. 30 November 1956. Vol. 124, # 3231. P. 1057—1066). Карл Роджерс, принадлежавший к гуманистической ветви психотерапии, настаивает на том, что поведенческий выбор может совершаться вне той парадигмы, которая традиционно рассматривается психологией бихевиоризма. По Роджерсу, поведение может определяться субъективной системой ценностей, добровольно избираемой индивидуумом. Что до Скиннера, то основной его тезис, который вызывает видимое, но не всегда мотивированное раздражение Хаксли: человек — продукт окружающей среды, следовательно, изменив среду, мы изменим поведение человека. Между тем Хаксли явно не оценил изящество рассуждений психолога. При внимательном и непредвзятом прочтении оказывается, что Скиннер готов принять в свою систему ценностей самоактуализацию, о которой говорит Роджерс, однако Скиннер настаивает на том, что прежде всего следует опреде-

ЛИТЕРАТУРОВЕДЕНИЕ

лить, каково назначение самоактуализации, почему она представляет для нас ценность? Оба — Скин-нер и Роджерс — прибегают в полемике к примеру государства, описанного Олдосом Хаксли в «Дивном Новом Мире». Заметим, что Скиннер предлагает решение проблемы диктатуры, т. е. злоупотребления властью: следует установить контроль над контролерами. Роджерс парирует: Кто будет контролировать контролеров? Ответ Скиннера: контролеров будут контролировать контрконтролеры.

8 Хаксли О. Остров. — СПб.: Академический проект, 2002. — С. 242—243.

9 Skinner B.F. Walden Two. — Upper Saddle River: Prentice Hall, 1976. — P. 257.

10 Op. cit. P. 505.

11 Скиннеру принадлежит идея «жетонной системы», применявшейся вначале в психиатрических лечебницах и тюрьмах: за безукоризненное исполнение правил выдавались «жетоны», которые впоследствии могли быть обменены на необходимые вещи или на привилегии.

12 Первый образец такого устройства Скиннер спроектировал для своей дочери, после чего попытался наладить его серийной выпуск. Продукция на рынке не прижилась.

13 Huxley A. Brave New World Revisited // Huxley A. Brave New World and Brave New World Revisited. — New York: Harper Perennial, 1965. — P. 81.

СВОБОДА, СТИМУЛ, РЕАКЦИЯ (БИХЕВИОРИЗМ В УТОПИЯХ О. ХАКСЛИ И Б. Ф. СКИННЕРА)

TY — JOUR

T1 — СВОБОДА, СТИМУЛ, РЕАКЦИЯ (БИХЕВИОРИЗМ В УТОПИЯХ О. ХАКСЛИ И Б. Ф. СКИННЕРА)

AU — Головачева, Ирина Владимировна

PY — 2008

Y1 — 2008

N2 — Неприятие Олдосом Хаксли классического бихевиоризма и необихевиоризма кажется очевидным — об этом на первый взгляд свидетельствуют многочисленные острополемические пассажи в его романах и эссе, в частности его знаменитый «Дивный Новый Мир». Пристальное чтение его поздних текстов вносит неожиданные коррективы в наши представления. Так, например, выясняется, что последняя утопия Хаксли «Остров», написана не без влияния скиннеровской утопии «Уолден Два».Aldous Huxley.s negative assessment of behaviorism seems undisputable, as one can judge by his numerous critical remarks in both fiction and non-fiction, including «Brave New World». However, rapt reading of his late writing gives us a new, revised view on the issue. For example, rereading of Huxley.s last utopia «Island» reveals the influence of B. F. Skinner.s «Walden Two».

AB — Неприятие Олдосом Хаксли классического бихевиоризма и необихевиоризма кажется очевидным — об этом на первый взгляд свидетельствуют многочисленные острополемические пассажи в его романах и эссе, в частности его знаменитый «Дивный Новый Мир». Пристальное чтение его поздних текстов вносит неожиданные коррективы в наши представления. Так, например, выясняется, что последняя утопия Хаксли «Остров», написана не без влияния скиннеровской утопии «Уолден Два».Aldous Huxley.s negative assessment of behaviorism seems undisputable, as one can judge by his numerous critical remarks in both fiction and non-fiction, including «Brave New World». However, rapt reading of his late writing gives us a new, revised view on the issue. For example, rereading of Huxley.s last utopia «Island» reveals the influence of B. F. Skinner.s «Walden Two».

KW — кафедра английской филологии и перевода психология

KW — утопии

KW — литература англоязычных стран

M3 — статья

SP — 144

EP — 150

JO — ИЗВЕСТИЯ РОССИЙСКОГО ГОСУДАРСТВЕННОГО ПЕДАГОГИЧЕСКОГО УНИВЕРСИТЕТА ИМ. А.И. ГЕРЦЕНА

JF — ИЗВЕСТИЯ РОССИЙСКОГО ГОСУДАРСТВЕННОГО ПЕДАГОГИЧЕСКОГО УНИВЕРСИТЕТА ИМ. А.И. ГЕРЦЕНА

SN — 1992-6464

IS — 10 (57)

ER —

Рассмотрение бихевиоризма в качестве психологической науки о поведении

В 1913 году американский психолог Дж. Уотсон (1878-1958 гг.), который впоследствии стал теоретическим лидером бихевиоризма (от английского слова behavior, что означает «поведение»), заявил, что психология получит полное право называться наукой, только когда начнет использовать объективные экспериментальные методы изучения. Но с объективной точки зрения, возможно изучать исключительно поведение человека, проявляющееся в одной либо другой ситуации. Все, что невозможно объективно зарегистрировать, то есть человеческие мысли и сознание – все, что происходит непосредственно внутри человека, изучению уже не подлежит. Объективно изучать и регистрировать возможно исключительно реакции, внешние действия индивида, а также те стимулы и ситуации, которые к этим реакциям приводят. Согласно Дж. Уотсону, задача психологической науки состоит в том, чтобы непосредственно по реакции определять возможный стимул, а по этому стимулу предсказывать конкретную реакцию. Та либо другая поведенческая реакция проявляется на отдельный стимул, какую-либо ситуацию. Формула «стимул-реакция» (S-R) считалась ведущей в бихевиоризме.

Определение 1

С точки зрения последователей этого направления, личность человека – это некая совокупность поведенческих реакций, присущих конкретному индивиду. Новые формы поведения возникают в результате образования условных рефлексов (так называемое обусловливание).

Психологические закономерности управления поведением людей

Можно осуществлять управление поведением людей, применяя некоторые психологические закономерности.

Закон эффекта

Был определен одним из первооткрывателей бихевиористского направления Э. Торндайком (1874-1949 гг.), подчеркивает: связь между стимулом и реакцией увеличивается, когда присутствует подкрепление. Оно бывает положительного характера (некая похвала, получение ожидаемого результата, материальное вознаграждение и т.д.) либо отрицательного (наказание, болевые ощущения, критическое замечание, неудача и т.п.). Поведение индивида зачастую вытекает из ожидания какого-либо положительного подкрепления, но в редких случаях преобладает желание в первую очередь избежать отрицательного подкрепления.

Закон субъективной ценности подкрепления

Чтобы осуществлять управление поведением, важно учитывать, какое именно подкрепление, какая именно награда предпочтительна, ценна и наиболее значима для индивида на конкретный момент. В концепции бихевиоризма индивид понимается в первую очередь как действующее, реагирующее, способное к обучению существо, которое «запрограммировано» на одни либо другие реакции, действия, проявления поведения. Меняя подкрепления и стимулы, можно «программировать» индивида на предпочтительное поведение. Помимо этого, в недрах самого бихевиоризма психолог Э. Толмен (1886-1959 гг.) подверг явному сомнению схему «стимул-реакция» как чрезвычайно упрощенную и добавил к этим членам новую переменную, стоящую между ними – психические процессы конкретного индивида, напрямую зависящие от его наследственности, прошлого опыта и нынешнего физиологического состояния.

Американский психолог Б.Ф. Скиннер (1904-1990 гг.) сформулировал положение о трех типах поведения человека: безусловно рефлекторном, условно рефлекторном и оперантном. Безусловно рефлекторный и условно рефлекторный типы поведения вызываются некими стимулами и называются, в свою очередь, респондентным (или отвечающим) поведением. Они составляют некую часть репертуара поведения человека, но исключительно ими не обеспечивается полная адаптация человека к нынешней среде его обитания. Сам процесс приспособления выстраивается на основании активных проб – то есть воздействий человека на окружающий его мир.

Замечание 1

Некоторые такие пробы совершенно случайно способны привести к получению полезного результата, который из-за своей очевидной полезности закрепляется. Данные реакции не вызываются стимулом, а выделяются (можно сказать, испускаются) самим организмом. Одни из них оказываются действительно верными и поэтому подкрепляются.

Скиннер дал им название «оперантные» (реакции типа Я). По мнению Скиннера, конкретно данные реакции можно считать преобладающими в адаптивном поведении человека. Основным средством формирования нового социального поведения является подкрепление.

Информация, приобретенная при изучении животных, перенесена Скиннером на людское поведение, что привело к довольно биологизаторской трактовке человека. Для решения некоторых социальных проблем современного социума Скиннер выдвинул задачу формирования технологии поведения, призванную вести контроль одной части людей над другой частью. В роли средства управления людского поведения выступал контроль за режимом подкреплений, дающий возможность осуществлять определенное манипулирование. Получается, что Скиннер огласил еще две психологические закономерности, которые можно увидеть ниже.

Нужна помощь преподавателя?

Опиши задание — и наши эксперты тебе помогут!

Описать задание

Принцип оперантного обусловливания

Поведение живых существ в полной мере определяется последствиями, к которым оно может привести. В зависимости от того, будут ли эти последствия положительными, безразличными либо отрицательными, данный живой организм проявит определенную тенденцию повторять конкретный поведенческий акт, не придавать ему малейшего значения либо стараться полностью избегать тех действий и тех ситуаций, которые способны привести к отрицательным последствиям.

Закономерность субъективной вероятности последствий

Индивид субъективно проводит оценку доли вероятности наступления одних либо других последствий своих собственных реакций. Чем сильнее субъективная вероятность проявления отрицательных последствий, тем значительнее это влияет на поведение индивида, и тем в большей степени он склоняется к тому, чтобы отказаться от подобных инициативных действий.

Определение 1

Скиннер говорил, что личность – это определенная совокупность социальных реакций, определенных навыков, сформировавшихся в результате оперантного научения.

Под достаточным влиянием конкретной системы подкреплений и наказаний человек получает новые социальные навыки, а также другие свойства личности.

Представитель школы необихевиоризма Альберт Бандура (1925-1988 гг.) продемонстрировал, что новое поведение способно появляться не только в результате спонтанной инструментальной активности (как считал Скиннер), но и как подражание либо как результат словесного (вербального) инструктирования. Именно так были озвучены закономерности управления поведением людей, перечисленные далее.

Закономерность подражания

Индивид склонен копировать поведение других индивидов с расчетом на то, что результаты этого копирования окажутся положительными для него лично.

Закономерность научения через пример либо наблюдение

Индивиды способны учиться, просто наблюдая, читая либо слыша об определенном поведении других людей.

Закономерность самоподкрепления

Индивиды обладают способностью самостоятельно давать оценку собственному поведению и поощрять либо критиковать либо каким-то образом наказывать себя в том случае, если они нарушили общепринятые нормы, которые кажутся им правильными.

Теория Джулиана Роттера

В теории социального научения, разработанной Дж. Роттером (1916-1914 гг.), социальное поведение человека возможно обрисовать, используя нижеперечисленные понятия:

  • Поведенческий потенциал. Любой индивид обладает конкретным набором действий, поведенческих реакций, образовавшихся в течение его жизни.
  • Субъективная вероятность. С какой, как считает индивид, вероятностью, некое подкрепление будет после конкретного поведения в какой-либо ситуации (когда индивид думает, что есть высокая вероятность того либо другого вида подкрепления в этой ситуации, он быстрее усваивает нужное поведение, которое максимально соответствует и ситуации, и подкреплению).
  • Характер и ценность подкрепления. Различные индивиды ценят и выбирают различные подкрепления. Для кого-то намного более ценна устная похвала, необходимо уважение окружающих, для кого-то – материальные блага, кто-то сильнее чувствителен к наказанию и так далее.
  • Локус контроля. От латинского слова locus, что означает «место», «местоположение». Это понятие, которое ввел Роттер, разделяет индивидов по такому принципу: часть считает себя «пешкой», а часть – человеком, чьи усилия могут привести к достижению поставленной цели. Экстерналы снимают с себя ответственность за абсолютно все происходящее с ними, и перекладывают ее на окружающих и жизненные обстоятельства. Интерналы склонны считать ответственным за все положительные и отрицательные события в жизни исключительно себя самих. Проще поддаются внешнему влиянию и управлению именно экстерналы, их поведение гораздо легче программируется переменами внешних воздействий, определенных ситуаций, стимулов и подкреплений.

Сильные и слабые стороны бихевиоризма

Основными достижения бихевиоризма в качестве психологии как науки о поведении считаются внедрение объективных методов регистрации, а также анализа внешне наблюдаемых реакций, действий индивида, неких процессов и событий, а также открытие конкретных закономерностей научения, появления навыков, поведенческих реакций.

Замечание 2

Значительное влияние бихевиоризм оказал на развитие психотерапии, а также на методы программированного обучения.

Главный недостаток бихевиоризма состоит именно в недостаточном учете сложности психической человеческой деятельности, значительном сближении психики человека и животного, игнорировании процессов сознания, самоопределения индивида, творчества.

Прикладной анализ поведения: от стимулов к реакциям

Вы когда-нибудь задумывались о том, что вся наша жизнь, в принципе, может быть охарактеризована одним единственным словом – «поведение». Все, что связывает нас с окружающими людьми, предметами, даже самим собой, – это те или иные проявления нашего поведения. А как много вы знаете об этом понятии? Когда оно зародилось? Какое место занимает в психологии? Можно ли воздействовать на свое поведение или на поведение окружающих людей и что такое прикладной анализ поведения? Давайте попытаемся постепенно ответить на все указанные вопросы.

Что такое «поведение»?

Определяя «поведение» отметим, что это взаимодействие живого организма с объектами окружающей среды, которое измеряется перемещением во времени или пространстве с одновременным изменением окружающей среды.

Наше поведение напрямую взаимосвязано с тем, что мы воспринимаем вокруг, поэтому изучение факторов, влияющих на поведение индивидуума, всегда привлекало большое количество ученых. В психологии развилось особенное направление – бихевиоризм (от англ. behavior – поведение), ставящее во главу угла изучение реакций на стимулы. Основателем бихевиоризма считается Джон Уотсон, американский психолог конца 19 – начала 20 века. Бихевиоризм отталкивался от возможности и необходимости познавать психологию личности при помощи точных и измеримых методов.

Дж. Уотсон вывел простую формулу, связанную с поведением:

Формула Джона Уотсона: Стимул = Реакция

Данная формула означает, что все поведение человека формируется в результате влияния стимулов. К примеру, мы ходим на работу, чтобы зарабатывать деньги, мы питаемся, чтобы получать энергию, мы идем в магазин за свитером, чтобы не замерзнуть зимой, мы читаем данную статью, чтобы стать более информированными и развитыми (или руководствуемся каким-либо другим мотивом, но главное, что он у нас есть). Непроизвольное моргание, дыхание и другие процессы в организме также основаны на физиологических причинах.

Позднее концепция бихевиоризма была содержательно дополнена нашим соотечественником Иваном Петровичем Павловым (1849-1936), который, проводя эксперименты на собаках, также доказал возможность выработки безусловного рефлекса (выработка слюны при виде пищи, а  точнее, при восприятии звонка) в результате научения или условного рефлекса (выдача пищи следовала после звонка).

Типы обусловливания поведения

В рамках изучения поведения стоит различать респондентное и оперантное обусловливание поведения. Два вышеуказанных ученых склонялись именно к изучению респондентного мотивирования, как раз-таки работающего по формуле «стимул-реакция», то есть за каждым мотивом следует определенный ответ в виде того или иного поведения.

Оперантное же обусловливание склоняется к формуле «стимул-подкрепление-реакция». То есть в данном случае мы руководствуемся не причиной нашего действия, а реакцией со стороны (поощрением или наказанием), и в зависимости от неё у нас складывается реакция.

Приведем пример. Ваш ребенок ходит зимой без шапки, вы за это переживаете, потому что он может заболеть. Джон Уотсон здесь предложил бы вам объяснить своему ребенку, что если он будет ходить с неприкрытой головой, он может заработать себе простуду. Либо в конце концов ваш ребенок заболеет, у него выработается реакция «хожу без шапки-болею», и он больше не будет выходить из дома в холод без головного убора.

Беррес Скиннер, как раз-таки разработавший идею оперантного обсуловливания, направил бы вас по другому пути и посоветовал бы ввести меру поощрения за то, что ребенок надевает шапку. Допустим, вы можете его похвалить, материально или идеально поощрить. Можно придумать что-то вроде этого: «Давай ты наденешь шапку, а я заберу тебя пораньше с занятий, и мы пойдем гулять». В такой ситуации ребенок наденет головной убор, потому что у него будет реакция на подкрепление – на то, что вы заберете его из школы пораньше.

При этом Скиннер указывал, что гораздо более твердо реакция закрепляется в случае поощрения, то есть позитивного подкрепления, а не наказания. Иными словами, если вы будете кричать, бить, оскорблять своих детей, вызывая страх и слезы, то реакция будет происходить, но при этом у личности будет развиваться низкая самооценка, излишнее переживание и тревога.

Обратите внимание, что таким образом мы можем влиять на поведение окружающих людей, то есть изменяя условия окружающей среды, мы вводим личность в то или иное психологическое состояния посредством мотивационного, стимулирующего механизма.

Именно на этом основывается разработанная в США методика Прикладного анализа поведения (ПАП, с английского ABA – Applied behavior analysis), направленная в большей степени на терапию с людьми, страдающими расстройствами аутистического спектра (попросту говоря, с аутистами). Давайте немного подробнее остановимся на данной методике.

Прикладной анализ поведения: сущность, этапы, критика

Прикладной анализ поведения (или ПАП-терапия/ABA-терапия) представляет собой поведенческую терапию, ориентированную на вовлечение детей-аутистов в окружающие социальные условия. При ПАП-терапии действия проводника (непосредственной личности, работающей с ребенком, как правило, кого-то из родителей) направлены главным образом на создание благоприятных внешних условий, в которых ребенок-аутист будет развиваться, социализироваться и принимать сложившуюся окружающую среду.

По сути, диагностированные аутистическим расстройством страдают от дефицита социального взаимодействия и общения, зачастую имеют неширокий круг интересов и могут выполнять повторяющиеся действия. Прикладной анализ поведения направлен как раз на нивелирование данной симптоматики, научение ребенка понимать мир, реагировать на него и успешно с ним контактировать.

Принципы бихевиоризма – стимулирование, поощрение – активно используются в данной методике. Однако важно помнить, что в данном случае от проводника должен исходить односторонний поток исключительно положительных эмоций. Вообще, данная методика, хоть и направлена на ребенка-аутиста, передается через проводника, фактически, он (она) становится главным фигурантом поведенческого анализа.

Ребенок, будучи подверженным прикладному анализу поведения, не должен видеть раздражения, нетерпения, уж тем более агрессии со стороны проводника. Первостепенной задачей является научение ребенка принимать свои эмоции:

Ментору важно сохранять спокойствие, не давать поводов для расстройства и закрытия, постоянно анализировать поведение ребенка. Некоторым аутистам присуща большая развитость слуха, другим – зрения, кто-то в большей степени познает действительность за счет вкуса, а кто-то – осязания. При поиске подхода к ребенку важно подобрать правильный канал, через который можно воздействовать на мозговую активность в большей степени.

Чтобы прикладной анализ поведения действительно работал, необходимо практиковать его ежедневно. Врачи называют цифру примерно 5-6 часов в день, однако методика ПАП должна стать образом жизни, особенно для проводника. Постоянное чуткое, внимательное, терпеливое отношение родителя (или другого проводника) при одновременном анализе поведения следует ввести в ежеминутную практику. Безусловно, это стоит больших усилий, но помните, что с улучшением состояния ребенка все будет возвращаться сторицей.

Условно выделяется четыре этапа при использовании методики ABA. Рассмотрим каждый из них.

Сигнал – понимание

На первом этапе ребенок пытается найти контакт с внешним миром, пытается понять, что от него требуют, затем оценивает это и выдает ответную реакцию на запрос из внешней среды. К примеру, проводник хочет, чтобы ребенок покачал головой. Это простой шаг на пути выстраивания более сложных комбинаций, однако он очень важен, так как на данном этапе ребенок учится воспринимать сигналы извне и реагировать на них. Очень важно также поощрение со стороны проводника, который видит успех у своего подопечного. Если же у больного не получается, наберитесь терпения – все обязательно продвинется.

Усложнение

Если на первом этапе мы учились просто распознавать сигналы и реагировать на них, то здесь мы связываем простые шаги и составляем более комплексные комбинации, задействуя разные участки мозга ребенка-аутиста. К примеру, если ранее вы учились махать рукой на прощание с кем-либо, то на втором этапе попробуйте добавить вербальный контакт –махать рукой и говорить «пока» одновременно. Задача проводника – разбудить мозг аутиста, заставить его работать. Помните, это самый малоизученный орган, подвергаемый изменениям в наиболее сложной степени. Наберитесь воли и терпения.

Генерализация навыков

Освоив два предыдущих этапа, обычные сигналы следует превратить в конкретные запросы от проводника. Степень выполнения этих запросов выражает обладание ребенком теми или иными навыками. Команды по типу «дай», «возьми», «принеси», «положи» являются кумулятивными и состоят из отдельных действий, простых шагов, которые, по идее, были изучены на первом и втором этапах. Поэтому здесь ребенок становится более подготовленным к жизни в обществе, может воспринимать комплексные сигналы и реагировать на них.

«Выход в свет»

Когда ребенок с аутистическим расстройством уже осваивает все вышеуказанные научения, он должен непосредственно выйти на практику и попробовать общаться с окружающими людьми. Не с мамой, папой, бабушкой, родственниками или психологом, а именно с чужими людьми. Тем не менее помните, что эти люди должны быть благожелательны и адекватны. Кстати, совершенно не рекомендуется вводить ребенка в среду с такими же особенными детьми, потому что их реакция может быть немного необычной, что может его смутить, расстроить.

Исходя из концепции ABA-терапии, пройдя четыре вышеописанных этапа, ребенок сможет социализироваться и погрузиться в среду других людей.

Однако многие психологи, эксперты подвергают методику ПАП критике, выражая мысль о том, что ребенок в данном случае подвергается некой дрессировке, проводник стимулирует, а ребенок исполняет команды только ради поощрения и получения похвалы. Фактически, метод ПАП основан именно на стимулах, поощрении и реакции. Однако подвергать сомнению его результативность сегодня не приходится.

Одним из менторов ABA-методики является Марина Азимова, магистр педагогических наук, доцент МГППУ, сертифицированный поведенческий аналитик, да и просто мать ребенка-аутиста. В этом видеоролике вы можете прослушать её лекцию, где она подробно делится опытом применения прикладного анализа поведения:

Методика ПАП применима не только в отношении больных аутизмом детей, но также и обычных здоровых людей самого разного возраста. Главное понимать сущность методики: берите в расчет формулу Б. Скиннера и меняйте свои привычки, а также влияйте на поведение других людей.

Кстати, отличным вариантом оказания влияния на свое поведение может служить наша онлайн-программа «Психическая саморегуляция», где за 6 недель вы научитесь бороться со стрессом и апатией, выстраивать хорошие отношения с друзьями и коллегами, а также победите прокрастинацию.

Завершая, хотелось бы напомнить, что если вам на долю выпало воспитание ребенка, страдающего аутизмом, помните, что вам это по силам и вы обязательно справитесь. Иначе, он бы не был вам послан. Главное при воспитании этого ребенка – не давать понять ему, что он сильно отличается от других. Создайте вокруг атмосферу совершенно обычного ребенка, и тогда он поверит и не будет чувствовать себя некомфортно в социальной среде.

Желаем вам удачи!

Понять мотивы потребителей

Будучи впервые опубликована в 2006 году статья в качестве иллюстрации анализировала ошибки организации фешн-лаборатории в Альта Центре, предвещая крах идее без изменения ее маркетинга

«Новый маркетинг» №11/2006, РУБРИКА: МАРКЕТИНГ ОТНОШЕНИЙ

Ни одна психологическая теория не дает так много знаний о том, как мыслят потребители и как повлиять на их мнение, как бихевиоризм. Это направление наиболее широко используют в интересах бизнеса. Оно изучает поведение индивида (англ. behaviour), которое понимается как совокупность реакций на внешние стимулы. Менеджмент черпает из теории бихевиоризма рекомендации о том, как достичь полной самоотдачи сотрудников и получить максимально возможную добавочную стоимость. Маркетингу же эта теория помогает обеспечить максимально возможную капитализацию добавочной стоимости.

Бихевиоризм в широком понимании

Изучать поведение индивидов начали американцы в конце ХІХ века (родоначальник данного направления социальной психологии – Дж. Уотсон), хотя элементы бихевиоризма использовали и раньше, например разрабатывая дворцовые этикеты и дресс-коды. Хочешь, чтобы тебя принимали определенным образом, – сигнализируй об этом миру своим внешним видом и манерами поведения. Этот императив иллюстрирует принцип психологического детерминизма – обусловленности одних психических явлений другими по схеме «стимул – реакция». И наоборот, любое протестное поведение основано на разрушении традиционной схемы «стимул – реакция», то есть на возникновении девиантной (маргинальной) реакции на обычный стимул. Если верить гарвардским профессорам, то маргинальность сегодня – синоним развития.

Схеме «стимул – реакция» обязан своим существованием также принцип бихевиористского интеракционизма как основы взаимодействия индивидов со средой и друг с другом. В маркетинге и менеджменте этот принцип лежит в основе всех программ стимулирования – потребителей, участников каналов распределения, персонала компаний.

Безусловно, ощущать себя механизмом с кнопкой малоприятно. Этим объясняется «послевкусие» от использования, например, НЛП. В ответ на любое шаблонное поведение возникает желание опротестовать его, нарушить механическую последовательность.

Так в психологии появилось понятие необихевиоризма – допущение того, что один и тот же стимул может вызывать абсолютно разные реакции у людей в зависимости от их возраста и настроения. Данное допущение проявляется в дополнении схемы «стимул – реакция» принципом пробабилизма (изучением вероятности, с которой последует или не последует ожидаемая или неожиданная реакция). Как только возникла мысль о том, что индивид демонстрирует разные реакции на один и тот же стимул в зависимости обстоятельств, бихевиористы предложили принцип верификации – необходимость чувственного установления истинности всякого утверждения (ощущаем с ним свое согласие или несогласие и доверяем этому своему ощущению как основному критерию).

Самые яркие проявления бихевиоризма в маркетинге

Иногда мы забываем, что маркетинг как таковой (в отличие от управления сбытом) возник именно тогда, когда бизнес увидел возможность зарабатывать на том, что и почему хотят купить, то есть когда появился интерес к мотивам потребителя как к одному из элементов модели поведения человека. Следующая ступень интеграции бихевиоризма в маркетинг – как они хотят покупать и потреблять продукт. Ответ на первый вопрос позволяет маркетологам разрабатывать эффективные методы продвижения и продаж, а ответ на второй – создавать принципиально новые продукты и находить способы позиционирования существующих товаров.

Один из главных результатов внедрения бихевиоризма в маркетинг – модель поведения потребителя (рис. 1) и вытекающее из нее понимание возможностей влияния на скорость и характер принятия решения о покупке (рис. 2). Чтобы продемонстрировать важность этих знаний, обратимся к традиционной проблеме многих компаний – обучению торгового персонала техникам продаж. Обращаясь к тренинговым компаниям, клиенты часто ставят задачу следующим образом: «Дайте нам тренинг по продажам пооригинальнее, а то клиенты уже посмеиваются». Если бы стиль продажи каждый раз согласовывался со стилем покупки, происходящим из стиля потребления, то усталость от шаблонного поведения продавцов, а соответственно, и скептицизм по поводу целесообразности покупки вряд ли возникали бы.

Рисунок 1. Модель поведения покупателя

Рисунок 2. Процесс принятия решения о покупке

Эффективные техники продаж основаны прежде всего на понимании продавцами причинно-следственных связей, которые управляют убеждениями и мотивами потребителей.

Продавцам бывает сложно описать ситуацию продажи с точки зрения клиента: что он думает о компании и ее конкурентах, как сопоставляет различные предложения и почему делает выбор в пользу того или иного. Самое частое заблуждение продавцов, особенно в ситуации, когда они регулярно слышат от своих руководителей нечто наподобие: «У нас оптимальное соотношение цены и качества», заключается в том, что клиент всегда действует в рамках рационального стиля принятия решения и, более того, разделяет оценку цены и качества продукта, данную продавцом. Это особенно вредно, когда клиент не проявляет заинтересованности в предложении продавца, что свидетельствует об ограниченном или даже автоматическом принятии решений (то есть клиент принимает решение о покупке на основании уже имеющихся знаний или воспроизводит ранее сделанный выбор без изменений). Понять, что именно движет потребителем, и повлиять на его поведение помогает знание и применение бихевиористических подходов.

Так, стиль потребления обусловлен стилем жизни не только индивида, но и общественного слоя, к которому он принадлежит. Если среднестатистический американец привык к регулярному (раз в полгода) повышению оклада, то возникает благоприятная для привязки к этому факту избирательность восприятия. И нестандартно мыслящая, интересующаяся тенденциями поведения среднестатистического работника офиса страховая компания находит блестящий способ коммуникации своего предложения: «Позаботьтесь об обеспеченной старости, не уменьшая свой текущий доход и привычный уровень расходов. Необходимость платить страховые взносы возникнет только в том случае, если вам повысят оклад. Сумма взноса составит всего лишь Х% от суммы прироста оклада». Избирательность восприятия говорит потребителю: «Неизвестно, когда еще будет это повышение, – я себе ни в каких текущих расходах не отказываю». И он приобретает страховой полис с легкостью. При этом разочарования от необходимости регулярных страховых платежей не возникает: по темпам роста потребление опережает вознаграждение за труд, благодаря чему и удается избежать ощущения дополнительного бремени затрат.

Примеры бихевиористически взвешенных решений

Самый простой и яркий пример бихевиористического решения в товарном маркетинге можно найти в истории чая Brook Bond: в результате маркетинговых исследований его производитель определил норму и девианты по количеству завариваний одного пакетика чая и решил уменьшить массу пакетика. При этом количество пакетиков в упаковке и ее цена остались неизменными. И компании выгодно, и покупателю удобно.

Примеры глубокого понимания своих потребителей демонстрирует и шоу-бизнес. Так, бихевиористические решения позволили американской группе Dead вести успешную концертную деятельность в течение 30 лет. Dead появилась на свет в 60-х годах ХХ века и была популярна среди хиппи. В начале 80-х годов менеджеры группы столкнулись с падением интереса к ее концертам. Повысить посещаемость удалось благодаря распространению 20–40% билетов по почте. Организаторы гастролей приняли это решение, осознав, что среди фанов Dead много семейных работающих людей 30-40 лет, которым недосуг выстаивать очередь за билетами.

Еще больше улучшить ситуацию удалось благодаря продаже 200 специальных мест с правом видеосъемки на концерте. Традиционно фото- и видеосъемка на концертах запрещена, поскольку продюсеры боятся потерять доход от продаж профессиональных записей. На чем основывались менеджеры Dead, принимая противоположное решение? Одна и та же песня в живом исполнении каждый раз звучит иначе. Собственноручно сделанная запись – это попытка остановить мгновение, чтобы испытать заново впечатления от концерта. Студийная запись – это удовольствие от идеализированного звучания. Другими словами, речь идет о совершенно разных товарах, удовлетворяющих разные потребности. Продажи специальных мест с правом видеозаписи укрепили фанов группы в намерении посещать все ее концерты, равно как и покупать студийные записи.

Бихевиористический подход широко используется и в ресторанном бизнесе. Например, франчайзинговое развитие ресторанной сети представляет собой, по сути, продажу начинающему ресторатору возможности воспользоваться сформировавшимся отношением потребителей к сети, франшизу которой он приобретает. Отдельная история – рассылка постоянным клиентам ресторанов поздравлений с днем рождения. Они стандартны, но вместе с тем сохраняют ощущение индивидуального подхода благодаря коммуникации, построенной с учетом психологического состояния гедониста и сибарита (таковы завсегдатаи хороших ресторанов). Каждому хочется, чтобы его праздник был незабываемым. Что делают маркетологи ресторанов? Основываясь на этом настроении, они предлагают клиенту сделать подарок самому себе – посетить любимое заведение, воспользовавшись разовой скидкой.

И наконец, еще один удачный с точки зрения бихеовиоризма пример – из области рекламы. Одна туристическая фирма, ориентированная на VIP-аудиторию, разработала рекламный проспект. Слоган, который она использовала для буклета («Качество жизни определяется количеством мгновений, которые хотелось бы остановить»), и великолепные фотографии с видами экзотических мест были призваны активизировать ценностно-рациональное поведение. Желание остановить мгновение возникало сразу, как только буклет попадал в руки к потенциальному клиенту фирмы.

Учет субкультурных отличий потребления – резерв для товарного маркетинга

Любопытно также влияние гендерной психологии на функционирование современного бизнеса. Происходит оно опосредованно, через бихевиористические модели, поскольку гендерные отличия являются отличиями субкультур. Так, исследователи обнаружили расхождения в процессе принятия решения, зависящие от пола (классические этапы, отраженные на рис. 1, неоспоримы).

Оказалось, что мужчины в случае поступления к ним новой информации, касающейся пройденных этапов принятия решения, предпочитают отмести ее как ненужный информационный мусор, отвлекающий от цели и отдаляющий момент ее достижения. Они склонны жертвовать качеством принимаемого решения ради скорости его принятия. Кто не рискует, тот не пьет шампанского – сугубо мужская народная мудрость. Женщины же возвращаются к предыдущему этапу, оценивают информацию, чтобы уточнить свою потребность или расширить перечень оцениваемых вариантов, то есть демонстрируют зигзагообразный процесс принятия решения о покупке. К тому же они принимают во внимание больше критериев выбора и поэтому пожертвуют скорее скоростью принятия решения, чем убежденностью в оптимальности своего выбора. Исключение составляет разве что шопинг – стремительно-прямолинейное, без каких-либо сомнений в целесообразности, движение навстречу покупке, когда рациональные критерии выбора уступают место потребности «купить что-то и обязательно сегодня», чтобы получить сатисфакцию за переутомление или стресс, самоутвердиться, повысить самооценку и т. д.

Отличия проявляются и в манере общения мужчин и женщин. Это хорошо знают исследовательские агентства. Чтобы получить непредвзятую картину, они иногда даже составляют фокус-группы исключительно из женщин или исключительно из мужчин. Социолингвисты утверждают, что мужчины способны нарисовать целостную картину в общих чертах, продемонстрировав ответную реакцию рынка (той его части, которую они представляют), а женщины, в силу привычки воспринимать детали и нюансы, размышлять в контексте окружения и жизненного уклада, могут предоставить информацию, которая позволяет понять причины подобной реакции. Так, в случае необходимости выделить бренд на фоне целого ряда аналогичных предложений именно детали (речь идет не о технической спецификации, в которой сильны мужчины, а о жизненном укладе, стиле потребления) определяют степень эффективности рыночных решений.

В смешанных же фокус-группах стремление мужчин доминировать и жестко, переходя на личности, отстаивать свою точку зрения в большинстве случаев вынуждает женщин промолчать, то есть оставить при себе важное для маркетолога мнение о механизмах потребительского поведения.

Система референций как рычаг капитализации добавочной стоимости

Управлять поведением потребителей маркетологам позволяет знание теории референций, референтных групп и личностей. Особенно полезны знания о референтных группах в маркетинге услуг и предметов роскоши, а также товаров, потребляемых в основном женщинами, которые особенно доверяют мнению людей из своего круга (предпочтениям тех или иных референтных групп) в противовес или в дополнение к рекламным сообщениям.

Пример игнорирования силы действия референций – эксперимент по созданию очага потребления продуктов украинской высокой моды на киевской Петровке, в районе традиционно дешевых покупок ширпотреба. Логика подобного размещения торгового центра – экономия на затратах и ставка на эффектные маркетинговые акции и мероприятия, которые привлекут целевую аудиторию куда угодно. Собственно, коммуникации происходят с завидной регулярностью в течение всех двух лет эксперимента, а модельеры тем временем регулярно сменяют друг друга в списке арендаторов.

Почему так происходит? Ответ можно найти, если посмотреть на ситуацию сквозь призму бихевиоризма, то есть проанализировать модель поведения потребителя модной индустрии и потребителя масс-маркета. Ведь управляющая компания помимо претенциозных магазинов украинских модельеров разместила в торговом центре точки с продукцией массового потребления, пытаясь удовлетворить потребности разных групп потребителей. Это можно объяснить желанием зарабатывать на одном продукте, чтобы вкладывать в другой и увеличить заработок в будущем. Данное решение окажется перспективным, если собственники торгового центра будут инвестировать в специальные маркетинговые коммуникации много и долго. Ведь само по себе такое сочетание предложения настораживает как потребителя предметов роскоши, так и потребителя товаров массового потребления.

Первый спрашивает: «Как же делать покупки в таком непрестижном районе, как Петровка, которая имеет репутацию места для шопинга несостоятельной части населения? Кого же там встретишь, с кем затусуешься, какой сервис получишь?» И приходится затрачивать средства на яркие события и их широкое освещение, чтобы внушить этой целевой группе другой стереотип: именно здесь на сегодняшний день и тусуются. Но смена стереотипов происходит медленно и стоит дорого.

Второй, склонный к рациональному стилю потребления, думает: «Какие же там накрутки на все, если они продают вещи с подиумов?» Заметьте, что информация о модных «тусовках» чаще попадается на глаза именно этой части населения, так как СМИ для нее – едва ли не единственное окно в Зазеркалье. Как вы думаете, какой из двух находящихся рядом торговых центров выберет среднестатистический покупатель: тот, в котором он чувствует себя равным среди равных, или тот, в котором волей-неволей начинает оглядываться по сторонам?

Возникает и ряд других вопросов: не слишком ли быстро работники «модной лаборатории» привыкают видеть в посетителях всего лишь зрителей – сидят и общаются между собой, нехотя оборачиваясь, когда кто-то из потребителей преодолевает свои опасения из разряда «это не для меня» и заходит в магазин? Способствует ли принятию решения о покупке плохо скрываемый скептицизм по отношению к намерениям посетителей или ссылки на то, что «именно эту вещь часто примеряли, но ни на ком она не смотрелась так хорошо, как на вас» или «эту вещь брала для своей программы сама N»? Как вы представляете себе внутренний монолог покупателя в данной ситуации? «Они меня совсем не уважают – хотят предложить за такие деньжищи секонд-хенд». Хотя в момент нахождения столь «удачного» аргумента речь о сумме покупки могла еще не идти.

И все это на фоне неутешительных мировых тенденций модной индустрии: ширпотреб побеждает и дорожает, а круг потребителей, нуждающихся в большом количестве одежды для светских раутов, с течением времени шире не становится, так как жесткие требования к дресс-коду предъявляют только в высшем обществе.

Кутюрье же, чтобы выжить, дарят свои уникальные работы звездам шоу-индустрии. С помощью этой своеобразной маркетинговой коммуникации они обеспечивают массовый сбыт аксессуаров и ароматов своих домов моды, зарабатывая именно на этих продуктах, а вовсе не на прет-а-порте.

Кстати, это решение вполне в духе бихевиоризма. Купить наряд от кутюр для одного выхода в свет массовому потребителю не под силу, зато стать ближе к миру звезд, приобретя приятные мелочи тех же домов моды, что и кумиры, вполне по средствам. Эксплуатацией этого стремления объясняется успех линий запахов и прет-а-порте от различных звезд подиума: например, духов от Лемпицки или одежды от Мийолович.

Однако украинский потребитель по-прежнему больше доверяет мировым брендам, чем отечественным, тем более когда речь идет о товарах-атрибутах. И эта позиция – вызов для того, кто решил делать бизнес на отечественной моде. Тем более, в сочетании же с восприятием места покупки как такого, в котором собираются люди «не того круга».

Например, вызывает массу вопросов такая оригинальная маркетинговая коммуникация, как предоставление нарядов ведущим светских теленовостей. На имидж самих ведущих соблюдение этикета, предписывающего выходить в свет каждый раз в новом наряде, влияет позитивно: они действительно становятся более популярными и узнаваемыми, их начинают причислять к звездам. А как отражается восприятие этих личностей массами на интересах самих модельеров, предоставляющих наряды, и владельцев помещений, в которых они продают свои коллекции?

Круг постоянных клиентов вряд ли находит новую ценность в демонстрации телеведущей новых изделий, так как надеть то, что надевала в свет другая женщина, еще хуже, чем повторно выйти в том, что уже надевала сама. Для круга же «теплеющих» клиентов эти изделия все еще непростая инвестиция, поскольку надо определить куда надеть и при этом решиться сделать это всего раз, чтобы реализовать амбиции по сближению, пусть и иллюзорному, со сравнительной референтной группой.

Кто ближе всего к клиенту

Принято считать, что дороже всего бизнесу обходится иллюзия знания потребностей, мотивов и причин принятия решений своими потребителями, тогда как у клиентов есть широкий выбор и они могут позволить себе «покапризничать». В настоящее время клиенты, чувствуя, что их выслеживают, словно охотничью добычу, активно сопротивляются, так как хотят, чтобы им облегчали и улучшали жизнь, а не принуждали делать то, чего они не желают.

Гибкий бихевиористический подход, в основе которого лежит изучение мотивации клиента, его убеждений, принадлежности к определенной субкультуре и т. п., позволяет добиться нужной реакции. Поэтому напоследок один совет маркетологам: будьте внимательны к сведениям, которыми обладает отдел продаж. Они ближе всего к клиенту, регулярно слышат его, начинают жить его умом, и если что-то из того, что маркетинг коммуницирует, остается непонятым продавцами не используется ими в работе, то как же это могут понять клиенты и партнеры компании? 

5 английских букв:

Искусственный интеллект и интеллектуальная собственность

(Фото: ВОИС)

ИИ и политика в области ИС

В результате распространения ИИ во многих областях техники возникает ряд вопросов политического характера, связанных с ИС. Их лейтмотив можно сформулировать следующим образом: нужно ли менять действующую систему ИС для обеспечения сбалансированной охраны произведений и изобретений, создаваемых машиной, ИИ как такового и данных, лежащих в основе ИИ. ВОИС инициировала открытый процесс, призванный положить начало дискуссии, посвященной последствиям ИИ для политики в области ИС.

Статьи, репортажи, новости и многое другое – в этом разделе вы найдете материалы по самым популярным темам, связанным с ИИ и ИС.

(ФОТО ПРЕДОСТАВЛЕНО BrightSign)

BrightSign: «умная» перчатка, дающая голос тем, кто не может говорить

Изобретательница из Саудовской Аравии Хадил Айюб, являющаяся основателем базирующегося в Лондоне стартапа BrightSign, рассказывает об истории создания работающей с использованием ИИ «умной» перчатки BrightSign, которая позволяет людям, объясняющимся на жестовом языке, общаться напрямую, не прибегая к помощи сурдопереводчиков.

(Фото: Alamy Stock Photo / © Hero Images Inc.)

ИИ – электричество нашего мира

Британский ученый в области компьютерной технологии и ведущий аналитик по вопросам ИИ Энрю Ын размышляет о преобразующей силе ИИ и мерах, которые необходимы для того, чтобы заставить эту технологию служить всему человечеству.

(Photo: PhonlamaiPhoto / iStock / Getty Images Plus)

Проект «Искусственный изобретатель»

Профессор Райан Эбботт размышляет о проблемах, с которыми столкнется система ИС в контексте все возрастающей роли ИИ, охватывающей в том числе процессы творчества и инноваций.

(ФОТО: ANYABERKUT/ Getty Images))

Право товарных знаков не успевает за развитием ИИ?

Большинство пишущих на тему ИИ уделяет основное внимание последствиям распространения ИИ для правовых норм, регламентирующих вопросы патентов, авторского права и промышленных образцов, но нас интересует другой вопрос: каково влияние ИИ на потребительские привычки, связанные с приобретением товаров и услуг, а, следовательно, и на право товарных знаков.

Как «приручить» правильные привычки | Бизнес-школа Laba (Лаба)

Представьте, что вы летите в самолете из Лос-Анджелеса в Нью-Йорк. И вдруг пилот решил чуть подкорректировать маршрут — на 3,5 градуса южнее. Как думаете, это сильно повлияет на ваш полет? Еще как — вы приземлитесь в Вашингтоне. 

Казалось бы, такая малость, но она серьезно отражается на конечном результате.

Аналогично и с привычками. Небольшие ежедневные изменения могут повернуть жизнь в другую сторону. Об этом в книге «Атомные привычки» пишет американский предприниматель и писатель Джеймс Клир.

Ссылаясь на исследования и опыт разных людей, он объясняет, как сделать правильные привычки стилем жизни и почему это проще, чем кажется. 

Публикуем главные идеи.

Как формируется привычка

Этот процесс делится на четыре этапа: стимул, желание, реакция и вознаграждение. Первые два показывают проблему, а вторые — ее решение. 

Стимул и желание побуждают мозг инициировать определенное поведение. На этом этапе мы получаем информацию, которая провоцирует нас что-то сделать, если для нас это актуально. Например, запах пиццы сподвигнет голодного человека ее купить, а сытый его просто проигнорирует. 

Реакция зависит от нашей мотивации и возможностей. Например, мы купим пиццу, если голодны (мотивация) и у нас есть деньги (возможности). 

После реакции идет вознаграждение. В примере с пиццей это удовлетворение от вкуса и сытость.

Все наши привычки построены на этих четырех стадиях, их цель — решать проблемы, с которыми мы сталкиваемся. Разберем привычку, которая укоренилась в нас с самого детства, — включать свет.

Стимул: вы входите в темную комнату. 

Желание: вы хотите видеть, что в ней находится. 

Реакция: вы нажимаете на выключатель. 

Вознаграждение: вы удовлетворяете потребность видеть. 

Несколько раз совершив это действие, вы к нему привыкаете, и оно начинает ассоциироваться у вас с пребыванием в темной комнате. Поэтому, заходя в такое помещение, вы в первую очередь ищете выключатель, а не зажигаете свечи. 

Как «приручить» хорошую привычку 

Джеймс Клир дает четыре совета по превращению хорошей привычки в стиль жизни. Для этого она должна быть очевидной, привлекательной, простой в выполнении и приносящей удовольствие. 

Разберемся, как это сделать. 

#1. Придайте очевидность

У японских машинистов есть странный ритуал: во время управления поездом они указывают на различные объекты и озвучивают свои действия. 

Например, когда поезд подъезжает к светофору, машинист видит его и говорит: «Зеленый свет», а прибывая или отъезжая от станции — смотрит на спидометр и называет точную скорость. Так машинисты обращают внимание на каждую ситуацию и проговаривают наблюдения вслух. 

Эта специальная система безопасности — «Показывай и называй» — разработана для уменьшения числа сбоев. Она может показаться глупой, но работает отлично: сокращает количество ошибок на 85% и аварийных ситуаций — на 30%. 

Система так эффективна, потому что повышает осознанность и придает очевидность тому, что человек делает в моменте. Мы тоже иногда пользуемся похожим подходом. Например, когда боимся забыть какие-то вещи и мысленно проговариваем список того, что уже взяли с собой. 

Клир советует чаще акцентировать внимание на том, что вы делаете прямо сейчас. Еще лучше — прописывать все свои действия на протяжении дня и анализировать, были ли они полезными.

Еще один способ придать действию очевидность — четко его запланировать. 

В 2001 году в Великобритании провели исследование с целью выяснить, как лучше «усваиваются» новые привычки. Испытуемых, которые хотели заниматься спортом, разделили на три группы и поставили перед ними разные задания. 

Первую группу попросили записывать, как часто они занимаются спортом. Вторую — делать то же самое, но еще и читать мотивационную литературу о пользе спорта. Третьей группе дали аналогичные задания, а в дополнение попросили составить четкий план, где и когда они будут заниматься спортом. Испытуемым нужно было закончить предложение: «В течение следующей недели я буду уделять 20 минут спорту в (время, день) в (место)».   

В итоге в первой и второй группах как минимум раз в неделю занимались спортом от 35 до 38% участников, а в третьей — 91%. Все потому, что они составили четкий план, чем придали планируемым действиям большую очевидность.

#2. Добавьте привлекательности

Студент-электротехник из Дублина Ронан Бирн страдал от вредной привычки — целыми днями смотрел Netflix. В то же время он понимал, что следовало бы чаще заниматься спортом. 

Ронан придумал выход из ситуации: подключил велотренажер к телевизору и сделал так, чтобы Netflix работал только при условии, что педали крутятся с определенной скоростью. Так Бирн и шоу смотрел, и спортом занимался.

Сочетание приятного с полезным — один из способов применения психологической теории, известной как принцип Премака. Он гласит, что «более вероятное поведение усилит маловероятное». То есть нам приятнее будет выполнять скучную, но нужную задачу, если заодно мы будем делать то, что хотим. Например, можно проверять рабочую почту под приятную музыку или учить английский в любимом кафе.

Также этот подход можно объединить со стратегией «наложения привычек друг на друга». Планировать, что после выполнения необходимой задачи вы займетесь тем, что хотите. Или наоборот. 

Например, позвонив трем клиентам, я смогу полистать ленту Facebook. Или утром приготовлю кофе после того, как выпью стакан воды. 

#3. Упростите

Представьте, что поливаете цветы в саду из шланга с перегибом посередине. Вода течет, но слабо. Есть два способа это исправить: выровнять изогнутый шланг или увеличить поток воды. Первый куда логичнее, но люди обычно выбирают второй. 

Мы часто совершаем подобную ошибку и с мотивацией. Нам кажется, чтобы овладеть сложной привычкой, нужно «добавить напора» — повысить мотивацию. Но на самом деле проще устранить препятствия, которые тормозят нас на пути. 

Для начала привычку нужно упростить и сделать так, чтобы она легко вписывалась в нашу рутину. Например, вы с большей вероятностью не пропустите занятие в спортзале, который находится по пути на работу. Если же он расположен чуть в стороне от вашего ежедневного маршрута, то «прогулять» тренировку будет легче.  

Для упрощения действия идеально подходит «правило двух минут». Оно звучит так: новая привычка должна занимать не больше 120 секунд. Например, хотите почитать книгу — начните с одной страницы в день, заниматься йогой — разложите коврик, выйти утром на пробежку — подготовьте спортивный костюм и оставьте на видном месте. 

Так вы начинаете с малого — и дальше вам будет легче продолжить. 

#4. Привнесите удовольствие

Жевательную резинку, изготовленную из каучука, выпускали на протяжении всего XIX века, но она была невкусной и, как следствие — непопулярной. Но в 1891 году компания Wrigley выпустила свою жвачку, которую начали покупать по всему миру. Все благодаря привкусу мяты и фруктов — жевательная резинка стала вкусной. Уже позднее компания начала продвигать свой продукт как способ очистки полости рта.

Эта история отлично иллюстрирует утверждение, что мы, скорее всего, повторим какое-то действие, если оно принесет нам удовольствие. Поэтому нужные нам привычки должны в результате давать ощущение выгоды и удовлетворения. 

Весь бизнес-контент в удобном формате. Интервью, кейсы, лайфхаки корп. мира — в нашем телеграм-канале. Присоединяйтесь!

Так сложилось, что большинство необходимых действий, которые мы совершаем, не приносят сиюминутного удовольствия. Они больше направлены на результат в будущем. Например, если вы хорошо работаете, то получите зарплату в конце месяца, если придерживаетесь диеты — начнете сбрасывать вес только через некоторое время. 

Поэтому нужно самостоятельно привносить удовольствие в свои привычки. Например, придумывать личные вознаграждения: «если я сегодня час позанимаюсь спортом, то вечером поиграю в Playstation» или «когда завершу эту рабочую задачу, схожу на кофе с коллегой». 

Последние материалы

Как оценить прибыльность очередной гениальной бизнес-идеи

Стоит ли воплощать задумку в жизнь: 5 подсказок для бухгалтера.

Как защитить деньги бизнеса от нечестных сотрудников

Топ-5 ситуаций, в которых предприниматели сами провоцируют кражу.

Чего клиенты хотят от служб поддержки в 2021

Омниканальность, ответ не дольше 30 минут и интернет вещей — новая реальность support-отделов.

Когнитивная теория обучения против теории стимула-реакции

Реферат

В своем обращении к Отделению теоретико-экспериментальной психологии Американской психологической ассоциации в 1948 году Кеннет В. Спенс обсудил шесть различий между когнитивной теорией и теорией стимул-реакция (СР). обучение. В этой статье я сначала рассмотрю эти шесть различий, а затем остановлюсь на двух из них в контексте моего собственного исследования. Это исследование касается спецификации ассоциаций стимул-стимул в ассоциативном обучении и характеристики нейронных систем, лежащих в основе этих ассоциаций.В ходе описания взглядов Спенса и моих исследований я надеюсь рассказать о некотором богатстве S-R психологии Спенса и ее актуальности в рамках современного научного анализа поведения.

Спенс (1950, стр. 161) охарактеризовал когнитивные теории обучения как те, которые «подчеркивают формирование и изменение когнитивных паттернов, представляющих отношения в окружающей среде». По большей части в рамках этих теорий, таких как теории Коффки (1935), Колера (1940), Левина (1936) и Толмана (1932), обучение было истолковано как часть более широкой проблемы организации восприятия и реорганизации с опытом. .Напротив, теории стимула-реакции (SR), такие как теории Гатри (1935), Халла (1943), Спенса (1936) и Торндайка (1898), подчеркивали такие конструкции, как привычки и связи SR, которые относились к гипотетическим состояниям обучения. или промежуточные переменные. Теории S-R предоставили правила, связывающие факторы стимула, такие как величина, количество и время вознаграждения, с сильными сторонами этих промежуточных переменных, а также правила, связывающие эти переменные с эмпирическими мерами реакции. В целом Спенс увидел несколько точек разногласий между этими двумя теоретическими позициями и приписал большую часть разногласий между лагерями неправильной интерпретации теории S-R когнитивными теоретиками.С моей точки зрения, тон его статьи был тон терпеливого учителя, указывающего на ошибки благонамеренных, но заблуждающихся учеников познания, но не щадя несколько менее распространенных (в его глазах) ошибок теоретиков S-R.

I. Шесть различий между когнитивной теорией и теорией СР

Метафоры: диспетчерские карты против телефонных коммутаторов

Возможно, потому что задачи пространственного обучения стали важной ареной тестирования для ранних когнитивных психологов и психологов СР, когнитивные теории обучения стали ассоциироваться с метафорой «диспетчерских карт», в которых пространственные представления и отношения были получены, вычислены и использованы.Напротив, теории S-R стали привязаны к аналогии с «телефонными коммутаторами», с помощью которых входные сигналы стимулов посредством обучения связывались с новыми выходными сигналами реакции (Tolman, 1948). Спенс (1950, стр. 161) утверждал, что «ни один научно ориентированный человек в психологии, однако, никогда не принял бы такие аналогии, будь то телефонные коммутаторы или диспетчерские на карте, как серьезную попытку теоретического представления изменений в обучении». Например, значение конструкции привычки Халла было «задано математической функцией, связывающей его с предшествующими экспериментальными переменными», и, таким образом, «любое сравнение распределительных щитов с диспетчерскими на карте совершенно неуместно» (Spence, 1950, p.163). Более актуальным был вопрос о том, было ли обучение в пространственных задачах более «похоже на карту» или «на привычку», то есть какая часть пространственной информации, содержащейся в этих задачах, была закодирована при обучении и могла быть использована для определения производительности. позже, когда, например, обычные пути были заблокированы или открыты ярлыки (Tolman, Richie, & Kalish, 1946a, b). Интересно, что большая часть этих дебатов в конечном итоге сводилась к проблеме «место против реакции», которую можно так же легко сформулировать полностью в терминах S-R, как «подойти к сигналу X» или «повернуть направо».

Нейрофизиологическая основа обучения: поля мозга или рецепторно-эффекторные связи

В то время как когнитивные теоретики ссылались на реорганизацию «электрических полей мозга» и «нейрофизиологических следовых систем», Халл (1943) связал формирование привычки с установлением нейронных «рецепторных» эффекторные »связи. Спенс отметил, что эти различия не имеют большого значения или не имеют никакого значения для теории обучения, потому что эти нейрофизиологические модели были не чем иным, как аналогиями и не играли никакой роли в выводах или умозаключениях любого лагеря.Свойства «мозговых полей» были выведены из интроспекции, а не физиологического исследования, и, за некоторыми исключениями, знания или даже предположения о физиологической основе рефлексов не способствовали построению теорий S-R. В самом деле, Спенс (1950, стр. 164) заявил, что «изображение нейрофизиологических процессов без указания гипотетических отношений, которые связывают их с экспериментальными переменными и мерой отклика, — это почти полная трата времени, поскольку дальнейшее понимание феномена обучения является обеспокоенный.В разделе 3 этой статьи я приведу примеры прогресса в установлении связи между мозгом и поведением, которые были более полезны для характеристики характера обучения.

Стимул-стимул (S-S) или стимул-реакция (S-R)

Когнитивные теоретики того времени были уверены, что обучение включает ассоциации или реорганизацию сенсорно-перцептивных процессов. Напротив, Гатри, Торндайк, Халл и другие утверждали, что обучение включает S-R-ассоциации между стимулами и «сокращением мышц и секрецией желез» (Guthrie, 1946, стр.7). Однако Спенс (1950) указал, что акцент Халла на S-R-ассоциациях следует из его нейрофизиологизации, а не из его математического определения привычки. С точки зрения Спенса, в привычке, как она определена в системе Халля, не было ничего по существу S-R или S-S, хотя, как и Халл, он явно полагал, что большая часть обучения связана с формированием ассоциаций между стимулами и реакциями.

«Мне нетрудно представить, что оба типа организаций или ассоциаций создаются в процессе обучения.Конечно, простые типы перцептивного обучения могут включать межсенсорные ассоциации. Однако я серьезно сомневаюсь, является ли обучение исключительно этим типом или даже большей частью. В самом деле, …… данные, по-видимому, более убедительно подтверждают концепцию S-R, чем концепцию S-S »(Spence, 1950, стр. 164-165).

Большая часть этой статьи (раздел 2) будет посвящена этому вопросу.

Содержание и условия обучения

Спенс отметил, что теоретики когнитивной науки, как правило, подчеркивали «внутренние» свойства своих построений, в то время как теоретики S-R, как правило, интересовались эмпирическими отношениями между экспериментальными переменными, которые определяют их конструкции.По терминологии Рескорла (1975), когнитивные теоретики сосредоточились на содержании обучения, тогда как теоретики S-R сосредоточились на условиях, в которых происходит обучение. Критикуя когнитивных теоретиков за то, что они слишком полагаются на интроспекцию, чтобы делать выводы о содержании обучения, Спенс признал, что такое содержание все же может быть строго определено в терминах переменных окружающей среды, превознося знаково-гештальт-психологию Толмена. Таким образом, он пришел к выводу, что эти опасения отражают «очень реальное различие между двумя теоретическими лагерями, но… одно из акцентов, а не конфликта» (Spence, 1950, p.166).

Стимулирующие переменные: внутренние и внешние

Во время написания Спенса исследователи когнитивной традиции стремились исследовать эффекты переменных, которые влияли на получение стимулов (например, ориентацию и внимание) и организацию восприятия (например, фигура). -основные отношения, отношения части-целого, принадлежность, множество). Напротив, большинство исследований поведения из традиции S-R сосредоточено на временных переменных и тех, которые связаны с мотивацией, такими как величина вознаграждения и состояние депривации.Но позиция Спенса (1950, стр. 167) заключалась в том, что «такие различия в акцентах…. не обязательно связаны с конфликтом », и отметил, что озабоченность теоретиков СР временем и мотивацией не исключает их интереса к восприятию стимулов и организационным переменным. Действительно, за последние 25 лет большое количество исследований, основанных на традиции СР, обращалось к этим более поздним вопросам, например, интересам к ориентации и вниманию (Holland, 1997; Mackintosh, 1975; Pearce & Hall, 1980) и перцептивному восприятию. организации (Кук, Райли и Браун, 1992; Рескорла, 1986).

Организм как активный или пассивный обработчик информации

Во время выступления Спенса шла активная дискуссия о «роли организма» в обработке информации, о том, действительно ли животные «просто пассивно воспринимают и реагируют на все раздражители, которые являются физическими. присутствует »(Tolman, 1948, p. 189), или активно обрабатывал эту информацию, выбирая и собирая элементы ассоциации до образования самих ассоциаций. И снова Спенс чувствовал, что когнитивные теоретики неверно истолковали позицию S-R:

«Трудно точно знать, что Толмен и другие, выразившие это понятие, имели в виду под таким утверждением.… .Большая часть теории СР связана с классической ситуацией обуславливания, в которой условия стимуляции чрезвычайно просты. Никакого «активного поиска» сигнала… или особой ориентации рецепторов не требуется… Но даже в случае этой простой обучающей ситуации теоретик обучения SR не предполагал, что организмы пассивно получают и реагируют на все стимулы, которые физически присутствуют »(Spence, 1950, p. 168.)

Таким образом, Спенс подготовил почву для последующего включения переменных, которые теперь описываются как «привлекающие внимание» в теорию СТО.Например, можно разумно ожидать, что непредвиденные обстоятельства подкрепления распространятся как на явную обработку внимания, такую ​​как движения глаз и ориентировочное поведение (например, Siegel, 1967), так и на более неявную обработку, предполагаемую более поздними теориями обучения, такими как изменения параметров скорости обучения. Все это могло повлиять на последующее восприятие и использование определенных стимулов в формировании ассоциации позже.

II. Изучение S-S или S-R?

Как заметил Спенс, в привычке нет ничего по существу S-S или S-R.Например, воспроизведите диаграммы Спенса (1950) и Холланда (1990), различая потенциальные S-S и S-R ассоциации в простом эксперименте по Павлову. Если второй член ассоциации опаздывает в потоке обработки, мы описываем ассоциацию как S-R, а если он ранний, мы описываем его как S-S. С этой точки зрения вопрос о том, насколько поздно и рано или поздно, определяет вопрос о том, является ли ассоциация или привычка S-R или S-S.

A: Диаграмма Спенса (1950), противопоставляющая ассоциации стимул-стимул (S-S) и стимул-ответ (S-R).Sc и Su относятся к условным и безусловным стимулам, соответственно, A1 и A2 относятся к афферентным процессам, производимым Sc и Su, E1 и E2 относятся к эфферентным процессам, производимым A1 и A2, а Ro и Ru — к ориентировочным и безусловным ответам. B: Диаграмма Холланда (1990), противопоставляющая ассоциации S-S и S-R. CS, US и UR относятся к условному раздражителю, безусловному раздражителю и ориентировочной реакции соответственно. Буквы a-d относятся к гипотетическим этапам обработки.

Поскольку в простейшем случае такие представления предполагают линейную цепочку обработки событий от получения стимула до моторного выхода, кажется маловероятным, что дихотомическая категоризация усвоенного поведения могла быть реалистично сделана в рамках психологических или нейрофизиологических теорий, указывая на различия в стимул против обработки ответа или сенсорная против двигательной области мозга.Тем не менее, вероятно, существует значительное согласие с тем, что одни события являются «большим стимулом», а другие — «большей реакцией». Возможно, самые ранние тестовые арены для того, чтобы задать вопрос S-S или S-R, были такими, в которых были минимизированы либо аспекты стимула, либо реакции второго, «подкрепляющего» события в событии ассоциации.

Ответы без стимулов

Loucks (1935) исследовал обучение, когда сгибание передних конечностей в присутствии зуммера было вызвано электрической стимуляцией соответствующей области моторной коры, а не обычным ультразвуковым воздействием на передние конечности.В этой процедуре предполагалось, что электрическая стимуляция вызывает реакцию без предварительного ввода стимула. Таким образом, обучение S-S должно быть невозможным, а обучение S-R не должно затрагиваться при этой подготовке. Действительно, Лаукс не обнаружил доказательств приобретения реакции сгибания ноги, предполагая, что смежность стимула и реакции была недостаточной для обучения. Спенс (1950) согласился с этой точкой зрения, но затем отметил, что во втором эксперименте Лоукс (1935) обнаружил, что если за стимуляцией зуммерно-моторной коры головного мозга также следовала еда, то приобреталось сгибание ног.Спенс утверждал, что эту пару результатов можно легко интерпретировать в рамках теории, основанной на вознаграждении SR: в отличие от шока ноги, стимуляция моторной коры вызывает реакцию сгибания, но не вызывает побуждения (боли), уменьшение которого может усилить формирование привычки, тогда как добавление пищи добавило такой реакции. источник вознаграждения. Хотя другие должны были найти успешное кондиционирование сгибания конечностей с помощью стимуляции моторной коры головного мозга (например, Doty & Giurgea, 1961), более поздние эксперименты (например, Thomas, 1971; Wagner, Thomas & Norton, 1967) ставят под сомнение, выявили ли такие исследования прямую Павловскую обусловленность. реакций на сгибание ног или инструментального кондиционирования ответов, которые уменьшали негативные постуральные последствия внезапных неконтролируемых движений ног, вызванных стимуляцией моторной коры головного мозга.И помимо этих опасений, можно легко усомниться в том, может ли массивная стимуляция моторной коры без рисунка обеспечить подходящую основу для пластичности, необходимой для обучения S-R в этой точке системы. Примечательно, что в некоторых системах, таких как кондиционирование век, и CS, и US могут быть заменены прямой стимуляцией нервных путей (например, Steinmetz, Lavond & Thompson, 1989; Thompson et al., 1998; см. Раздел 3 этой статьи).

Стимулы без ответов

По той же логике, блокирование ответов на УЗ или выбор УЗ с минимальными ответами должно существенно ухудшить обучение, если обучение — S-R, но иметь небольшой эффект, если обучение S-S.Ранние исследования периферической блокады ответов во время тренировки обычно выявляли существенную реакцию после снятия блокады (например, Finch, 1938). Однако снова легко возразить, что никто не ожидает, что обучение S-R будет локализовано в нервно-мышечном соединении или симпатическом нейроне. Такие исследования оказались более полезными при рассмотрении утверждений о том, что случайное инструментальное усиление двигательных реакций было ответственно за появление якобы павловских CR.

Более плодотворным направлением исследований было сенсорное прекондиционирование, в котором были объединены относительно нейтральные стимулы, такие как свет и звуки.Хотя обычно такие пары CS1-CS2 сами по себе не вызывают легко наблюдаемых изменений в поведении, последующее объединение одного из них (CS2) с более значительным событием, таким как еда или шок, обычно приводит к обучению, реагирующему и на другой сигнал (CS1). (). Обычно считалось, что CR к нетренированному сигналу CS1 опосредовано сцеплением двух отдельно приобретенных ассоциаций во время выступления. На начальном этапе S-S-ассоциации формировались между событиями, которые носили преимущественно сенсорный характер.Затем, на втором этапе, были сформированы ассоциации между CS2 и США. Наконец, когда CS1 был представлен в тесте, он вызвал CS2, который, в свою очередь, вызвал CR (). Конечно, творческие теоретики S-R быстро предложили альтернативные, S-R-решения проблемы сенсорной предварительной подготовки. Например (), в первой фазе S-R ассоциации могут быть сформированы между CS1 и ориентирующими ответами на CS2, а затем ассоциации между сенсорной обратной связью от этих ответов и реакцией на УЗ во второй фазе.Наконец, в тесте S1 будет вызывать условный OR, первоначально вызванный CS2, а обратная связь от этих условных OR, в свою очередь, будет вызывать UR-подобный CR, обусловленный этими стимулами обратной связи во второй фазе (Osgood, 1953, стр. 461-462) . Поскольку такие ответы часто нелегко было наблюдать, эти рассказы часто было трудно поддержать или опровергнуть. Тем не менее, сотни экспериментов по сенсорному прекондиционированию дали доказательства обучения в отсутствие очевидных реакций (например, Thompson, 1972).Я подозреваю, что Спенс был бы доволен описанием этих результатов как примеров сенсорно-сенсорных привычек.

Процедуры и результаты сенсорного эксперимента по предварительной подготовке. A: Экспериментальные процедуры. B: Отчет о производительности, опосредованной стимулом-стимулом. C: Расчет производительности, опосредованный стимулом-ответом. D: Отчет об обучении, опосредованном стимулом-стимулом. CS1, CS2 и US относятся к двум условным стимулам и безусловному стимулу. OR2 и OR2-s относятся к ориентировочной реакции, первоначально вызванной CS2, и к обратной связи со стимулом от OR2.Прочерки (—) обозначают установленные отношения; стрелки (→) обозначают выученные ассоциации; двуглавые стрелки (← →) означают двунаправленные ассоциации; линии (-) означают безусловные отношения.

Обе учетные записи S-S и S-R, приведенные выше, предполагают, что производительность CR для CS1 опосредуется во время тестовых презентаций путем объединения в цепочку отдельных ассоциаций, ранее установленных между CS1 и CS2, а также между CS2 и США. Прямых ассоциаций между CS1 и США не возникает. Альтернативный вариант состоит в том, что на втором этапе между CS1 и США формируются прямые ассоциации.Согласно этому «опосредованному обучению» (Holland, 1981a) или «обратному сенсорному прекондиционированию» (Ward-Robinson & Hall, 1996), во второй фазе CS2 ассоциативно активирует представление CS1, за которым затем следует США. Таким образом, ассоциации могут формироваться непосредственно между CS1 и США, которые затем выявляются в финальном тесте только CS1 (). Обычно трудно провести различие между этими альтернативами, хотя примечательно, что в раннем эксперименте по сенсорной предварительной подготовке человека Брогден (1947) проводил различие между субъектами, которые приписывали свою реакцию на CS1 в тесте тем, что он напоминал им CS2, и субъектов, которые утверждали, что на Фазе 2 CS1 фактически работал в паре с США.Субъектов можно побудить использовать стратегию «опосредованного обучения», используя параметры кондиционирования, которые препятствуют использованию ассоциаций CS1-CS2, требуемых опосредованной учетной записью производительности, и вместо этого поощряют использование ассоциаций CS2-CS1, требуемых учетной записью опосредованного обучения. Например, Уорд-Робинсон и Холл (1996) представили два нейтральных стимула в порядке CS2-CS1 в первой фазе эксперимента по сенсорному прекондиционированию и обнаружили существенную реакцию на CS1 в тесте.

Оценка характера обучения после обучения

В экспериментах, описанных выше, логика заключалась в том, чтобы изучить последствия изменения условий обучения так, чтобы они способствовали (или не способствовали) либо S-S, либо S-R обучению.Однако, хотя такие исследования были полезны для демонстрации того, что обучение может быть S-S или S-R, они не были информативными относительно того, было ли обучение в любой типичной процедуре кондиционирования S-S или S-R. Использование различного рода посттренировочных тестов часто позволяло собирать такую ​​информацию.

Тесты передачи

Возможно, наиболее распространенным использованием тестов передачи после обучения было определение того, изучали ли крысы в ​​простых лабиринтах пространственные атрибуты среды лабиринта или реакции поворота.Например, в эксперименте Толмена с «солнечными лучами» (Tolman et al., 1946a) крысы обучались в аппарате, в котором крысы сначала бежали прямо по переулку, а затем должны были сделать два поворота влево и два вправо, прежде чем найти пищу справа. сторона комнаты. В тесте переноса крысам предъявляли переулки, ведущие веерообразным множеством углов от стартовой зоны. Если крысы научились реакции «повернуть налево» или «повернуть направо», можно ожидать, что они выберут левую (0 градусов) или правую (180 градусов) аллею, если они научились «идти прямо, то тогда делать повороты », они выбрали бы переулок, идущий прямо (90 градусов), но если бы они узнали приблизительное расположение еды в комнате, они могли бы выбрать переулок, указывающий на это место (135 градусов).Хотя Tolman et al. (1946a) обнаружили значительные индивидуальные вариации в выборе поведения крыс, большая часть данных подтверждала утверждение, что крысы узнали приблизительное местоположение пищи (или что они соответствующим образом интегрировали прямые и правильные векторы ответа). Версия этого эксперимента, которая длилась дольше, следует за тренировкой в ​​Т-образном лабиринте с тестом в лабиринте, когда он повернут на 180 градусов (Packard & McGaugh, 1996; Poldrack and Packard, 2003; Tolman, Richie, & Kalish, 1946b).Таким образом, в тесте стратегии «ответ» и «место» противопоставляются. Если крыса делает тот же поворот (например, вправо), что и при обучении, идентифицируется обучение реакции, тогда как если она приближается к той же стороне комнаты, что и при обучении, подразумевается обучение месту.

Изменения в вознаграждении после тренировки

Другой способ сформулировать вопрос «S-R против S-S» заключался в том, способствовало ли вознаграждение формированию ассоциаций или участвовало в них. То есть награда просто запечатлела (Thorndike, 1898) или катализировала (Colwill & Rescorla, 1986; Rescorla, 1988) ассоциации стимул-ответ, или животные сформировали ассоциации между стимулами и сенсорными и другими свойствами вознаграждения? Первоначальный подход к этому вопросу заключался в том, чтобы установить стабильную производительность с определенной наградой, а затем заменить ее другой наградой.Если подкрепления просто устанавливают ассоциации, то никаких сбоев в работе не ожидается (при условии, что замененное подкрепление имеет сопоставимую ценность), тогда как если животные ожидают определенных наград, то аспекты производительности могут быть чувствительны к изменению. Ранние эксперименты с отложенным ответом показали, что обезьяны могут сохранять в памяти представления об определенных продуктах питания в течение относительно длительных интервалов. Например, работая с Колером, Тинкельпау (1928) обучал обезьян выполнению задания, в котором экспериментатор помещал пищу под одну чашку, а не под другую, идентичную чашке.После задержки, в течение которой чашки были закрыты из поля зрения обезьяны, экран был удален, и обезьяне приказали принести еду. На разных занятиях использовалось несколько разных продуктов. Обычно обезьяна выбирает правильную чашку и быстро съедает награду за еду. Однако, если экспериментатор спрятал банан, но затем подставил салат под чашку, пока он был скрыт от взгляда обезьяны, обезьяна исследовала, но не касалась салата, тщательно исследовала чашку и иногда визжала экспериментатору.Напротив, в последующем испытании, в котором салат был спрятан и сохранен под чашкой, обезьяна съела салат быстро и без происшествий. Таким образом, исходя из этих реакций на замененное вознаграждение, обезьяны должны были отражать в памяти определенные аспекты вознаграждения. К сожалению, поскольку ожидание вознаграждения было вызвано представлением самого вознаграждения, а не партнером вознаграждения, такие эксперименты проливают мало света на то, представлены ли свойства вознаграждения в ассоциативном обучении.Ближе к цели был эксперимент, проведенный в лаборатории Толмена Эллиотом (1928), в котором различные группы крыс были обучены бегать по сложному лабиринту либо для семян подсолнечника, либо для предпочтительного отрубного сусла. После серьезного обучения в группе отрубей награда за отруби была заменена менее предпочтительными семечками подсолнечника. Хотя крысы охотно ели семена подсолнечника без каких-либо признаков нарушения, производительность в последующих испытаниях была значительно ниже, чем у крыс, которых с самого начала приучили к семечкам подсолнечника.Это нарушение предполагало, что крысы ожидали особого вознаграждения. Однако Эллиот не выполнил аналогичную замену подсолнечника на отруби, и поэтому нарушение могло отразиться только на эффектах уменьшения величины вознаграждения.

В более поздних экспериментах изучались эффекты замещения УЗ в Павловской обусловленности более симметричным образом. Например, Холланд и Форбс (1982) обнаружили, что любой из двух US (гранул сахарозы с разным вкусом) лучше сохранялся в памяти (по оценке с помощью процедуры подготовительного высвобождения, например.грамм. Terry & Wagner, 1976), если им предшествовала неконгруэнтная Павловская CS1 (т.е.для других США), чем конгруэнтная CS. Точно так же в моей лаборатории Александр Джонсон (неопубликованные данные) недавно обнаружил, что у мышей наблюдается нарушение потребления каждого из пары жидких УЗИ (лецитина и сахарозы), когда каждый из них сопровождался слуховым сигналом для другой жидкости. Таким образом, по крайней мере, некоторые свойства арматуры кажутся закодированными CS после простых процедур кондиционирования.

Переоценка подкрепления

Процедура переоценки подкрепления после обучения (формально описанная Rozeboom, 1958) стала золотым стандартом анализа наличия или отсутствия SS (павловских) или RS (инструментальных) ассоциаций (Pickens & Holland, 2004) .Животные сначала проходят Павловскую или инструментальную подготовку с одним или несколькими подкреплениями. Затем ценность подкрепления изменяется при отсутствии сигналов или реакций обучения. Наконец, реакция оценивается при отсутствии какого-либо подкрепления. Часто уровень ответа, наблюдаемый в тесте, спонтанно изменяется, чтобы отразить изменения в ценности подкрепления, с которым он был ранее связан. Основные преимущества этой парадигмы включают ее полезность практически после любой процедуры обучения и доступность широкого спектра методов для изменения стоимости вознаграждения в сторону увеличения («инфляция») или уменьшения («девальвация»).Например, мотивационные состояния, относящиеся к подкрепляющим элементам, могут быть вызваны химическим путем (например, увеличение или уменьшение баланса натрия после тренировки с помощью солевого раствора) или путем изменения воздействия на них (например, выборочное насыщение одной из двух пищевых наград). Точно так же отдельные аспекты вознаграждений могут быть изменены ассоциативно путем объединения их с различными агентами, которые увеличивают или уменьшают их привлекательность. Даже неассоциативные манипуляции, такие как простое воздействие на само подкрепление или более слабые или более сильные варианты подкрепления, могут быть эффективными (например,грамм. Рескорла, 1973, 1974).

Ранним применением этого метода было исследование Зенера и МакКарди (1939). Собаки, лишенные еды, получали пары из двух реплик с собачьим печеньем разного вкуса. Затем собак тщательно насытили одним из вкусов собачьего печенья. Наконец, были записаны реакции собак на каждый сигнал. Они гораздо менее энергично откликнулись на сигнал о бисквите, которым они насытились. Хотя по нынешним стандартам исследование было несколько некорректным, потому что печенье продолжало присутствовать в тесте (и, таким образом, снижение реакции могло отражать более низкую ценность подкрепления насыщенного печенья, а не спонтанную корректировку реакции на основе его измененного значения), эти и другие результаты воодушевили Зинера (1937, стр.386) описывать обусловливание как «реорганизацию в некое функциональное целое систем восприятия, соответствующих условным и безусловным раздражителям; и в функциональном отношении этой организованной системы к системе побуждения или напряжения, первоначально возбужденной безусловным стимулом », а не в обучении ассоциациям S-R.

Подобная логика мотивировала ранние исследования различительного поведения лабиринта или переулка, проведенные Толменом (1933), Миллером (1935) и Толменом и Глейтманом (1949).Толмен (1933) первоначально обучал крыс в боксе с двумя вариантами выбора с двумя отличительными стимулами, черными или белыми занавесками. Прохождение (скажем) через черные занавески вело к ящику с едой, а прохождение через белые занавески вело в тупик, где не было еды. После значительного обучения этой задаче крыс помещали прямо в контейнер для корма и подвергали поражению электрическим током. Наконец, крыс возвращали в стартовую коробку и позволяли бежать. Если крысы действительно усвоили ассоциации «ответ-еда» или «ожидания знак-гештальт», то даже при первом испытании они не смогут бежать.Однако каждая крыса «сразу же весело и, как обычно, промчалась через весь распознающий аппарат и нанесла удар по отделению с едой, в котором она только что была шокирована» (Tolman, 1933, с. 250.)

В ответ Толмену ( 1933), Миллер (1935) пошел еще дальше, описав SR-объяснение того, как крысы могут проявлять гибкое поведение в такой ситуации, и приступил к его демонстрации. В своем отчете Миллер использовал концепцию дробных упреждающих целевых реакций. Крысы могут давать мощные целевые ответы (Rg, e.g., жевание), части которого (rg) могут быть адаптированы к аллейным сигналам, которые предшествуют самой коробке ворот. Когда крысу впоследствии помещали в коробку ворот и шокировали, реакция прыжка или замирания на шок могла быть обусловлена ​​обратной связью со стимулом от предыдущих целевых реакций, основанных на еде (например, Rg-Sg → Rshock). Затем, когда крысу поместили обратно в переулок, выполнение условного rg дало бы сигнал обратной связи sg, который, в свою очередь, вызвал бы условную дробную часть реакции на шок, мешающую бегу.Миллер предположил, что все, что потребуется для получения ожидаемых Толменом данных, — это дать блокам целей отчетливые ответы на цели. Он сделал это с помощью двух наград (еда и вода) и двух отличительных ворот, одна требовала подъема и резкого поворота вправо, а другая требовала прямого входа с последующим резким левым поворотом. В отличие от аппарата Толмена, который требовал одновременного распознавания выбора, Миллер использовал одиночный переулок с единственной коробкой ворот, но выставил крыс на другую зону ворот в отсутствие переулка.Когда позже крыс помещали непосредственно во вход в одну из коробок ворот и подвергали электрошоку, шоковая реакция была обусловлена ​​определенным Sg, возникающим из отличительного Rg в этой коробке. Если крысу ударили током в той же коробке ворот, которая всегда находилась в конце переулка, размещение этой крысы обратно в стартовую коробку переулка для теста вызовет rg, чья обратная связь sg была связана с дробной реакцией на электрошок, и, следовательно, производят помехи при работе. Напротив, если крысу ударили током в другом боксе, ответная реакция rg, вызванная переулком, не будет связана с реакцией на удар током, и такое вмешательство не ожидается.Миллер (1935) действительно нашел такой результат. Таким образом, отчет Миллера S-R не только объяснял такую ​​девальвацию, но и предлагал условия, при которых она будет и не будет соблюдаться.

Интересно, что в классическом исследовании Т-образного лабиринта Толмана и Глейтмана (1949), в котором Толмену наконец удалось обнаружить характеристики спонтанной девальвации, две коробки для ворот также были сконструированы таким образом, что они требовали четких ответов на цели (хотя Толмен и Глейтман вместо этого подчеркнули различия в восприятии ящиков).Наконец, в одном из наиболее причудливых поворотов логики посредничества rg-sg эффектов девальвации, используя вариант процедуры Миллера (1935), Фаулер и Миллер (1963) обнаружили, что удары от ворот могут либо ухудшить, либо улучшить результаты теста. в зависимости от того, наносили ли удары током по передним или задним лапам крыс. Если бы удары были приложены к передним ногам, Rshock отскочил бы назад, но если бы они были применены к задним ногам, Rshock прыгнул бы вперед.При замене в переулках крысы, получившие удар от ворот по передним ногам, отпрыгивали назад, замедляя свою работу, но те, кто получил удар от ворот по задним ногам, прыгали вперед, улучшая свои показатели. Таким образом, еще раз, система посредничества rg-sg не только обеспечивала учет S-R для эффектов «девальвации», но также предсказывала характер результата на основе характеристик условной дробной упреждающей реакции.

Современный эксперимент по девальвации

Современный эксперимент по девальвации связан с использованием Рескорла процедуры для изучения содержания защитной (Rescorla, 1973, 1974) и аппетитной (Holland & Rescorla, 1975) конструкции по Павлову, а затем с последующим использованием процедура, проведенная Дикинсоном, Рескорла и их коллегами для изучения инструментального обусловливания вознаграждения (например,г., Адамс и Дикинсон, 1981; Баллейн и Дикинсон, 1991; Колвилл и Рескорла, 1985b, 1986; Рескорла, 1987). В каждом из этих исследований наблюдался умеренный эффект девальвации США после спаривания CS-US. Например, Холланд и Рескорла (1975) объединили тон с пищевыми гранулами, а затем обесценили корм, либо насытив крыс этими гранулами, либо сочетая их с высокоскоростным вращением, вызывая укачивание. Они обнаружили, что крысы, получившие такую ​​девальвацию, показали меньшую реакцию, чем те, которые не получали насыщения или которые получали непарные подачи пищи и вращения.В то же время крысы, получившие кондиционирование второго порядка одного и того же тона, не показали таких эффектов любой девальвационной обработки на CR второго порядка, что исключает множество простых основанных на производительности объяснений снижения реакции после девальвации.

Результаты, подобные этим, побудили авторов учебников и вводной психологии утверждать, что обусловленность — это преимущественно S-S. Но такой вывод не обязательно имеет веские основания. Во-первых, эффекты девальвации обычно невелики и, возможно, ограничиваются ограниченным диапазоном параметров обучения.Я получил много сообщений с просьбой предоставить информацию от исследователей, которые не смогли обнаружить эффекты девальвации. Хотя в целом мне удавалось направить их на путь успеха в получении этого феномена, примечательно, насколько мало эффектов девальвации в абсолютном выражении. Например, показаны эффекты девальвации в последней дюжине экспериментов, опубликованных членами моей лаборатории. Большинство этих исследований было проведено на интактных животных, хотя некоторые из них представляют эффекты девальвации у крыс с фиктивными поражениями различных областей мозга, которые, как известно, важны для девальвации.Примечательной особенностью этих данных является то, насколько мала разница между условиями контроля и девальвации и насколько остаётся реакция после девальвации. В большинстве случаев девальвация самих США была полной, то есть крысы практически ничего не ели из самой пищи. Колвилл и Рескорла (1990) широко обсуждали этот вопрос в контексте инструментальной девальвации, указывая на важность таких переменных, как сходство между моделями предоставления услуг в США на стадиях обучения и девальвации.Тем не менее, в большинстве случаев остаток довольно велик (но см. Colwill & Rescorla, 1990; Kerfoot et al., 2007).

Результаты 12 экспериментов по девальвации из моей лаборатории. В каждом эксперименте звуковой или зрительный условный раздражитель (CS) сначала сочетался с пищей, затем пища либо обесценивалась путем сочетания ее с хлоридом лития (LiCl), либо поддерживалась путем подачи пищи и непарного LiCl, и, наконец, CS была представлена ​​отдельно в контрольная работа.

Во-вторых, результаты экспериментов по девальвации могут существенно различаться в зависимости от выбранного агента девальвации.Например, Холланд и Штрауб (1979) и Холланд (1981b) исследовали эффекты обесценивания пищи за счет насыщения или сочетания ее с хлоридом лития или высокоскоростным вращением. показывает потребление пищи и эффективность упреждающих реакций при входе в чашку с едой на сигналы в паре с едой после девальвации каждым из этих трех методов. В этих исследованиях обнадеживает тот факт, что степень снижения потребления положительно коррелировала со степенью уменьшения реакции чашки с едой во время CS.В то же время заметно отсутствие такой корреляции. Например, Galarce, Crombag и Holland (2007) обучили крыс двум слуховым сигналам, передающим сигнал о двух пищевых продуктах (сахарозе и мальтодекстрине). Один продукт был соединен с LiCl, а другой — нет. Наконец, крыс тестировали на присутствие двух тонов. Необычной особенностью этого эксперимента было то, что в различных тестовых сессиях либо предотвращенный, либо неперевернутый УЗ был представлен в чашке с едой во время теста на девальвацию.Интересно, что постоянное присутствие любого из этих продуктов в чашках с едой мало влияло на реакцию на CS. Хотя неудивительно, что крысы проводили больше времени в чашке с пищей, когда она содержала неотвернутую пищу, чем когда она содержала отвергнутую пищу, CS для чашки с неотвернутой пищей, усиленной пищей, реагировала больше, чем сигнал для отклоненной пищи, независимо от того, какая пища была физически присутствует. Таким образом, ответ, основанный на ожидаемой цели, может иметь место, несмотря на явно не подтверждающие доказательства цели.

Левая полоса: Показатели условных реакций чашки с едой (CR) только на условный стимул (CS) в тестовой сессии после того, как еда была обесценена путем сочетания ее с хлоридом лития (LiCl) или высокоскоростным вращением, или насыщением этой пищей. . Правые столбцы: количество пищевых гранул, потребленных за 10 минут после того, как 50 пищевых гранул были помещены в чашку для корма в экспериментальных камерах. Реагирование в состоянии «Поддержание» представляет собой совокупность реакции на тестовый CS, который был представлен после непарных предъявлений пищи и LiCl или вращения, или в отсутствие насыщения пищей.Данные взяты из Голландии (1981b) и Голландии и Штрауба (1979).

Другая проблема в экспериментах по девальвации — это показатель, выбранный для отражения ожидаемого результата. Во-первых, некоторые меры более чувствительны к девальвации, чем другие. Холланд и Штрауб (1979) обнаружили, что поведение более поздней цепи (например, прикосновение и захват гранулы) показало большую чувствительность к девальвации пищи за счет сочетания с LiCl, чем поведение на ранней стадии (приближение к чашке с едой). Интересно, что некоторые другие косвенные меры обучения, которые, как часто думают, отражают обусловленные побудительные мотивационные свойства, кажутся особенно нечувствительными к девальвации.Например, Холланд (2004) и Рескорла (1994) не нашли доказательств того, что на Павловский инструментальный перенос повлияла девальвация подкрепления. В исследовании Холланда (2004) после тренировки с двумя CS, двумя US и двумя инструментальными реакциями пары одного US с LiCl снижали исходные уровни инструментального ответа для этого US и уменьшали ответы чашки еды на CS, которые предсказывали, что US, но никак не повлиял на то, насколько эта CS улучшила инструментальную реакцию, которая обычно приносила эти США.Аналогичным образом, Parkinson et al. (2005) обнаружили, что, хотя после повторного тестирования, девальвация США полностью устранила реакцию, вызванную CS, эта CS не утратила своей способности служить вторичным или условным подкреплением.

Во-вторых, меры реагирования и методы девальвации могут взаимодействовать. Например, хотя Холланд и Штрауб (1979) обнаружили, что обесценивание пищи с помощью LiCl уменьшало вход в чашку с едой больше, чем обесценивание за счет высокоскоростного вращения, на восприятие визуальных сигналов и реакции испуга на слуховые сигналы больше влияло вращение с высокими расходами, чем на пары пища-LiCl.Напротив, насыщение уменьшило оба класса ответов на промежуточную степень. Ясно, что «американская ценность» не одномерна в своем отношении к системам поведения. Различные поведенческие реакции могут быть опосредованы разными сенсорными свойствами представлений США, которые, в свою очередь, могут быть по-разному чувствительны к различным методам обесценивания. Я вкратце вернусь к этому вопросу в разделе 3.

В-третьих, аппетитные и последовательные CR могут по-разному реагировать на подкрепляющую девальвацию.Хотя, как отмечалось в, реакция на подход с чашкой еды часто демонстрирует относительно низкую чувствительность к обесцениванию подкрепления, постоянные CR, такие как облизывание, и различные так называемые вкусовые реакции (TR; Berridge, 2000; Grill & Norgren, 1978), меры, которые, как считается, отражают гедонистические подходы. или аспекты вкусовых качеств вознаграждений часто полностью устраняются. Используя крыс с хроническими внутриротовыми канюлями, Kerfoot et al. (2007) соединили тональный CS с внутриротовой доставкой раствора сахарозы за один сеанс в двух группах крыс и представили эти события непарными у других крыс.Затем крысы в ​​группе Devalue заболели инъекцией LiCl после одного сеанса внутриротовой доставки сахарозы в отсутствие тонов, в то время как крысы в ​​группе поддержки получали сахарозу и LiCl в отдельные дни. Контрольные крысы, тренированные с использованием тонуса и неспаренной сахарозы, также получали сахарозу и LiCl в паре или без пары в этой фазе. Наконец, все крысы были протестированы с сочетанием тона с настоями простой воды. Крысы в ​​группе «Поддержание» показали высокие уровни TR положительного (гедонистического) воздействия в тестовых испытаниях ().Хотя эти реакции были особенно очевидны в присутствии воды, которая обеспечивала основу для их выступления, они также возникали во время одного тона перед вливанием воды в каждом испытании. Напротив, у крыс из группы Devalue не было больше лизания или положительных TR, чем у контрольных крыс. Таким образом, девальвация завершилась. Кроме того, у этих крыс было значительно больше отрицательных TR, таких как зияние и сокращенные облизывания, которые обычно проявляются в ответ на сами предотвращенные ароматы, чем у контрольных или поддерживающих крыс ().Возникновение этих отрицательных TR особенно важно, потому что крысы Devalue никогда ранее не выполняли отрицательные TR ни к тону, ни к сахарозе. Во время сочетания тон-сахароза и во время введения одной сахарозы перед инъекцией LiCl сахароза выявляла только положительные TR, и сахароза больше не представлялась после однократной инъекции LiCl. Таким образом, проявление отрицательных TR-ответов крыс с парной девальвацией в тесте не могло отражать обучение S-R, даже через механизмы посредничества S-R (Osgood, 1953) или rg-sg (Miller, 1935), описанные ранее.

Положительные (панель A) и отрицательные (панель B) реакции вкусовой реакции (TR) во время тестовых презентаций тонального условного стимула (CS) и простой воды в тесте на девальвацию. Крысы сначала получали пары тон → сахароза, а затем пары сахароза-хлорид лития (LiCl) (Devalue) или непарные представления этих событий (Maintain). Контрольные крысы получали тонус и сахарозу неспаренными при обучении, за которыми следовали сахароза и LiCl, либо парные, либо непарные. Все жидкости были доставлены внутрь ротовой полости.Данные взяты из Kerfoot et al., 2007.

На основании результатов Kerfoot et al. (2007) заманчиво предположить, что усвоенные окончательные или TR-ответы особенно чувствительны к девальвации. Однако более простая возможность состоит в том, что введение подкрепления в ротовую полость и использование этого метода доставки как на этапе обучения, так и на этапе обесценивания являются более важными факторами. В соответствии с этой возможностью, Colwill и Rescorla (1990) обнаружили почти полную девальвацию нажатия на оперантный рычаг после тренировки и девальвацию с внутриротовой подачей подкрепления.Совсем недавно Холланд, Лассетер и Агарвал (2008) исследовали консумативные и TR-реакции в экспериментах по девальвации с интраоральной или традиционной (в утопленную чашку) доставкой усилителей сахарозы. Стаканы с едой были оснащены камерами, позволяющими измерять TR-ответы в условиях чашки, а также в условиях внутриротовой доставки. Положительные TR-ответы показали одинаковую картину независимо от метода введения сахарозы. Как при внутриротовом, так и в чашечном способах доставки крысы в ​​состоянии девальвации показали почти полную потерю положительных TR после девальвации сахарозы по сравнению с крысами в состоянии поддержания, и только крысы в ​​состоянии девальвации показали отрицательные TR-ответы ().В то же время прием пищи из чашки показал лишь частичную чувствительность к девальвации сахарозы. Кроме того, при обоих условиях доставки простые реакции облизывания, охарактеризованные Berridge (2000) как последовательные, но негедонические, показали умеренную, но не полную чувствительность к девальвации. Таким образом, результаты исследования Holland et al. (2008) показывают, что, независимо от метода введения подкрепления, оценочные TR-ответы особенно чувствительны к обесцениванию по сравнению с неоценочными консумативными ответами (простое лизание) и (с традиционной доставкой) к аппетитные реакции (прием пищи в чашке).

A: Чашка для еды и положительная реакция вкуса-реактивности (TR) во время тестовых презентаций на тон и простую воду после минимального количества пар тон-сахар, с последующим сочетанием (девальвация) сахарозы с хлоридом лития (LiCl) или непарных презентаций тех событий (Поддерживать). B: То же, что и панель A, за исключением обширной тренировки тона сахарозы. C: Простое (неоценочное) лизание, положительный TR и отрицательный TR, ответ во время тестовых презентаций тона и простой воды, после минимального количества сочетаний тон-сахароза, с последующим либо сочетанием (Devalue) сахарозы с LiCl, либо непарными представлениями этих событий ( Поддерживать).D: То же, что и панель C, за исключением обширной тренировки тона сахарозы. Все жидкости доставлялись в утопленную чашку для еды (панели A и B; Holland et al., 2008, эксперимент 1) или внутрь ротовой полости (панели C и D; Holland et al., 2008, эксперимент 2).

Вторая цель исследования Холланда и др. (2008) состояла в том, чтобы изучить влияние объема обучения на эффективность девальвации со всеми этими показателями. В контексте инструментального обучения часто утверждается (например, Adams, 1982; Kimble & Perlmuter, 1970; но см. Colwill & Rescorla, 1985a; Colwill & Triola, 2002; Holland, 2004), что наученная реакция становится все более невосприимчивой к подкреплению. девальвация с расширенным обучением.В самом деле, одним из алиби (его слов) Толмена (1933) по поводу отсутствия эффекта девальвации было то, что его крысы перетренировались и «зациклились» на беге. Мы никогда не наблюдали такого эффекта у Павлова; То есть, павловские CRs по крайней мере так же чувствительны к обесцениванию пищи за счет сочетания с LiCl после продолжительной тренировки, как и после минимальной тренировки (например, Holland, 1998; 2004, 2005). Тем не менее, мы часто наблюдали резкую потерю способности павловской системы обучения участвовать в «опосредованном обучении» по мере продолжения обучения.

Holland (1981a, 1990) обнаружил, что опосредованное обучение отвращению к пище может быть установлено, когда ассоциативно-активированное представление о еде сочетается с болезнью (недавний обзор см. В Holland & Wheeler, в печати). Например, в одном эксперименте (Holland, 1981a) крысы сначала получали пары из двух слуховых CS с двумя пищевыми усилителями, которые различались только по вкусу (например, тон → сахароза со вкусом грушанки и шум → сахароза со вкусом мяты перечной), чтобы дать им CS способность выборочно активировать представления того или иного из этих подкреплений.Затем презентация одного из слуховых CS была объединена с инъекцией токсина хлорида лития (LiCl) при отсутствии каких-либо запахов. Последующие тесты на потребление показали установление легкого отвращения к пище, чей CS-партнер был связан с болезнью, как если бы активация CS представления пищи непосредственно перед индукцией болезни позволила сформировать ассоциации пища-болезнь. Позже Холланд (1990, 1998, 2005) обнаружил, что, хотя пары CS-LiCl выявляют значительную опосредованную отвращение к пище после 16-24 пар CS-еда, крысы, тренированные с 40 или более парами CS-еда, не показали никаких доказательств такого опосредованного отвращения к пище.В то же время другие крысы, обученные с целыми 160 парами CS-US, продолжали демонстрировать доказательства обучения S-S тон-еда, на что указывают процедуры обесценивания подкрепления. Эти результаты привели Холланда (1990, 1998, 2005) к предположению, что на ранних этапах обучения CS активируют широкий спектр обработки, обычно активируемой самими США, включая раннюю стадию обработки восприятия, но по мере продолжения обучения этот доступ сужается до более ограниченного. комплекты систем обработки. Таким образом, с этой точки зрения, опосредованное обучение отвращению к вкусу не наблюдалось на более поздних этапах обучения, потому что CS больше не активировал перцептивную обработку отсутствующего аромата, которая могла вступить в ассоциации с болезнью.

Логика, лежащая в основе исследований Холланда и др. (2008), заключалась в том, что если кондиционирование TR-ответов на сигналы в паре с сахарозой отражает активацию сигналами перцепционной обработки отсутствующей сахарозы, и что такая активация происходит только на ранних этапах обучения , то только минимально обученный CS будет контролировать эти положительные оценочные ответы, а более тщательно обученный CS — нет. В каждом из своих экспериментов Holland et al. (2008) тренировали каждую крысу с двумя CS: одна была соединена с сахарозой US 16 раз, а другая — 112 раз.показать ответ на минимально обученный CS (описанный ранее), тогда как показать ответ на хорошо обученный CS. Как и ожидалось, проявление условных ТУ-ответов наблюдалось только после минимальной тренировки. В то же время аппетитные и неоценочные конечные ответы (простые облизывания) были чувствительны к обесцениванию сахарозы после минимальной или обширной тренировки.

Эти данные, как и данные исследований опосредованного обучения, согласуются с точкой зрения (Holland, 1990), что на ранних этапах обучения CS активирует обработку восприятия, обычно активируемую самой пищей.С этой точки зрения любая функция, обычно контролируемая вкусом США, должна быть доступна CS. Таким образом, можно было бы ожидать опосредованного обучения отвращению к этому подкреплению, если бы CS был соединен с инъекцией LiCl, потому что крыса испытала бы болезнь после того, как попробовала отсутствующий US. Точно так же этот CS должен контролировать оценочные TR-ответы, соответствующие этому вкусу, как наблюдали Holland et al. (2008) и Kerfoot et al. (2007). Поскольку CS активирует предоценочную перцептивную обработку еды US, наблюдаемая TR будет согласована с текущей оценкой вкуса этой еды и, таким образом, будет чувствительна к изменениям ценности подкрепления после тренировки, как это наблюдается в тех случаях, когда исследования.Напротив, по мере продолжения обучения CS теряет доступ к этой низкоуровневой обработке восприятия США и вместо этого активирует аспекты обработки подкрепления, которые не включают в себя сам перцептивный опыт или способность контролировать оценочные реакции, соответствующие текущей оценке этого. перцептивный опыт. Эти более концептуальные аспекты США, тем не менее, должны включать в себя как сенсорную, так и своего рода мотивационную информацию, потому что эффекты девальвации подкрепления остаются в высокой степени специфичными для США даже после того, как CS теряют способность контролировать реакции TR или опосредовать обучение новому отвращению к вкусам (Holland, 1998). .

Очевидно, в этой истории есть нечто большее, чем ассоциации S-S и S-R. Представления, активируемые CS после минимального и расширенного обучения, можно отличить по их способности участвовать в новом (опосредованном) обучении и по их способности контролировать соответствующие оценочные TR-ответы. Тем не менее, даже после длительного обучения CS могут активировать подкрепляющие репрезентации, которые включают богатую сенсорную информацию, которая может поддерживать эффекты обесценивания подкрепления. Это различие напоминает различие, предложенное Конорски (1967, e.g., pp. 170-181), который различал ассоциативную активацию «галлюцинации» и «образа» CS. В первом случае считалось, что CS вызывает активность сенсорных «проективных» единиц, которая может напоминать активность этих единиц, когда они активируются самими США. Напротив, в последнем случае CS активировала только «гностические» единицы, которые кодировали информацию о США, но которые обычно не генерировали перцепционную обработку. Проще говоря, галлюцинация включает чувственное переживание отсутствующего объекта, тогда как можно представить этот объект и его сенсорные свойства, не испытывая их.

III. Может ли нейросистемный анализ помочь нам понять содержание обучения?

В разделе I я отметил, что Спенс пренебрег физиологизацией, даже физиологией Халла, как скорее вводящей в заблуждение, чем полезной при характеристике математических и поведенческих аспектов обучения привычкам. Однако результаты описанных мною задач по девальвации подразумевают, что ассоциативное обучение может задействовать различные уровни нейронной обработки. Пластичность не уникальна ни для одного из кругов в. Например, исследования нервной пластичности в кондиционировании век (например,г., Medina et al., 2000; Steinmetz et al., 1989; Thompson et al., 1998) идентифицировали участки пластичности мозжечка, которые можно охарактеризовать как находящиеся в пределах «выходных» путей и, следовательно, более «S-R», а также другие участки ранее в потоке обработки. Разумная исследовательская программа могла бы представить себе обстоятельства, при которых сигналы управляют обработкой в ​​различных системах мозга, которые преимущественно контролируют различные аспекты поведения. Понимание потока информации в мозге может помочь нам понять, почему, например, некоторые продукты обучения, такие как контроль TR-ответов и способность поддерживать опосредованное обучение, связаны между собой своими функциями быстрого битонического усвоения, почему другие, кажется, поддерживают чувствительность. к девальвации из-за обширных тренировок, а некоторые, кажется, теряют такую ​​чувствительность из-за тренировок.

Для получения информации, необходимой для понимания содержания обучения, использовались различные нейробиологические методы. Методы стимуляции мозга вышли далеко за рамки грубой стимуляции моторной коры, как в экспериментах Лаукса (1935). Например, при анализе нервных систем кондиционирования век замена реальных событий, таких как CS и US (или того и другого, например, Steinmetz et al., 1989), стимуляцией мозга выявила события, критические для кондиционирования век.Сходным образом структурированная стимуляция миндалины помогла выяснить механизмы приобретения и исчезновения условного рефлекса страха (Vidal-Gonzalez et al., 2006).

Точные фармакологически селективные поражения и обратимая инактивация различных групп клеток могут избирательно изменять чувствительность крыс к девальвации, не влияя на другие аспекты производительности. Например, повреждение компонентов схемы, включая базолатеральную миндалину (BLA), орбитофронтальную кору (OFC), субрегионы медиальной префронтальной коры и, в некоторых случаях, медиодорсальный таламус, мешают работе крыс по Павловской девальвации, не влияя на получение пищи. чашки CR или отвращение к вкусу (Gallagher et al., 1999; Hatfield et al., 1996; Maddux & Holland, 2007; Пикенс, 2008; Пикенс и др., 2003). Кроме того, эти исследования показывают, что различные части этой схемы выполняют специализированные функции в рамках задачи девальвации. Например, для того, чтобы крысы демонстрировали эффекты девальвации с помощью процедур с одним подкреплением, функция BLA необходима во время начальных пар CS-еда, но не после этого. То есть, если крысы приобрели ассоциации CS-еда, в то время как функция BLA не нарушена, то последующие поражения не ухудшают производительность этой формы девальвации, как будто функция BLA необходима крысам для приобретения ассоциаций SS, а не SR, но не для использования ранее. -установленные ассоциации SS для контроля поведения (Pickens et al., 2003). Напротив, функция OFC, по-видимому, имеет решающее значение для выражения, а также приобретения таких ассоциаций в задачах девальвации. Поражения OFC нарушают эффективность девальвации (то есть крысы не могут спонтанно снижать реакцию на CS после девальвации в США), независимо от того, выполняются ли они до CS-еды, отвращения к пище или заключительных фаз тестирования (Pickens et al., 2003, 2005) . Наконец, участие этих областей мозга может варьироваться в зависимости от требований задачи. Например, хотя при использовании одной комбинации сигнал-подкрепление, функция BLA не требуется после установления ассоциаций сигнал-подкрепление, при использовании двух или более сигналов и подкреплений функция BLA также должна быть неизменной во время тренировки отвращения вкуса. и / или тестирование девальвации (Johnson et al., 2007). Точно так же Пикенс (2008) обнаружил, что функция медиодорсального таламуса важна для выполнения задачи по Павловской девальвации только в том случае, если эта задача требует изменения стратегии по сравнению с предыдущей задачей.

Результаты недавних исследований электрофизиологической записи также предполагают, что процедуры кондиционирования могут устанавливать различные типы ассоциаций как внутри, так и между взаимосвязанными областями мозга. Например, используя задачу распознавания по запаху, Schoenbaum, Chiba и Gallagher (1998) обнаружили нейроны в BLA и OFC, которые можно охарактеризовать как отражающие ассоциации S-S и ответ-стимул (R-S).Первоначально эти нейроны избирательно реагировали на один из двух подкрепляющих элементов, используемых в задаче, но в ходе обучения их активность находилась под контролем либо определенной запаховой подсказки, либо определенной реакции. Более поздние исследования показали, что природа нейронного кодирования информации о стимулах или ответах в этих двух областях мозга зависит от связи между ними (например, Saddoris, Gallagher & Schoenbaum, 2005; Schoenbaum, et al., 2003). Совсем недавно Furuyashiki, Holland и Gallagher (2008) также сравнили активность нейронов OFC, кодирующих информацию о результатах, с нейронами, кодирующими информацию об ответах.Эти последние нейроны специфически реагировали на определенные ответы, но не на определенные подкрепления. Хотя эти последние нейроны не могут быть истолкованы как субстрат для ассоциаций S-R, поскольку они увеличивают свою активность только после выполнения закодированного ответа, их существование показывает, что по крайней мере в некоторых областях мозга отдельные нейроны могут кодировать различные виды информации о задачах.

Наконец, мы использовали методы немедленной экспрессии генов, чтобы связать функцию мозга с производительностью в простых задачах обесценивания (и других).Наша цель — связать различия в производительности в разных условиях с различиями в системах мозга, задействованных в этих условиях. Посмертный анализ ткани может выявить подробную информацию об отдельных нейронах, которые были активны (Lee et al., 2005) или претерпевали пластические изменения (Guzowski & Worley, 2001; Petrovich et al., 2005) в течение довольно ограниченных интервалов времени, таких как конкретный эпизод поведенческого теста перед жертвоприношением. Например, после оценки ответов TR на минимально обученный тон CS в отсутствие сахарозы Kerfoot et al.(2007;) пожертвовали своих крыс, чтобы исследовать экспрессию FOS, белкового продукта зависимого от активности гена немедленного раннего развития c-fos . Они обнаружили, что зависимая от обучения и девальвации экспрессия FOS в ряде областей мозга, известных из экспериментов с повреждениями (только что описанных), имеет решающее значение для обучения, чувствительного к девальвации результатов (базолатеральная миндалина и орбитофронтальная кора; Holland & Gallagher, 2004) в регионы, связанные с отображением TR-ответов (оболочка прилежащего тела; Reynolds & Berridge, 2002), и регионы, связанные с обработкой информации о вкусе (вкусовая кора; Kiefer & Orr, 1992).Эти последние наблюдения особенно интересны из нашего более раннего предположения, что обусловливание может наделить CS способностью активировать перцептивную обработку отсутствующих US. Если в результате сочетания тона и сахарозы тон вызывал ощущение сладости, делая вкус простой воды сладким, можно было ожидать, что крысы в ​​условиях девальвации и сохранения будут демонстрировать повышенную активность ФОС во вкусовой коре головного мозга, что они и сделали. Более того, поскольку крысы в ​​состоянии Поддержания будут реагировать на сладкое аппетитными реакциями вкуса и реактивности, один только тон также будет вызывать эти реакции и активность ФОС в части прилежащей оболочки, коррелирующую с такими ответами.Напротив, поскольку крысы в ​​состоянии девальвации будут реагировать на сладкое с помощью аверсивных ответов, тон будет вызывать аверсивные реакции и FOS в другом субрегионе прилежащей раковины, что коррелирует с аверсивными TR-ответами. Все эти результаты были соблюдены. Учитывая результаты Холланда и др. (2008), было бы интересно определить, является ли более тщательно обученный CS, который не вызывает аппетитных TR-ответов при обучении или вызывает отрицательные TR-ответы после девальвации и не поддерживает опосредованный вкус -аверсионное обучение, также не может вызвать ФОС в прилежащей оболочке или вкусовой коре.

Интересно, хотя Kerfoot et al. (2007) обнаружили зависимую от кондиционирования экспрессию FOS в центральном ядре миндалины (CeA), это выражение не зависело от состояния девальвации (обесценивалось или сохранялось). Это наблюдение примечательно по трем причинам. Во-первых, это предполагает, что ассоциативно активируемые вкусовые воспоминания не полностью взаимозаменяемы с самими вкусами. Информация о вкусах и болезнях сходится в этом регионе (Bernstein & Koh, 2007; Yamamoto, 2007), и известно, что CeA играет важную роль во многих аспектах обучения и выражения вкусовых отвращений (Lamprecht and Dudai, 2000; Yamamoto, 2007).Однако, если ассоциативно активируемая память вкуса спровоцировала эти аспекты обработки вкуса, мы бы наблюдали различную активность СеА в условиях Поддержания и Обесценивания. Во-вторых, повреждения CeA не влияют на эффективность девальвации (Hatfield et al., 1996). В-третьих, функция CeA имеет решающее значение для приобретения условных OR, которые при других обстоятельствах, как обнаружили Холланд и Штрауб (1979), относительно нечувствительны к девальвации за счет сочетаний пищи и LiCl. Взятые вместе, эти последние два наблюдения предполагают сходные доказательства, которые связывают различия в чувствительности условных ОР и связанных с пищей CR к процедурам девальвации на основе LiCl (Holland & Straub, 1979) с различиями в мозговых цепях, поддерживающих эти выученные реакции.Различия в рабочих характеристиках этих систем могут определять дифференциальную чувствительность разных поведенческих систем к параметрам девальвации.

Эти нейросистемные исследования девальвации и связанных с ней явлений проясняют, что вопросы содержания обучения являются сложными. Даже в очевидно простых поведенческих системах, таких как рефлекс моргания, возможности для пластических изменений имеются в изобилии в нервных системах, которые их обслуживают. Последствия экспериментальных манипуляций со стимулами окружающей среды для обучения могут значительно различаться в зависимости от этих систем и их компонентов.Становится все труднее различать ассоциации S-S и S-R с какой-либо уверенностью на основе какого-либо одного поведенческого анализа или аспекта нейронной обработки. Характеристика множественных поведенческих и нейронных последствий вариаций в процедурах ассоциативного обучения должна привести к более богатым, хотя, возможно, менее понятным описаниям природы обучения.

Выводы

В контексте ассоциаций S-S и S-R в обучении маятник решительно качнулся в когнитивную сторону со времен Спенса.В настоящее время существует множество демонстраций кодирования детализированных сенсорных аспектов подкреплений с помощью CS из ряда поведенческих парадигм, включая сенсорное предварительное кондиционирование, девальвацию подкрепления, опосредованное обучение и другие. Возможно, из-за этого множества примеров приобретение ассоциаций S-R редко непосредственно исследуется. Ассоциация S-S стала стандартом по умолчанию, и отсутствие доказательств для нее больше не используется в качестве доказательства для ассоциаций S-R, как это было раньше. Например, хотя эффекты девальвации часто незначительны, преобладающее мнение, по-видимому, состоит в том, что остаточная реакция после девальвации отражает неадекватность процедуры девальвации, а не обучение S-R.Это мнение может быть необоснованным. Существует множество примеров неудачной девальвации, и примечательно, что некоторые из множества поражений мозга, которые ухудшают эффективность девальвации, приводят к общему снижению измеряемых CR. Вместо этого животные с такими поражениями работают на нормальном уровне до девальвации, но не могут скорректировать свою реакцию вниз после девальвации. Таким образом, эти поражения, по-видимому, изменяют то, что извлекается из ассоциаций S-S и S-R, не затрагивая наиболее очевидные аспекты формы CR.Более того, из исследований нейронных систем ясно, что происходит пластичность ответа и что через ассоциативное обучение нейроны могут кодировать аспекты поведения, а также стимулы.

Что можно сказать о других 5 характеристиках Спенсом «когнитивных теорий обучения и теорий стимула-реакции»? С точки зрения метафоры , и телефонные коммутаторы, и диспетчерские на карте стали анахронизмами. Как и во времена Спенса, большинство современных количественных моделей обучения и поведения подчеркивают ассоциативные структуры, которые могут быть одинаково истолкованы как S-S или S-R.Широкое представление о задачах и результатах обучения и гибкость их использования в процессе работы широко считаются правилом, но, вероятно, они не лучше определены в рамках формальных моделей, чем карты прошлых лет.

Спенс, вероятно, поступил мудро, проигнорировав нейрофизиологизацию своего времени, потому что она имела мало оснований для изучения нервной системы. Нейрофизиологические характеристики обучения сегодня имеют гораздо более прочную основу, чем они были в 1950 году, и с гораздо большей вероятностью будут основаны на данных, чем на предположениях.Методы электрофизиологического перекодирования могут характеризовать нейронное кодирование различных видов информации, а функциональные анатомические методы могут использоваться для изучения основ изначально гипотетических сетей мозга, лежащих в основе аспектов ассоциативного обучения. Хотя многие современные редукционистские анализы обучения подчеркивают клеточные и молекулярные изменения, лежащие в основе обучения, эти анализы редко используются в качестве замены поведенческого анализа. Хотя я считаю, что лучший способ углубить наше понимание поведения — это изучить поведение, нейронный анализ часто может дать нам подсказки и подсказки о поведенческих процессах и организации.Возможно, что не менее важно, изучение нейронной основы обучения может связать изучение обучения с гораздо более широкой научной базой и сообществом.

В современных исследованиях в области обучения наш выбор переменных стимула гораздо более эклектичен, чем во времена Спенса, с теми же лабораториями, часто исследующими перцептивные, мотивационные и другие переменные, и в равной степени углубляясь в определение содержимого и условий из

обучение. Мы, по крайней мере, более восприимчивы к идее о том, что условия и содержание обучения не являются независимыми, и с большей вероятностью будем проводить программы, которые исследуют, например, условия, способствующие формированию обучения SS или SR, чем просто спрашивать: такое изучение СС или СР?

Обращаясь к состоянию теоретизирования в изучении обучения, Спенс (1950, стр.171) посетовал, что

«почти создается впечатление, что главная цель состоит в том, чтобы доказать ошибочность другой концепции, чем пытаться прийти к более всеобъемлющей интерпретации явления. Психологи, заинтересованные и высоко оценивающие роль теории в развитии совокупности научных знаний, должны противостоять таким искушениям… исключение всех теоретизаций, безусловно, не поможет ускорить приобретение совокупности научных знаний об обучении ».

Я думаю, будет справедливо сказать, что конфликт между когнитивной теорией обучения и теорией «стимул-реакция» в конечном итоге вышел за рамки этой ранней соревновательной фазы и стимулировал большие успехи в нашем понимании ассоциативного обучения.

Когнитивная теория обучения против теории стимула-реакции

Реферат

В своем обращении к Отделению теоретико-экспериментальной психологии Американской психологической ассоциации в 1948 году Кеннет В. Спенс обсудил шесть различий между когнитивной теорией и теорией стимул-реакция (СР). обучения. В этой статье я сначала рассмотрю эти шесть различий, а затем остановлюсь на двух из них в контексте моего собственного исследования. Это исследование касается спецификации ассоциаций стимул-стимул в ассоциативном обучении и характеристики нейронных систем, лежащих в основе этих ассоциаций.В ходе описания взглядов Спенса и моих исследований я надеюсь рассказать о некотором богатстве S-R психологии Спенса и ее актуальности в рамках современного научного анализа поведения.

Спенс (1950, стр. 161) охарактеризовал когнитивные теории обучения как те, которые «подчеркивают формирование и изменение когнитивных паттернов, представляющих отношения в окружающей среде». По большей части в рамках этих теорий, таких как теории Коффки (1935), Колера (1940), Левина (1936) и Толмана (1932), обучение было истолковано как часть более широкой проблемы организации восприятия и реорганизации с опытом. .Напротив, теории стимула-реакции (SR), такие как теории Гатри (1935), Халла (1943), Спенса (1936) и Торндайка (1898), подчеркивали такие конструкции, как привычки и связи SR, которые относились к гипотетическим состояниям обучения. или промежуточные переменные. Теории S-R предоставили правила, связывающие факторы стимула, такие как величина, количество и время вознаграждения, с сильными сторонами этих промежуточных переменных, а также правила, связывающие эти переменные с эмпирическими мерами реакции. В целом Спенс увидел несколько точек разногласий между этими двумя теоретическими позициями и приписал большую часть разногласий между лагерями неправильной интерпретации теории S-R когнитивными теоретиками.С моей точки зрения, тон его статьи был тон терпеливого учителя, указывающего на ошибки благонамеренных, но заблуждающихся учеников познания, но не щадя несколько менее распространенных (в его глазах) ошибок теоретиков S-R.

I. Шесть различий между когнитивной теорией и теорией СР

Метафоры: диспетчерские карты против телефонных коммутаторов

Возможно, потому что задачи пространственного обучения стали важной ареной тестирования для ранних когнитивных психологов и психологов СР, когнитивные теории обучения стали ассоциироваться с метафорой «диспетчерских карт», в которых пространственные представления и отношения были получены, вычислены и использованы.Напротив, теории S-R стали привязаны к аналогии с «телефонными коммутаторами», с помощью которых входные сигналы стимулов посредством обучения связывались с новыми выходными сигналами реакции (Tolman, 1948). Спенс (1950, стр. 161) утверждал, что «ни один научно ориентированный человек в психологии, однако, никогда не принял бы такие аналогии, будь то телефонные коммутаторы или диспетчерские на карте, как серьезную попытку теоретического представления изменений в обучении». Например, значение конструкции привычки Халла было «задано математической функцией, связывающей его с предшествующими экспериментальными переменными», и, таким образом, «любое сравнение распределительных щитов с диспетчерскими на карте совершенно неуместно» (Spence, 1950, p.163). Более актуальным был вопрос о том, было ли обучение в пространственных задачах более «похоже на карту» или «на привычку», то есть какая часть пространственной информации, содержащейся в этих задачах, была закодирована при обучении и могла быть использована для определения производительности. позже, когда, например, обычные пути были заблокированы или открыты ярлыки (Tolman, Richie, & Kalish, 1946a, b). Интересно, что большая часть этих дебатов в конечном итоге сводилась к проблеме «место против реакции», которую можно так же легко сформулировать полностью в терминах S-R, как «подойти к сигналу X» или «повернуть направо».

Нейрофизиологическая основа обучения: поля мозга или рецепторно-эффекторные связи

В то время как когнитивные теоретики ссылались на реорганизацию «электрических полей мозга» и «нейрофизиологических следовых систем», Халл (1943) связал формирование привычки с установлением нейронных «рецепторных» эффекторные »связи. Спенс отметил, что эти различия не имеют большого значения или не имеют никакого значения для теории обучения, потому что эти нейрофизиологические модели были не чем иным, как аналогиями и не играли никакой роли в выводах или умозаключениях любого лагеря.Свойства «мозговых полей» были выведены из интроспекции, а не физиологического исследования, и, за некоторыми исключениями, знания или даже предположения о физиологической основе рефлексов не способствовали построению теорий S-R. В самом деле, Спенс (1950, стр. 164) заявил, что «изображение нейрофизиологических процессов без указания гипотетических отношений, которые связывают их с экспериментальными переменными и мерой отклика, — это почти полная трата времени, поскольку дальнейшее понимание феномена обучения является обеспокоенный.В разделе 3 этой статьи я приведу примеры прогресса в установлении связи между мозгом и поведением, которые были более полезны для характеристики характера обучения.

Стимул-стимул (S-S) или стимул-реакция (S-R)

Когнитивные теоретики того времени были уверены, что обучение включает ассоциации или реорганизацию сенсорно-перцептивных процессов. Напротив, Гатри, Торндайк, Халл и другие утверждали, что обучение включает S-R-ассоциации между стимулами и «сокращением мышц и секрецией желез» (Guthrie, 1946, стр.7). Однако Спенс (1950) указал, что акцент Халла на S-R-ассоциациях следует из его нейрофизиологизации, а не из его математического определения привычки. С точки зрения Спенса, в привычке, как она определена в системе Халля, не было ничего по существу S-R или S-S, хотя, как и Халл, он явно полагал, что большая часть обучения связана с формированием ассоциаций между стимулами и реакциями.

«Мне нетрудно представить, что оба типа организаций или ассоциаций создаются в процессе обучения.Конечно, простые типы перцептивного обучения могут включать межсенсорные ассоциации. Однако я серьезно сомневаюсь, является ли обучение исключительно этим типом или даже большей частью. В самом деле, …… данные, по-видимому, более убедительно подтверждают концепцию S-R, чем концепцию S-S »(Spence, 1950, стр. 164-165).

Большая часть этой статьи (раздел 2) будет посвящена этому вопросу.

Содержание и условия обучения

Спенс отметил, что теоретики когнитивной науки, как правило, подчеркивали «внутренние» свойства своих построений, в то время как теоретики S-R, как правило, интересовались эмпирическими отношениями между экспериментальными переменными, которые определяют их конструкции.По терминологии Рескорла (1975), когнитивные теоретики сосредоточились на содержании обучения, тогда как теоретики S-R сосредоточились на условиях, в которых происходит обучение. Критикуя когнитивных теоретиков за то, что они слишком полагаются на интроспекцию, чтобы делать выводы о содержании обучения, Спенс признал, что такое содержание все же может быть строго определено в терминах переменных окружающей среды, превознося знаково-гештальт-психологию Толмена. Таким образом, он пришел к выводу, что эти опасения отражают «очень реальное различие между двумя теоретическими лагерями, но… одно из акцентов, а не конфликта» (Spence, 1950, p.166).

Стимулирующие переменные: внутренние и внешние

Во время написания Спенса исследователи когнитивной традиции стремились исследовать эффекты переменных, которые влияли на получение стимулов (например, ориентацию и внимание) и организацию восприятия (например, фигура). -основные отношения, отношения части-целого, принадлежность, множество). Напротив, большинство исследований поведения из традиции S-R сосредоточено на временных переменных и тех, которые связаны с мотивацией, такими как величина вознаграждения и состояние депривации.Но позиция Спенса (1950, стр. 167) заключалась в том, что «такие различия в акцентах…. не обязательно связаны с конфликтом », и отметил, что озабоченность теоретиков СР временем и мотивацией не исключает их интереса к восприятию стимулов и организационным переменным. Действительно, за последние 25 лет большое количество исследований, основанных на традиции СР, обращалось к этим более поздним вопросам, например, интересам к ориентации и вниманию (Holland, 1997; Mackintosh, 1975; Pearce & Hall, 1980) и перцептивному восприятию. организации (Кук, Райли и Браун, 1992; Рескорла, 1986).

Организм как активный или пассивный обработчик информации

Во время выступления Спенса шла активная дискуссия о «роли организма» в обработке информации, о том, действительно ли животные «просто пассивно воспринимают и реагируют на все раздражители, которые являются физическими. присутствует »(Tolman, 1948, p. 189), или активно обрабатывал эту информацию, выбирая и собирая элементы ассоциации до образования самих ассоциаций. И снова Спенс чувствовал, что когнитивные теоретики неверно истолковали позицию S-R:

«Трудно точно знать, что Толмен и другие, выразившие это понятие, имели в виду под таким утверждением.… .Большая часть теории СР связана с классической ситуацией обуславливания, в которой условия стимуляции чрезвычайно просты. Никакого «активного поиска» сигнала… или особой ориентации рецепторов не требуется… Но даже в случае этой простой обучающей ситуации теоретик обучения SR не предполагал, что организмы пассивно получают и реагируют на все стимулы, которые физически присутствуют »(Spence, 1950, p. 168.)

Таким образом, Спенс подготовил почву для последующего включения переменных, которые теперь описываются как «привлекающие внимание» в теорию СТО.Например, можно разумно ожидать, что непредвиденные обстоятельства подкрепления распространятся как на явную обработку внимания, такую ​​как движения глаз и ориентировочное поведение (например, Siegel, 1967), так и на более неявную обработку, предполагаемую более поздними теориями обучения, такими как изменения параметров скорости обучения. Все это могло повлиять на последующее восприятие и использование определенных стимулов в формировании ассоциации позже.

II. Изучение S-S или S-R?

Как заметил Спенс, в привычке нет ничего по существу S-S или S-R.Например, воспроизведите диаграммы Спенса (1950) и Холланда (1990), различая потенциальные S-S и S-R ассоциации в простом эксперименте по Павлову. Если второй член ассоциации опаздывает в потоке обработки, мы описываем ассоциацию как S-R, а если он ранний, мы описываем его как S-S. С этой точки зрения вопрос о том, насколько поздно и рано или поздно, определяет вопрос о том, является ли ассоциация или привычка S-R или S-S.

A: Диаграмма Спенса (1950), противопоставляющая ассоциации стимул-стимул (S-S) и стимул-ответ (S-R).Sc и Su относятся к условным и безусловным стимулам, соответственно, A1 и A2 относятся к афферентным процессам, производимым Sc и Su, E1 и E2 относятся к эфферентным процессам, производимым A1 и A2, а Ro и Ru — к ориентировочным и безусловным ответам. B: Диаграмма Холланда (1990), противопоставляющая ассоциации S-S и S-R. CS, US и UR относятся к условному раздражителю, безусловному раздражителю и ориентировочной реакции соответственно. Буквы a-d относятся к гипотетическим этапам обработки.

Поскольку в простейшем случае такие представления предполагают линейную цепочку обработки событий от получения стимула до моторного выхода, кажется маловероятным, что дихотомическая категоризация усвоенного поведения могла быть реалистично сделана в рамках психологических или нейрофизиологических теорий, указывая на различия в стимул против обработки ответа или сенсорная против двигательной области мозга.Тем не менее, вероятно, существует значительное согласие с тем, что одни события являются «большим стимулом», а другие — «большей реакцией». Возможно, самые ранние тестовые арены для того, чтобы задать вопрос S-S или S-R, были такими, в которых были минимизированы либо аспекты стимула, либо реакции второго, «подкрепляющего» события в событии ассоциации.

Ответы без стимулов

Loucks (1935) исследовал обучение, когда сгибание передних конечностей в присутствии зуммера было вызвано электрической стимуляцией соответствующей области моторной коры, а не обычным ультразвуковым воздействием на передние конечности.В этой процедуре предполагалось, что электрическая стимуляция вызывает реакцию без предварительного ввода стимула. Таким образом, обучение S-S должно быть невозможным, а обучение S-R не должно затрагиваться при этой подготовке. Действительно, Лаукс не обнаружил доказательств приобретения реакции сгибания ноги, предполагая, что смежность стимула и реакции была недостаточной для обучения. Спенс (1950) согласился с этой точкой зрения, но затем отметил, что во втором эксперименте Лоукс (1935) обнаружил, что если за стимуляцией зуммерно-моторной коры головного мозга также следовала еда, то приобреталось сгибание ног.Спенс утверждал, что эту пару результатов можно легко интерпретировать в рамках теории, основанной на вознаграждении SR: в отличие от шока ноги, стимуляция моторной коры вызывает реакцию сгибания, но не вызывает побуждения (боли), уменьшение которого может усилить формирование привычки, тогда как добавление пищи добавило такой реакции. источник вознаграждения. Хотя другие должны были найти успешное кондиционирование сгибания конечностей с помощью стимуляции моторной коры головного мозга (например, Doty & Giurgea, 1961), более поздние эксперименты (например, Thomas, 1971; Wagner, Thomas & Norton, 1967) ставят под сомнение, выявили ли такие исследования прямую Павловскую обусловленность. реакций на сгибание ног или инструментального кондиционирования ответов, которые уменьшали негативные постуральные последствия внезапных неконтролируемых движений ног, вызванных стимуляцией моторной коры головного мозга.И помимо этих опасений, можно легко усомниться в том, может ли массивная стимуляция моторной коры без рисунка обеспечить подходящую основу для пластичности, необходимой для обучения S-R в этой точке системы. Примечательно, что в некоторых системах, таких как кондиционирование век, и CS, и US могут быть заменены прямой стимуляцией нервных путей (например, Steinmetz, Lavond & Thompson, 1989; Thompson et al., 1998; см. Раздел 3 этой статьи).

Стимулы без ответов

По той же логике, блокирование ответов на УЗ или выбор УЗ с минимальными ответами должно существенно ухудшить обучение, если обучение — S-R, но иметь небольшой эффект, если обучение S-S.Ранние исследования периферической блокады ответов во время тренировки обычно выявляли существенную реакцию после снятия блокады (например, Finch, 1938). Однако снова легко возразить, что никто не ожидает, что обучение S-R будет локализовано в нервно-мышечном соединении или симпатическом нейроне. Такие исследования оказались более полезными при рассмотрении утверждений о том, что случайное инструментальное усиление двигательных реакций было ответственно за появление якобы павловских CR.

Более плодотворным направлением исследований было сенсорное прекондиционирование, в котором были объединены относительно нейтральные стимулы, такие как свет и звуки.Хотя обычно такие пары CS1-CS2 сами по себе не вызывают легко наблюдаемых изменений в поведении, последующее объединение одного из них (CS2) с более значительным событием, таким как еда или шок, обычно приводит к обучению, реагирующему и на другой сигнал (CS1). (). Обычно считалось, что CR к нетренированному сигналу CS1 опосредовано сцеплением двух отдельно приобретенных ассоциаций во время выступления. На начальном этапе S-S-ассоциации формировались между событиями, которые носили преимущественно сенсорный характер.Затем, на втором этапе, были сформированы ассоциации между CS2 и США. Наконец, когда CS1 был представлен в тесте, он вызвал CS2, который, в свою очередь, вызвал CR (). Конечно, творческие теоретики S-R быстро предложили альтернативные, S-R-решения проблемы сенсорной предварительной подготовки. Например (), в первой фазе S-R ассоциации могут быть сформированы между CS1 и ориентирующими ответами на CS2, а затем ассоциации между сенсорной обратной связью от этих ответов и реакцией на УЗ во второй фазе.Наконец, в тесте S1 будет вызывать условный OR, первоначально вызванный CS2, а обратная связь от этих условных OR, в свою очередь, будет вызывать UR-подобный CR, обусловленный этими стимулами обратной связи во второй фазе (Osgood, 1953, стр. 461-462) . Поскольку такие ответы часто нелегко было наблюдать, эти рассказы часто было трудно поддержать или опровергнуть. Тем не менее, сотни экспериментов по сенсорному прекондиционированию дали доказательства обучения в отсутствие очевидных реакций (например, Thompson, 1972).Я подозреваю, что Спенс был бы доволен описанием этих результатов как примеров сенсорно-сенсорных привычек.

Процедуры и результаты сенсорного эксперимента по предварительной подготовке. A: Экспериментальные процедуры. B: Отчет о производительности, опосредованной стимулом-стимулом. C: Расчет производительности, опосредованный стимулом-ответом. D: Отчет об обучении, опосредованном стимулом-стимулом. CS1, CS2 и US относятся к двум условным стимулам и безусловному стимулу. OR2 и OR2-s относятся к ориентировочной реакции, первоначально вызванной CS2, и к обратной связи со стимулом от OR2.Прочерки (—) обозначают установленные отношения; стрелки (→) обозначают выученные ассоциации; двуглавые стрелки (← →) означают двунаправленные ассоциации; линии (-) означают безусловные отношения.

Обе учетные записи S-S и S-R, приведенные выше, предполагают, что производительность CR для CS1 опосредуется во время тестовых презентаций путем объединения в цепочку отдельных ассоциаций, ранее установленных между CS1 и CS2, а также между CS2 и США. Прямых ассоциаций между CS1 и США не возникает. Альтернативный вариант состоит в том, что на втором этапе между CS1 и США формируются прямые ассоциации.Согласно этому «опосредованному обучению» (Holland, 1981a) или «обратному сенсорному прекондиционированию» (Ward-Robinson & Hall, 1996), во второй фазе CS2 ассоциативно активирует представление CS1, за которым затем следует США. Таким образом, ассоциации могут формироваться непосредственно между CS1 и США, которые затем выявляются в финальном тесте только CS1 (). Обычно трудно провести различие между этими альтернативами, хотя примечательно, что в раннем эксперименте по сенсорной предварительной подготовке человека Брогден (1947) проводил различие между субъектами, которые приписывали свою реакцию на CS1 в тесте тем, что он напоминал им CS2, и субъектов, которые утверждали, что на Фазе 2 CS1 фактически работал в паре с США.Субъектов можно побудить использовать стратегию «опосредованного обучения», используя параметры кондиционирования, которые препятствуют использованию ассоциаций CS1-CS2, требуемых опосредованной учетной записью производительности, и вместо этого поощряют использование ассоциаций CS2-CS1, требуемых учетной записью опосредованного обучения. Например, Уорд-Робинсон и Холл (1996) представили два нейтральных стимула в порядке CS2-CS1 в первой фазе эксперимента по сенсорному прекондиционированию и обнаружили существенную реакцию на CS1 в тесте.

Оценка характера обучения после обучения

В экспериментах, описанных выше, логика заключалась в том, чтобы изучить последствия изменения условий обучения так, чтобы они способствовали (или не способствовали) либо S-S, либо S-R обучению.Однако, хотя такие исследования были полезны для демонстрации того, что обучение может быть S-S или S-R, они не были информативными относительно того, было ли обучение в любой типичной процедуре кондиционирования S-S или S-R. Использование различного рода посттренировочных тестов часто позволяло собирать такую ​​информацию.

Тесты передачи

Возможно, наиболее распространенным использованием тестов передачи после обучения было определение того, изучали ли крысы в ​​простых лабиринтах пространственные атрибуты среды лабиринта или реакции поворота.Например, в эксперименте Толмена с «солнечными лучами» (Tolman et al., 1946a) крысы обучались в аппарате, в котором крысы сначала бежали прямо по переулку, а затем должны были сделать два поворота влево и два вправо, прежде чем найти пищу справа. сторона комнаты. В тесте переноса крысам предъявляли переулки, ведущие веерообразным множеством углов от стартовой зоны. Если крысы научились реакции «повернуть налево» или «повернуть направо», можно ожидать, что они выберут левую (0 градусов) или правую (180 градусов) аллею, если они научились «идти прямо, то тогда делать повороты », они выбрали бы переулок, идущий прямо (90 градусов), но если бы они узнали приблизительное расположение еды в комнате, они могли бы выбрать переулок, указывающий на это место (135 градусов).Хотя Tolman et al. (1946a) обнаружили значительные индивидуальные вариации в выборе поведения крыс, большая часть данных подтверждала утверждение, что крысы узнали приблизительное местоположение пищи (или что они соответствующим образом интегрировали прямые и правильные векторы ответа). Версия этого эксперимента, которая длилась дольше, следует за тренировкой в ​​Т-образном лабиринте с тестом в лабиринте, когда он повернут на 180 градусов (Packard & McGaugh, 1996; Poldrack and Packard, 2003; Tolman, Richie, & Kalish, 1946b).Таким образом, в тесте стратегии «ответ» и «место» противопоставляются. Если крыса делает тот же поворот (например, вправо), что и при обучении, идентифицируется обучение реакции, тогда как если она приближается к той же стороне комнаты, что и при обучении, подразумевается обучение месту.

Изменения в вознаграждении после тренировки

Другой способ сформулировать вопрос «S-R против S-S» заключался в том, способствовало ли вознаграждение формированию ассоциаций или участвовало в них. То есть награда просто запечатлела (Thorndike, 1898) или катализировала (Colwill & Rescorla, 1986; Rescorla, 1988) ассоциации стимул-ответ, или животные сформировали ассоциации между стимулами и сенсорными и другими свойствами вознаграждения? Первоначальный подход к этому вопросу заключался в том, чтобы установить стабильную производительность с определенной наградой, а затем заменить ее другой наградой.Если подкрепления просто устанавливают ассоциации, то никаких сбоев в работе не ожидается (при условии, что замененное подкрепление имеет сопоставимую ценность), тогда как если животные ожидают определенных наград, то аспекты производительности могут быть чувствительны к изменению. Ранние эксперименты с отложенным ответом показали, что обезьяны могут сохранять в памяти представления об определенных продуктах питания в течение относительно длительных интервалов. Например, работая с Колером, Тинкельпау (1928) обучал обезьян выполнению задания, в котором экспериментатор помещал пищу под одну чашку, а не под другую, идентичную чашке.После задержки, в течение которой чашки были закрыты из поля зрения обезьяны, экран был удален, и обезьяне приказали принести еду. На разных занятиях использовалось несколько разных продуктов. Обычно обезьяна выбирает правильную чашку и быстро съедает награду за еду. Однако, если экспериментатор спрятал банан, но затем подставил салат под чашку, пока он был скрыт от взгляда обезьяны, обезьяна исследовала, но не касалась салата, тщательно исследовала чашку и иногда визжала экспериментатору.Напротив, в последующем испытании, в котором салат был спрятан и сохранен под чашкой, обезьяна съела салат быстро и без происшествий. Таким образом, исходя из этих реакций на замененное вознаграждение, обезьяны должны были отражать в памяти определенные аспекты вознаграждения. К сожалению, поскольку ожидание вознаграждения было вызвано представлением самого вознаграждения, а не партнером вознаграждения, такие эксперименты проливают мало света на то, представлены ли свойства вознаграждения в ассоциативном обучении.Ближе к цели был эксперимент, проведенный в лаборатории Толмена Эллиотом (1928), в котором различные группы крыс были обучены бегать по сложному лабиринту либо для семян подсолнечника, либо для предпочтительного отрубного сусла. После серьезного обучения в группе отрубей награда за отруби была заменена менее предпочтительными семечками подсолнечника. Хотя крысы охотно ели семена подсолнечника без каких-либо признаков нарушения, производительность в последующих испытаниях была значительно ниже, чем у крыс, которых с самого начала приучили к семечкам подсолнечника.Это нарушение предполагало, что крысы ожидали особого вознаграждения. Однако Эллиот не выполнил аналогичную замену подсолнечника на отруби, и поэтому нарушение могло отразиться только на эффектах уменьшения величины вознаграждения.

В более поздних экспериментах изучались эффекты замещения УЗ в Павловской обусловленности более симметричным образом. Например, Холланд и Форбс (1982) обнаружили, что любой из двух US (гранул сахарозы с разным вкусом) лучше сохранялся в памяти (по оценке с помощью процедуры подготовительного высвобождения, например.грамм. Terry & Wagner, 1976), если им предшествовала неконгруэнтная Павловская CS1 (т.е.для других США), чем конгруэнтная CS. Точно так же в моей лаборатории Александр Джонсон (неопубликованные данные) недавно обнаружил, что у мышей наблюдается нарушение потребления каждого из пары жидких УЗИ (лецитина и сахарозы), когда каждый из них сопровождался слуховым сигналом для другой жидкости. Таким образом, по крайней мере, некоторые свойства арматуры кажутся закодированными CS после простых процедур кондиционирования.

Переоценка подкрепления

Процедура переоценки подкрепления после обучения (формально описанная Rozeboom, 1958) стала золотым стандартом анализа наличия или отсутствия SS (павловских) или RS (инструментальных) ассоциаций (Pickens & Holland, 2004) .Животные сначала проходят Павловскую или инструментальную подготовку с одним или несколькими подкреплениями. Затем ценность подкрепления изменяется при отсутствии сигналов или реакций обучения. Наконец, реакция оценивается при отсутствии какого-либо подкрепления. Часто уровень ответа, наблюдаемый в тесте, спонтанно изменяется, чтобы отразить изменения в ценности подкрепления, с которым он был ранее связан. Основные преимущества этой парадигмы включают ее полезность практически после любой процедуры обучения и доступность широкого спектра методов для изменения стоимости вознаграждения в сторону увеличения («инфляция») или уменьшения («девальвация»).Например, мотивационные состояния, относящиеся к подкрепляющим элементам, могут быть вызваны химическим путем (например, увеличение или уменьшение баланса натрия после тренировки с помощью солевого раствора) или путем изменения воздействия на них (например, выборочное насыщение одной из двух пищевых наград). Точно так же отдельные аспекты вознаграждений могут быть изменены ассоциативно путем объединения их с различными агентами, которые увеличивают или уменьшают их привлекательность. Даже неассоциативные манипуляции, такие как простое воздействие на само подкрепление или более слабые или более сильные варианты подкрепления, могут быть эффективными (например,грамм. Рескорла, 1973, 1974).

Ранним применением этого метода было исследование Зенера и МакКарди (1939). Собаки, лишенные еды, получали пары из двух реплик с собачьим печеньем разного вкуса. Затем собак тщательно насытили одним из вкусов собачьего печенья. Наконец, были записаны реакции собак на каждый сигнал. Они гораздо менее энергично откликнулись на сигнал о бисквите, которым они насытились. Хотя по нынешним стандартам исследование было несколько некорректным, потому что печенье продолжало присутствовать в тесте (и, таким образом, снижение реакции могло отражать более низкую ценность подкрепления насыщенного печенья, а не спонтанную корректировку реакции на основе его измененного значения), эти и другие результаты воодушевили Зинера (1937, стр.386) описывать обусловливание как «реорганизацию в некое функциональное целое систем восприятия, соответствующих условным и безусловным раздражителям; и в функциональном отношении этой организованной системы к системе побуждения или напряжения, первоначально возбужденной безусловным стимулом », а не в обучении ассоциациям S-R.

Подобная логика мотивировала ранние исследования различительного поведения лабиринта или переулка, проведенные Толменом (1933), Миллером (1935) и Толменом и Глейтманом (1949).Толмен (1933) первоначально обучал крыс в боксе с двумя вариантами выбора с двумя отличительными стимулами, черными или белыми занавесками. Прохождение (скажем) через черные занавески вело к ящику с едой, а прохождение через белые занавески вело в тупик, где не было еды. После значительного обучения этой задаче крыс помещали прямо в контейнер для корма и подвергали поражению электрическим током. Наконец, крыс возвращали в стартовую коробку и позволяли бежать. Если крысы действительно усвоили ассоциации «ответ-еда» или «ожидания знак-гештальт», то даже при первом испытании они не смогут бежать.Однако каждая крыса «сразу же весело и, как обычно, промчалась через весь распознающий аппарат и нанесла удар по отделению с едой, в котором она только что была шокирована» (Tolman, 1933, с. 250.)

В ответ Толмену ( 1933), Миллер (1935) пошел еще дальше, описав SR-объяснение того, как крысы могут проявлять гибкое поведение в такой ситуации, и приступил к его демонстрации. В своем отчете Миллер использовал концепцию дробных упреждающих целевых реакций. Крысы могут давать мощные целевые ответы (Rg, e.g., жевание), части которого (rg) могут быть адаптированы к аллейным сигналам, которые предшествуют самой коробке ворот. Когда крысу впоследствии помещали в коробку ворот и шокировали, реакция прыжка или замирания на шок могла быть обусловлена ​​обратной связью со стимулом от предыдущих целевых реакций, основанных на еде (например, Rg-Sg → Rshock). Затем, когда крысу поместили обратно в переулок, выполнение условного rg дало бы сигнал обратной связи sg, который, в свою очередь, вызвал бы условную дробную часть реакции на шок, мешающую бегу.Миллер предположил, что все, что потребуется для получения ожидаемых Толменом данных, — это дать блокам целей отчетливые ответы на цели. Он сделал это с помощью двух наград (еда и вода) и двух отличительных ворот, одна требовала подъема и резкого поворота вправо, а другая требовала прямого входа с последующим резким левым поворотом. В отличие от аппарата Толмена, который требовал одновременного распознавания выбора, Миллер использовал одиночный переулок с единственной коробкой ворот, но выставил крыс на другую зону ворот в отсутствие переулка.Когда позже крыс помещали непосредственно во вход в одну из коробок ворот и подвергали электрошоку, шоковая реакция была обусловлена ​​определенным Sg, возникающим из отличительного Rg в этой коробке. Если крысу ударили током в той же коробке ворот, которая всегда находилась в конце переулка, размещение этой крысы обратно в стартовую коробку переулка для теста вызовет rg, чья обратная связь sg была связана с дробной реакцией на электрошок, и, следовательно, производят помехи при работе. Напротив, если крысу ударили током в другом боксе, ответная реакция rg, вызванная переулком, не будет связана с реакцией на удар током, и такое вмешательство не ожидается.Миллер (1935) действительно нашел такой результат. Таким образом, отчет Миллера S-R не только объяснял такую ​​девальвацию, но и предлагал условия, при которых она будет и не будет соблюдаться.

Интересно, что в классическом исследовании Т-образного лабиринта Толмана и Глейтмана (1949), в котором Толмену наконец удалось обнаружить характеристики спонтанной девальвации, две коробки для ворот также были сконструированы таким образом, что они требовали четких ответов на цели (хотя Толмен и Глейтман вместо этого подчеркнули различия в восприятии ящиков).Наконец, в одном из наиболее причудливых поворотов логики посредничества rg-sg эффектов девальвации, используя вариант процедуры Миллера (1935), Фаулер и Миллер (1963) обнаружили, что удары от ворот могут либо ухудшить, либо улучшить результаты теста. в зависимости от того, наносили ли удары током по передним или задним лапам крыс. Если бы удары были приложены к передним ногам, Rshock отскочил бы назад, но если бы они были применены к задним ногам, Rshock прыгнул бы вперед.При замене в переулках крысы, получившие удар от ворот по передним ногам, отпрыгивали назад, замедляя свою работу, но те, кто получил удар от ворот по задним ногам, прыгали вперед, улучшая свои показатели. Таким образом, еще раз, система посредничества rg-sg не только обеспечивала учет S-R для эффектов «девальвации», но также предсказывала характер результата на основе характеристик условной дробной упреждающей реакции.

Современный эксперимент по девальвации

Современный эксперимент по девальвации связан с использованием Рескорла процедуры для изучения содержания защитной (Rescorla, 1973, 1974) и аппетитной (Holland & Rescorla, 1975) конструкции по Павлову, а затем с последующим использованием процедура, проведенная Дикинсоном, Рескорла и их коллегами для изучения инструментального обусловливания вознаграждения (например,г., Адамс и Дикинсон, 1981; Баллейн и Дикинсон, 1991; Колвилл и Рескорла, 1985b, 1986; Рескорла, 1987). В каждом из этих исследований наблюдался умеренный эффект девальвации США после спаривания CS-US. Например, Холланд и Рескорла (1975) объединили тон с пищевыми гранулами, а затем обесценили корм, либо насытив крыс этими гранулами, либо сочетая их с высокоскоростным вращением, вызывая укачивание. Они обнаружили, что крысы, получившие такую ​​девальвацию, показали меньшую реакцию, чем те, которые не получали насыщения или которые получали непарные подачи пищи и вращения.В то же время крысы, получившие кондиционирование второго порядка одного и того же тона, не показали таких эффектов любой девальвационной обработки на CR второго порядка, что исключает множество простых основанных на производительности объяснений снижения реакции после девальвации.

Результаты, подобные этим, побудили авторов учебников и вводной психологии утверждать, что обусловленность — это преимущественно S-S. Но такой вывод не обязательно имеет веские основания. Во-первых, эффекты девальвации обычно невелики и, возможно, ограничиваются ограниченным диапазоном параметров обучения.Я получил много сообщений с просьбой предоставить информацию от исследователей, которые не смогли обнаружить эффекты девальвации. Хотя в целом мне удавалось направить их на путь успеха в получении этого феномена, примечательно, насколько мало эффектов девальвации в абсолютном выражении. Например, показаны эффекты девальвации в последней дюжине экспериментов, опубликованных членами моей лаборатории. Большинство этих исследований было проведено на интактных животных, хотя некоторые из них представляют эффекты девальвации у крыс с фиктивными поражениями различных областей мозга, которые, как известно, важны для девальвации.Примечательной особенностью этих данных является то, насколько мала разница между условиями контроля и девальвации и насколько остаётся реакция после девальвации. В большинстве случаев девальвация самих США была полной, то есть крысы практически ничего не ели из самой пищи. Колвилл и Рескорла (1990) широко обсуждали этот вопрос в контексте инструментальной девальвации, указывая на важность таких переменных, как сходство между моделями предоставления услуг в США на стадиях обучения и девальвации.Тем не менее, в большинстве случаев остаток довольно велик (но см. Colwill & Rescorla, 1990; Kerfoot et al., 2007).

Результаты 12 экспериментов по девальвации из моей лаборатории. В каждом эксперименте звуковой или зрительный условный раздражитель (CS) сначала сочетался с пищей, затем пища либо обесценивалась путем сочетания ее с хлоридом лития (LiCl), либо поддерживалась путем подачи пищи и непарного LiCl, и, наконец, CS была представлена ​​отдельно в контрольная работа.

Во-вторых, результаты экспериментов по девальвации могут существенно различаться в зависимости от выбранного агента девальвации.Например, Холланд и Штрауб (1979) и Холланд (1981b) исследовали эффекты обесценивания пищи за счет насыщения или сочетания ее с хлоридом лития или высокоскоростным вращением. показывает потребление пищи и эффективность упреждающих реакций при входе в чашку с едой на сигналы в паре с едой после девальвации каждым из этих трех методов. В этих исследованиях обнадеживает тот факт, что степень снижения потребления положительно коррелировала со степенью уменьшения реакции чашки с едой во время CS.В то же время заметно отсутствие такой корреляции. Например, Galarce, Crombag и Holland (2007) обучили крыс двум слуховым сигналам, передающим сигнал о двух пищевых продуктах (сахарозе и мальтодекстрине). Один продукт был соединен с LiCl, а другой — нет. Наконец, крыс тестировали на присутствие двух тонов. Необычной особенностью этого эксперимента было то, что в различных тестовых сессиях либо предотвращенный, либо неперевернутый УЗ был представлен в чашке с едой во время теста на девальвацию.Интересно, что постоянное присутствие любого из этих продуктов в чашках с едой мало влияло на реакцию на CS. Хотя неудивительно, что крысы проводили больше времени в чашке с пищей, когда она содержала неотвернутую пищу, чем когда она содержала отвергнутую пищу, CS для чашки с неотвернутой пищей, усиленной пищей, реагировала больше, чем сигнал для отклоненной пищи, независимо от того, какая пища была физически присутствует. Таким образом, ответ, основанный на ожидаемой цели, может иметь место, несмотря на явно не подтверждающие доказательства цели.

Левая полоса: Показатели условных реакций чашки с едой (CR) только на условный стимул (CS) в тестовой сессии после того, как еда была обесценена путем сочетания ее с хлоридом лития (LiCl) или высокоскоростным вращением, или насыщением этой пищей. . Правые столбцы: количество пищевых гранул, потребленных за 10 минут после того, как 50 пищевых гранул были помещены в чашку для корма в экспериментальных камерах. Реагирование в состоянии «Поддержание» представляет собой совокупность реакции на тестовый CS, который был представлен после непарных предъявлений пищи и LiCl или вращения, или в отсутствие насыщения пищей.Данные взяты из Голландии (1981b) и Голландии и Штрауба (1979).

Другая проблема в экспериментах по девальвации — это показатель, выбранный для отражения ожидаемого результата. Во-первых, некоторые меры более чувствительны к девальвации, чем другие. Холланд и Штрауб (1979) обнаружили, что поведение более поздней цепи (например, прикосновение и захват гранулы) показало большую чувствительность к девальвации пищи за счет сочетания с LiCl, чем поведение на ранней стадии (приближение к чашке с едой). Интересно, что некоторые другие косвенные меры обучения, которые, как часто думают, отражают обусловленные побудительные мотивационные свойства, кажутся особенно нечувствительными к девальвации.Например, Холланд (2004) и Рескорла (1994) не нашли доказательств того, что на Павловский инструментальный перенос повлияла девальвация подкрепления. В исследовании Холланда (2004) после тренировки с двумя CS, двумя US и двумя инструментальными реакциями пары одного US с LiCl снижали исходные уровни инструментального ответа для этого US и уменьшали ответы чашки еды на CS, которые предсказывали, что US, но никак не повлиял на то, насколько эта CS улучшила инструментальную реакцию, которая обычно приносила эти США.Аналогичным образом, Parkinson et al. (2005) обнаружили, что, хотя после повторного тестирования, девальвация США полностью устранила реакцию, вызванную CS, эта CS не утратила своей способности служить вторичным или условным подкреплением.

Во-вторых, меры реагирования и методы девальвации могут взаимодействовать. Например, хотя Холланд и Штрауб (1979) обнаружили, что обесценивание пищи с помощью LiCl уменьшало вход в чашку с едой больше, чем обесценивание за счет высокоскоростного вращения, на восприятие визуальных сигналов и реакции испуга на слуховые сигналы больше влияло вращение с высокими расходами, чем на пары пища-LiCl.Напротив, насыщение уменьшило оба класса ответов на промежуточную степень. Ясно, что «американская ценность» не одномерна в своем отношении к системам поведения. Различные поведенческие реакции могут быть опосредованы разными сенсорными свойствами представлений США, которые, в свою очередь, могут быть по-разному чувствительны к различным методам обесценивания. Я вкратце вернусь к этому вопросу в разделе 3.

В-третьих, аппетитные и последовательные CR могут по-разному реагировать на подкрепляющую девальвацию.Хотя, как отмечалось в, реакция на подход с чашкой еды часто демонстрирует относительно низкую чувствительность к обесцениванию подкрепления, постоянные CR, такие как облизывание, и различные так называемые вкусовые реакции (TR; Berridge, 2000; Grill & Norgren, 1978), меры, которые, как считается, отражают гедонистические подходы. или аспекты вкусовых качеств вознаграждений часто полностью устраняются. Используя крыс с хроническими внутриротовыми канюлями, Kerfoot et al. (2007) соединили тональный CS с внутриротовой доставкой раствора сахарозы за один сеанс в двух группах крыс и представили эти события непарными у других крыс.Затем крысы в ​​группе Devalue заболели инъекцией LiCl после одного сеанса внутриротовой доставки сахарозы в отсутствие тонов, в то время как крысы в ​​группе поддержки получали сахарозу и LiCl в отдельные дни. Контрольные крысы, тренированные с использованием тонуса и неспаренной сахарозы, также получали сахарозу и LiCl в паре или без пары в этой фазе. Наконец, все крысы были протестированы с сочетанием тона с настоями простой воды. Крысы в ​​группе «Поддержание» показали высокие уровни TR положительного (гедонистического) воздействия в тестовых испытаниях ().Хотя эти реакции были особенно очевидны в присутствии воды, которая обеспечивала основу для их выступления, они также возникали во время одного тона перед вливанием воды в каждом испытании. Напротив, у крыс из группы Devalue не было больше лизания или положительных TR, чем у контрольных крыс. Таким образом, девальвация завершилась. Кроме того, у этих крыс было значительно больше отрицательных TR, таких как зияние и сокращенные облизывания, которые обычно проявляются в ответ на сами предотвращенные ароматы, чем у контрольных или поддерживающих крыс ().Возникновение этих отрицательных TR особенно важно, потому что крысы Devalue никогда ранее не выполняли отрицательные TR ни к тону, ни к сахарозе. Во время сочетания тон-сахароза и во время введения одной сахарозы перед инъекцией LiCl сахароза выявляла только положительные TR, и сахароза больше не представлялась после однократной инъекции LiCl. Таким образом, проявление отрицательных TR-ответов крыс с парной девальвацией в тесте не могло отражать обучение S-R, даже через механизмы посредничества S-R (Osgood, 1953) или rg-sg (Miller, 1935), описанные ранее.

Положительные (панель A) и отрицательные (панель B) реакции вкусовой реакции (TR) во время тестовых презентаций тонального условного стимула (CS) и простой воды в тесте на девальвацию. Крысы сначала получали пары тон → сахароза, а затем пары сахароза-хлорид лития (LiCl) (Devalue) или непарные представления этих событий (Maintain). Контрольные крысы получали тонус и сахарозу неспаренными при обучении, за которыми следовали сахароза и LiCl, либо парные, либо непарные. Все жидкости были доставлены внутрь ротовой полости.Данные взяты из Kerfoot et al., 2007.

На основании результатов Kerfoot et al. (2007) заманчиво предположить, что усвоенные окончательные или TR-ответы особенно чувствительны к девальвации. Однако более простая возможность состоит в том, что введение подкрепления в ротовую полость и использование этого метода доставки как на этапе обучения, так и на этапе обесценивания являются более важными факторами. В соответствии с этой возможностью, Colwill и Rescorla (1990) обнаружили почти полную девальвацию нажатия на оперантный рычаг после тренировки и девальвацию с внутриротовой подачей подкрепления.Совсем недавно Холланд, Лассетер и Агарвал (2008) исследовали консумативные и TR-реакции в экспериментах по девальвации с интраоральной или традиционной (в утопленную чашку) доставкой усилителей сахарозы. Стаканы с едой были оснащены камерами, позволяющими измерять TR-ответы в условиях чашки, а также в условиях внутриротовой доставки. Положительные TR-ответы показали одинаковую картину независимо от метода введения сахарозы. Как при внутриротовом, так и в чашечном способах доставки крысы в ​​состоянии девальвации показали почти полную потерю положительных TR после девальвации сахарозы по сравнению с крысами в состоянии поддержания, и только крысы в ​​состоянии девальвации показали отрицательные TR-ответы ().В то же время прием пищи из чашки показал лишь частичную чувствительность к девальвации сахарозы. Кроме того, при обоих условиях доставки простые реакции облизывания, охарактеризованные Berridge (2000) как последовательные, но негедонические, показали умеренную, но не полную чувствительность к девальвации. Таким образом, результаты исследования Holland et al. (2008) показывают, что, независимо от метода введения подкрепления, оценочные TR-ответы особенно чувствительны к обесцениванию по сравнению с неоценочными консумативными ответами (простое лизание) и (с традиционной доставкой) к аппетитные реакции (прием пищи в чашке).

A: Чашка для еды и положительная реакция вкуса-реактивности (TR) во время тестовых презентаций на тон и простую воду после минимального количества пар тон-сахар, с последующим сочетанием (девальвация) сахарозы с хлоридом лития (LiCl) или непарных презентаций тех событий (Поддерживать). B: То же, что и панель A, за исключением обширной тренировки тона сахарозы. C: Простое (неоценочное) лизание, положительный TR и отрицательный TR, ответ во время тестовых презентаций тона и простой воды, после минимального количества сочетаний тон-сахароза, с последующим либо сочетанием (Devalue) сахарозы с LiCl, либо непарными представлениями этих событий ( Поддерживать).D: То же, что и панель C, за исключением обширной тренировки тона сахарозы. Все жидкости доставлялись в утопленную чашку для еды (панели A и B; Holland et al., 2008, эксперимент 1) или внутрь ротовой полости (панели C и D; Holland et al., 2008, эксперимент 2).

Вторая цель исследования Холланда и др. (2008) состояла в том, чтобы изучить влияние объема обучения на эффективность девальвации со всеми этими показателями. В контексте инструментального обучения часто утверждается (например, Adams, 1982; Kimble & Perlmuter, 1970; но см. Colwill & Rescorla, 1985a; Colwill & Triola, 2002; Holland, 2004), что наученная реакция становится все более невосприимчивой к подкреплению. девальвация с расширенным обучением.В самом деле, одним из алиби (его слов) Толмена (1933) по поводу отсутствия эффекта девальвации было то, что его крысы перетренировались и «зациклились» на беге. Мы никогда не наблюдали такого эффекта у Павлова; То есть, павловские CRs по крайней мере так же чувствительны к обесцениванию пищи за счет сочетания с LiCl после продолжительной тренировки, как и после минимальной тренировки (например, Holland, 1998; 2004, 2005). Тем не менее, мы часто наблюдали резкую потерю способности павловской системы обучения участвовать в «опосредованном обучении» по мере продолжения обучения.

Holland (1981a, 1990) обнаружил, что опосредованное обучение отвращению к пище может быть установлено, когда ассоциативно-активированное представление о еде сочетается с болезнью (недавний обзор см. В Holland & Wheeler, в печати). Например, в одном эксперименте (Holland, 1981a) крысы сначала получали пары из двух слуховых CS с двумя пищевыми усилителями, которые различались только по вкусу (например, тон → сахароза со вкусом грушанки и шум → сахароза со вкусом мяты перечной), чтобы дать им CS способность выборочно активировать представления того или иного из этих подкреплений.Затем презентация одного из слуховых CS была объединена с инъекцией токсина хлорида лития (LiCl) при отсутствии каких-либо запахов. Последующие тесты на потребление показали установление легкого отвращения к пище, чей CS-партнер был связан с болезнью, как если бы активация CS представления пищи непосредственно перед индукцией болезни позволила сформировать ассоциации пища-болезнь. Позже Холланд (1990, 1998, 2005) обнаружил, что, хотя пары CS-LiCl выявляют значительную опосредованную отвращение к пище после 16-24 пар CS-еда, крысы, тренированные с 40 или более парами CS-еда, не показали никаких доказательств такого опосредованного отвращения к пище.В то же время другие крысы, обученные с целыми 160 парами CS-US, продолжали демонстрировать доказательства обучения S-S тон-еда, на что указывают процедуры обесценивания подкрепления. Эти результаты привели Холланда (1990, 1998, 2005) к предположению, что на ранних этапах обучения CS активируют широкий спектр обработки, обычно активируемой самими США, включая раннюю стадию обработки восприятия, но по мере продолжения обучения этот доступ сужается до более ограниченного. комплекты систем обработки. Таким образом, с этой точки зрения, опосредованное обучение отвращению к вкусу не наблюдалось на более поздних этапах обучения, потому что CS больше не активировал перцептивную обработку отсутствующего аромата, которая могла вступить в ассоциации с болезнью.

Логика, лежащая в основе исследований Холланда и др. (2008), заключалась в том, что если кондиционирование TR-ответов на сигналы в паре с сахарозой отражает активацию сигналами перцепционной обработки отсутствующей сахарозы, и что такая активация происходит только на ранних этапах обучения , то только минимально обученный CS будет контролировать эти положительные оценочные ответы, а более тщательно обученный CS — нет. В каждом из своих экспериментов Holland et al. (2008) тренировали каждую крысу с двумя CS: одна была соединена с сахарозой US 16 раз, а другая — 112 раз.показать ответ на минимально обученный CS (описанный ранее), тогда как показать ответ на хорошо обученный CS. Как и ожидалось, проявление условных ТУ-ответов наблюдалось только после минимальной тренировки. В то же время аппетитные и неоценочные конечные ответы (простые облизывания) были чувствительны к обесцениванию сахарозы после минимальной или обширной тренировки.

Эти данные, как и данные исследований опосредованного обучения, согласуются с точкой зрения (Holland, 1990), что на ранних этапах обучения CS активирует обработку восприятия, обычно активируемую самой пищей.С этой точки зрения любая функция, обычно контролируемая вкусом США, должна быть доступна CS. Таким образом, можно было бы ожидать опосредованного обучения отвращению к этому подкреплению, если бы CS был соединен с инъекцией LiCl, потому что крыса испытала бы болезнь после того, как попробовала отсутствующий US. Точно так же этот CS должен контролировать оценочные TR-ответы, соответствующие этому вкусу, как наблюдали Holland et al. (2008) и Kerfoot et al. (2007). Поскольку CS активирует предоценочную перцептивную обработку еды US, наблюдаемая TR будет согласована с текущей оценкой вкуса этой еды и, таким образом, будет чувствительна к изменениям ценности подкрепления после тренировки, как это наблюдается в тех случаях, когда исследования.Напротив, по мере продолжения обучения CS теряет доступ к этой низкоуровневой обработке восприятия США и вместо этого активирует аспекты обработки подкрепления, которые не включают в себя сам перцептивный опыт или способность контролировать оценочные реакции, соответствующие текущей оценке этого. перцептивный опыт. Эти более концептуальные аспекты США, тем не менее, должны включать в себя как сенсорную, так и своего рода мотивационную информацию, потому что эффекты девальвации подкрепления остаются в высокой степени специфичными для США даже после того, как CS теряют способность контролировать реакции TR или опосредовать обучение новому отвращению к вкусам (Holland, 1998). .

Очевидно, в этой истории есть нечто большее, чем ассоциации S-S и S-R. Представления, активируемые CS после минимального и расширенного обучения, можно отличить по их способности участвовать в новом (опосредованном) обучении и по их способности контролировать соответствующие оценочные TR-ответы. Тем не менее, даже после длительного обучения CS могут активировать подкрепляющие репрезентации, которые включают богатую сенсорную информацию, которая может поддерживать эффекты обесценивания подкрепления. Это различие напоминает различие, предложенное Конорски (1967, e.g., pp. 170-181), который различал ассоциативную активацию «галлюцинации» и «образа» CS. В первом случае считалось, что CS вызывает активность сенсорных «проективных» единиц, которая может напоминать активность этих единиц, когда они активируются самими США. Напротив, в последнем случае CS активировала только «гностические» единицы, которые кодировали информацию о США, но которые обычно не генерировали перцепционную обработку. Проще говоря, галлюцинация включает чувственное переживание отсутствующего объекта, тогда как можно представить этот объект и его сенсорные свойства, не испытывая их.

III. Может ли нейросистемный анализ помочь нам понять содержание обучения?

В разделе I я отметил, что Спенс пренебрег физиологизацией, даже физиологией Халла, как скорее вводящей в заблуждение, чем полезной при характеристике математических и поведенческих аспектов обучения привычкам. Однако результаты описанных мною задач по девальвации подразумевают, что ассоциативное обучение может задействовать различные уровни нейронной обработки. Пластичность не уникальна ни для одного из кругов в. Например, исследования нервной пластичности в кондиционировании век (например,г., Medina et al., 2000; Steinmetz et al., 1989; Thompson et al., 1998) идентифицировали участки пластичности мозжечка, которые можно охарактеризовать как находящиеся в пределах «выходных» путей и, следовательно, более «S-R», а также другие участки ранее в потоке обработки. Разумная исследовательская программа могла бы представить себе обстоятельства, при которых сигналы управляют обработкой в ​​различных системах мозга, которые преимущественно контролируют различные аспекты поведения. Понимание потока информации в мозге может помочь нам понять, почему, например, некоторые продукты обучения, такие как контроль TR-ответов и способность поддерживать опосредованное обучение, связаны между собой своими функциями быстрого битонического усвоения, почему другие, кажется, поддерживают чувствительность. к девальвации из-за обширных тренировок, а некоторые, кажется, теряют такую ​​чувствительность из-за тренировок.

Для получения информации, необходимой для понимания содержания обучения, использовались различные нейробиологические методы. Методы стимуляции мозга вышли далеко за рамки грубой стимуляции моторной коры, как в экспериментах Лаукса (1935). Например, при анализе нервных систем кондиционирования век замена реальных событий, таких как CS и US (или того и другого, например, Steinmetz et al., 1989), стимуляцией мозга выявила события, критические для кондиционирования век.Сходным образом структурированная стимуляция миндалины помогла выяснить механизмы приобретения и исчезновения условного рефлекса страха (Vidal-Gonzalez et al., 2006).

Точные фармакологически селективные поражения и обратимая инактивация различных групп клеток могут избирательно изменять чувствительность крыс к девальвации, не влияя на другие аспекты производительности. Например, повреждение компонентов схемы, включая базолатеральную миндалину (BLA), орбитофронтальную кору (OFC), субрегионы медиальной префронтальной коры и, в некоторых случаях, медиодорсальный таламус, мешают работе крыс по Павловской девальвации, не влияя на получение пищи. чашки CR или отвращение к вкусу (Gallagher et al., 1999; Hatfield et al., 1996; Maddux & Holland, 2007; Пикенс, 2008; Пикенс и др., 2003). Кроме того, эти исследования показывают, что различные части этой схемы выполняют специализированные функции в рамках задачи девальвации. Например, для того, чтобы крысы демонстрировали эффекты девальвации с помощью процедур с одним подкреплением, функция BLA необходима во время начальных пар CS-еда, но не после этого. То есть, если крысы приобрели ассоциации CS-еда, в то время как функция BLA не нарушена, то последующие поражения не ухудшают производительность этой формы девальвации, как будто функция BLA необходима крысам для приобретения ассоциаций SS, а не SR, но не для использования ранее. -установленные ассоциации SS для контроля поведения (Pickens et al., 2003). Напротив, функция OFC, по-видимому, имеет решающее значение для выражения, а также приобретения таких ассоциаций в задачах девальвации. Поражения OFC нарушают эффективность девальвации (то есть крысы не могут спонтанно снижать реакцию на CS после девальвации в США), независимо от того, выполняются ли они до CS-еды, отвращения к пище или заключительных фаз тестирования (Pickens et al., 2003, 2005) . Наконец, участие этих областей мозга может варьироваться в зависимости от требований задачи. Например, хотя при использовании одной комбинации сигнал-подкрепление, функция BLA не требуется после установления ассоциаций сигнал-подкрепление, при использовании двух или более сигналов и подкреплений функция BLA также должна быть неизменной во время тренировки отвращения вкуса. и / или тестирование девальвации (Johnson et al., 2007). Точно так же Пикенс (2008) обнаружил, что функция медиодорсального таламуса важна для выполнения задачи по Павловской девальвации только в том случае, если эта задача требует изменения стратегии по сравнению с предыдущей задачей.

Результаты недавних исследований электрофизиологической записи также предполагают, что процедуры кондиционирования могут устанавливать различные типы ассоциаций как внутри, так и между взаимосвязанными областями мозга. Например, используя задачу распознавания по запаху, Schoenbaum, Chiba и Gallagher (1998) обнаружили нейроны в BLA и OFC, которые можно охарактеризовать как отражающие ассоциации S-S и ответ-стимул (R-S).Первоначально эти нейроны избирательно реагировали на один из двух подкрепляющих элементов, используемых в задаче, но в ходе обучения их активность находилась под контролем либо определенной запаховой подсказки, либо определенной реакции. Более поздние исследования показали, что природа нейронного кодирования информации о стимулах или ответах в этих двух областях мозга зависит от связи между ними (например, Saddoris, Gallagher & Schoenbaum, 2005; Schoenbaum, et al., 2003). Совсем недавно Furuyashiki, Holland и Gallagher (2008) также сравнили активность нейронов OFC, кодирующих информацию о результатах, с нейронами, кодирующими информацию об ответах.Эти последние нейроны специфически реагировали на определенные ответы, но не на определенные подкрепления. Хотя эти последние нейроны не могут быть истолкованы как субстрат для ассоциаций S-R, поскольку они увеличивают свою активность только после выполнения закодированного ответа, их существование показывает, что по крайней мере в некоторых областях мозга отдельные нейроны могут кодировать различные виды информации о задачах.

Наконец, мы использовали методы немедленной экспрессии генов, чтобы связать функцию мозга с производительностью в простых задачах обесценивания (и других).Наша цель — связать различия в производительности в разных условиях с различиями в системах мозга, задействованных в этих условиях. Посмертный анализ ткани может выявить подробную информацию об отдельных нейронах, которые были активны (Lee et al., 2005) или претерпевали пластические изменения (Guzowski & Worley, 2001; Petrovich et al., 2005) в течение довольно ограниченных интервалов времени, таких как конкретный эпизод поведенческого теста перед жертвоприношением. Например, после оценки ответов TR на минимально обученный тон CS в отсутствие сахарозы Kerfoot et al.(2007;) пожертвовали своих крыс, чтобы исследовать экспрессию FOS, белкового продукта зависимого от активности гена немедленного раннего развития c-fos . Они обнаружили, что зависимая от обучения и девальвации экспрессия FOS в ряде областей мозга, известных из экспериментов с повреждениями (только что описанных), имеет решающее значение для обучения, чувствительного к девальвации результатов (базолатеральная миндалина и орбитофронтальная кора; Holland & Gallagher, 2004) в регионы, связанные с отображением TR-ответов (оболочка прилежащего тела; Reynolds & Berridge, 2002), и регионы, связанные с обработкой информации о вкусе (вкусовая кора; Kiefer & Orr, 1992).Эти последние наблюдения особенно интересны из нашего более раннего предположения, что обусловливание может наделить CS способностью активировать перцептивную обработку отсутствующих US. Если в результате сочетания тона и сахарозы тон вызывал ощущение сладости, делая вкус простой воды сладким, можно было ожидать, что крысы в ​​условиях девальвации и сохранения будут демонстрировать повышенную активность ФОС во вкусовой коре головного мозга, что они и сделали. Более того, поскольку крысы в ​​состоянии Поддержания будут реагировать на сладкое аппетитными реакциями вкуса и реактивности, один только тон также будет вызывать эти реакции и активность ФОС в части прилежащей оболочки, коррелирующую с такими ответами.Напротив, поскольку крысы в ​​состоянии девальвации будут реагировать на сладкое с помощью аверсивных ответов, тон будет вызывать аверсивные реакции и FOS в другом субрегионе прилежащей раковины, что коррелирует с аверсивными TR-ответами. Все эти результаты были соблюдены. Учитывая результаты Холланда и др. (2008), было бы интересно определить, является ли более тщательно обученный CS, который не вызывает аппетитных TR-ответов при обучении или вызывает отрицательные TR-ответы после девальвации и не поддерживает опосредованный вкус -аверсионное обучение, также не может вызвать ФОС в прилежащей оболочке или вкусовой коре.

Интересно, хотя Kerfoot et al. (2007) обнаружили зависимую от кондиционирования экспрессию FOS в центральном ядре миндалины (CeA), это выражение не зависело от состояния девальвации (обесценивалось или сохранялось). Это наблюдение примечательно по трем причинам. Во-первых, это предполагает, что ассоциативно активируемые вкусовые воспоминания не полностью взаимозаменяемы с самими вкусами. Информация о вкусах и болезнях сходится в этом регионе (Bernstein & Koh, 2007; Yamamoto, 2007), и известно, что CeA играет важную роль во многих аспектах обучения и выражения вкусовых отвращений (Lamprecht and Dudai, 2000; Yamamoto, 2007).Однако, если ассоциативно активируемая память вкуса спровоцировала эти аспекты обработки вкуса, мы бы наблюдали различную активность СеА в условиях Поддержания и Обесценивания. Во-вторых, повреждения CeA не влияют на эффективность девальвации (Hatfield et al., 1996). В-третьих, функция CeA имеет решающее значение для приобретения условных OR, которые при других обстоятельствах, как обнаружили Холланд и Штрауб (1979), относительно нечувствительны к девальвации за счет сочетаний пищи и LiCl. Взятые вместе, эти последние два наблюдения предполагают сходные доказательства, которые связывают различия в чувствительности условных ОР и связанных с пищей CR к процедурам девальвации на основе LiCl (Holland & Straub, 1979) с различиями в мозговых цепях, поддерживающих эти выученные реакции.Различия в рабочих характеристиках этих систем могут определять дифференциальную чувствительность разных поведенческих систем к параметрам девальвации.

Эти нейросистемные исследования девальвации и связанных с ней явлений проясняют, что вопросы содержания обучения являются сложными. Даже в очевидно простых поведенческих системах, таких как рефлекс моргания, возможности для пластических изменений имеются в изобилии в нервных системах, которые их обслуживают. Последствия экспериментальных манипуляций со стимулами окружающей среды для обучения могут значительно различаться в зависимости от этих систем и их компонентов.Становится все труднее различать ассоциации S-S и S-R с какой-либо уверенностью на основе какого-либо одного поведенческого анализа или аспекта нейронной обработки. Характеристика множественных поведенческих и нейронных последствий вариаций в процедурах ассоциативного обучения должна привести к более богатым, хотя, возможно, менее понятным описаниям природы обучения.

Выводы

В контексте ассоциаций S-S и S-R в обучении маятник решительно качнулся в когнитивную сторону со времен Спенса.В настоящее время существует множество демонстраций кодирования детализированных сенсорных аспектов подкреплений с помощью CS из ряда поведенческих парадигм, включая сенсорное предварительное кондиционирование, девальвацию подкрепления, опосредованное обучение и другие. Возможно, из-за этого множества примеров приобретение ассоциаций S-R редко непосредственно исследуется. Ассоциация S-S стала стандартом по умолчанию, и отсутствие доказательств для нее больше не используется в качестве доказательства для ассоциаций S-R, как это было раньше. Например, хотя эффекты девальвации часто незначительны, преобладающее мнение, по-видимому, состоит в том, что остаточная реакция после девальвации отражает неадекватность процедуры девальвации, а не обучение S-R.Это мнение может быть необоснованным. Существует множество примеров неудачной девальвации, и примечательно, что некоторые из множества поражений мозга, которые ухудшают эффективность девальвации, приводят к общему снижению измеряемых CR. Вместо этого животные с такими поражениями работают на нормальном уровне до девальвации, но не могут скорректировать свою реакцию вниз после девальвации. Таким образом, эти поражения, по-видимому, изменяют то, что извлекается из ассоциаций S-S и S-R, не затрагивая наиболее очевидные аспекты формы CR.Более того, из исследований нейронных систем ясно, что происходит пластичность ответа и что через ассоциативное обучение нейроны могут кодировать аспекты поведения, а также стимулы.

Что можно сказать о других 5 характеристиках Спенсом «когнитивных теорий обучения и теорий стимула-реакции»? С точки зрения метафоры , и телефонные коммутаторы, и диспетчерские на карте стали анахронизмами. Как и во времена Спенса, большинство современных количественных моделей обучения и поведения подчеркивают ассоциативные структуры, которые могут быть одинаково истолкованы как S-S или S-R.Широкое представление о задачах и результатах обучения и гибкость их использования в процессе работы широко считаются правилом, но, вероятно, они не лучше определены в рамках формальных моделей, чем карты прошлых лет.

Спенс, вероятно, поступил мудро, проигнорировав нейрофизиологизацию своего времени, потому что она имела мало оснований для изучения нервной системы. Нейрофизиологические характеристики обучения сегодня имеют гораздо более прочную основу, чем они были в 1950 году, и с гораздо большей вероятностью будут основаны на данных, чем на предположениях.Методы электрофизиологического перекодирования могут характеризовать нейронное кодирование различных видов информации, а функциональные анатомические методы могут использоваться для изучения основ изначально гипотетических сетей мозга, лежащих в основе аспектов ассоциативного обучения. Хотя многие современные редукционистские анализы обучения подчеркивают клеточные и молекулярные изменения, лежащие в основе обучения, эти анализы редко используются в качестве замены поведенческого анализа. Хотя я считаю, что лучший способ углубить наше понимание поведения — это изучить поведение, нейронный анализ часто может дать нам подсказки и подсказки о поведенческих процессах и организации.Возможно, что не менее важно, изучение нейронной основы обучения может связать изучение обучения с гораздо более широкой научной базой и сообществом.

В современных исследованиях в области обучения наш выбор переменных стимула гораздо более эклектичен, чем во времена Спенса, с теми же лабораториями, часто исследующими перцептивные, мотивационные и другие переменные, и в равной степени углубляясь в определение содержимого и условий из

обучение. Мы, по крайней мере, более восприимчивы к идее о том, что условия и содержание обучения не являются независимыми, и с большей вероятностью будем проводить программы, которые исследуют, например, условия, способствующие формированию обучения SS или SR, чем просто спрашивать: такое изучение СС или СР?

Обращаясь к состоянию теоретизирования в изучении обучения, Спенс (1950, стр.171) посетовал, что

«почти создается впечатление, что главная цель состоит в том, чтобы доказать ошибочность другой концепции, чем пытаться прийти к более всеобъемлющей интерпретации явления. Психологи, заинтересованные и высоко оценивающие роль теории в развитии совокупности научных знаний, должны противостоять таким искушениям… исключение всех теоретизаций, безусловно, не поможет ускорить приобретение совокупности научных знаний об обучении ».

Я думаю, будет справедливо сказать, что конфликт между когнитивной теорией обучения и теорией «стимул-реакция» в конечном итоге вышел за рамки этой ранней соревновательной фазы и стимулировал большие успехи в нашем понимании ассоциативного обучения.

Реакция на стимул — обзор

1.28.2.4 Обонятельная реверсия у нематод

Если организация поведения стимул-реакция была особой эволюционной адаптацией, например, эволюционировала для ускорения выбора действий в предсказуемых ситуациях, возможно, можно найти примеры их в животной модели, где у нас есть указание на то, что эволюция, возможно, упростила пути от стимулов к ответам. Одним из наиболее хорошо изученных генетических модельных организмов и пока что единственным взрослым животным с полным коннектомом нервной системы является нематодный червь Caenorhabditis elegans с его 302 нейронами.В коннектоме C. elegans преобладают прямые связи от сенсорных нейронов к моторным нейронам (Qian et al., 2011), поэтому, возможно, нервная система этой нематоды является многообещающим кандидатом для поиска «ответов» в буквальном смысле слова. слово.

Одно хорошо охарактеризованное поведение этой нематоды — обратное поведение. Это происходит всякий раз, когда животное сталкивается с неприятными раздражителями, такими как определенные запахи. Схема, управляющая этим поведением, может быть описана всего с 4 нейронами, их 44 химическими связями и их электрическими синапсами.Центральным компонентом системы является нейрон, называемый AVA. Когда АВА активна, животное меняет свой курс. Сенсорный ввод в этот нейрон обеспечивается обонятельным нейроном AWC. Например, если AWC стимулируется привлекательным запахом, он перестает активироваться, так что AVA теряет возбуждающий сигнал и также перестает активироваться, что снижает вероятность реверсирования. И наоборот, активация AWC экспериментально или с неприятным запахом увеличивает вероятность реверсирования путем синаптической активации AVA (Gordus et al., 2015). В эту цепь вовлечены два дополнительных нейрона, AIB и RIM, и характеристика их роли в цепи является критической для понимания организации обонятельно-опосредованного обратного поведения у C. elegans .

Первое интересное наблюдение из связности схемы — то, что существует больше соединений от сенсорного нейрона AWC к интернейрону AIB, чем к нейрону разворота AVA. Это неожиданно, если бы основная функция нервной системы заключалась в передаче сенсорной информации двигательным центрам.Визуализация этой цепи у иммобилизованных червей в отсутствие каких-либо стимулов выявляет сложный паттерн коррелированной активности всех нейронов. Интересно, что нейроны демонстрируют своего рода бинарное состояние активности, которое по большей части либо включено (нейрон активен), либо выключено (нейрон неактивен). Количественно оценивая колебания активности в этой цепи, можно обнаружить, что существует три основных состояния (из восьми теоретически возможных), в которых она обычно находится: чуть более 60% времени, когда система находится в состоянии «все включено», примерно 20% — в состоянии «все включено». «Все выключено», а для оставшихся 20% он находится в состоянии «только AIB включен».Это наблюдение приводит к двум выводам: во-первых, даже без какой-либо стимуляции эта сетевая динамика может генерировать спонтанные развороты, не требуя каких-либо сенсорных входов. Во-вторых, каждый обонятельный стимул, достигающий AWC, будет взаимодействовать с состоянием, в котором сейчас находится контур, вместо того, чтобы приходить в неподвижный контур и запускать некоторую нейронную активность, которой раньше не было. Поведенческим следствием этого взаимодействия является не только возникновение спонтанных поворотов, но и возникновение «спонтанных» необращений в присутствии неприятного запаха.Другими словами, схема обращения является вероятностной, и без наблюдения за нервной системой червя невозможно сказать, насколько спонтанно наблюдаемое поведение на самом деле.

Экспериментальное отключение звука одного или обоих интернейронов в этой цепи показывает, что роль AIB и RIM заключается в увеличении вариабельности реверсивной цепи. В то время как вход в схему от обонятельного нейрона AWC всегда очень точен и предсказуем, если, например, присутствует запах, активность реверсивного контура всегда значительно меняется, и эта изменчивость уменьшается, если AIB, RIM или оба отключены ( Gordus et al., 2015). Это открытие является прекрасным аргументом в пользу включения RIM и AIB в схему разворота специально для внесения столь необходимой изменчивости в схему разворота, которая иначе неадекватно детерминированная. Удивительно, но даже при том, что соединения с прямой связью доминируют над связностью также в этой маленькой цепи, изменчивость, обеспечиваемая соединениями обратной связи, доминирует над адаптивной особенностью поведения, его изменчивостью. Эта работа добавляет C. elegans к растущему списку животных, нервная система которых устроена так, что текущая активность просто модулируется внешними стимулами.В случае с нематодой оказывается, что из четырех нейронов, включенных в эту цепь, два существуют с единственной целью смягчить эффекты, которые стимулы оказывают на поведение животного, чтобы сделать животное более автономным по отношению к окружающей среде. Если животное, имеющее всего 302 нейрона, которые, как и все другие животные, составляют наиболее энергетически затратную ткань, выделяет 50% цепи для противодействия влиянию связей «стимул-ответ» в своей нервной системе, то последствия этого открытия ведь организацию поведения животных вообще нельзя недооценивать.

Таким образом, вопреки идее о том, что коннектом, в котором преобладают прямые связи от сенсорных к моторным областям, подразумевает, что он в основном вычисляет моторный выход из сенсорных входов, также нервная система C. elegans лучше всего характеризуется постоянно меняющейся, продолжающейся активностью. , как и многие другие нервные системы, ранее изученные в этом отношении. Кажется, что даже численно небольшая составляющая обратной связи вносит фундаментальный вклад в общую архитектуру даже таких сетей, в которых преобладает прямая связь.Что это означает для мозга, например, у млекопитающих, в нейроанатомии которых, по-видимому, преобладают петли обратной связи?

Стимул-реакция Медицинское определение | Медицинский словарь Merriam-Webster

: относящиеся к стимулу или являющиеся реакцией на него. также : , представляющая деятельность организма, состоящую из таких реакций. стимул-реакция психология

Стимул — реакция, теории, смысл и энергия

Термин «стимул» имеет много значений; в общем, это любое событие (будь то внешнее событие, что-либо воспринимаемое или мысленное), вызывающее обнаруживаемую реакцию.Стимул часто используется с уточняющими терминами для дальнейшего уточнения его значения, например, условный раздражитель и нейтральный раздражитель.

В различных областях обучения термин «стимул» используется по-разному. В психологии он чаще всего используется для описания форм энергии, , которые достигают органов чувств и вызывают реакцию. Например, зрение с помощью глаз реагирует на световое излучение или свет . Поскольку человеческие органы чувств реагируют на ограниченное количество форм энергии, и даже тогда только на ограниченное количество этой энергии, некоторая энергия, достигающая органов чувств, не обнаруживается и не вызывает реакции.Энергия, достигающая органов чувств, но не вызывающая реакции, может считаться стимулом для физиолога, но для психологов она не будет считаться стимулом, если на нее не отреагировал или не обнаружил организм . Стимул также может быть внутренним психическим событием, вызывающим реакцию.

«Стимул» — это основной термин в теории «стимул-реакция», который относится к ряду изучающих теорий, которые теоретически основаны на условных связях или ассоциациях между стимулом и реакцией.Ассоциативные связи образуются путем повторного сочетания определенных стимулов и определенных реакций. Большинство этих теорий также являются бихевиористскими в том смысле, что они сосредотачиваются на поведении и не рассматривают психические процессы, и они рассматривают окружающую среду как наиболее важный детерминант человеческого поведения . Действительно, эти теории рассматривают связь между стимулом и реакцией как основу поведения и полагают, что основная цель психологии должна заключаться в обнаружении правил, регулирующих взаимодействие стимулов и реакций.Две доминирующие теории «стимул-реакция» — это классическая и оперантная теории, обусловливающие .

Книги

Аткинсон, Р.Л., Р.С. Аткинсон, Э.Е. Смит и Д.Дж. Бэм. Введение в психологию. 10-е изд. Нью-Йорк: Харкорт Брейс Йованович, 1990.

Масин, С.С., изд. Основы теории восприятия. New York: Elvesier Science, 1993.

Селективное связывание признаков стимула, ответа и эффекта

Мы адаптировали парадигму из Moeller, Pfister, Kunde, and Frings (2016) для изучения связывания как свойств стимула, так и эффекта.Участники выполняли простые ответы на нажатие клавиш в присутствии отвлекающего стимула, и каждый ответ производил эффект. Экспериментальные планы для захвата SR- или RE-связывания происходят из разных исследовательских традиций, поэтому их парадигмы немного отличаются, что приводит к различным зависимым переменным. Обе парадигмы включают два ответа и предполагают интеграцию характеристик при первом (первичном) ответе и извлечение при втором (зондовом) ответе, измеряя эффекты связывания в тестовом ответе.В парадигмах связывания SR все ответы обычно являются принудительным выбором, а эффекты связывания измеряются с помощью разницы во времени ответа (RT). Здесь связывание оценивается по облегчению повторений ответа (по сравнению с изменениями ответа), когда стимул повторяется, а не изменяется. Критическим ответом в парадигмах RE-связывания обычно является свободный выбор, и связывание измеряется в различиях в процентах повторений ответа от прайма к зонду (за исключением см. Herwig & Waszak, 2012). Footnote 1 Здесь более высокие частоты повторения ответа для повторения эффекта по сравнению с изменениями эффекта указывают на связывание.Чтобы учесть обе традиции и любой аспект эффектов связывания, которые могут преимущественно влиять на любую зависимую переменную, мы включили два экспериментальных блока: один адаптирует парадигму RE к полному случаю SRE, а другой — парадигму SR (см. Moeller, Pfister, и др., 2016).

Метод

Проект

RE-block: Дизайн включал в себя два внутрисубъектных фактора: отношение стимула (повторение против изменения) и отношение эффекта (повторение против изменения).менять).

SR-блок: Дизайн включал три внутрисубъектных фактора: отношение отклика (повторение против изменения), отношение стимула (повторение против изменения) и отношение эффекта (повторение против изменения).

Участники

В эксперименте приняли участие 32 студента (26 женщин) из Университета Трира. Их средний возраст составлял 20 лет (от 18 до 52 лет). Все участники получили зачетные единицы курса.Такой размер выборки обеспечивал степень 1-β> 0,99 для обнаружения эффектов поиска в процедуре RE (при условии, что d z ≥ 0,98, как указано для Exp.1 в Moeller, Pfister, et al., 2016 , и двусторонний тест) и степень 1-β = 0,80 для наименьшего размера эффекта, указанного для SR-процедуры ( d z = 0,51 для Exp. 2 в Moeller, Pfister, et al. ., 2016). Величину эффекта для связывания SE нельзя оценить из литературы, хотя кажется правдоподобным предположить такую ​​же величину, что и для связывания SR и RE, если такие связывания должны были быть созданы.Использование среднего размера эффекта для каждой экспериментальной процедуры в предыдущем исследовании предполагает степень 1-β> 0,99 для процедуры RE и степень 1-β = 0,87 для процедуры SR.

Материалы

Эксперимент проводился с использованием E-prime 2.0. Инструкции и целевые стимулы отображались черным цветом на белом фоне на стандартном TFT-экране. Целями были буквы D, F, J и K. Они имели горизонтальный угол обзора 0.8–1,1 ° и вертикальный угол обзора 0,9–1,0 °. Визуальные (дополнительные) стимулы и эффекты представляли собой цветные прямоугольники (красный, желтый, синий или зеленый), которые располагались по центру экрана и охватывали горизонтальный угол обзора 2,2 ° и вертикальный угол обзора 1,4 °. Слуховые стимулы и эффекты представляли собой два синусоидальных звука длительностью 300 мс и 80 дБ с частотой 400 и 800 Гц соответственно. Расстояние просмотра составляло примерно 60 см.

Процедура

участников прошли индивидуальное тестирование в звукоизолированных камерах.Инструкции были даны на экране. Участники поместили левый указательный палец на клавишу F, а правый указательный палец на клавишу J стандартной клавиатуры QWERTZ. Буквы D и F были сопоставлены с одной клавишей, а буквы J и K — с другой. Стимулы и эффекты могли возникать как в зрительной, так и в слуховой модальности, и модальности (зрительная / слуховая и слуховая / визуальная) были сбалансированы для всех участников. Каждый участник выполнил два экспериментальных блока, которые немного различались по зондовой задаче.Один блок следовал типичной процедуре, используемой для изучения связывания SR в прошлом. Другой блок следовал процедуре, которая использовалась для изучения связывания RE. Мы будем называть их SR-процедурой (SR-блок) и RE-процедурой (RE-блок). В блоке SR задача участников всегда заключалась в том, чтобы классифицировать целевую букву, которая была представлена ​​в центре дисплея, путем нажатия клавиши соответствующим пальцем и игнорирования любого звука или цветного прямоугольника, которые могут быть представлены как дополнительный стимул одновременно с цель или как эффект ответа.В зависимости от условий каждая основная цель сопровождалась цветным прямоугольником или звуком. Выполнение основного ответа сопровождалось эффектом другой модальности, соответственно (то есть звуком или цветным прямоугольником). Затем цель зонда сопровождалась цветным прямоугольником и звуком. В RE-блоке цель (сопровождаемая дополнительным стимулом и сопровождаемая эффектом) была представлена ​​только в штрихе. Дисплей зонда включал три восклицательных знака черного цвета, которые сопровождались звуком, и цветной прямоугольник.Участники были проинструктированы нажимать любую клавишу в ответ на эти стимулы. Им было предложено выбрать этот ключ ответа случайным образом, но попытаться использовать оба ключа примерно для одинакового количества испытаний на протяжении всего эксперимента.

В испытаниях с повторением стимула предыдущий звук / прямоугольник, который сопровождал первичную цель, повторялся при предъявлении зонда. В испытаниях изменения стимула и звук, и прямоугольник, представленные в зонде, отличались от дополнительного стимула, который был представлен вместе с основной целью.В испытаниях с повторением эффекта цветной прямоугольник / звук, который следовал за первичным ответом, был представлен в зонде, и в испытаниях на изменение эффекта ни звук, ни цвет прямоугольника в зонде не были представлены как эффект первичного ответа. Фактор Stimulus Relation (повторение против изменения) варьировался ортогонально к фактору Effect Relation (повторение против изменения).

Каждое испытание (см. Рис. 1) начиналось с отображения звездочки продолжительностью 2000 мс. Затем на 300 мс появлялись основная цель и дополнительный стимул.Каждый простой ответ запускал звук или прямоугольник с эффектом 300 мс. Через 500 мс после этого эффекта на 300 мс появился дисплей датчика, и участники ответили нажатием одной из клавиш ответа. Каждый блок состоял из 128 последовательностей первичного зондирования, и порядок блоков был уравновешен между участниками. Перед экспериментальными блоками участники отработали практический блок из 32 последовательностей первичного зондирования, в которых они получали обратную связь после каждого ответа. Перед началом второго экспериментального блока участники были ознакомлены с несколько иной процедурой в 16 практических испытаниях.

Рис. 1

Последовательность событий в одном испытании в блоке ответ-эффект (RE) (слева) и блоке «стимул-ответ» (SR) (справа) для различных модальностей стимула / эффекта (цвет / звук vs. звук / цвет). Стимулы нарисованы не в масштабе

Результаты

Повторная процедура

Чтобы обеспечить максимально чистый тест влияний связывания и поиска, мы решили удалить всех участников, которые сообщили об использовании стратегии или чьи данные предполагали использование стратегий принятия решений, из анализа RE-блока (для недавних доказательств влияния стратегий принятия решений в конструкции со свободным выбором, см. Vogel, Scherbaum, & Janczyk, 2018; Weller, Kunde & Pfister, 2017).Четыре участника сообщили, что использовали стратегии, а еще девять (а также три участника, сообщившие о стратегиях) повторили ответ от первичной пробы в более чем 90% или менее чем 10% испытаний, если либо стимул, либо эффект повторялись. что мы интерпретировали как убедительное указание на использование стратегии. Картина результатов была идентична, если бы все эти участники были включены. Сноска 2

Рассматривались только испытания с правильным ответом в прайме.Из-за этого ограничения 6,3% всех испытаний были отклонены. Участники использовали левую и правую клавиши для ответа на зонд примерно в половине испытаний каждое (47% нажатий левой и 53% правой клавиш). Эти ставки не отличались от случайности, t (18) = 1,01, p = 0,328, d = 0,24. То есть участникам удалось примерно одинаково часто следовать инструкции использовать оба ключа.

Нашей интересующей зависимой переменной была скорость, с которой участники повторяли свой ответ от начального до зондирующего.Средние проценты повторений см. В таблице 1. В 2 (отношение стимулов: повторение против изменения) × 2 (отношение эффектов: повторение против изменения) ANOVA с повторными измерениями на частоту повторения ответов, основные влияния взаимосвязи эффектов, F (1,18) = 7,93, p = 0,011, η p 2 = 0,31, и отношение стимулов, F (1,18) = 9,08, p =. 007, η p 2 = 0,34, были значимыми. Участники повторяли свой ответ чаще, если первичный эффект ответа снова проявлялся в пробе (31.0% повторений ответа), чем если бы звук / цвет, который был представлен как эффект в начальном значении, отличался в тесте (26,5% повторений ответа), и они повторяли свой ответ чаще, если бы дополнительный стимул в начальном значении снова был представлен в зонде ( 30,7% повторений ответа), чем если бы звук / цвет, который был представлен в качестве дополнительного стимула в начальном значении, отличался в тесте (26,8% повторений ответа). Очевидно, первичные ответы были объединены со стимулом, а также с эффектом.Важно отметить, что связь стимула и эффекта не взаимодействовала, F (1,18) <1, p = 0,760, η p 2 <0,01. То есть ответы были независимо интегрированы со стимулом и эффектом.

Таблица 1 Средний процент испытаний в блоке ответ-эффект, в которых участники повторили свой последний ответ, как функция отношения стимула и отношения эффекта; эти показатели составляют в общей сложности 57,5% повторений ответов

SR-процедура

Для анализа SR-блока для анализа RT-данных учитывались только испытания с правильными ответами в первичном и зондовом тестах.RT, которые были более чем на 1,5 интерквартильных диапазонов выше третьего квартиля распределения RT участника (Tukey, 1977), и те, которые были короче 200 мс, были исключены из анализа. Из-за этих ограничений 11,5% всех испытаний были отброшены (частота ошибок первичного анализа составляла 3,0%, а частота ошибок зонда после правильных простых чисел составляла 4,8%). Кроме того, испытания, в которых идентичная буква была представлена ​​в качестве цели в начальном и зондовом, были исключены из анализа. Footnote 3 Средние RT и частота ошибок показаны в таблице 2.

Таблица 2 Среднее время отклика в мс и средняя частота ошибок в% (в скобках) в блоке «стимул-ответ» как функция отношения отклика, отношения стимула и отношения эффекта

В 2 (отношение отклика: повторение против изменения) × 2 (отношение стимула: повторение против изменения) × 2 (отношение эффекта: повторение против изменения) ANOVA с повторными измерениями на RT, основное влияние отношения стимула было значительным , F (1,31) = 4,16, p =.050, η p 2 = 0,12. Участники отвечали быстрее, если дополнительный звуковой или цветной стимул от начального сигнала повторялся в пробе (M = 588 мс, SD = 95), чем если бы стимул изменялся с основного на пробный (M = 597 мс, SD = 109). Что еще более важно, взаимодействие отношения отклика и отношения стимула, F (1,31) = 20,52, p <0,001, η p 2 = 0,40, а также взаимодействие отношения отклика и соотношение эффектов, F (1,31) = 8.25, p = 0,007, η p 2 = 0,21, были значимыми, в то время как взаимодействие отношения стимула и отношения эффекта не было, F (1,31) <1, p = 0,382, η p 2 = 0,03 (см. Рис. 2). Кроме того, трехстороннее взаимодействие отношения отклика, отношения стимула и отношения эффекта, F (1,31) = 2,72, p = .109, η p 2 = 0,08, тоже не было значительным.То есть стимул и эффект не были интегрированы друг с другом, и их интеграция с ответом не зависела от отношения друг к другу, соответственно. Ни один из других эффектов не был значительным, F s <1.

Рис. 2

Связывающие эффекты в блоке стимул-ответ (SR). Эффекты связывания «стимул-ответ», «ответ-эффект» и «стимул-эффект» в мс рассчитываются как (RT Повторение ответа / изменение стимула — RT Повторение ответа / повторение стимула ) — (RT Изменение ответа / изменение стимула — RT Изменение ответа / повторение стимула ) исчезло в ходе испытаний повторения / изменения эффекта, как (RT Повторение ответа / изменение эффекта — RT повторение ответа / повторение эффекта ) — (RT изменение ответа / изменение эффекта — RT изменение ответа / Повторение эффекта ) коллапсировало при испытаниях повторения / изменения стимула, и как (RT Повторение стимула / Изменение эффекта — RT Повторение стимула / Повторение эффекта ) — (RT Изменение стимула / Изменение эффекта — RT Изменение стимула / Effect Repetition ) рухнул из-за попыток повторения / изменения ответа.Планки погрешностей указывают стандартные ошибки средних значений. * р <0,01

В том же анализе частоты ошибок картина была идентична, но только основное влияние оказывала связь стимула, F (1,31) = 3,77, p = 0,061, η p 2 =. 11 и взаимодействие отношения отклика и отношения эффекта, F (1,31) = 3,37, p = 0,076, η p 2 = 0,10, были близки к значимости.Ни один из других эффектов не достиг значимости, все F s <2,3, p s> 0,14, η p 2 <0,07.

Стимул-реакция совместимости и эффект Саймона

Следующая часть этого урока предназначена только для продвинутого использования. Нет сложно, но не обязательно для понимания основ.

Вы можете скачать все файлы и запустить пробную версию эксперимент. Затем убедитесь, что вы установили файл данных на имя вашего файл данных и проанализировать.Вы, вероятно, обнаружите, что отвечаете на в среднем менее чем за 500 мс, и что вы примерно на 30 мс быстрее в ответ совместим, чем в ответ несовместимых испытаний

В R введите следующее:

> источник ("rtplot.r")
> источник ("errorplot.r") 

На рисунке ниже вы видите анализ данных примера с 200 испытания. На левой панели вы видите среднее время ответа и стандартные ошибки для четырех условий этого эксперимента. в на правой панели вы видите то же самое для частоты ошибок.Вы видите, что красные линии (несовместимые данные) выше для обоих времен ответа и данные об ошибках, означающие, что участник был медленнее и меньше точен в этом состоянии. Вы также видите, что участник выполняется по-разному левой и правой рукой.

Помимо этих средних и стандартных ошибок, у вас могут быть другие вопросы по производительности. Например, это могло быть так что участник был очень мотивирован в первой половине экспериментировал, но потом устал и наделал много ошибок.Такого рода проблему трудно увидеть, если вы просто посмотрите на средние значения условия. Что действительно следует делать при анализе данных любого Эксперимент заключается в построении всех точек данных.

Ниже вы видите время отклика для всех испытаний в том порядке, в котором Были проведены испытания. Красные точки обозначают испытания, в которых была обнаружена ошибка. сделал. Черная горизонтальная линия указывает средний грант, а синяя линия — локальное среднее значение (с использованием Фильтр Лоуесса).

Эти данные теперь не разделяются по условию.Теперь основное внимание уделяется тому, чтобы увидеть не изменил ли участник внезапно свою скорость или уровень точности. Вы можете видеть, что RT довольно часто поднимаются и опускаются, но что с течением времени кардинальных изменений не происходит. Это нормально случайное изменение, общий для любой биологической переменной.

В R введите следующее:

.

About the Author

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Related Posts