Специфика перцептивного образа в ряду других видов образов: Виды образных явлений. — Ответы к экзамену по дисциплине «Общая психология»

Содержание

Виды образных явлений. — Ответы к экзамену по дисциплине «Общая психология»

Краткий обзор основных свойств образов восприятия будет неполным, если мы не охарактеризуем другие виды образов. Такое сравнение поможет еще точнее понять специфику перцептивного образа в ряду других. Вслед за американским психологом Р.Холтом и другими авторами представим следующую номенклатуру образов. Давая определение понятию «образ», Р.Холт1 подчеркивал, что это обобщающий термин для осознанных представлений, имеющих квазисенсорный, но не перцептивный характер.

Другие авторы дают в целом похожие определения, выделяя в качестве основной характеристики то, что образ — это чувственная форма психических явлений, однако их содержание может иметь не только чувственную основу

Мысленные образы — образы памяти и воображения. Их основная характеристика состоит в том, что, несмотря на возможную ясность1 и отнесенность к определенной модальности, они лишены чувственной основы.

Образы памяти возникают в отсутствие относящихся к ним объектов и являются следом прошлых восприятий, имевших под собой конкретную чувственную основу. Они менее реальны, менее конкретны, более обобщены и схематизированы по сравнению с образами восприятия. Основоположник бихевиоризма Джон Уотсон (J.Wotson, 1878—1958) называл образы памяти «призраками ощущений». После длительного и однообразного восприятия каких-либо объектов могут возникать особенно яркие образы памяти — так называемые персеверирующие образы, характерные навязчивостью и высокой степенью реальности. Один известный московский психолог рассказывал, что после первого дня работы в летнем студенческом строительном отряде в качестве помощника каменщика он, засыпая, в мельчайших деталях представлял

каждый поданный им мастеру кирпич. К ряду очень ярких образов памяти, которые настолько фотографически точны и «живы», что почти реально воспринимаются, многие современные когнитивные психологи относят так называемые

«воспоминания-вспышки». Как пишет У.Найссер, «это субъективно непреодолимое возникающее в памяти человека воспроизведение какого-либо случая, о котором субъект некогда узнал как о важной новости» . Например, многие испытуемые, описывая подобные воспоминания спустя 13 лет, в мельчайших деталях воспроизводили то, что с ними происходило в момент потрясшего их известия об убийстве в Далласе президента США Джона Кеннеди.

Образ воображения — нереальное, вымышленное представление, образ, никогда не соответствовавший реальности и поэтому не имевший конкретной чувственной основы. Этот образ является результатом переработки, синтеза всего предшествующего опыта субъекта, некое образное конструирование субъективной реальности. Для образа воображения характерны целостность и обобщенность чувственного представления предмета, события или явления, его субъективная осмысленность и даже эмоциональная окрашенность.

Самый простой вид образов — фосфены. Они представляют собой локализованные на сетчатке и не имеющие предметного характера световые ощущения в виде отдельных точек, пятен или узоров. Фосфены могут появляться при механическом или электрическом раздражении глаза или других отделов зрительного анализатора. Фосфены как нельзя лучше характеризуют известный в истории психологии принцип специфических энергий органов чувств немецкого физиолога И.Мюллера, который гласит, что качество ощущения определяется лишь присущей каждому органу чувств энергией, и, следовательно, независимо от характера стимульного воздействия, соответствующее раздражение каждого чувствительного нерва будет вызывать только один вид ощущения (в нашем случае — зрительного).

Для полноты изложения упомянем еще раз

синестезии — стойкие и определенные чувственные переживания (в одной модальности), которые сопровождают наши образы восприятия в иной модальности. В добавление к тому, что было сказано выше, при классификации ощущений укажем, что синестезии могут выражаться не только в появлении простых сенсорных качеств, но и в образном представлении определенных чисел или геометрических фигур, закономерно связанных, например, с именами знакомых

Внимание!

Если вам нужна помощь в написании работы, то рекомендуем обратиться к профессионалам. Более 70 000 авторов готовы помочь вам прямо сейчас. Бесплатные корректировки и доработки. Узнайте стоимость своей работы.

людей. Имеются результаты исследований, в которых были обнаружены синестезии в виде цветовых образов, соответствовавших предъявлявшимся на экране монитора цифрам. От перцептивных образов синестезии отличаются прежде всего тем, что эти образы не вынесены во вне, не сопровождаются чувством предметной реальности.

Схема, или образ, тела — представление о собственном теле, пространственном расположении его частей и его ближайшем окружении в любой момент времени посредством кинестетических и температурно-тактильных переживаний. В нормальных условиях у здоровых людей — это сенсорная часть обычных представлений о самом себе, которые, как правило, актуально не представлены в сознании. При потере тактильной или проприоцептивной чувствительности, при психиатрических расстройствах, в условиях сенсорной депривации или под действием наркотических веществ могут наблюдаться симптомы потери чувства реальности собственного существования, сопровождающиеся нарушением схемы тела или искаженными представлениями о расположении его частей и пропорций.

От образа восприятия образ тела отличается меньшей осознанностью, отсутствием объективированности, т.е. переживания реальности, вынесенной во вне. Образ тела может возникнуть у нас и вполне произвольно, в форме мысленного представления, например, когда мы проигрываем в уме процесс выполнения некоторого нового действия. Как отмечает М.Хоровитц, в измененных состояниях сознания происходят характерные переживания собственного тела: чувство выхода из своего тела, вдение его на расстоянии. В состоянии сильной усталости, токсикоза или при органической патологии головного мозга наблюдается так называемый аутоскопический феномен, или феномен «двойника», — яркий зрительный образ собственного тела, видимый как бы со стороны.

Фантомный образ связан с появлением ощущений в ампутированной части тела. Это один из вариантов нарушения образ тела. Характеризуется возникновением навязчивых ощущений зуда, боли, анемии, субъективно локализованных в удаленной конечности, уверенностью в возможности ее использовать.

У взрослых людей после ампутации конечностей почти всегда появляются фантомные образы, у детей данный феномен встречается реже. Американский психолог Д.Кац писал о характерном самонаблюдении человека с ампутированной рукой: «Если ампутированный подходит вплотную к стене, ему кажется, что фантомная рука проходит через стену, т.е. для него перестает действовать закон непроницаемости вещества» . Подобные примеры приводили А.Н. Леонтьев и А.В. Запорожец в своей работе по восстановлению движений у раненых минеров. Эти чувственные (по форме) представления могут быть временными и хроническими.

В работе М.Симмел было показано, что фантомный образ может быть продолжением действия сформированной ранее схемы тела, т.е. это феномен неполной перцептивной адаптации человека к новым условиям. Иногда фантомные образы сопровождаются так называемыми фантомными болями в отсутствующих конечностях, которые связаны с раздражением подкорковых структур головного мозга. Сравнивая фантомный образ с образом восприятия, следует отметить, что при всей реальности для человека у него нет адекватной сенсорной основы — это образ реально не существующего объекта.

Последовательный образ — специфическое ощущение, возникающее сразу после прекращения действия раздражителя. Например, если в течение 10—20 с смотреть на ярко освещенный предмет (или просто пятно света), а затем закрыть глаза, то возникнет такой же яркий, положительный последовательный образ, повторяющий форму исходного предмета. Если глаза не закрывать, а перевести взор на лист белой бумаги, то на этом фоне возникнет отрицательный последовательный образ, более темный, чем сама бумага. Интенсивность и длительность отрицательного послеобраза прямо зависят от яркости, контраста и длительности исходного стимула. Для ярких цветных раздражителей последовательный образ окрашивается в дополнительные цвета: красный — зеленый, синий — желтый. Если послеобраз возникает в темноте, то при движениях глаз он перемещается вместе с ними. Воспринимаемый размер послеобраза на светлом экране прямо пропорционален расстоянию до поверхности экрана. Эта феноменальная закономерность получила название закона Эммерта по имени немецкого психолога Ф.

Эммерта. Хотя последовательный образ лишь тень, отражение образа реального предмета, он обладает внешней объективированностью. Палиопсия — редко встречающийся тип послеобразов, возникающий при органических поражениях головного мозга или под действием галлюциногенных препаратов. Палиопсия характеризуется сохранением только что воспринятого образа какого-либо предмета после того, как взор отведен в сторону. Например, один из испытуемых М.Хоровитца зарисовал свои зрительные впечатления при перемещении взгляда слева направо, возникшие у него после приема гашиша, в виде ряда последовательных профилей лица своего товарища, на которое он смотрел; когда же взгляд перемещался сверху вниз, удваивались только глаза.

Эйдетический образ — как правило проецированный вовне зрительный образ-представление, образ памяти, обладающий ясностью, красочностью и высокой детальностью, сопровождается чувством реальности, очень похожим на обычное восприятие. Л.С.Выготский писал, что человек, обнаруживающий эйдетические способности, может «видеть в буквальном смысле этого слова на пустом экране отсутствующую картину или предмет, который перед тем находился перед его глазами» .

В большей степени эйдетические образы характерны для детей, нежели для взрослых. Длительность таких образов редко превышает 1 мин, хотя описаны случаи, когда они продолжались 10 мин. Немецкий психолог Эрих Йенш описал два вида таких образов: 1) похожий на растянутый во времени последовательный образ, как правило, с дополнительными к оригиналу цветами; он отличается слабостью произвольного контроля и получил название Т-типа; 2) как бы усиленные (яркие, живые) образы памяти, отличающиеся возможностью произвольного контроля, получили название В-типа.

Особый вид образов представляют собой галлюцинации, определяемые как ложное восприятие отсутствующего предмета или его признаков, субъективно признаваемое за реальное восприятие. Галлюцинаторные образы возникают, как правило, при различных психических расстройствах, в стрессовых ситуациях, во время длительной сенсорной изоляции, в условиях депривации сна или после приема особых веществ — галлюциногенов (ЛСД, гашиш, атропин, амфетамины и др. ). Для этих образных явлений характерна убежденность человека в реальности переживаемого образа. Некоторыми учеными обычное сновидение также рассматривается как нормальная галлюцинация во время сна.

Характерные образные феномены могут иногда появляться при засыпании или в момент пробуждения ото сна, т.е. в измененных состояниях сознания. Гипногогический образ (или галлюцинация) — ясное, детальное и отчетливое проецируемое вовне представление, появляющееся в период засыпания. То же в период пробуждения — гипнопомпический образ.

Иногда психиатрическим больным, страдающим шизофренией, кажется, что яркое и реальное чувственное впечатление возникает по причине проецирования образов прямо к ним в сознание извне с помощью «специальных лучей» или «дистанционного воздействия» спецслужб, такие галлюцинации характеризуются чувством навязанности и получили название псевдогаллюцинации.

Среди образов-галлюцинаций выделяют особенно нереальные образы или паранормальные галлюцинации: представление приведения, духа или призрака (живущих или умерших людей), различного рода религиозные и мистические видения. В истории культуры известны разнообразные религиозные церемонии, в ходе которых паранормальные галлюцинации специально вызывались природными галлюциногенами. Галлюцинации обладают всеми основными свойствами перцептивного образа, у них нет лишь одного — реальной сенсорной основы.

Особый вид образов может возникать в ходе специально организованной экспериментальной процедуры, называемой сенсорным обусловливанием. В ходе этой процедуры экспериментально формируется чувственное переживание (безусловный образ), возникающее под действием условного стимула. Механизм такого формирования достаточно прост: в ряду проб появление некого стимула, вызывающего соответствующий образ, сочетается во времени с предъявлением условного стимула. После ряда подобных сочетаний, которые лучше всего проводить, когда испытуемый находится в состоянии легкого транса или гипноза, образ безусловного стимула появляется после предъявления одного лишь условного стимула и переживается человеком как вполне реальный. Иногда феномен сенсорного обусловливания называют экспериментальной галлюцинацией.

Поможем написать любую работу на аналогичную тему

Получить выполненную работу или консультацию специалиста по вашему учебному проекту

Узнать стоимость

Виды образных явлений. Специфика перцептивного образа в ряду других видов образов.

1. Последовательный образ (послеобраз).Человек долго смотрит на ярко освещенный объект, затем переводит взгляд на пустой экран, либо закрывает глаза. В этот момент и возникает образ ранее рассматриваемого объекта, который называется последовательным образом. Последовательный образ может быть положительным или отрицательным.

Положительный по своим цветовым характеристикам полностью соответствует предшествующему ему образу восприятия. Если послеобраз приобретает дополнительный цвет, он называется отрицательным.

Дополнительный цвет — это такой цвет, который, смешиваясь с основным, дает ощущение белого цвета. Например, у человека — дополнительным к синему, будет желтый цвет. Если человек смотрел на синий по цвету объект, а появился этот же объект желтого цвета, то это будет отрицательно последовательный образ.

Закон, описанный немецким психологом М.Эммертом – наличие прямопропорциональной зависимости между величиной последовательного образа, спроецированного на определенную фронтально расположенную поверхность и расстоянием до этой поверхности.

Предположим, у человека создали последовательный

образ, который он проецирует на фронтально располо-

женный экран, стену.

Этот человек отходит на расстояние 1 м, затем на 2 м.

В результате, послеобраз, спроецированный на этот экран

увеличивается в два раза.

 

2. Фосфен – может возникать вследствие самопроизвольных возбуждений рецепторов сетчатки.

Если оказаться в полной темноте, то можно наблюдать некие вспышки света (искрами), которые возникают перед нами.

Фосфенами называются образы, которые возникают при возбуждении рецепторов глаза или других отделов зрительного анализатора при воздействии неспецифических раздражителей (не световой образ).

Например: если пальцем надавить на глазное яблоко, стукнуть по глазу – «искры из глаз». При надавливании на глаз возникает образ, напоминающий шахматную доску. Если раздражать зрительный нерв электрическим током, возникают образы-фосфены в виде определенных линий или простых геометрических фигур. У.Пенфилд – канадский хирург описывал фосфены при раздражении определенных участков зрительной коры – возникали не геометрические фигуры, а целые сцены, имевшие место в реальной жизни человека.

3. Фантом– образ отсутствующей конечности, возникающий после ее ампутации.

У больных, которые перенесли ампутацию конечностей, например, руки, наблюдается очень яркий и живой образ реально существующей руки, люди даже пытаются совершать какие-то действия отсутствующей рукой.

4. Эйдетический образ (его часто называют фотографическим образом, но ведутся споры) – это образ памяти, в котором во всех подробностях и деталях запечатлены реальные объекты, события и ситуации прошлого. Встречается лишь у 5% населения.

Этот образ ярко выражен у людей, которых в обыденной жизни называют мнемонистами, люди, которые зарабатывают себе на жизнь, демонстрируя свои выдающиеся способности памяти. Исследования психологов указывают, что именно эта способность к эйдетизму позволяет этим людям запоминать и сохранять в памяти гораздо больше информации, чем это свойственно обычным людям. Например: человеку предъявляется матрица – 10х10=100 клеточек, которые заполнены разными цифрами – он на нее смотрит несколько секунд, потом отворачивается и воспроизводит эту матрицу уже по памяти, с точностью до мельчайших штрихов, которыми она была нарисована. Когда просят назвать цифру на пересечении второй строки и второго столбца – они с легкостью это делают.

Эти образы очень сходны по условиям возникновения с последовательными образами. Но по своим свойствам, они отличаются:

· эйдетические образы бывают только положительными, у них нет обращения по цвету и превращения в отрицательный образ;

·· эти образы могут вызываться через гораздо больший промежуток времени. А.Р.Лурия в своих экспериментах описал случай, когда профессиональный мнемонист мог воспроизвести какой-то список слов, который ему диктовали много лет назад;

··· эйдетические образы можно произвольно изменять, чего нельзя сделать с послеобразами.

Лурия описал забавный случай – мнемонист мог вызвать образ матрицы, а потом в образе взять мокрую тряпку и стереть этот образ с доски. Эта техника помогала ему забывать эти многочисленные матрицы, с которыми он работал, чтобы избежать ошибок, не дай бог вспомнится какая-то матрица, предъявленная вчера.

5. Галлюцинации – возникают в отсутствие специфической стимуляции органов чувств, но при этом человеком воспринимаются очень живо и ярко, так как будто эти образы есть реальные объекты, и нет такой силы, которая могла бы человека в этом разубедить. Специфика галлюцинаций и состоит в том, что они переживаются, как образы реально существующих объектов. В основном они возникают при психических болезнях. Исследования психологов говорят о том, что галлюцинации можно вызвать искусственным путем, но все-таки они будут немножко другими. Часто используют ЛСД, нискалин – нискалиновые галлюцинации. В США эта техника вызывания искусственных образов используется в практике обучения психиатров. Чтобы человек, который общается с больными, понимал мир, который открывается в их сознании в результате галлюцинаций.

6. Псевдогаллюцинации– галлюцинации, но не совсем. Человек слышит голоса, видит образы, но вместе с тем сознает, что эти голоса звучат у него в голове.

7. Иллюзия – возникает, когда стимул искажается.

8. Синестезия — сопутствующие образы,часто встречаются в жизни человека, но мы об этом не знаем, например цветной слух. При неком воздействии на органы чувств, например на рецепторы глаза, у нас должен возникнуть зрительный образ, но наряду со зрительным образом у нас возникают сопутствующие образы, образы другой модальности. Наиболее известны в литературе – образы, которые возникают при слуховом восприятии. Хотя многие психологи говорят, что синестезии наблюдаются в самых разных модальностях. Такого рода смешение образов фиксируется в обыденном языке, мы часто говорим такие слова: теплый цвет. Вероятно, за этими фразами стоит реальность, иначе их бы не появилось в языке. Как утверждают люди, занимающиеся исследованиями синестезий, что это обыденные явления. Но что бы это проверить, нужно разлагать свои образы на составные части, как это делал Вундт.

8. Образы, связанные с нашими сновидениями.Традиционные образы сновидения, которые возникают в состоянии сна:

гипнагогический образ – когда мы засыпаем, дремотное состояние, предшествующее сну;

гипнопомпический образ – перед пробуждением. Может быть зрительным или слуховым, иногда бывает и в других модальностях.

9. Сенсорное обуславливание – галлюцинация, вызванная экспериментально с помощью стимулов разных модальностей. Особенно эффективно при гипнозе.

Необходимо заметить, что во всех этих образах нет реального стимула, т.е. дистального. Главное и принципиальное отличие перцептивного образа – в том, что только в перцептивном образе есть реальный объект, т.е. чувственная основа. Во всех вышеперечисленных чувственной основы нет.

Виды образных явлений. Перцептивный образ контрольная 2010 по психологии

Министерство науки и образования Украины Национальный аэрокосмический университет Им. Н.Е. Жуковского Контрольная работа По предмету «Общая психология» На тему: Виды образных явлений. Перцептивный образ Выполнила студентка гр 91П2 Молчанова О.А. Проверил: Фролова З.С. Харьков 2009-2010 Введение Восприятие — форма ориентировки организма, которая осуществляется за счет процесса формирования при помощи активных действий субъективного образа целостного предмета, непосредственно воздействующего на анализаторы. В отличие от ощущений, отражающих лишь отдельные свойства предметов, в образе восприятия в качестве единицы взаимодействия представлен весь предмет, в совокупности его инвариантных свойств. Образ восприятия выступает как результат синтеза ощущений, возможность которого, по мнению А.Н. Леонтьева, возникла в филогенезе в связи с переходом живых существ от гомогенной, предметно неоформленной среды к среде, предметно оформленной. Образ восприятия — субъективная представленность предметов окружающего мира или их свойств, которая обусловлена как чувственно воспринимаемыми признаками, так и гипотетическими конструктами. Являясь основой для реализации практических действий по овладению объектами окружающего мира, образ также определяется характером этих действий, в процессе которых исходный образ видоизменяется, все, более удовлетворяя практическим нуждам. Образные явления в индивидуальном сознания разнообразны. Если вы находитесь в сознательном состоянии, у вас хорошее самочувствие, и вы находитесь в окружении обычных предметов, то нормальное функционирование ваших органов чувств обеспечивает наличие в вашем сознании образов восприятия. Осознанные образы или предметные образы — это та психическая реальность, которую мы без труда находим в своем сознании с помощью самонаблюдения. Предметные восприятия имеют чувственную основу. Важнейшая характеристика предметных образов — их реальность: человек верит в реальность предмета, который подается ей в образе, то есть она убеждена в объективном существовании этого предмета. подчеркивает значимость указанных образов, прежде всего для внутренней жизни человека, ведь именно эти образы создают тот план, на котором оно разворачивается. Образы представления непосредственно связаны с предыдущим опытом человека, поскольку это процесс воспроизведения ранее воспринятых предметов, явлений и т.п. В отличие от указанных образов, образы воображения выполняют функцию преобразования результатов прошлого опыта, это прежде психический процесс, заключающийся в создании новых образов (представлений) путем переработки материала восприятия и представлений, полученного в предыдущем опыте. Образ — это универсальная человеческая способность к построению новых целостных образов действительности путем переработки содержания практического, чувственного, интеллектуального и эмоционально-смыслового опыта. Итак, образ воображения выполняет четыре функции: 1) построение образа средств и конечного результата предметной деятельности субъекта, 2) создание программы поведения, когда проблемная ситуация является неопределенной, 3) продуцирование образов, которые не программируют, а заменяют деятельность; 4) создание образов, соответствующих описанию объекта. Представление синтезируются в процессах воображения в различных формах: агглютинация — сочетание несовместимых реально качеств, признаков, частей предметов; гиперболизация — увеличение или уменьшение предмета, изменение качества его частей; обострения — подчеркивание определенных признаков; схематизация — сглаживание различий предметов и выявление рис сходства между ними; типизация — выделение существенного, неповторимого в однородных явлениях и воплощение его в конкретном образе. Оба вида образов (представления и воображения) включены в мыслительной процес. Галлюцинаторные образы, лишенные реальности (т.е. образы, возникающие в отсутствие предмета, но субъективность, которых осознается) — псевдогаллюцинации. Еще один вид образов — мысленные образы, к которым относятся образы памяти и воображения. Они лишены чувственной основы, хотя и не лишены модальности (качественная характеристика ощущения, которая дифференцирует различие свойств отображаемого объекта и описывается в терминах предметных качеств объекта, например, высота (для слуховых ощущений), твердость, упругость (для тактильных ощущений), глубина, удаленность (для зрительных ощущений) и т. Д). 2 Перцептивный образ Перцептивный образ относится к восприятию, сопровождающемуся соотнесением, взаимодействием чувственных ощущений и прошлого опыта. Понимание способствует скорейшему возникновению правильного перцептивного образа. Первичный образ — совокупность впечатлений, формирующихся без каких бы то ни было реминисценций — и прежнего опыта и содержащих то, что вытекает из непосредственных чувственных ощущений. Все в нашем чувственном восприятии, что может быть преодолено и обращено в свою противоположность, не является ощущением. Все, что может быть обращено в свою противоположность — это продукт опыта и тренировки. Чистое ощущение — это только качества ощущения. Перцептивным образом является фигура в перцептивном пространстве. В отличие от ощущений, которым соответствуют свойства, признаки, параметры внешних воздействий, в восприятии получает воспроизведение объективная целостная связность явления. Если ощущения локализованы в пространстве, центром координатных осей которого является человеческое тело (определенный анализатор), то для восприятий в первую очередь характерна отнесенность к объективному пространству, вынесенность, проецированность образов вовне. Но возможность изучения восприятия как определенного рода психического феномена мы получаем лишь тогда, когда мы способны дифференцировать субъективные и объективные составляющие образа. Образ восприятия является, как правило, продуктом интеграции сенсорных данных, получаемых от многих рецепторов, и собственной активности субъекта, его перцептивных действий. В этом смысле образы восприятия более субъективны, чем ощущения, которые возникают как эффект преимущественно экстрапсихического воздействия. Однако будучи спроецированными во внешнее пространство, их свойства переживаются именно как свойства самого объекта. К основным свойствам перцептивных образов относят предметность, целостностность, константность. Предметность при этом трактуется как воспроизводимость в перцептивном образе связности его свойств как свойств самого объекта. Иначе говоря, восприятие тогда полноценно, когда итогом субъективных действий является возможность дифференциации объективных и субъективных компонентов образа. (Воспринимая края (границы) образа размытыми, я понимаю, что это следствие дефекта моего зрения. Оценивая пищу как аппетитную или неаппетитную, я понимаю, что это может быть в значительной мере обусловлено тем, насколько я голоден.) В понятие предметности восприятия включается и такое его свойство, как опознаваемость, т.е. осознание производности образа, отдельных его свойств от свойств объекта как источника его образа, его характеристик. (Можно говорить о восприятии звука, когда я воспринимаю его, например, как звук проезжающей машины; о восприятии цвета, когда я воспринимаю его, например, как цвет спелой вишни и т. д.) Свойство целостности перцептивного образа обнаруживается тогда, когда, например, неполнота или выпадение, искажение каких-либо деталей изображения объекта не мешают его узнаванию (слово, написанное с «ошипкой»), когда мы группируем разрозненные детали, структурируем нерасчлененную совокупность так, что они образуют осмысленное целое (фразанаписаннаябезпропусковмеждусловами), либо, наоборот, воспринимаем некоторое изображение как изображение невозможного объекта (например, фигуры Пенроуза). Свойство целостности восприятия коротких экспозициях было зафиксировано отсутствие дифференцировки фигуры и фона; возникало впечатление гомогенной картины. По мере увеличения времени экспозиции постепенно происходит выделение границ экспонируемой фигуры, пока. наконец, восприятие не примет устойчивый характер. Иной способ зашумливания экспонируемого объекта используется тогда, когда границы фигуры и фона размываются за счет пространственной удаленности или когда экспонат маскируется другими изображениями. При этом перед испытуемым ставится задача выделить называемый в инструкции объект, найти определенный маршрут в лабиринте и т.п. Зависимость полноценного восприятия от сохранности психофизиологических механизмов центрального синтеза эффективно демонстрируют особенности восприятия у людей, у которых расщеплен мозг. Например, Сперри (Sperry, 1968) продемонстрировал изменения в восприятии, когда полностью перерезано мозолистое тело, т.е. когда передача информации из одного полушария в другое стала невозможной. Хотя такая операция обычно не вызывает сколько-нибудь серьезных нарушений повседневного поведения, однако было замечено, что люди, перенесшие такого рода операцию, ведут себя так, как если бы у них было два мозга. Один из экспериментов Сперри состоял в следующем. Перед испытуемым находился экран, который закрывал его руки и на который проецировались изображения разных предметов, так чтобы информация поступала либо в правое, либо в левое полушарие. На столе, где находились руки испытуемого, лежали предметы, которые он мог ощупывать. Иначе говоря, у испытуемого формировались как бы независимо друг от друга зрительный и гаптический образы предметов в одном или в разных полушариях. Было обнаружено, что испытуемый мог после ощупывания предметов левой рукой взять тот из них, изображение которого на короткое время появлялось в левой части экрана, но он не мог ни назвать этот предмет, ни описать словами действия своей левой руки. Когда изображение проецировалось в правую часть зрительного поля и была задействована правая рука, такого явления не наблюдалось. Если же разные изображения направлялись в разные полушария одновременно и испытуемого просили выбрать предмет левой рукой, то он выбирал предмет, изображение которого было спроецировано в правое полушарие, но при этом называл тот предмет, который был спроецирован в левое полушарие. Иначе говоря, назывался образ, спроецированный в «говорящее полушарие», в противоречие с тем, что левая рука выбирала предмет, изображение которого было спроецировано в правое полушарие. Заключение Образные явления, возникающие в особых условиях или в особых людей разделяются на несколько видов: • образ восприятия — отражение в идеальном плане внешнего объекта (сцены), которое влияет на органы чувств; • образ воображения — вымышленный образ, который подан в представлении; • послеобраз — модифицированное произвольное восприятие объекта представляется и недавно рассматривался при строго неподвижном взгляде; • эйдетичний образ — четкое, полное и детальное представление объекта (сцены) в течение определенного времени после прекращения его рассмотрения, отличается от послеобраза независимостью от движения глаз и стабильностью во времени; • фосфена — спонтанные световые ощущения; • фантом — ощущение утраченной части тела; • галлюцинация — иллюзорное восприятие предмета, который реально отсутствует, субъективно неотделимо от образа восприятия. Перцептивный образ в психологии восприятия — это совокупность связанных характеристик, типичных для распознаваемого объекта. Например, мы распознаем «чай» исходя из запаха, вкуса, прикосновения, телесных ощущений, которые он вызывает. Связанные в один образ в сознании характеристики «чая» — это его перцептивный образ.

Билеты 2011, вопросы и ответы

Первые вопросы билетов

Вопрос No1. Общее определение восприятия. Основные свойства

(феномены) образов восприятия.

Восприятие – активный процесс построения осознанного образа целостных предметов и событий окр. Мира, основанный на воздействии физ. Энергии на органы

чувств. Продукт восприятия – перцептивный (целостный!) образ (лицо человека, яблоко,

лай собаки).

Ощущение первично – ступенька к восприятию. Феномены восприятия практически равны его cв-вам. 6 осн. феноменов ( Ф.Олпорт):

  1. Сенсорное качество
  2. Конфигурация (фигура-фон)
  3. Константность
  4. Система отсчета
  5. Предметность
  6. Установка в восприятии

Вопрос No2.

Двойственная природа перцептивного образа.

Субъектно- и объектно ориентированные процессы восприятия.

Перцептивный образ – это субъективное отражение целостного предмета.

Свойства образов: полимодальность (объединение отдельных деталей и

предметов в целостный образ), целостность (мы воспринимает объекты

окружающего мира не как механическую сумму частей, а как целостные предметы),

предметность (отнесенность всех получаемых с помощью органов чувств сведений о

внешнем мире к самим предметам, а, например, не к раздражаемым рецепторным

поверхностям или структурам мозга), константность (относительная

устойчивость воспринимаемых признаков предметов при изменении

условий восприятия), категориальность (свойственная высшим формам

восприятия расчлененность и обобщенность).

Двойственная природа

  1. Куб Неккера: Ретинальное изображение такого куба получается при проекции с любой из двух разных позиций. Поэтому здесь одинаково возможны два разных ответа на один и тот же вечный вопрос перцепции: что есть этот предмет и где он находится? Один общий ответ на эти вопросы дать нельзя —не хватает информации. И мозг, не давая окончательного ответа в этой неясной ситуации, принимает поочередно каждую из двух возможных гипотез.

На первом рисунке грани находятся то на заднем плане, то на переднем (когда на переднем, они как бы просвечиваются)

На втором рисунки изображение воспринимается однозначно.

Его изображение порождает два различных образа. Но у этих образов одна

чувственная основа (один и тот же состав ощущений), но они организованы в разное восприятие.

  1. Феномен «фигуры/фона» Е.Рубин: человек всегда воспринимает окружающий мир, выделяя в нем фон и фигуры на этом фоне.

Фигура и фон спонтанно изменяют свой статус.

  1. Фигура Маха.

Может восприниматься двояким образом и «впукло» и выпукло.

  1. Титченер выделял в образе его чувственную основу и воспринимаемый смысл.

  2. Гельмгольц. Различал первичные образы (выделение комплекса стимулов из массы прочих, как относящихся к одному определенному объекту) и образы восприятия (отражение в субъективном плане реальных предметов или их свойств). Первичные образы содержат только непосредственные чувственные данные. В образах восприятия первичная чувственная форма становится знанием о свойствах мира.

->. Для субъект-ориентированной теории главная детерминанта — субъект (для которого большую роль играет познавательный опыт, мотивы, избирательность сознания, функция внимания).

->. Для объект-ориентированной главная детерминанта — объект. (образ мира — итог преобразования внешних воздействий в чувственную форму).

  1. Различия в содержании процесса В.:

-> .Для объективистов: В. — процесс отражения, копирования объективных свойств внешней среды в субъективной форме, пример: если общественный опыт — это тоже явления внешнего мира, то восприятие цвета вполне от него зависит — всех нас просто научили называть траву зеленой (не уверена, что этот пример максимально показателен).

->. Для субъективистов: в образе представлен не только внешний мир, но и наши собственные когнитивные конструкты, наши собственные представления. Пример: Иллюзия Уоллаха: полосатая линия движется вниз, однако строй полосок задает восприятие движения направо.

  1. Свойства процесса В.:

->. Для объективистов: процесс В. происходит вне зависимости от субъекта — в это вкладывалось два смысла: а. процесс протекает автоматически по неким непреложным законам, он детерминирован внешним миром. б. процесс, его механизм, одинаков для всех субъектов, они (S’ы) взаимозаменяемы. Образ индифферентен по отношению к объекту.

->. Для субъективистов: В. — активный процесс построения образа, тесно связан с познавательными и жизненными задачами субъекта. Пример: эксперимент Ярнуса — Репин "Не ждали", в зависимости от разных инструкций по-разному объясняли картину. Процесс В. — активный, индивидуально-пристрастный процесс, зависит от конкретной личности, ее эмоционального состояния, опыта, целей.

Подобная, четко прослеживаемая двойственная природа процессов восприятия подчеркивает прежде всего разнородность этих самых процессов. Вот несколько примеров подобных раздвоений: — наши образы являются произвольными, они носят навязчивый характер, с другой стороны они все-таки результат определенной активности с нашей стороны: смотрим семантику — слышать или слушать? смотреть или видеть? 😉 — с одной стороны образ восприятия является чувственным образом, т.к. напрямую зависит от органов чувств, однако при этом он является и интеллектуальным образом. — образ восприятия во многом сходен для всех людей, однако у каждого "сове видение".

Вопрос No3. Понятие об ощущении, основные их свойства.

Классификация ощущений и рецепторов. Различные представления о

стимуле.

В философии «ощущение» и «восприятие» рассматривались, как психическое

отражение действительности посредством органов чувств.

В ОП о. и в. Рассматриваются, как определенные виды образов, данные нам при

самонаблюдении, в результате нормального функционирования органов чувств. Анализируя проблему происхождения процессов психического отражения,

выдающийся отечественный психолого А. Н. Леонтьев полагал, что филогенетическая

основа ощущений – это элементарная раздражимость низших органов по отношению к

биотическим раздражителям (тепло, свет, пища), имеющим для них прямое биологические

значение. В отличие от раздражимости ощущения животных и человека опосредованы

особенностями их поведения или практический деятельности. Они имеют абиотические

значение, выполняя сигнальную, ориентировочную функцию, т.е. несут информацию о наличии жизненно важных изменений в окружающей среде и на прямую могут быть не

связаны с наличным потребностым состоянием организма.

В советско-российской психологической школе принято считать «ощущение» и

«чувство» синонимами, однако это не всегда верно для других психологических школ.

Другие эквиваленты термину «ощущения» — сенсорные процессы и чувствительность.

Свойства ощущений:

 Сенсорное качество (модальность ощущений) – специфичность энергии стимула, действующий на соответствующий рецептор (зрение – цвет; слух – высота тона)  Интенсивность ощущений – зависит от интенсивности энергии стимула (в зрении – светлота светового пятна, в слухе – громкость звука)  Протяженность ощущения в пространстве – задается распределением стимульной энергии в пространстве (световой круг: большой-маленький, справа-слева)  Длительность ощущения – характеризуется длительностью стимула во времени (звук: короткий-длинный)  Э. Титченер выделял еще одно ощущение, как элемент опыта – ясность. Характеризуется его местом в сознании индивида: то, что находится в центре сознания, будет более ясным, отчетливым, чем то, что находится на периферии сознания.

Следует отметить, что эти сенсорные качества не являются независимыми друг от друга, т.е. при изменении одного может измениться и другое. Не все физические параметры стимулов могут улавливаться человеком. Люди не

обладают высокой чувствительностью к дистантным тепловым излучениям, запахам и т.п.

Что бы разграничить те свойства объекта, которыми он обладает по своей

физической природе, от той части стимульной энергии, которая попадает от него на

рецепторную поверхность Д. Гибсоном введены 2а важных термина. Дистальный стимул

  • сам объект во всей совокупности своих свойств и качеств (размер, форма, масса и т.д.).

Проксимальный стимул – те пространственно-временные паттерны энергии, которые

попадают на рецепторную поверхность органов чувств. Дистальный стимул является

источником проксимального стимула. Например, когда человек наблюдает собаку, сама

собака является дистальным стимулом, свет отражающийся от собаки и проецирующийся

на рецепторы сетчатки глаза, другие сигналы исходящие от объекта (звук, запах и т. п.) —

 Протопатическая – протопатические ощущения имеют диффузных характер и выраженную аффективную окраску, отражая особенности состояния человека, а не свойства предмета. Этот умный мужик перерезал на своей руке чувствительный нерв и смотрела как он будет восстанавливаться. Через 1,5 месяца появилась, отсутствующая до того, чувствительность в виде диффузных и нелокализуемых протопических ощущений. Они были либо приятны, либо нет. Через 6 месяцев ощущения стали осознаваться, как прикосновения к определенному участку кожи. Затем восстановилась способность воспринимать направление движения предмета по коже руки и форму самого предмета.

Некоторые ученые выделяют ноцицептивную чувствительность – неприятные или

болезненные ощущения

Синестезия – сенсорные феномены: когда ощущения одной модальности появляются под

воздействием стимулов другой модальности. Пример – возникновение устойчивых

цветовых ощущений под воздействием музыки

ВопросNo4. Виды образных явлений. Специфика перцептивного

образа в ряду других видов образов. (Гусев 31 – 40 стр)

Гусев:

Образ ( Р Холт) – обобщающий термин ,для осознанных представлений имеющих квазисенсорный ,но не перцептивный характер Основная характеристика – образ -это чувственная форма психических явлений, но их содержание может иметь не только чувственную основу. Мысленные образы – образы памяти и воображения Лишены чувственной основы Образы памяти – возникают в отсутствие относящихся к ним объектов и являются следом прошлых восприятий, имевших под собой конкретную чувственную основу. Уотсон — После длительного однообразного восприятия каких-либо обектов могут возникать особенно явркие образы памяти – персеверирующие образы, характерные ненавзчивостью и высокой степенью реальности. Найссер – «субъективно непреодолоимое возникающее в памяти человека воспроизведение какого-лтбо случая . о котором субъект некогда узнал как о важной новости» Образ воображения – нереальное вымышеленное представление никогда не соответсвовавший реальности и поэтому не имевший конкретной чувственной основы. Характерны – целостность, обобщённость чувственного представления предмета, события или явления, его субъективная осмысленность и эмоциональная окрашенность Фосфены – локализованные на сетчатке и не имеющие предметного характера световые ощущения в виде отдельных точек, пятен или узоров. Появляются при механическом или эектрическом раздражение глаза. Синестезия – стойкие и определённые чувственные переживания (в одной модальности), сопровождающие наши образы восприятия в другой модальности. Они не вынесены во вне и не сопровождаются чувством предметной реальности. Схема или образ тела – представление о своём собственном теле ,пространственном расположение его частей и его ближайшем окружение в любой момент времени посредствам кинестетических темпрературно-тактильных переживаний.

От образа восприятия, образ тела отличается меньшей осознанностью, отсутсвтвием объектированности ( переживания реальности, вынесенной во вне). В состояние усталости, токсикоза или паталогии головного мозга наблюдается аутоскопический феномен – яркий зрительный образ собсвенного тела, видимый «со стороны» Фантомный образ – появление ощущения в ампутированных конечностях. Характеризуется возникновением ненавязчивых ощущений зуда, боли, анемии ,уверенность в возможности использовать конечность. Последовательный образ – ощущение, возникающее сразу после прекращения действия раздражителя. (если смотреть на яврко-освещённое пятно) Положительный посл. Образ – повторяет форму исходного предмета, более яркий Отрицательный последовательный образ – более тёмный. Закон Эммерта – воспринимаемый размер послеобраза на светлом экране прямо порпорцционален расстоянию до поверхности экрана. Полиопсия – тип послеобраза ( редкий) – при органических повреждения головного мозга или под действием галлюциногенный препаратов, характерезуется сохранением только что воспринятого образа предмета после того, как взор был отведён в сторону. Эйдетический образ – проецирование вовне зрительный образ-представление, образ памяти, обладающий ясностью, красочностью и высокой детализированностью, сопровождающийся чувством реальности ,похожим на обычное восприятие. Эрих Йкнш – 2 вида таких образов –  похожий на растянутый во времени последовательный образ, с дополненными к оригиналу цветами, отл. Стабильностью контроля (Т-тип)  «усиленные» образы памяти, отл возможностью произвольного контроля, В- тип. Галлюцинации – ложное воспроизведение отсутствующего предмета или его признаков ,субъективно признаваемое за реальное восприятие. Гипногогический образ – ясное детальное и отчётливое проекцируемое во вне представление, проявляющеесе в период засыпания – то же при пробуждение- гипнопомический образ. Псевдогаллюцинаии – «проникают в сознание из вне по мнению психов с помощью специальных лучей» Паранормальные галлюцинации – представление приведения и религиозных мистических ведений. Феномен сенсорной обусловленности -эксперементальная галлюцинация. Главная особенность перцептвного образа – его двойственность. С одной стороны – это чувственное отражение объективного мира ,с другой – форма представления знаний человека о нём в виде предметного значения образа. В структуре перц. Обр. в кач-ве основного содержания- чувственная ткань и чувственная основа. Её ф-и – приданеи чувства реальности сознательной картине мира, переживание объективности предствленности объекта восприятия во вне. Другая состовляющая – его предметное содержание. эТо сверхчувствительное содержанеи перцептивного образа. Значении япредметов происходят из мира кльтуры ,осознаваемого и присваемого человекам в течение всей жизни. Процесс жизненного взаимодействия – предметная деятельность. Коротко Шпаргалка: Логвиненко: «Осознанный образ восприятия – эта та психическая реальность, которую мы без труда находим в своем сознании с помощью самонаблюдения. Одной из важнейших характеристик образа восприятия является его предметность». Предметность:

1) Реальность (человек убежден в объективном существовании предмета восприятия)

состояние, разложив его на составные части; 2) найти, каким образом соединены эти составные части, какие законы управляют их комбинацией и 3) привести эти законы в связь с физиологической (телесной) организацией». Таким образом, построив научную психологию по образцу естественных наук, исследование воспри ятия рассмат ривалось структуралистами так же, как, например, в химии: не обходимо разложить целое на элементы — ощущения и, поняв законы их соединения, познать суть психического явления — вос приятия . Поскольку, как полагали структуралисты, элементы со —
знательного опыта едины у людей, то психология действительно изучает базовые механизмы сознания. Второй класс элементов сознательного опыта представляю т образы памяти ,
или представления . Восприятие как явление сознания представляет собой сумму двух этих основных элементов — ощущений и образов памяти. Еще один принципиальный вопрос — каким образом формируются образы восприятия? Ответ структуралистов конкретен и ясен: образы восприятия получаются в ре зультате работы двух механизмов — суммации отдельных ощуще ний и их ассоциации (соединения) с образами памяти. Чтобы пояснить, как работает данный механизм, рассмотрим предлагаемое структуралистами объяснение процесса формирования образа восприятия удаленного объекта. Восприятие удаленности складывается из суммы множества двумерных зрительных ощущений, поступающих от сетчатки глаза, которые, соединяясь (по прин- ципу ассоциации) с кинестетическими образами памяти, хранящими наш двигательный опыт передвижения в пространстве, создают трехмерное восприятие удаленного объекта. Таким образом, в структурализме постулируется наличие двух гипотетических механизмов, опосредствующих возникновение образов ощущений из двух элементов сознания, — механизмов суммации и ассоциации. В соответствии с гипотезой суммации, или, как ее иначе называл К. Коффка, гипотезой констант, перцептивный эффект от суммы ощущений равен эффекту от всех ее составляющих. Из этого следует, что если имеется постоянная связь между воздействи- ем некоторого стимула и соответствующим ощущением (что, как правило, и происходит), то, когда этот стимул проявляется в окружении других стимулов (естественно вызывающих другие ощущения), его вклад в восприятие будет точно таким же, как и в том случае, когда он предъявляется отдельно от других. В этой связи мы можем сделать очень важный вывод: в соответствии с гипотезой суммации вклады в образ восприятия каждого его эле мента независимы друг от друга. Физиологической основой построения перцептивного образа являлась закономерная связь между ощущениями и природой соответствующего рецептора. Эта связь выражается в принципе специфических энергий органов чувств И. Мюллера (см. разд. 1.6). Таким образом, в структурализме выстраивается строг о детерминисти ческое и естественно-научное понимание механизмов формиро вания образов восприятия: стимульная энергия однозначно пре образуется в специфическую энергию органов чувств, отобража ется в сознании в виде ощущения, а затем различные ощущения структурируются с помощью механизма суммации. Еще один базовый механизм формирования восприятий — ассоциация наличных ощущений с образами памяти. Использование структуралистами известного принципа образования ассоциации предполагает, что если два ощущ ения повторялись совмест но
много раз, то появление в сознании одного его элемента — ощущения влечет за собой появление и другого элемента — обра за памяти. Образование ассоциаций, в свою очередь, может определяться сходством двух содержаний сознания (красный — оран- жевый), их контрастом (сладкий — горький) или смежностью во времени и пространстве (после вспышки молнии — удар грома) и другими причинами.- Этот механизм придает

образу восприятия значение, или, пользуясь терминологией Э.Титченера, контекст. Таким образом, означенный образ восприятия формируется из соединения в единую структуру контекста в виде ассоциаций и сердцевины образа — сенсорного опыта. В рамках структурализма появился специфический метод изу чения восприятия — метод аналитической интроспекции . Эта сугубо эмпирическая процедура самонаблюдения была направлена на анализ сенсорного опыта специально обученного испытуемого и требовала от него расчленения образа восп риятия на базовые со —
ставляющие элементы — ощущения. При самоотчете в виде о пи сания объекта восприятия испытуемый мог использовать только названия ощущений и их основные свойства. Главная трудность заключалась в том, чтобы не допустить так называемую ошибку стимула — не использовать в описании объекта элементы про —
шлого опыта или воспринимаемый контекст, т.е. избегат ь сооб щений о значении объекта. Как пишет известный американский исследователь перцептивных процессов Дж.Хохберг, можно попробовать воспроизвести эту процедуру, если взять какое-либо очень знакомое и наполненное смыслом слово, например «мама», и произнести его несколько десятков раз. При некотором усилии и тренировке вы сможете воспринять произносимые звуки, полностью отвлекшись от смысла этого слова, так, как будто это звуки незнакомого языка. Оценивая структуралистскую теорию восприятия, отметим, что, хотя в настоящее время структурализм представляет лишь исторический интерес, в рамках этого направления были заложены общие представления о специфике ощущений и восприятий, многие термины используются до сих пор, а нерешенные проблемы остаются теми же самыми. Критический анализ данной теории восприятия позволяет заключить следующее.

  1. Гипотеза суммации противоречит многим феноменам восприятия. Имеющиеся факты говорят о том, что перцептивные эффекты от воздействия отдельных стимулов зависят также от присутствия других стимулов, т.е. наше восприятие не может рассматриваться как сумма независимых ощущений. Более того, одни и те же ощущения могут приводить к совершенно разным восприятиям.
  2. И главное — это критика метода аналитической интроспекции, с помощью которого были получены основные эмпирические факты. Анализ протоколов с самоотчетами испытуемых свидетельствует о том, что в принципе невозможно преодолеть эффектов контекста, установок, влияния состояния испытуемого, его прошлого опыта. Таким образом, ставится под сомнение основная теоретическая посылка — возможность экстрагирования из опыта так называемых чистых ощущений.

Вопрос No6. Гештальттеория восприятия.

Для гештальттеории главным является целое. Начало XX века. Оппозиция структуралистам. Макс Вергаймер – основатель В. Келер Курт Коффка Все они были физиками Гештальт – целое, состоящее из отдельных частей. Целостный образ первичен по отношению к ощущениям. Cв-ва перцептивного образа не сводимы к св-вам его элементов. Гештальтпсихологами выделялось две реальности и два мира: 1). Мир физических объектов и мир ощущений. 2). Физическое воздействие отражаются в мире ощущений двояко: физиологической реальности мозговых процессов, и феноменальной, или психологической реальности.

В его подходе признавалось, что не только отдельные ощущения, но и целостные образы обусловлены особенностями внешней стимуляции. Экологическая психология (от греч. оikоs – дом, родина и psyche – душа + logos – учение) — психологическое направление, одним из основателей является Дж. Брунер. Рассматривает психологические процессы человека, находящегося в том или ином окружении. Постулируется наличие причинной связи не линейного характера, а системного (сетевого). В соответствии с этим считается, что новые знания усваиваются не сами по себе, а в контексте события их социального усвоения. Концепция Объкт-ориентированная теория. Принципиальная новизна заключается в том, что сенсорная информация сама по себе адекватная, точная и исчепывающая и не требует привлечения каких-либо дополнительных ментальных механизмов для объяснения формирования перцептивного образа.

«Почему мы видим, то что мы видим?» (Коффка) Потому что для каждого образа восприятия есть существует соответсвующий ему стимульный паттерн (то есть объединение сенсорных стимулов как принадлежащих одному классу объектов), другими словами стимул высшего порядка, который не означает одномерного потока Физической энергии. В реальной жизни нет отдельных ощущений

  • это научная абстракция, нет точечных источников света, статических стимульных воздействий. Понятие стимул изменено в понятие оптическая информация.

С точки зрения экологической теории, при зрительном восприятии на сетчатку глаза попадает мноджество световых лучей, которые много раз отразились от поверхностей. Вся необходимая информация содержится в объемлющем оптическом строе — структурированный сетевой поток, попадающий на сетчатку и отражающий структурированность внешнего мира. Причем информацию нельзя передавать, и она никуда не исчезает. Информация – это то, что непосредственно и всегда находится во внешнем мире и воздействует на наблюдателя только во время активного взаимодействия его с миром. Поэтому иногда теорию называют – теория извлечения информации. Человек имеет воспринимающие системы. В.С. состоят из органов, а органы имеют рецепторы. К примеру, низший уровень – это зрачок, хрусталик, сетчатка, далее подключается сам глаз и мышцы. Более высокий уровень – это два глаза. Если наблюдаемый объект подвижен, то в систему включаются движения глаз и головы. А если движется и сам человек, то система образуется наивысшим органом – глаз- голова-тело. Специфика воспринимающей системы напрямую зависит от особенностей внешнего мира, свойств объекта. Восприятие – процесс активный, так как движется объект, движется человек, двигаются глаза, меняются условия. Но воспринимаемый мир остается неизменным. Перцептивный инвариант – сложное свойство оптической информации, выражается в том, что оно остается неизменным, независимо от движений в мире и самого наблюдателя.

Когда предмет удаляется, по законам перспективы его размер уменьшается, но мы, все равно воспринимаем его, как неизменный – это трансформационный инвариант. Структурный инвариант остается неизменным при изменении оптиче6ской информации. Мы можем безошибочно воспринимать объекты одинаковой величины, расположенные любым образом (близко, далеко друг от друга и

т.д.). Все дело в геометрии оптического строя (одинаковые объекты перекрывают собой одинаковое количество текстуры) – градиент текстуры.

Пример:

Столбы воспринимаются, как равные по высоте и более высокие, чем дерево, так как отношение высоты каждого объекта к расстоянию между его основанием и линией горизонта неизменно, инвариантно на любом расстоянии от наблюдателя.

Концепция возможностей. Если субъект может воспринимать какие-то объекты внешнего мира, то он воспринимает их в совокупности с теми возможностями, которые эти объекты могут предоставить. Например, если я могу воспринимать горизонтальную, возвышенную поверхность, значит я воспринимаю ее вместе с возможностью посидеть на ней. => Конкретная экология человека определяет возможности его предметного восприятия. Восприятие возможностей естественно, здесь нет личностных смыслов, опыта и интерпретаций. Важное значение Гибсон уделял той информации, которую мы получаем сами от себя. Когда мы пытаемся извлечь необходимую информацию из оптического строя, мы постоянно видим свои части тела, движения. Но дополнительная информация не мешает нам, так как вопринимается, как кинестезия, то есть движения собственного тела, грубо говоря, мы не обращаем никакого внимаения на это. Гибсон назвал это явление зрительной кинестезией. Критика:

  1. Не совсем ясмно понятие «прямое или непосредственное восприятие». Некоторые ученые (к примеру, Уоллах) доказали, что восприятие не всегда можно назвать «непосредственным», его можно разбить на составляющие стадии. Другие (Д.Марр) пришли к выводу, что выделение инвариантов проблематично и сложно, но не непосредственно«.
  2. Критиковали концепцию возможностей, в которой, возможности, которые по Гибсону человек извлекает непосредственно, воспринимая объекты, а это противоречит тому, что, как известно, предметное значение формируется в онтогенезе.
  3. Ограниченность теории – исследование только зрительного восприятия.
  4. Не до конца проработаны некоторые вопросы – активность восприятия, полимодальность. Достоинства:
  5. Важный прорыв в психологии восприятия.
  6. Учитывается важная роль окружающей среды в процессе восприятия.
  7. Толчок к исследованиям в естественных условиях, экологически валидной стимуляции.
  8. Породила интерес к исследованиям и животных тоже.

Резюме:

которые важны для восприятия внешних объектов (не воспринимаем двоения, не видим

слепого пятна).

Как можно определить, какова роль первичного образа? Необходимо отвлечься от предметного содержания, например, создавая ситуацию необычного наблюдения.

Пример: инвертированное зрение, которое можно осуществить при помощи

инвертоскопа – оптического прибора, при помощи которого можно перевернуть

изображения на сетчатке.

Выделял 3 вида образов:

 Образ в представлении – относится только к впечатлениям, не имеющим текущей чувственной основы, образ прошлых впечатлений.  Перцептивный образ – относится непосредственно к восприятию, которое сопровождается непосредственными чувственными ощущениями  Первичный образ – относится к совокупности чувственных впечателений, формирующихся на основе текущих ощущений и не имеющих в своей основе прежнего опыта.

Таким образом, перцептивный образ образуется в процессе взаимодействия

прежнего опыта и текущих чувственных ощущений. Механизм такого взаимодействия – умозаключение, которое по своей форме бессознательно. Именно поэтому, воспринимая

окружающую нас реальность, мы не в состоянии осознать, в какой степени содержание

наших образов зависит от памяти, а в какой – от их непосредственной чувственной

основы.

Считал, что иллюзии восприятия происходят по тому, что происходит нарушение

нормального восприятия: дефицит опыта, времени или нарушение нормальных условий наблюдения.

Вопрос No9. Теория восприятия Дж. Брунера.

Гусев =- (стр 74 – 78) Теория перцептивной готовности американского психолога Дж. Брунера( 1957 )

рассматривает восприятие как процесс категоризации. Поступивший сигнал сличается с

соответствующим образом (по принципу «лучше или хуже») «подготовленной»

категорией, которая определяет условия, необходимые для подтверждения или

опровержения перцептивной гипотезы.

Стратегии процесса решения включают несколько стадий:

 первичную,  грубой категоризации,  поиска дополнительных признаков,  промежуточной проверки,  окончательной проверки. На готовность категорий также оказывают влияние контекст, степень знакомства с

объектом и актуальные потребностные установки.

Предлагаются четыре механизма, обеспечивающие перцептивную готовность:

 группировка и интеграция;  упорядочение альтернатив;  установление соответствия;  блокировка «входов». Психологи, которых объединяет указанный теоретический подход, получивший

название «Новый взгляд», внесли существенный вклад в экспериментальное исследование

перцептивных процессов, а также влияния личностных особенностей на восприятие

объектов окружающей действительности.

Гусев: Восприятие – один из познавательных процессов. Процесс порждения чувственного перцептивного образа наряду с сенсорной основой

включает в себя процесс категоризации, состоящий из выделения определённых

признаков стимульного воздействия, на основание которых – отнесение вспринимаемого

объекта к той или иной сигнальной категории объектов внешнего мира. Под признаками

(сигнальными признаками) понимаются характерные для критического свойства

стимуляции, специфичнх данной категории объектов.

Восприятие (как и у Гельмгольца ) – процесс обобщения восприятия – движение от

призаков категории происходящие в основном безсознательно. Всякий перцептивный

опыт -есть конечный продукт категоризации ,по Брунеру.

Репрезентативная роль восприятия – ориентируя субъекта во внешнем мире, образы

восприятия позволяют серез обобщение приобретаемого опыта выйти за пределы

непосредственного чувственного познания. Восприятия — предсказание свойств

отражаемого объекта.

Умение сопосотовлять признаки объектов с эталонной системой категорий.

Способность человека создавать систему взаимоотнесенных категорий, отражающих

существование черты мира, в котором жёвёт человек.

По сравнению с понятийными умозаключсениями, перцептивные – менее подвержены

произвольным изменениям.

Акт перцептивной категоризации – как внутренний психический процесс. Для объяснения перцептивной изобретательности – понятие готовность категорий.

Это – преднастройка восприятия, задающаяся повышенной вероятностью или лёгкостью

опознания данного объекта среди других. Роль готовностьи особенно велика в ситуации

высокой сенсорной неопределённости- красткость экспозиции, плохие условия

наблюдения.

Чем больше готовность категорий – тем 1. меньше сенсорной инфы необходимо для отнесения какого-либо объекта к соответсвующей категории 2. шире мн-во стимульных характеристик, которые будут предъявлены в кач. Характеристик дан. Категории

Модель предполагает, что на ранней стадии формирования единиц поле

разбивается на сегменты или группы. Работу со зрительными стимулами на этой стадии

описывают гештальт законы группировки. Соответствующие правила группировки

действуют в чувстве слуха. Например, последовательные звуки, возникающие в одном и том же месте, группируются как единица с большей вероятностью, чем звуки из разных

мест. Эти правила продуцируют перцептивные единицы, которые с высокой

вероятностью соответствуют отдельным объектам окружения. Робот,

запрограммированный на применение гештальт законов группировки, при

фотографировании будет выделять, как правило, реальные объекты. Единицы имеют как

пространственный, так и временной аспект: группировка в пространстве дает

воспринимаемые объекты; группировка во времени – воспринимаемые события. Внимание участвует на следующей стадии, где некоторые из ранее изолированных

единиц, подвергаются акцентированию фигуры более сильному, чем другие единицы.

На этой стадии принимается решение о выборе объема релевантной единицы и отборе той

единицы или единиц выбранного объема, которые должны быть выделены. Так,

релевантными единицами могут стать страница, строка, слово или особенная буква.

Среди них мы отбираем то слово или ту букву, которым будет уделено наибольшее

внимание. Количество внимания, отводимое на этой стадии к воспринимаемому объекту или событию, влияет на последующую обработку различным образом. События,

которым уделено внимание, с большей вероятностью будут восприниматься осознанно и

детально. С большей вероятностью они будут вызывать ответы, управлять ими и

запоминаться в долговременной памяти, причем таким способом, который оставляет

возможность их произвольного восстановления

Следующая стадия обработки – активация единиц опознания. Эти гипотетические структуры активируются появлением стимула, обладающего определенными

критическими признаками. Активация единицы опознания происходит в разной степени.

Она наиболее высока, когда стимул обладает всеми критическими признаками,

предъявляется с высокой интенсивностью и является объектом внимания. Невнимание,

размытое предъявление и рассогласование между признаками стимула и признаками

единицы опознания снижают активацию.

На выходе, различные по степени активации единицы опознания, поступают на стадию, где происходит селекция перцептивных интерпретаций некоторых из

воспринимаемых объектов или событий. Единицы опознания и интерпретации

организованы по измерениям и множествам. Гарантировано, что на стадии отбора

интерпретаций любому объекту в любом множестве или измерении будет дана только

одна интерпретация. Так, мы не видим гомогенное цветное пятно одновременно как

красное и желтое, квадратное и круглое. Воспринимаемому объекту обычно

приписываются значения по измерениям размера, цвета, удаленности, направления, скорости движения и т.д. Кроме того, ему может придаваться [предметное] значение.

Следовательно, полная перцептивная интерпретация объекта или события состоит из

связки частичных интерпретаций. Селекция интерпретации необходима потому, что

обычно стимуляция неоднозначна. Вероятно, что любое стимульное событие активирует

несколько единиц опознания в каждом множестве или измерении, хотя и в разной

степени. Кроме того, в любой момент времени существует разная по степени перцептивная готовность к тому, чтобы совершить любую из возможных интерпретаций.

Отбирается та интерпретация, сумма готовности и активации которой наиболее высока.

Полезно предположить существование порога, ниже которого интерпретация не

происходит. Так, стимул может быть не интер

Восприятие. Общее определение восприятия

  1. Общее определение восприятия.
  2. Двойственная природа перцептивного образа: чувственная ткань и предметное содержание.
  3. Виды образных явлений. Специфика перцептивного образа в ряду других видов образов.
  4. Свойства перцептивного образа.
  5. Феноменология восприятия. Общая схема видов и свойств восприятия. Единица процесса восприятия.
 
 
 
  1. Общее определение восприятия.
 

Восприятие — непосредственное, чувственное отражение  предметов и явлений  в целостном виде в результате осознания  их опознавательных  признаков*

Восприятие  – сложный процесс приема и  преобразования информации, обеспечивающий отражение объективной реальности и ориентировку в окружающем мире. Как форма чувственного отражения  предмета включает обнаружение объекта  как целого, различение отдельных  признаков в объекте, выделение  в нем информативного содержания, адекватного цели действия, формирование чувственного образа.

Восприятие  – осмысленный (включающий принятие решений) и означенный (связанный  с речью) синтез разнообразных ощущений, получаемый от целостных предметов  и явлений, который выступает  в виде образа данного предмета или  явления и складывается в ходе активного их отражения.

Сущность  процесса

Образ, складывающийся в результате процесса восприятия предполагает взаимодействие и скоординированную работу сразу нескольких анализаторов. Анализатор – совокупность нервных структур, участвующих в восприятии и реагировании на раздражители.

Классификация

Свойства  восприятия:

Предметность восприятия не является врожденной качеством; существует определенная система действий, которая дает субъекту возможность открыть предметный мир. Решающую роль здесь играют прикосновение и движение. Как особенность восприятия предметность имеет большое значение для регуляции поведения. Кирпич и блок с взрывчаткой внешне и на Прикосновение могут восприниматься как похожие, но по назначению они абсолютно разные. Обычно определяют предметы не по внешнему  видом, а в соответствии с тем, как их применяют на практике, или с их основными качествами. Предметность играет важную роль в дальнейшем формировании самых перцептивных процессов. Когда возникает расхождение между внешним миром и его отражением, субъект должен искать новые способы восприятия, которые обеспечат правильное отображение.

Целостность и структурность. Воспринимая определенный объект, мы выделяем его отдельные признаки, свойства и одновременно объединяем их в единое целое, благодаря чему у нас возникает его целостный образ.

На уроках химии ученик приобретает знания о свойствах различных химических элементов: узнает о удельный вес каждого из них, цвет, структуру, запах и т.д. Все эти данные об отдельных химические свойства синтезируются в общие знания и обусловливают целостное восприятие химического элемента в совокупности его свойств.

Каждая  составляющая образа восприятия приобретает  значение лишь в соотношении ее с  целым и определяется им. Сам образ  восприятия также зависит от особенностей его составляющих. Так, воспринимая  новый учебный материал, ученик следит за содержанием объяснений учителя. Для осмысленного целостного восприятия ему важно понять связь между  словами, фразами. Целостное восприятие ответа ученика тоже возникает после  того, как он выразил свои знания в языке. Как объяснения учителя, так и ответ ученика имеют  определенное смысловое значение, не присущее отдельных звуков и слов, из которых состоит их язык.

Воспринимая предмет, мы осмысливает его как  единое целое, имеющее свою структуру. Во время разговора по телефону некоторые  звуки мы слышим нечетко, но понимаем суть разговора. Так, на основе приобретенного опыта и знаний человек в процессе восприятия объединяет отдельные элементы в целостный образ, придает им определенной структуры, сформированности.

Гештальтпсихологи объясняют целостность восприятия НЕ объективной целостностью предметов и явлений, а внутренними качествами «духа», его первобытными целостную структуру. Они утверждают, что в акте восприятия совершенствуется своеобразное формообразования, предоставляется целостности и структурности предметам, которые отображаются. Они считают целостность лишь субъективным качеством, которая возникает в рефлекторный деятельности. С точки зрения гештальтпсихологии, в восприятие хаотичность мира превращается в определенные структуры, укладывается в определенные формы, в результате чего предметы и выступают как целостные.

«Восприятие — это реконструкция мира», утверждают  гештальтпсихологи. Эта теория объясняет восприятие как спонтанный процесс  (т.е. такой, который возникает сам по себе) и фактически игнорирует существование ощущений как перцептивной отражения отдельных качеств и свойств предметов и явлений объективной действительности.

Константность. Под  константностью понимают относительное постоянство величины, формы, цвета предметов, которые воспринимаются при изменении расстояния, ракурса, освещенности.

Если  предмет воспринимается на некотором  расстоянии от того, кто воспринимает, то отображение его на сетчатке уменьшается  как по длине, так и по горизонтали, т.е. уменьшается и площадь его, а между тем в восприятии образ  сохранит в определенных пределах приблизительно ту самую, свойственную предметов, величину. Так же форма отображения предмета на сетчатке будет изменяться при  каждом изменении угла зрения, под  которым мы видим предмет, однако его форма восприниматься нами как  более-менее постоянно.

Константность имеет место по зрительного восприятия формы и цвета предметов. Например, когда на уроке рисования учащиеся рассматривают набор овощей на столе, каждый воспринимает их под своим углом зрения. Но образы этих предметов сохраняют постоянные размеры.

Классная  доска воспринимается черной, потолок — белой, обложка тетради — синей и  при ярком освещении, и при  тусклом, и при электрическом, и  при дневном свете. Механизм константности НЕ врожденный. Так, человек, который прожил всю свою жизнь в одноэтажном доме, попав на верхний этаж высотного дома, не может распознать внизу людей, автомобили, поскольку они ей кажутся очень маленькими. Одновременно жители этого дома видят все объекты внизу без искажения их размеров. У К. Чуковского описан случай, когда трехлетняя девочка посмотрела на крышу многоэтажного дома и, увидев мастера, Что его ремонтировал, закричала: «Мама, получат мне он ту куклу».

Константность восприятия обеспечивается опытом, который  приобретается в процессе индивидуального  развития личности, и имеет большое  практическое значение. Если бы восприятие не было константным, то при каждом шаге, повороте, движении, изменении  освещенности мы не могли бы распознавать то, что было известно ранее.

Апперцепция. С предыдущим опытом человека связаны его интересы, установки, стремления, чувства, взгляды и убеждения, которые также влияют на восприятие ею предметов и явлений окружающей действительности. Известно, что восприятие картинки, мелодии, кинокартины в Разных людей неодинакова. Бывают случаи, когда человек воспринимает не то, что есть, а желаемое ей. Апперцепция — это зависимость содержания и направленности восприятия от опыта человека, его интересов, отношение к жизни, установок, знаний.   

Апперцепция — одна из важнейших особенностей восприятия. Воспринимает НЕ само по себе глаз, не изолированное ухо слышит звук, не отдельно язык различает вкусовые качества. Все виды восприятия осуществляются конкретным живым человеком. В восприятие всегда проявляются индивидуальные особенности человека, его желания, интересы, определенное отношение к  предмету или явлению. Так, уходя  Лугом, ботаник может обратить внимание на разнообразные растения, совокупность которых дает полную структуру травяного  покрова. Художник-пейзажист, уходя  тем самым Лугом, останется равнодушным  к этим объектам, однако его внимание привлечет соотношения цветовых пятен, которые образуют живописный пейзаж этой местности.

Интересными являются исследования американского  психолога А. Реймса с «перекошенной комнатой. Она построена таким  образом, что благодаря использованию  правил перспективы создает такое  же изображение на сетчатке глаза, что  и обычная прямоугольная комната. Если в «перекошенной комнате» размещают  какие-либо объекты, то наблюдатель  воспринимает их искажений в размерах (например, взрослый кажется меньше, чем маленький ребенок). Наверное, люди настолько привыкли к нормальным прямоугольных комнат, которые восприятия искажаются быстрее объекты, помещенные в «перекошеную комнату», нежели сама комната. Интересно, что женщины не воспринимают своих мужей с какими изменениями в этой комнате, они их воспринимают как обычно, а комнату видят искажений.

При наличии  противоречивой информации перцептивные система должна сделать выбор. Результат  выбора предопределяется предыдущим опытом человека; хорошо знакомые предметы «перекошена комната» не искажает. Знакомство с  комнатой путем облапывания приводит к постепенному уменьшению эффекта искажение других предметов, и в конце концов сама комната начинает восприниматься правильно, т.е. перекошеной.

Итак, восприятие зависит от предыдущего опыта  человека. Чем больше человек знакома с определенным объектом, тем полным, точным и содержательным  является ее восприятия этого объекта.

И еще  пример. Вспомним роман в стихах А. С. Пушкина «Евгений Онегин». В образе Ольги влюблен Ленский увидел «деву красоты», а для равнодушной к ней Онегина Ольга «круглая, красная она, как эта глупая луна на этом глупо небосклоне».

Зависимость восприятия от прежнего опыта человека, его предпочтений является важной закономерностью, на которую нужно учитывать в  организации учебной деятельности. В педагогической практике учителю  важно учитывать опыт и знания ученика, направленность его интересов, наличие или отсутствие установок  на восприятие, чтобы обеспечить основательное  усвоение учебного материала.

Осмысленность. Восприятие — это не только чувственный образ, но и осознание выделенного объекта. Человек воспринимает предметы, которые имеют для нее определенное значение. Восприятие человека тесно связано с мышлением, с пониманием сущности предмета. Сознательно воспринять предмет означает мысленно назвать, то есть отнести его к определенной группе, классу предметов, обобщить его в слове.

Благодаря осмыслению сущности и назначения предметов  становится возможным целенаправленное их использование. Воспринимая предмет, мы можем точно назвать его  или сказать, что он нам напоминает.

Обобщенность восприятия — это отражение единичного случая как особого проявления общего. Определенное обобщение имеющееся в каждом акте восприятия. Степень обобщения зависит от уровня и объема имеющихся у человека знаний. Скажем, ярко-красный цветок осознается нами или как астра, или как представитель семейства сложноцветных. Слово — орудие обобщения. Называние предмета повышает уровень обобщения восприятия. Осмысленность и обощенность хорошо выявляются при восприятия незаконченных рисунков. Эти рисунки дополняются нашими опытом и знаниями.

Таким образом, уже в акте восприятия отражение  любого предмета приобретает определенного  обобщения, предмет определенным образом  соотносится с другими. Обобщенность является высшим проявлением осознанного  человеческого восприятия. В акте восприятия воплощается единство чувственных  и логических элементов, взаимосвязь  сенсорной и мыслительной деятельности личности.

Избирательность. На наши анализаторы действует конечно ряд объектов. Однако не все эти объекты мы воспринимаем одинаково четко и ясно. Эта особенность характеризует избирательность восприятия.

Избирательность восприятия — это смена деятельности органов чувств под влиянием предыдущего  опыта, установок и интересов  человека.

Каждый  специалист пытается воспринять в предметах  и явлениях главным образом то, что его интересует, что он изучает, а потому он не замечает тех деталей, которые не касаются его профессии. Это создает индивидуальный подход к восприятия. Поэтому и говорят о профессиональное восприятие у людей разных специальностей: художник-живописец видит в окружающем мире, прежде всего красоту людей, природы, форм, линий, цветов; композитор отмечает гармонию звуков, а ботаник — особенности строения растений и т.п.

    дополнение к программе для 2-го курса д/о

    курса лекций и семинарских занятий по общей психологии
    раздел

    Программа составлена С.А. Капустиным

    и дополнена постраничным указателем расположения литературы в новой хрестоматии (М.В. Фаликман)

    ЧАСТЬ I. ВВЕДЕНИЕ В ПСИХОЛОГИЮ ВОСПРИЯТИЯ

    ТЕМА 1. Общее представление об ощущении и восприятии

    Вопросы к семинарским занятиям

    1. Общее определение ощущения и восприятия.
    2. Феномены восприятия. Основные свойства перцептивного образа.
    3. Двойственная природа перцептивного образа: чувственная ткань и предметное содержание.
    4. Понятие об ощущении и стимулах, их вызывающих. Основные свойства ощущений.
    5. Классификации ощущений и рецепторов.
    6. Виды образных явлений. Специфика перцептивного образа в ряду других видов образов.

    Литература

    ХРЕСТОМАТИЯ Психология ощущений и восприятия. / Под ред. Ю.Б. Гиппенрейтер, В.В. Любимова и М.Б. Михалевской. М.: ЧеРо: 1999.

    47-55 (Шеррингтон), 60-66 (Бернщтейн) (к вопр. 5),

    14-16 (Хольт), 444-446 (Симмел) (к вопр. 6).

    67-76 (Оллпорт), 340-341 (Липер), 342 (Сийпола), 490-493 (Уоллах), 496-498 (Мишотт) (к вопр. 2),

    567-570 (Стрэттон) (к вопр. 3).

    ПОМИМО ХРЕСТОМАТИИ:

    1. Величковский Б.М., Зинченко В.П., Лурия А.Р. Психология восприятия. М., 1973. С.40-58 (к вопр. 5).
    2. Грегори Р. Разумный глаз. М., 1972. С.41-47 (2), 138-144 (к вопр. 3).
    3. Леонтьев А.Н. Деятельность. Сознание. Личность. М., 1975. С.133-140 (к вопр. 3).
    4. Логвиненко А.Д. Психология восприятия. М., 1987. С. 3 -11 (к вопр. 1-4, 6), С.14-16 (к вопр. 3).

    ТЕМА 2. Теории восприятия (12 часов)

    Вопросы к семинарским занятиям

    1. Структуралистская теория восприятия. Ощущение как единица перцептивного образа. Гипотеза суммации ощущений.
    2. Гештальттеория восприятия. Законы перцептивной организации. Перцептивные силы. Принцип изоморфизма.
    3. Экологическая теория восприятия Дж. Гибсона. Понятие объемлющего оптического строя и инвариантных структур светового потока. Восприятие как акт извлечения информации.
    4. Теория восприятия Г. Гельмгольца. Понятия первичного образа, перцептивного образа, образа представления, бессознательных умозаключений.
    5. Теория восприятия Дж. Брунера. Понятие категоризации. Стадии категоризации. Перцептивная готовность.
    6. Теория восприятия У. Найссера. Понятие когнитивной схемы. Функции схем. Перцептивный цикл.

    Литература

    ХРЕСТОМАТИЯ Психология ощущений и восприятия. / Под ред. Ю.Б. Гиппенрейтер, В.В. Любимова и М.Б. Михалевской. М.: ЧеРо: 1999.

    С.117-125(Хохберг) (к вопр. 1),

    126-129 (Коффка), 113-116 (Осгуд), 144-155 (Осгуд) (к вопр. 2),

    21-46 (Гельмгольц) (к вопр. 4),

    164-181 (Брунер) (к вопр. 5),

    ПОМИМО ХРЕСТОМАТИИ:

    Гибсон Дж. Экологический подход к зрительному восприятию. М., 1988. С.336-363 (к вопр. 3).

    Найссер У. Познание и реальность. М., 1981. С.40-52, 71-82 (к вопр. 6).

    ТЕМА 3. Научение в восприятии (6 часов)

    Вопросы к семинарским занятиям

    1. Проблема врожденного и приобретенного в восприятии. Экспериментальные исследования.
    2. Роль двигательной активности в развитии ощущений и восприятия. Понятие о перцептивных действиях, этапы их формирования.
    3. Теории перцептивного научения: обогащение и дифференциация.

    Литература

    ХРЕСТОМАТИЯ Психология ощущений и восприятия. / Под ред. Ю.Б. Гиппенрейтер, В.В. Любимова и М.Б. Михалевской. М.: ЧеРо: 1999.

    565-566 (Зенден) (к вопр. 1),

    597-600 (Грегори) (к вопр. 1),

    411-416 (Ярбус), 539-546 (Запорожец) (к вопр. 2),

    547-562 (Гибсон и Гибсон) (к вопр. 3).

    217-228 (Леонтьев) (к вопр. 2).

    ПОМИМО ХРЕСТОМАТИИ:

    Рок И. Введение в зрительное восприятие. М., 1980. Кн.1. С.82-89, 144-149 (к вопр. 1), Кн.2. С.70-75 (к вопр. 1).

    ЧАСТЬ II. ОСНОВНЫЕ НАПРАВЛЕНИЯ И РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТАЛЬНЫХ ИССЛЕДОВАНИЙ ВОСПРИЯТИЯ

    ТЕМА 4. Психофизика и измерение ощущений (12 часов)

    Вопросы к семинарским занятиям

    1. Косвенное измерение ощущений. Пороги ощущений. Чувствительность. Субсенсорный диапазон. Методы измерения порогов. Закон Фехнера.
    2. Прямое измерение ощущений. Методы прямого измерения. Закон Стивенса. Метод кроссмодальных сравнений. Типы шкал.
    3. Теория обнаружения сигналов. Понятие сигнала, шума, критерия, чувствительности, рабочей характеристики приемника.

    Литература

    ХРЕСТОМАТИЯ Психология ощущений и восприятия. / Под ред. Ю.Б. Гиппенрейтер, В.В. Любимова и М.Б. Михалевской. М.: ЧеРо: 1999.

    С.271-274 (Макаров) (к вопр. 1),

    275-282 (Джелдард), 283-292 (Стивенс) (к вопр. 2),

    256-270 (Кимбл и Джармези) (к вопр. 3).

    С.250-255 (Гершуни, Соколов) (к вопр. 1),

    ПОМИМО ХРЕСТОМАТИИ:

    Проблемы и методы психофизики / Под.ред. А.Г.Асмолова и М.Б.Михалевской. М., 1974. С. 107-116, 119-130 (к вопр. 1), 71-76, 193-194, 202-204, 208-211 (к вопр. 2).

    ТЕМА 5. Восприятие пространства, движения, времени (8 часов)

    Вопросы к семинарским занятиям

    1. Проблема восприятия третьего измерения. Признаки удаленности и глубины: окуломоторные, монокулярные (изобразительные), бинокулярные, трансформационные. Механизмы стереозрения: корреспондирующие и диспартные точки сетчатки, гороптер. Стереограммы Юлеша.
    2. Восприятие движения. Признаки восприятия реального движения. Две системы восприятия реального движения: изображение-сетчатка и глаз-голова. Теории восприятия стабильности видимого мира. Иллюзии восприятия движения: автокинетическое, стробоскопическое и индуцированное движение, эффект водопада. Восприятие времени.
    3. Экологический подход к восприятию, пространства и движения. Основные инварианты структуры светового потока, содержащие информацию о компоновке поверхностей, движении объектов и наблюдателя.

    Литература

    ХРЕСТОМАТИЯ Психология ощущений и восприятия. / Под ред. Ю.Б. Гиппенрейтер, В.В. Любимова и М.Б. Михалевской. М.: ЧеРо: 1999.

    343-359, 375-378 (Вудвортс) (к вопр. 1),

    461-489 (Грегори), 447-456 (Креч и др.) (к вопр. 2),

    ПОМИМО ХРЕСТОМАТИИ:

    1. Величковский Б.М., Зинченко В.П., Лурия А.Р. Психология восприятия. М., 1973. С.143-147 (к вопр. 1).
    2. Гибсон Дж. Экологический подход к зрительному восприятию. М., 1988. С.222-226, 261-269 (к вопр. 3).
    3. Логвиненко А.Д. Зрительное восприятие пространства. М., 1981. С.151-153 (к вопр. 1).

    ТЕМА 6. Константность восприятия (6 часов)

    Вопросы к семинарским занятиям

    1. Понятие константности восприятия, ее основные виды. Процедура измерения константности. Коэффициент константности. Связь константности величины с признаками удаленности.
    2. Теория перцептивных уравнений. Инвариантные отношения в восприятии.
    3. Экологический подход к решению проблемы константности. Основные инварианты структуры светового потока, содержащие информацию о величине воспринимаемых объектов.

    Литература

    ХРЕСТОМАТИЯ Психология ощущений и восприятия. / Под ред. Ю.Б. Гиппенрейтер, В.В. Любимова и М.Б. Михалевской. М.: ЧеРо: 1999.

    359-372 (Вудвортс) (к вопр.1)

    383-399 (Логвиненко) (к вопр. 1,2)

    ПОМИМО ХРЕСТОМАТИИ:

    1. Гибсон Дж. Экологический подход к зрительному восприятию. М., 1988. С.231-238 (к вопр. 3).
    2. Рок И. Введение в зрительное восприятие. М., 1980. Кн.1. С.89-92, 243-250 (к вопр. 1). Кн.2. С.213-217 (к вопр. 1).

    ТЕМА 7. Предметность и установка в восприятии (8 часов)

    Вопросы к семинарским занятиам

    1. Способы искажения сетчаточных изображений: инверсия, реверсия, смещение в пространстве и во времени, изменение цветности, знака диспаратности.
    2. Феномены инвертированного зрения. Проблема перцептивной адаптации и ее экспериментальные исследования.
    3. Феномены псевдоскопического восприятия. Условия возникновения обращений зрительных образов по глубине. Правило правдоподобия.
    4. Создание искусственных органов чувств и формирование у слепых «кожного зрения».
    5. Кросскультурные исследования восприятия. Особенности восприятия двумерных изображений в отдельных культурах.
    6. Потребности и ценности как организующие факторы восприятия. Экспериментальные исследования в школе «Новый взгляд».

    Литература

    ХРЕСТОМАТИЯ Психология ощущений и восприятия. / Под ред. Ю.Б. Гиппенрейтер, В.В. Любимова и М.Б. Михалевской. М.: ЧеРо: 1999.

    600-614 (Грегори) (к вопр. 1,2),

    571-584 (Логвиненко) (к вопр. 2),

    403-410 (Компанейский) (к вопр. 3),

    618-623 (Логвиненко) (к вопр. 4),

    ПОМИМО ХРЕСТОМАТИИ:

    1. Брунер Дж. Психология познания. М., 1977. С.65-78 (к вопр. 6).
    2. Восприятие и деятельность. Под.ред. А.Н.Леонтьева. М., 1976. С.186-192 (Столин) (к вопр. 3).
    3. Коул М., Скрибнер С. Культура и мышление. М., 1977. С.84-92 (к вопр. 5).

    Психические познавательные процессы (стр. 2 из 11)

    Эти примеры убедительно доказывают, что константность восприятия не врожденное, а приобретенное свойство. Действительным источником константности восприятия являются активные действия перцептивной системы. Из разнообразного и изменчивого потока движений рецепторных аппаратов и ответных ощущений субъект выделяет относительно постоянную, инвариантную структуру воспринимаемого объекта. Многократное восприятие одних и тех же объектов при разных условиях обеспечивает устойчивость перцептивного образа относительно этих изменчивых условий. Константность восприятия обеспечивает относительную стабильность окружающего мира, отражая единство предмета и условий его существования.

    Избирательность восприятия заключается в преимущественном выделении одних объектов по сравнению с другими (т.е. внимании), обусловленном особенностями субъекта восприятия: его опытом, потребностями, мотивами и т.д. В каждый конкретный момент человек выделяет лишь некоторые объекты из бесчисленного количества окружающих его предметов и явлений.


    Рис. 1. Восприятие обусловлено тем, какие признаки объекта избираются в качестве исходных при его опознании. На этом рисунке можно увидеть и образ молодой женщины, и образ старухи

    Чем больше в объекте новизны, чем он сложнее (структурно организованнее) и интереснее, чем сильнее стимул и чем чаще он повторяется, тем легче он может привлечь к себе внимание. Однако более важную роль в привлечении внимания играют потребности, интересы, ожидания субъекта восприятия. Мозг создает себе образ реальности, которая связана с интересами и нуждами индивидуума. Психолог Бергсон (1907) сравнивал человеческий мозг с фильтром, благодаря которому человек проявляет избирательное внимание и пропускает на уровень сознания только ту информацию, которая необходима для его выживания в предметном и социальном мире. Ребенок с самого рождения имеет относительно запрограммированный мозг и уже достаточно развитые для восприятия предметного мира органы чувств. Однако процессы восприятия должны каким-то образом упорядочиваться. Мозг сортирует по категориям колоссальное количество раздражителей, причем способ классификации воспринятого тесно связан с индивидуальным жизненным опытом каждого. Все виды восприятия — результат практики и опыта. Только благодаря им мозг способен структурировать и организовывать элементы внешнего мира, придавая им точное значение. С другой стороны мозг испытывал бы слишком большую информационную перегрузку, если бы он не смог осуществить выбор среди слишком большого количества сигналов, привлекающих его внимание. Этого удается избежать благодаря сенсорной адаптации на уровне рецепторов (уменьшение чувствительности к повторяющимся или длительно воздействующим стимулам) и привыканию на уровне ретикулярной формации (ретикулярная формация блокирует передачу ставших привычными сигналов, чтобы они не загромождали сознание). Так, горожане на улице уже не чувствуют запаха выхлопных газов и не слышат автомобильных сигналов.

    В головном мозге действует фильтр, который лимитирует способность улавливать различные сигналы. Прежде, чем поступить в мозг, сигнал должен превысить физиологический порог на уровне рецепторов, а затем — порог восприятия или порог осознанного узнавания, который контролируется ретикулярной формацией. Между этими двумя порогами, видимо, существует подпороговая зона, где сигналы обрабатываются без участия сознания. Физиологический порог предопределен генетически и может изменяться только в зависимости от возраста или других физиологических факторов. Порог восприятия гораздо менее стабилен и зависит от уровня бодрствования мозга, от внимания мозга к сигналу, который преодолел физиологический порог. Здесь возникает очень интересное явление, объясняющее порой необъяснимые, с точки зрения логики бытовой психологии, факты. Оно заключается в том, что подпороговое восприятие информации может вызывать реакции на уровне организма без сознательной оценки соответствующих сигналов.

    Гипотеза о бессознательной обработке сигналов из подпороговой зоны позволяет объяснить многие спорные явления: подпороговое восприятие, перцептивную защиту, внечувственное (экстрасенсорное восприятие) и др. которые мы рассмотрим позднее. Осмысленность восприятия указывает на его связь с мышлением, с пониманием сущности предметов. Несмотря на то, что восприятие возникает вследствие непосредственного воздействия объекта на органы чувств, перцептивные образы всегда имеют определенное смысловое значение. Сознательно воспринять предмет — это значит мысленно назвать его, т.е. отнести к определенной категории, обобщить его в слове. Даже при виде незнакомого предмета мы пытаемся уловить в нем сходство со знакомыми объектами, отнести его к некоторой категории.

    Восприятие зависит не только от раздражения, но и от самого воспринимающего субъекта. Зависимость восприятия от содержания психической жизни человека, от особенностей его личности носит название апперцепции. Восприятие — активный процесс, использующий информацию, чтобы выдвигать и проверять гипотезы. Характер гипотез определяется содержанием прошлого опыта личности. Чем богаче опыт человека, чем больше у него знаний, тем ярче и насыщеннее его восприятие, тем больше он видит и слышит. Содержание восприятия определяется также поставленной задачей и мотивами деятельности. Например, слушая в исполнении оркестра музыкальное произведение, мы воспринимаем музыку в целом, не выделяя звучание отдельных инструментов. Только поставив цель выделить звук какого-либо инструмента, это удается сделать. Существенным фактом, влияющим на содержание восприятия, является установка субъекта, т.е. готовность воспринять что-то определенным образом. Кроме того, на процесс и содержание восприятия оказывают воздействие эмоции.

    Классификация восприятий

    В основе любой классификации лежит определенный критерий. С этой точки зрения при классификации восприятий наиболее распространенными являются следующие основания. Они обобщенно показаны в таблице 1.

    Таблица 1. Классификация видов восприятия

    1. В основе классификации восприятий, так же как и ощущений, лежат различия в анализаторах, участвующих в восприятии. В соответствии с тем, какой анализатор играет в восприятии преобладающую роль, различают зрительные, слуховые, осязательные, кинестезические, обонятельные и вкусовые восприятия. Обычно процесс восприятия осуществляется рядом взаимодействующих между собой анализаторов. Двигательные ощущения в той или иной степени участвуют во всех видах восприятий.

    2. Поскольку воспринимающие информацию органы относятся к группам интеро-, проприо- и экстерорецепторов, то восприятия можно подразделить на внутренние и внешние.

    3. Основой другого типа классификации восприятий являются формы существования материи: пространство, время, движение. В соответствии с этим выделяют восприятие пространства, восприятие времени, восприятие движения.

    4. Специфика формирования образных явлений. Специфика перцептивного образа в ряду других видов образов.

    Образ – обобщающий термин для всех осознанных субъективных представлений. Необходимо заметить, что существует два типа образов — образы где нет реального стимула и те где он присутствует.

    Главное и принципиальное отличие перцептивного образа – в том, что только в перцептивном образе есть реальный объект, т.е. чувственная основа. Во всех иных чувственной основы нет. К числу таковых относят следующие.

    Мысленный образ – смутное субъективное воспроизведение ощущения или восприятия при отсутствии адекватного сенсорного воздействия.

    Фосфены – возникновение или изменение идеосетчаточного света: пятна, узоры. Возникают из-за механического или электрического стимулирования.

    Синестезия – когда восприятие одной модальности сопровождается образами других модальностей. Пример: “цветной слух”, Скрябин.

    Образ собственного тела.

    Фантомный образ: боли в несуществующей руке, ноге и проч. Продолжающееся действие сформированной схемы тела. Могут возникать фантомы только тех частей тела, которые человек сумел освоить. Чем старше человек к моменту ампутации, тем вероятнее возникновение фантома. Фантом не возникает, когда части тела разрушаются постепенно.

    Гипнагогическая галлюцинация – образы, возникающие в процессе засыпания (при пробуждении – гипнопомпическая). Кажущийся образ, представляющийся реальным.

    Эйдетический образ – кажется бодрствующему (обычно ребёнку) перцептом. Типы: Т-эйдетический образ (послеобраз, растянутый во времени), В-эйдетический (усиленные мысленные образы).

    Функциональные механизмы и клиническое применение

    Trends Cogn Sci. 2015 окт; 19 (10): 590–602.

    Джоэл Пирсон

    1 Школа психологии, Университет Нового Южного Уэльса, Сидней, Австралия

    Томас Населарис

    2 Кафедра нейробиологии, Медицинский университет Южной Каролины, Чарльстон, Южная Каролина, США

    Эмили A. Holmes

    3 Подразделение когнитивных исследований и наук о мозге Совета медицинских исследований, Кембридж, Великобритания

    4 Отдел клинической неврологии, Каролинский институт, Стокгольм, Швеция

    Стивен М.Kosslyn

    5 Школы Минервы в Институте Кека, Сан-Франциско, Калифорния, США

    1 Школа психологии, Университет Нового Южного Уэльса, Сидней, Австралия

    2 Департамент неврологии Медицинского университета из Южной Каролины, Чарльстон, Южная Каролина, США

    3 Отдел познания и изучения мозга Совета медицинских исследований, Кембридж, Великобритания

    4 Отдел клинической неврологии, Каролинский институт, Стокгольм, Швеция Институт Кека, Сан-Франциско, Калифорния, США

    Это статья в открытом доступе по лицензии CC BY (http: // creativecommons.org / licenses / by / 4.0 /).

    Эта статья цитируется в других статьях в PMC.

    Abstract

    Исследование ментальных образов преодолело как неверие в этот феномен, так и присущие методологические ограничения. Здесь мы рассматриваем недавние поведенческие исследования, изображения мозга и клинические исследования, которые изменили наше понимание ментальных образов. Исследования подтверждают утверждение, что визуальные ментальные образы — это изобразительное внутреннее представление, функционирующее как слабая форма восприятия. Работа с изображениями мозга продемонстрировала, что нейронные представления ментальных и перцептивных образов похожи друг на друга еще в первичной зрительной коре (V1).Паттерны деятельности в V1 кодируют мысленные образы и образы восприятия с помощью общего набора низкоуровневых изобразительных визуальных функций. Недавние трансляционные и клинические исследования показывают, что образы играют ключевую роль во многих психических расстройствах, и показывают, как врачи могут использовать образы в лечении.

    Тенденции

    Недавние исследования показывают, что визуальные ментальные образы функционируют так, как если бы они были слабой формой восприятия.

    Свидетельства указывают на перекрытие между визуальными образами и визуальной рабочей памятью — те, у кого сильные образы, как правило, используют их для мнемонической работы.

    Работа с изображениями мозга предполагает, что представления воспринимаемых стимулов и мысленных образов похожи друг на друга еще в V1.

    Изображения играют ключевую роль во многих психических расстройствах, и врачи могут использовать изображения для лечения таких расстройств.

    Ментальные образы

    Ментальные образы играли центральную роль в дискуссиях о психических функциях на протяжении тысячелетий. Многие утверждали, что это одно из основных психических событий человека, которое позволяет нам помнить, планировать будущее, ориентироваться и принимать решения.Кроме того, ментальные образы играют ключевую роль во многих расстройствах психического здоровья и играют все более важную роль в их лечении.

    Мы используем термин «ментальные образы» для обозначения представлений и сопутствующего опыта сенсорной информации без прямого внешнего стимула. Такие представления вызываются из памяти и приводят к повторному переживанию версии исходного стимула или некоторой новой комбинации стимулов. Обратите внимание, что не все мысленные образы должны быть произвольными; внешние события или внутренние ассоциации также могут вызвать мысленный образ, даже если человек не хочет испытывать этот образ в это время [1].Ментальные образы могут явно включать все чувства, но в этом обзоре мы сосредоточимся на визуальных ментальных образах, учитывая, что большинство эмпирических исследований касались этой сенсорной области.

    Исторически сложилось так, что исследования ментальных образов страдали как по практическим, так и по теоретическим причинам. Методологические ограничения, вызванные по сути своей частной природой образов, накладывают практические ограничения на типы механистических исследований, которые могут быть выполнены. Кроме того, во второй половине 20-го века в психологии возник бихевиоризм.Эта теоретическая ориентация отвергала изучение внутренних представлений, в том числе ментальных образов. Комбинация этих двух препятствий в значительной степени ответственна за сравнительный недостаток исследований ментальных образов относительно связанных тем, таких как зрительное внимание и зрительная рабочая память [2].

    В настоящее время такие ограничения снимаются, поскольку все более изощренные методы исследования приводят ко многим новым открытиям в области изображений. В последние годы новые объективные методы исследования позволили проводить более прямые исследования механизмов и нейронных субстратов ментальных образов.Результаты этих методов проливают свет на роль ментальных образов в восприятии, познании и психическом здоровье. Полученные данные укрепили наше понимание визуальных ментальных образов как изобразительного внутреннего представления с сильными и неожиданными связями с визуальным восприятием, эффективно положив конец так называемым «дебатам об образах» [3]. Более того, исследования показывают, что ментальные образы играют ключевую роль в клинических расстройствах, таких как тревожность. Этот подъем фундаментальной и клинической науки в отношении ментальных образов показывает центральную роль, которую ментальные образы играют в повседневном поведении, а также в психических функциях и дисфункциях человека.

    Психические образы и слабое восприятие

    Большая часть работ по образу и восприятию в 1990-х и 2000-х годах показала, что образы разделяют механизмы обработки с восприятием подобной модальности. Например, исследователи показали, что воображаемые визуальные паттерны взаимодействуют с одновременным перцептивным стимулом, чтобы повысить сенсорную производительность в задаче обнаружения [4]. Многие исследования сошлись в демонстрации того, что ментальные образы могут действовать так же, как афферентное сенсорное восприятие. Представление ориентированных линий может вызвать последействие ориентации [5] или представление движущегося стимула может вызвать последействие движения на последующий перцептивный стимул, во многом аналогично нормальному восприятию [6].

    Ментальные образы также могут заменять перцептивные стимулы во время различных типов обучения. Перцептивное обучение обычно включает в себя повторное выполнение задачи перцептивного обнаружения или распознавания, что приводит к повышению производительности. Однако воображение важнейших компонентов такой задачи вместо того, чтобы на самом деле выполнять их на основе перцептивного стимула, также может улучшить выполнение задачи восприятия [7]. Например, когда участники неоднократно представляют вертикальную линию между двумя линиями восприятия, они впоследствии лучше справляются с различением расстояний между тремя линиями восприятия [7].Точно так же классическая обусловленность может происходить с произвольно сформированными визуальными образами вместо перцептивных стимулов [8]. В обоих этих примерах обучение на основе образов позже проверяется с помощью перцептивных стимулов, что демонстрирует обобщение от воображаемого к перцептивному содержанию.

    Одним из важных требований в исследовании мысленных образов является обеспечение того, чтобы эффект визуальных образов на одновременное восприятие не зависел только от визуального внимания. Многие исследования продемонстрировали, что уделение внимания определенному стимулу или его части может изменить несколько аспектов сенсорного восприятия.Например, только внимание может увеличить контраст, цвет или когерентность стимула [9–11]. Исследования с использованием техники « бинокль соперничество » (см. Глоссарий) продемонстрировали контрастирующие эффекты образа и внимания. Когда участники визуализируют один из двух паттернов, отображаемый паттерн имеет гораздо более высокую вероятность того, что он будет доминирующим в последующем кратком представлении о соперничестве с одним биноклем [2,12,13]. Другими словами, содержание ментального образа предопределяет последующее доминирование в бинокулярном соперничестве, так же как и слабый или низкоконтрастный перцептивный стимул.Более того, эти эффекты усиливаются с увеличением времени генерации изображения, тогда как увеличение периодов внимания к конкретному стимулу не модулирует этот эффект прайминга [12]. Более того, определенные экспериментальные манипуляции могут ослабить эффект прайминга образов, оставляя нетронутым эффект предшествующего внимания [12]. Таким образом, образы можно отделить от визуального внимания, по крайней мере, по двум разным направлениям.

    В результате многочисленных поведенческих исследований формируется консенсус о том, что влияние предшествующих перцептивных стимулов на последующие перцепционные задачи зависит от «энергии восприятия» или силы предшествующего стимула [12,14–16].Содействие более вероятно, если предыдущий стимул короткий и / или малоконтрастный, тогда как подавление более вероятно, если предыдущий стимул высококонтрастный и / или показан в течение длительного времени [12,14–16]. Следовательно, стимулирующий эффект предшествующего стимула увеличивается по мере увеличения силы или продолжительности представления, пока не достигнет критической точки, когда эффект меняется на противоположный и приводит к уменьшению содействия и усилению подавления () [12,15,16]. Данные свидетельствуют о едином непрерывном механизме, который зависит от визуальной «энергии» предшествующего стимула; то есть его сенсорная сила.На данный момент поведенческие данные показывают, что влияние образов на последующее восприятие ограничивается диапазоном содействия, а не подавления (B, правая панель) (обзор см. В [2]).

    Образцы похожи на слабую версию восприятия. (A) Полезный способ концептуализировать ментальные образы — это слабая форма сенсорного восприятия. (B) схематическая иллюстрация воздействия предшествующих перцептивных стимулов разной силы и образов на последующее восприятие. На левом графике показаны гипотетические данные для предшествующих перцептивных стимулов разной силы (например,г., контрасты). Низкоконтрастная предварительная стимуляция облегчает последующее обнаружение [16] или доминирование бинокулярного соперничества [12,15], тогда как предыдущая высококонтрастная стимуляция вызывает подавляющее последействие. Напротив, на правом графике изображения только облегчают последующее восприятие. В целом образы действуют как слабое восприятие. Графики схематических данных основаны на данных из [12,15].

    Если мысленные образы задуманы как тип восприятия сверху вниз, визуальные характеристики, такие как яркость или яркость, также должны быть сохранены в воображаемых представлениях и должны иметь аналогичный эффект на физиологию.Действительно, недавнее исследование продемонстрировало именно это: яркость воображаемого стимула оказала надежное и предсказуемое влияние на сужение зрачка, как и во время восприятия [17].

    Кроме того, исследования мозга предоставили убедительные доказательства того, что визуальные ментальные образы возникают в результате активации тех же типов зрительных функций, которые активируются во время зрительного восприятия. Несколько исследований явно смоделировали представления, закодированные в активности во время восприятия, а затем использовали эту модель для декодирования мысленных образов на основе активности мозга.Насколько нам известно, этот явный подход к моделированию — известный как воксельное моделирование и декодирование (VM) — впервые был применен к мысленным образам в 2006 году [18]. Это знаменательное исследование разработало воксельную модель настройки на ретинотопное местоположение (то есть модель рецептивного поля), а затем использовало ее для декодирования мысленных изображений высококонтрастных пятен в различных конфигурациях. В соответствии с доказательствами ретинотопной организации в ментальных образах [19], модели ретинотопной настройки во время зрительного восприятия могут быть использованы для идентификации и даже реконструкции ментальных образов стимулов ().

    Паттерны активности, вызываемые визуальным восприятием и визуальными мысленными образами, становятся все более похожими с ростом иерархии обработки. Эта диаграмма суммирует организационный принцип, который подразумевается в литературе по фМРТ по визуальным ментальным образам. Здесь вентральный поток грубо сгруппирован в ранние визуальные области (заштрихованная область мозга, левые панели), которые представляют визуальные особенности низкого уровня (например, края, текстуры) и визуальные области более высокого уровня (заштрихованная область, правые панели), которые представляют сцену. информация об уровне и категориях объектов.В целях иллюстрации мы рассматриваем гипотетические популяции мультивокселей, состоящие только из двух вокселей в ранней зрительной коре (слева) и двух вокселей в верхней зрительной коре (справа). Паттерны активности представлены как векторы в двухмерном пространстве, в котором оси соответствуют двум гипотетическим вокселям. В ранних визуальных областях активность, связанная с мысленными образами, имеет более низкое отношение сигнал / шум (SNR), чем активность, связанная с восприятием. Это означает, что средний вектор активности (черная стрелка), вызванный визуализацией определенного стимула, короче, чем средний вектор активности, вызванный фактическим просмотром соответствующего стимула, в то время как разброс моделей активности вокруг среднего вектора активности (длина дуги) больше.В более высоких визуальных областях отношение сигнал / шум, связанное с мысленными образами, не так сильно ослаблено.

    Можно утверждать, что представление простых, похожих на капли стимулов, оптимизированных для взаимодействия с областью V1, — это особый случай мысленных образов, которые могут не иметь отношения к богатым, сложным образам, которые мы генерируем и используем ежедневно. Однако представление низкоуровневых визуальных характеристик сохраняется даже тогда, когда люди визуализируют сложные, многообъектные сцены, такие как фотографии и произведения искусства [20]. Модель, настроенная на ретинотопное расположение, пространственную частоту и ориентацию [21], отбирала мысленные образы конкретных произведений искусства среди тысяч других случайно выбранных изображений — и даже из других примеров собственных работ художников.Производительность была ниже, чем для реального восприятия, но все же намного лучше, чем ожидалось случайно. Таким образом, репрезентации ретинотопии и пространственной частоты — квинтэссенция «визуальных» репрезентаций — закодированы в активности даже во время сложных и сложных мысленных образов.

    Более того, чувствительность как к ориентации восприятия, так и к положению в визуальном пространстве была связана с анатомией V1 [22,23]. Точно так же точность мысленных образов пространственной ориентации и местоположения в ретинотопном пространстве связаны с размером V1 [24].Фактически, точность как мысленных образов, так и визуального восприятия коррелирует с размером области V1, обеспечивая дополнительную поддержку общности между ними.

    В совокупности эти исследования показывают, что паттерны активности в зрительной коре не просто похожи между визуальными ментальными образами и восприятием: паттерны активности кодируют общий набор визуальных представлений. При рассмотрении в свете рассмотренных выше поведенческих свидетельств эти результаты дополнительно подтверждают концептуализацию визуальных ментальных образов как слабой или шумной формы нисходящего восприятия, которое в некоторых случаях может заменять восприятие снизу вверх.

    Психические образы и визуальная рабочая память

    Хотя умственные образы и визуальная рабочая память включают способность представлять и манипулировать визуальной информацией, исследования по этим двум темам разделились на две отдельные литературы, которые редко ссылаются друг на друга [25]. Из-за различных поведенческих мер и используемых задач оказалось непросто установить степень общности между двумя функциями.

    Когда участников экспериментов с визуальной рабочей памятью просят описать стратегии, которые они используют для выполнения задачи памяти, они, как правило, описывают одну из двух различных стратегий.Один из них включает создание мысленного образа для сравнения с последующими тестовыми стимулами [26–28]; другая стратегия заключается в выделении определенных деталей сцены или массива и их фонологическом или вербальном кодировании, которые затем сравниваются с тестовыми стимулами [26,28,29].

    Недавние поведенческие исследования подтверждают эти субъективные отчеты о различных стратегиях [29,30] (но см. [31]). Эта поведенческая работа напрямую сравнивала сенсорную силу мысленных образов и различные показатели зрительной рабочей памяти.Лица с более сильными мысленными образами обладали большей точностью и большей способностью в задачах визуальной рабочей памяти, но не в задачах с иконической или вербальной рабочей памятью [29,30]. Кроме того, только участники с сильными сенсорными образами были обеспокоены пассивным присутствием однородной фоновой яркости во время хранения визуальной рабочей памяти, но не в задаче вербальной рабочей памяти. Важно отметить, что создание визуальных мысленных образов также нарушается наличием однородной пассивной яркости [12,32].Вдобавок, подобно визуальным образам, содержимое зрительной рабочей памяти может искажать восприятие [33] и может способствовать обнаружению в запущенном полуполе пациентов с угасанием зрения [34].

    Взятые вместе, эти поведенческие данные предполагают, что люди с относительно сильными мысленными образами используют их для выполнения задачи визуальной рабочей памяти, тогда как те, у кого более слабые образы, склонны полагаться на невизуальные стратегии.

    Работа с изображениями мозга продемонстрировала перекрытие в нейронном представлении визуальной рабочей памяти и ментальных образов.Например, в одном исследовании [35] в некоторых испытаниях от участников требовалось держать ориентированный решетчатый узор в визуальной рабочей памяти до тех пор, пока их характеристики памяти не будут проверены с помощью зондирующего стимула; в других испытаниях те же участники должны были сформировать и повернуть мысленный образ той же решетки в соответствии с заданным сигналом. ЖИРНЫЕ паттерны активности в области V1 позволили точно расшифровать, какой паттерн сохранялся в зрительной рабочей памяти и в состоянии умственного вращения (образа). Когда классификатор был обучен на данных из условия рабочей памяти, а затем применен для декодирования данных из условия изображения, производительность была столь же высокой [35].Это обобщение декодирования из памяти в образы свидетельствует об общности пространственного паттерна BOLD-активности во время выполнения двух задач. Это, в свою очередь, свидетельствует о перекрытии репрезентативных мысленных образов и визуальной рабочей памяти. Недавние результаты также показывают, что как объем визуальной рабочей памяти, так и сила и точность изображений связаны с размером поверхности V1 [24,36].

    Комбинация поведенческих данных и данных визуализации мозга показывает, что, несмотря на четкие различия в задачах («Сохраните эту визуальную информацию в памяти, и мы впоследствии проверим вас на ней» против «Создайте мысленный образ этого»), мысленные образы и визуальная работа память может иметь общие нейронные механизмы в сенсорной коре.Во многих задачах участники должны решить для себя, как лучше всего увеличить производительность своей памяти. В зависимости от имеющихся «ментальных инструментов» это могут быть ментальные образы или пропозициональная стратегия. Недавняя работа предполагает, что сила изображения и нейронные сети, лежащие в основе изображений, могут играть роль в том, как люди выполняют такие задачи [37].

    Ключ к раскрытию механистической взаимосвязи между визуальными образами и визуальной рабочей памятью может лежать в индивидуальных различиях среди населения в силе визуального представления, физиологии и даже анатомии [36].Если часть населения склонна использовать образы для улучшения памяти, как показывают данные, тогда как другая группа людей, у которых нет сильных образов, использует другую стратегию, коллапс в этих двух группах может вызвать несоответствия в данных визуальной рабочей памяти. Разделение участников на эти группы, основанное на силе их образов, может быть хорошей отправной точкой для понимания нейронных механизмов, используемых в визуальной рабочей памяти.

    Градуированная общесистемная активация зрительной коры во время ментальных образов

    Зрительная система человека представляет собой совокупность функционально различных областей.Эти области задуманы как организованные в иерархию. Активация в областях наверху иерархии — так называемых визуальных областях «высокого уровня» — чувствительна к изменениям семантического содержания визуального пейзажа и инвариантна к визуальным деталям. Эти области расположены в вентральной височной доле, и представления, закодированные в активности этих областей, становятся все более абстрактными по отношению к переднему полюсу. Области в нижней части иерархии — «ранние» визуальные области — расположены в затылочной коре и чрезвычайно чувствительны к визуальным деталям (например,g., ретинотопное расположение, пространственная частота, края).

    Учитывая эту организацию и тот факт, что первые визуальные области посылают проекции и получают проекции из визуальных областей высокого уровня, многие исследователи предсказали, что роль ранних визуальных областей в ментальных образах состоит в том, чтобы конкретизировать визуальные детали.

    Между 1993 и 2010 годами, по крайней мере, 20 исследований пытались проверить эту гипотезу с помощью сканирования мозга для сравнения амплитуды активности в ранних визуальных областях во время визуальных мысленных образов с амплитудой активности во время восприятия (или отдыха).Во многих исследованиях не сообщалось о значительной активности выше исходного уровня в ранней зрительной коре во время мысленных образов [38–45], но несколько большее количество исследований сообщали о значительной активности [46–57]. Расхождение может быть объяснено различиями в экспериментальных факторах [58] и различиями в яркости ментальных образов у ​​разных людей [55]. Между тем, свидетельства активации в высокоуровневых областях во время съемки неоспоримы; исследования, опубликованные более десяти лет в разных группах, показали сравнимые уровни активности в визуальных ментальных образах и визуальном восприятии в визуальных областях высокого уровня [38,49,59,60].Хотя активация в более высоких областях во время мысленных образов более сильна, чем в ранних визуальных областях, яркость мысленных образов, по-видимому, наиболее тесно связана с активностью в ранних визуальных областях [55]. См. Вставку 1 для других доказательств.

    Box 1

    Исследования повреждений мозга

    Многие исследования связаны с измерениями изображений для повреждения определенных частей мозга. Например, в одном исследовании исследователи [112] просили пациентов с односторонним игнорированием заботы представить, что они стоят по обе стороны известной площади в Милане, Италия.Первичный симптом одностороннего пренебрежения заключается в том, что, когда пациенты смотрят на перцептивную сцену перед ними, они склонны пренебрегать одной стороной пространства. Когда пациентов просили описать площадь мысленным взором, пациенты описывали ориентиры только на одной стороне площади. Чтобы убедиться, что это не из-за дефицита памяти, пациентов просили представить площадь с противоположной точки зрения; пациенты могли описать детали ранее игнорировавшейся стороны, но теперь не обращали внимания на другую сторону.Этот результат был принят как доказательство того, что образы и восприятие имеют общие нейронные процессы на уровне развертывания внимания.

    Повреждение ранней зрительной коры также было диагностировано с учетом роли области V1 в генерации изображений. В одном исследовании исследователи смогли проверить размер визуализируемых объектов как до, так и после односторонней резекции затылочной доли для лечения эпилепсии [113]. Используя особый метод, который включает в себя представление объекта и затем движение к нему мысленным взором, пока объект не заполняет все поле зрения, а затем сообщая расстояние между человеком и объектом, исследователи могут сделать вывод о максимальном размере изображения.Здесь они обнаружили, что после операции максимальный размер изображения пациента уменьшился по горизонтали по сравнению с размером изображения до операции.

    Такие данные предполагают, что область V1 играет функциональную роль в визуальных ментальных образах. Однако другие исследования показали, что возможно иметь неповрежденные и даже яркие мысленные образы, как поведенческие, так и при оценке с использованием изображений мозга, несмотря на почти полную слепоту из-за повреждения коркового вещества серого вещества в известковой борозде (V1) [114].Следовательно, повреждение V1 ухудшит ментальные образы, но даже если V1 почти полностью исчез, ментальные образы остаются возможными (вставка 2).

    Таким образом, результаты исследований пациентов с повреждениями головного мозга согласуются с результатами фМРТ и поведенческих исследований, отмеченными в тексте: области раннего зрения могут способствовать формированию образов, но другие области также играют ключевую роль. Этот вывод согласуется с идеей, что ментальные образы, как и зрительные восприятия, полагаются на представления, которые совместно создаются визуальными областями на всех этапах иерархии визуальной обработки.

    Однако активация — это только часть картины. Недавние исследования с использованием многомерных классификаторов паттернов (MVPC) показали, что те же самые классификаторы паттернов, которые точно распознают стимулы, анализируя паттерны активности в зрительных областях V1 и V2 во время восприятия простых внешних стимулов, также могут различать одни и те же стимулы во время мысленных образов [35]. , 61,62]. Это говорит о том, что, хотя общие уровни активации в V1 во время изображений относительно низки, паттерны активности в изображениях и восприятии в V1 и V2 схожи.Этот вывод снова подтверждает гипотезу об общем формате представления в образах и восприятии.

    Исследования MVPC также выявили сходство в моделях активности визуального восприятия и образов в визуальных областях высокого уровня [59,60,63]. В соответствии с исследованиями активации, производительность декодирования обычно более надежна в областях высокого уровня, чем в областях ранней визуализации. Таким образом, исследования визуальных ментальных образов с помощью MVPC подтверждают утверждение о том, что паттерны деятельности в восприятии и образе становятся все более похожими с подъемом визуальной иерархии (см. Вставки 1 и 2).

    Box 2

    Первичная зрительная кора и ментальные образы

    Во время визуального восприятия область V1 отличается как своим анатомическим расположением, так и визуальными особенностями, которые закодированы в ее активности. Эта область является анатомически привилегированной, потому что она является привратником информации сетчатки в кору. Он получает больше прямых связей от латерального коленчатого ядра, чем любая другая часть зрительной коры. Однако во время мысленных образов его близость к сетчатке не делает его особенным.Источник мысленных образов неизвестен, но вполне вероятно, что критически важны структуры кодирования памяти в медиальной височной доле (MTL) и исполнительные структуры в префронтальной коре. Кроме того, область V1 отличается представлением низкоуровневых визуальных функций. Модели восприятия с прямой связью рассматривают эти низкоуровневые функции как строительные блоки представления объекта. Однако модели обратной связи рассматривают их не как основу для построения представлений объектов, а как инструмент для проверки ошибок прогнозов о том, какие объекты присутствуют в ближайшем окружении [115].

    Анатомическая важность V1 во время мысленных образов может быть получена из его топографической организации, которая позволяет ему делать явные и доступные геометрические свойства, которые неявно присутствуют только в представлениях, хранящихся в долговременной памяти. Другими словами, роль V1 в образе может определяться видами умозаключений, которые он позволяет сделать из мысленного образа. Например, если мы хотим сделать вывод, есть ли у немецкой овчарки заостренные или висячие уши [116], нам может потребоваться использовать V1-подобное представление как компонент нашего ментального образа.Если мы просто хотим сделать вывод, больше ли слон, чем мышь, может быть достаточно вызвать представления в любой из многих визуальных и / или теменных областей, которые топографически отображены. Эта идея полностью согласуется с выводами, которые предполагают, что степень активации V1 во время мысленных образов зависит от задачи.

    Кроме того, роль V1 в изображениях может сильно различаться у разных людей. Область V1 может вносить очень разный вклад в мысленные образы у разных людей, в зависимости от того, насколько важны ее представления для того, как каждый человек представляет объекты и / или сцены [117].Недавние исследования документально подтвердили, что размер области V1 определяет сенсорную силу и точность визуальных образов [24]. Такие отношения хорошо согласуются с теориями ограничения емкости, которые предлагают взаимодействие между содержимым и анатомическими ограничениями из-за двумерной компоновки структур, таких как V1, которые поддерживают представления [118].

    Взятые вместе, MVPC и исследования активации показывают, что паттерны активности, связанные с подобранными внешними и воображаемыми стимулами, начинают напоминать друг друга уже в области V1.Сходство возрастает с подъемом визуальной иерархии, хотя яркость образов, по-видимому, наиболее тесно связана с ранними визуальными областями.

    Эта общая картина того, как мысленные образы задействуют зрительную кору головного мозга, удовлетворяет многие интуитивные представления о том, как генерируются мысленные образы. Например, мысленные образы предположительно основаны на воспроизведении и рекомбинации воспоминаний. Поскольку высокоуровневые области физически (и синаптически) ближе к структурам кодирования памяти в медиальной височной доле, чем более ранние зрительные области, имеет смысл, что паттерны активности, связанные с воспринимаемыми и воображаемыми изображениями, должны больше напоминать друг друга в высоком уровень, чем в ранних визуальных областях.Это также может объяснить, почему семантические аспекты ментальных образов имеют тенденцию быть менее двусмысленными, чем визуальные детали (например, мы можем точно знать, что представляем зебру, а не лошадь, даже если мы не можем представить себе отдельные полосы зебры. ). Наконец, имеет смысл, что части зрительной системы, отвечающие за визуальные детали, должны быть наиболее тесно связаны с визуальной яркостью ментальных образов.

    Психические образы при психических расстройствах и их лечении

    В те же временные рамки, что и растущие фундаментальные механистические исследования, которые мы обсуждали до сих пор, было обнаружено, что умственные образы также играют ключевую роль во многих психических и неврологических расстройствах и их лечении.Например, навязчивые эмоциональные ментальные образы вызывают дистресс при различных психических расстройствах, от посттравматического стрессового расстройства (ПТСР) и других тревожных расстройств до биполярного расстройства и шизофрении [64]. Однако эти психологические методы лечения, в основном основанные на вербальном обмене, исторически игнорировали образы, в первую очередь сосредоточиваясь на вербальных мыслях пациента.

    После психологически травмирующего события у значительной части людей развивается посттравматическое стрессовое расстройство [65]. Посттравматическое стрессовое расстройство, характеризующееся повторным переживанием травмирующего события через нежелательные и повторяющиеся навязчивые воспоминания и кошмары, является отличительной иллюстрацией клинически значимых мысленных образов.Примером навязчивого воспоминания является повторное переживание яркого визуального и слухового мысленного образа момента, когда красная машина сбила ребенка на тротуаре. Такие тревожные образы могут быть лишь мимолетными и происходить всего несколько раз в неделю, но их влияние может быть огромным. Пациент может избегать напоминаний о травмирующем событии, например, об автомобилях, детях или прогулке по улице, и может чувствовать текущую угрозу и учащенное сердцебиение. Эти основанные на образах воспоминания — не просто эпифеномен посттравматического стрессового расстройства, а когнитивный механизм, поддерживающий текущее клиническое расстройство [66].Другими словами, навязчивые образы могут сильно повлиять на поведение и физиологию.

    В последние годы наблюдается бурный рост исследований, предполагающих, что ментальные образы играют роль в широком спектре психических расстройств [64,67–69]. Было показано, что тревожные и нежелательные эмоциональные образы возникают при многих психических расстройствах, и их содержание соответствует основной заботе людей с этим расстройством. Например, пациент с арахнофобией (страхом перед пауками) может сообщать о том, что он видит больших волосатых пауков с клыками.У пациента с обсессивно-компульсивным расстройством (ОКР) могут быть изображения зараженных личинок, проникающих в его кожу, и поэтому он чувствует себя грязным, подпитывая поведение многократного мытья. Во время разговора пациентка с социальной фобией (страх публичных выступлений) может одновременно воспринимать образы того, как она выглядит перед собеседником, представляя себя красной и потной. Пациент с биполярным расстройством может иметь ориентированные на будущее образы и «мчаться вперед» к суицидальному акту [70]. И наоборот, в депрессии люди могут сообщать о трудностях с представлением о позитивном будущем [71] (см.).

    Образы — ключевая часть симптомов при психических расстройствах — от навязчивых воспоминаний о травме при посттравматическом стрессовом расстройстве (ПТСР) до отсутствия позитивных представлений о будущем при депрессии. Он представляет собой когнитивный механизм, управляющий психопатологией, и, таким образом, образы также могут быть нацелены как процесс — и использоваться как инструмент — в психологическом лечении.

    Клиническая значимость ментальных образов

    Учитывая центральную роль навязчивых эмоциональных образов в таком большом разнообразии психических расстройств, базовое понимание ментальных образов может оказаться полезным в разработке новых методов лечения.К потенциально критическим проблемам относятся относительное эмоциональное воздействие различных форматов представления, «реальность» образов и предполагаемая вероятность возникновения воображаемых событий.

    До недавнего времени относительное влияние графических форматов и языковых описательных форматов на эмоции проводилось на удивление мало. то есть ментальные образы против вербальной мысли (за исключением см. [72]). Недавние эксперименты подтверждают гипотезу о том, что по сравнению с вербальной обработкой того же содержания мысленные образы вызывают более сильные эмоции.Например, в одном эксперименте участникам были предложены негативные сценарии с инструкциями, которые способствовали вербальной обработке или мысленным образам [73]. Образы привели к еще большему усилению беспокойства. При представлении положительных сценариев образы снова усиливали (положительные) эмоции [74,75]. Такие данные согласуются с выводом о том, что эмоциональные воспоминания имеют больше сенсорно-перцептивных характеристик, чем неэмоциональные воспоминания [76].

    Другие свойства изображений также важны. По сравнению со словесными мыслями аналогичного содержания, мысленные образы оцениваются как более «реальные» [77].Многие пациенты сообщают, что их образы «кажутся реальными», несмотря на то, что они знают, что они ненастоящие, образы оказывают глубокое влияние на их поведение. Кажущаяся реалистичность клинических образов, кажется, добавляет им силы, влияя не только на поведение и эмоции, но и на убеждения. Галлюцинации при шизофрении определяются как психические переживания, которые считаются внешними восприятиями. И шизофрения [78], и болезнь Паркинсона [79] связаны с непроизвольными сенсорными галлюцинациями. При болезни Паркинсона степень зрительной галлюцинации хорошо предсказывается сенсорной силой произвольных мысленных образов человека [79].

    Неоднократное воображение будущего события увеличивает предполагаемую вероятность его наступления [80]. Этот эвристический эффект моделирования также имеет место для провоцирующих тревогу будущих событий [81], повышающих уровень тревожности. И наоборот, представление события, которое предположительно произошло в прошлом (даже если оно не произошло), раздувает уверенность человека в том, что событие действительно произошло [82].

    Воображаемая репетиция действия влияет на вероятность того, что человек завершит это действие [83]. Хотя такое продвижение поведения может быть полезно, когда желательны действия, например, в спортивной психологии, можно увидеть, как его последствия могут быть неадаптивными в психопатологии; например, за счет улучшения стирки при ОКР.Точно так же образ желаемого вещества может способствовать развитию тяги и тем самым вызывать привыкание [84,85]. При депрессии воображение суицидальных действий может даже увеличить риск самоубийства [86]. И наоборот, нарушение способности моделировать позитивные события будущего связано с депрессией [87,88] (расстройство, характеризующееся пессимизмом), тогда как оптимизм в отношении черт характера связан с большей способностью мысленно моделировать позитивные события будущего [119].

    Психические образы в клинической практике

    Эти интригующие результаты об эмоциональном и поведенческом влиянии мысленных образов предлагают понимание разработки новых методов лечения тревожных расстройств.Трудно лечить проблемные эмоциональные образы с помощью чисто словесного обсуждения в терапии: для эффективного уменьшения симптомов, связанных с образами, терапевтические методы должны включать компонент, ориентированный на образы. Техники ментальных образов в настоящее время используются в некоторых основанных на фактических данных методах лечения. Например, когнитивно-поведенческая терапия (КПТ) часто включает «воображаемое воздействие», при котором пациенту постоянно приходится воображать пугающий объект или контекст (например, загрязненные руки) до тех пор, пока его или ее уровень тревожности не снизится [89].Воображаемое воздействие — ключевой метод, используемый при тревожных расстройствах.

    Другой метод, «переписывание изображений» [68], направлен на преобразование содержания изображений. Например, при социальной фобии отрицательный результат мысленных образов (например, плохая работа) меняется на новый, более адаптивный образ, такой как компетентное выполнение [90]. «Систематическая десенсибилизация» использует постепенное воздействие на изображения предметов или ситуаций, которых боятся, при этом образ сочетается с несовместимой реакцией на страх — такой как физическое расслабление — до тех пор, пока изображение не перестанет вызывать негативные эмоции [91].Форма терапии, называемая «десенсибилизация и переработка движений глаз» (EMDR), способствует боковым движениям глаз во время вызова эмоциональных воспоминаний; эта техника, кажется, приглушает яркость и эмоциональность образов [92].

    Эти терапевтические техники, ориентированные на образы, уменьшают мощное воздействие дисфункциональных образов на эмоции и / или уменьшают частоту связанных навязчивых образов. Примечательно, что когнитивно-поведенческая терапия, ориентированная на образы, как указано в клинических руководствах [120], оказывает сильнейшее документально подтвержденное влияние на лечение посттравматического стрессового расстройства и социальной фобии, при этом некоторые испытания показали, что показатели успеха достигают 75%.

    Будущие методы лечения с помощью ментальных образов

    Каким образом исследование ментальных образов может привести к инновациям в лечении в будущем? Во-первых, мы можем импортировать существующие методы обработки изображений в клинические области, где изображениями не уделялось должного внимания. Например, лечение биполярного расстройства не улучшилось с момента открытия лития много десятилетий назад. Возможно, можно добиться прогресса, если использовать тот факт, что люди с биполярным расстройством часто спонтанно используют образы и навязчивые образы [70,93].Рассматривая возможную роль образов в этом расстройстве, можно разработать новые методы лечения, импортировав методы визуализации из тех, что используются для лечения тревожных расстройств. Другой пример — обращение к безнадежной, пессимистической ориентации на будущее путем обучения пациентов с депрессией формированию более адаптивных мысленных образов и имитации будущих позитивных событий. Первоначальное рандомизированное контролируемое исследование, включающее компьютеризированную тренировку позитивных образов у ​​пациентов с депрессией, показало некоторые многообещающие результаты [94] (хотя см. Также [71]), требующие дальнейших исследований.

    Во-вторых, фундаментальные научные исследования ментальных образов могут помочь в разработке новых методов обработки образов, сосредоточив внимание на изобразительном, изобразительном формате самих образов. Например, как обсуждалось выше, одновременное восприятие может мешать генерации изображения [2,12,95]. Этот вывод согласуется с тем фактом, что стратегически применяемые визуальные задачи, такие как компьютерная игра Тетрис, выполняемые вскоре после экспериментальной травмы (во временном окне для консолидации памяти), снижают частоту навязчивых изображений [96]; этот метод был недавно распространен на обратное уплотнение [97].Такие открытия могут открыть способы предотвращения накопления навязчивых образов, что важно, поскольку нам необходимы профилактические методы лечения посттравматического стрессового расстройства [98]. Также может быть полезно увязать исследования эмоциональных образов с нейронными механизмами [99,100].

    В целом открытия в области ментальных образов могут способствовать нашему пониманию когнитивных и нейронных механизмов, лежащих в основе психопатологии, и того, какие механизмы следует использовать при улучшении лечения [101]. Даже самые лучшие методы лечения не работают для всех, а эффективные методы лечения доступны не для всех психических расстройств.Научно обоснованные методы лечения ментальными образами могут очень помочь и могут даже предложить инновационные методы лечения, мало похожие на традиционные методы разговорной терапии. Такое лечение будет основываться на том принципе, что изображения включают в себя изобразительный формат со своим собственным набором свойств [3] (вставка 2).

    Заключительные замечания

    Многие новые методы, затронутые здесь, не только предлагают новые механизмы понимания ментальных образов, но также предлагают новые инструменты для будущих исследований. Недавняя работа продемонстрировала, как образы могут «заменять» афферентное визуальное представление внешнего стимула.В частности, ментальные образы, кажется, ведут себя как слабые версии внешне запускаемых перцептивных репрезентаций. Функциональная визуализация мозга поддерживает поведенческие свидетельства, демонстрируя, что общие наборы нейронных структур используются во время обоих событий. Кроме того, оба представления кажутся закодированными с использованием общего набора основных визуальных функций, которые во многих визуальных областях организованы топографически.

    Все более важным компонентом исследования изображений сейчас и в будущем будет перевод фундаментальной науки в клинику.Клинические исследования показывают, что многие различные психические расстройства связаны с симптоматическими образами, и их использование в поведенческих методах лечения оказывается полезным. Мосты от фундаментальных исследований к эмоциональным образам будут иметь решающее значение для системного понимания ментальных репрезентаций при дисфункции. Точно так же характеристики и функция ментальных представлений в повседневном познании помогут сформировать более полное понимание ментальных событий человека.

    Основные функции мысленных образов включают моделирование возможных сценариев будущего и «повторное переживание» прошлого опыта [83,102,103].С этой точки зрения, образы, возможно, следует изучать не только сами по себе, но и для решения многих типов когнитивных задач. Помимо визуальной рабочей памяти, мы знаем, что образы играют роль в аффективном прогнозировании [104], памяти очевидцев [105], принятии определенных моральных решений [106], шаблонах предварительных ожиданий для помощи в предсказуемых визуальных задачах [107] и облегчении эмоций. [108]. Психические симуляции теперь используются для обнаружения сознания у пациентов с вегетативным состоянием [109] и могут быть декодированы с помощью изображений мозга на ранних стадиях сновидений [110].Одно интересное предположение состоит в том, что все формы познания включают специфические для модальности ментальные симуляции, известные как воплощенное или обоснованное познание [111]. Такие теории подразумевают, что образы играют функциональную роль во всех когнитивных событиях. Приятно видеть подробные, вездесущие и многогранные образы, которые играют в нашей повседневной жизни как в функциях, так и в дисфункциях.

    Неурегулированные вопросы

    Чем различаются восприятие и ментальные образы? Между внешними перцептивными и ментальными образами существуют явные феноменологические и эпистемологические различия, а паттерны активности, измеренные во время воображения и восприятия одного и того же стимула, не идентичны.Первым шагом к ответу на этот вопрос будет определение того, являются ли модели нейронной активности, индуцированные образами, просто более слабыми или шумными версиями активности во время восприятия совпадающих внешних стимулов, или они кодируют систематически искаженные представления.

    Могут ли люди использовать различия между мысленными образами и восприятием?

    Чем мысленные образы отличаются от других форм нисходящей деятельности? На зрительное восприятие сильно влияют рабочая память, внимание и ожидания.Очевидно, что ментальные образы связаны с этими разрозненными когнитивными явлениями, но требуется дополнительная работа, чтобы выяснить сети и паттерны нейронной активности, которые отличают ментальные образы от этих и других способов познания и восприятия.

    Могут ли ментальные образы быть непроизвольными, как предлагает клиническая теория? Или люди просто не осознают добровольный процесс (например, имеют плохое метапознание)? Тип образов, преобладающий при многих психических расстройствах, обычно описывается как непроизвольный или неподконтрольный человеку (см. Клинический раздел).Мало что известно о механизмах, которые различают произвольные и непроизвольные образы.

    Могут ли мысленные образы генерироваться бессознательно?

    Какие функциональные механизмы определяют индивидуальные различия в силе образа?

    Существует множество примеров визуальных иллюзий, которые создают сознательный визуальный опыт без прямого стимула. Может ли непроизвольная природа такого фантомного перцептивного опыта предложить новый способ изучения непроизвольных элементов образов?

    Заявление об отказе от ответственности

    Выраженные взгляды принадлежат авторам, а не обязательно NHS, NIHR или Департамента здравоохранения.Финансирование для оплаты публикации этой статьи в открытом доступе было предоставлено Советом медицинских исследований Соединенного Королевства.

    Благодарности

    J.P. поддерживается австралийскими грантами NHMRC APP1024800, APP1046198 и APP1085404, стипендиями для развития карьеры APP1049596 и ARC Discovery Project DP140101560. E.A.H. поддерживается Внутренней программой Совета медицинских исследований (Соединенное Королевство) (MC-A060-5PR50), Клинической стипендией Wellcome Trust (WT088217) и Программой Оксфордского центра биомедицинских исследований Национального института исследований в области здравоохранения (NIHR).Выраженные взгляды принадлежат авторам, а не обязательно NHS, NIHR или Министерства здравоохранения. Финансирование для оплаты публикации этой статьи в открытом доступе было предоставлено Советом медицинских исследований Соединенного Королевства.

    Глоссарий

    Бинокулярное соперничество визуальное явление, в котором представлены два разных рисунка, по одному для каждого глаза; паттерны конкурируют за перцептивное доминирование, так что во время непрерывного просмотра осознание чередуется между двумя паттернами.
    Низкоуровневые визуальные признаки в этом контексте относятся конкретно к воспринимаемым визуальным характеристикам, таким как цвет, пространственная ориентация, контраст и пространственная частота; особенности зрительных стимулов, которые в значительной степени обрабатываются ранней зрительной корой.
    Многомерные классификаторы шаблонов (MVPC), также называемые многомерным декодированием; в фМРТ, как правило, использование пространственных паттернов (много вокселей) для прогнозирования или классификации некоторого перцептивного, когнитивного или поведенческого состояния.Активация нескольких вокселей из данных фМРТ используется как шаблон, а не усреднение по интересующей области.
    Ретинотопический относится к отображению информации из расположения сетчатки глаза в зрительную кору. Клетки зрительной коры отвечают на стимуляцию определенной части зрительного пространства, так что две соседние клетки будут реагировать на два соседних стимула, поражающих сетчатку.
    Voxel в фМРТ, наименьшая единица измеренных данных.

    Ссылки

    1. Пирсон Дж., Вестбрук Ф. Фантомное восприятие: произвольное и непроизвольное зрение без сетчатки. Trends Cogn. Sci. 2015; 19: 278–284. [PubMed] [Google Scholar] 2. Пирсон Дж. Новые направления в исследовании ментальных образов: техника бинокулярного соперничества и расшифровка паттернов фМРТ. Curr. Реж. Psychol. Sci. 2014; 23: 178–183. [Google Scholar] 3. Пирсон Дж., Кослин С.М. Неоднородность ментальной репрезентации: окончание дискуссии об образах. Proc. Natl. Акад. Sci.США, 2015; 112: 10089–10092. [Бесплатная статья PMC] [PubMed] [Google Scholar] 4. Ишай А., Саги Д. Общие механизмы визуальных образов и восприятия. Наука. 1995; 268: 1772–1774. [PubMed] [Google Scholar] 5. Мор Х. Последствия, связанные с ориентацией, на мысленно генерируемые линии. Восприятие. 2011; 40: 272–290. [PubMed] [Google Scholar] 6. Винавер Дж. Последействие движения от визуальных образов движения. Познание. 2010. 114: 276–284. [PubMed] [Google Scholar] 7. Тарталья Э.М. Обучение восприятию человека с помощью мысленных образов.Curr. Биол. 2009; 19: 2081–2085. [PubMed] [Google Scholar] 8. Льюис Д. Кондиционирование мысленного взора: ассоциативное обучение с произвольными мысленными образами. Clin. Psychol. Sci. 2013 г. Опубликовано в Интернете 16 апреля 2013 г. [Google Scholar] 9. Лю Т. Внимание изменяет внешний вид связности движений. Психон. Бык. Ред. 2006; 13: 1091–1096. [PubMed] [Google Scholar] 10. Фуллер С., Карраско М. Экзогенное внимание и цветовое восприятие: исполнение и внешний вид насыщенности и оттенка. Vision Res. 2006; 46: 4032-4047.[PubMed] [Google Scholar] 13. Пирсон Дж. Оценка мысленным взором: метапознание визуальных образов. Psychol. Sci. 2011; 22: 1535–1542. [PubMed] [Google Scholar] 14. Пирсон Дж., Браскэмп Дж. Сенсорная память для неоднозначного видения. Trends Cogn. Sci. 2008; 12: 334–341. [PubMed] [Google Scholar] 15. Браскэмп Дж. В. Подавление вспышки и облегчение вспышки в бинокулярном соперничестве. J. Vis. 2007; 7: 12. [PubMed] [Google Scholar] 17. Лаенг Б., Сулутведт У. Зрачок глаза приспосабливается к воображаемому свету. Psychol. Sci. 2014; 25: 188–197.[PubMed] [Google Scholar] 18. Тирион Б. Обратная ретинотопия: вывод визуального содержания изображений из паттернов активации мозга. Нейроизображение. 2006. 33: 1104–1116. [PubMed] [Google Scholar] 19. Слотник С.Д. Визуальные ментальные образы вызывают ретинотопически организованную активацию ранних зрительных областей. Цереб. Cortex. 2005; 15: 1570–1583. [PubMed] [Google Scholar] 20. Населарис Т. Модель кодирования по вокселям для ранних зрительных областей декодирует мысленные образы запомненных сцен. Нейроизображение. 2015; 105: 215–228. [Бесплатная статья PMC] [PubMed] [Google Scholar] 22.Сонг С. Изменчивость размера зрительной коры отражает компромисс между чувствительностью к локальной ориентации и модуляцией глобальной ориентации. Nat. Commun. 2013; 4: 2201. [Бесплатная статья PMC] [PubMed] [Google Scholar] 24. Бергманн Дж. Меньшая первичная зрительная кора связана с более сильными, но менее точными мысленными образами. Цереб. Cortex. 2015 г. Опубликовано в Интернете 18 августа 2015 г. [PubMed] [Google Scholar] 26. Гур Р.К., Хилгард Э.Р. Визуальные образы и различение различий между измененными изображениями, одновременно и последовательно представленными.Br. J. Psychol. 1975. 66: 341–345. [PubMed] [Google Scholar] 28. Бергер Г.Х., Гауниц С.С. Самооценка образов и стратегии кодирования в зрительной памяти. Br. J. Psychol. 1979; 70: 21–24. [PubMed] [Google Scholar] 29. Кио Р., Пирсон Дж. Сенсорная сила произвольных визуальных образов предсказывает объем рабочей зрительной памяти. J. Vis. 2014; 14: 7. [PubMed] [Google Scholar] 31. Борст Г. Репрезентации в мысленных образах и рабочей памяти: свидетельства различных типов визуальных масок. Mem. Cognit. 2011; 40: 204–217.[PubMed] [Google Scholar] 32. Чанг С. Функциональные эффекты цветового восприятия и цветовой образности. J. Vis. 2013; 13: 4. [PubMed] [Google Scholar] 34. Сото Д., Хамфрис Г.В. Увидеть содержимое ума: повышенное осознание за счет рабочей памяти у пациентов с угасанием зрения. Proc. Natl. Акад. Sci. США, 2006 г .; 103: 4789–4792. [Бесплатная статья PMC] [PubMed] [Google Scholar] 35. Альберс А.М. Общие представления рабочей памяти и мысленных образов в ранней зрительной коре. Curr. Биол. 2013; 23: 1427–1431.[PubMed] [Google Scholar] 36. Бергманн Дж. Нейронная анатомия первичной зрительной коры ограничивает зрительную рабочую память. Цереб. Cortex. 2014 г. Опубликовано в Интернете 6 августа 2014 г. [PubMed] [Google Scholar] 37. Логи Р.Х. Построители низкого и высокого изображений активируют сети по-разному в умственном вращении. Нейропсихология. 2011; 49: 3071–3077. [PubMed] [Google Scholar] 38. Ишай А. Распределенные нейронные системы для генерации зрительных образов. Нейрон. 2000; 28: 979–990. [PubMed] [Google Scholar] 39. Д’Эспозито М. Функциональное МРТ-исследование создания мысленных образов.Нейропсихология. 1997. 35: 725–730. [PubMed] [Google Scholar] 40. Кнауфф М. Кортикальная активация, вызванная визуальными мысленными образами, измеренная с помощью фМРТ. Нейроотчет. 2000; 11: 3957–3962. [PubMed] [Google Scholar] 41. Трояно Л. Сопоставление двух воображаемых часов: функциональная анатомия пространственного анализа в отсутствие визуальной стимуляции. Цереб. Cortex. 2000; 10: 473–481. [PubMed] [Google Scholar] 43. Формизано Э. Отслеживание мысленного образа в мозгу I: фМРТ с временным разрешением во время визуально-пространственных мысленных образов.Нейрон. 2002; 35: 185–194. [PubMed] [Google Scholar] 44. Мешок А. Отслеживание мысленного образа в мозге II: транскраниальная магнитная стимуляция выявляет теменную асимметрию в зрительно-пространственных образах. Нейрон. 2002; 35: 195–204. [PubMed] [Google Scholar] 45. Даселаар С.М. Специфические и независимые от модальности компоненты системы человеческих образов. Нейроизображение. 2010. 52: 677–685. [PubMed] [Google Scholar] 46. Ле Бихан Д. Активация первичной зрительной коры человека во время визуального воспоминания: исследование магнитно-резонансной томографии.Proc. Natl. Акад. Sci. США 1993; 90: 11802–11805. [Бесплатная статья PMC] [PubMed] [Google Scholar] 47. Саббах П. Функциональная магнитно-резонансная томография при 1,5 Тл во время сенсомоторной и когнитивной задачи. Евро. Neurol. 1995. 35: 131–136. [PubMed] [Google Scholar] 48. Чен В. Активация первичной зрительной коры головного мозга и латерального коленчатого ядра человека во время визуальных образов. Нейроотчет. 1998. 9: 3669–3674. [PubMed] [Google Scholar] 49. О’Крэвен К.М., Канвишер Н. Мысленные образы лиц и мест активируют соответствующие области мозга, специфичные для стимулов.J. Cogn. Neurosci. 2000; 12: 1013–1023. [PubMed] [Google Scholar] 50. Ишай А. Визуальные образы известных лиц: эффекты памяти и внимания, выявленные с помощью фМРТ. Нейроизображение. 2002; 17: 1729–1741. [PubMed] [Google Scholar] 51. Ганис Г. Области мозга, лежащие в основе визуальных мысленных образов и визуального восприятия: исследование фМРТ. Cogn. Brain Res. 2004. 20: 226–241. [PubMed] [Google Scholar] 52. Гебель Р. Конструктивная природа зрения: прямые доказательства из исследований с использованием функциональной магнитно-резонансной томографии видимых движений и образов движения.Евро. J. Neurosci. 1998; 10: 1563–1573. [PubMed] [Google Scholar] 53. Кляйн И. Переходная активность в калькариновой коре человека во время визуально-мысленных образов: исследование фМРТ, связанное с событием. J. Cogn. Neurosci. 2000; 12: 15–23. [PubMed] [Google Scholar] 54. Ламберт С. Нейронные субстраты ментальных образов животных: известковая борозда и вовлечение дорсальных путей — исследование с помощью фМРТ. Brain Res. 2002; 924: 176–183. [PubMed] [Google Scholar] 56. Амеди А. Негатив Жирным шрифтом выделены визуальные образы и восприятие. Нейрон.2005. 48: 859–872. [PubMed] [Google Scholar] 57. Хэнди Т. Визуальные образы и память: влияют ли стратегии поиска на то, что видит мысленный глаз? Евро. J. Cogn. Psychol. 2004. 16: 631–652. [Google Scholar] 58. Кослин С.М., Томпсон В.Л. Когда во время визуальных мысленных образов активируется ранняя зрительная кора головного мозга? Psychol. Бык. 2003. 129: 723–746. [PubMed] [Google Scholar] 60. Стокс М. Нисходящая активация популяционных кодов определенной формы в зрительной коре во время мысленных образов. J. Neurosci. 2009. 29: 1565–1572. [Бесплатная статья PMC] [PubMed] [Google Scholar] 61.Cichy R.M. Образ и восприятие имеют общие корковые представления о содержании и местоположении. Цереб. Cortex. 2012; 22: 372–380. [PubMed] [Google Scholar] 64. Холмс Э.А., Мэтьюз А. Психические образы при эмоциях и эмоциональных расстройствах. Clin. Psychol. Ред. 2010; 30: 349–362. [PubMed] [Google Scholar] 65. Американская психологическая ассоциация. 6 изд. Американская психологическая ассоциация; 2010. Публикационное руководство Американской психологической ассоциации. [Google Scholar] 66. Брюин К.Р. Эпизодическая память, перцептивная память и их взаимодействие: основы теории посттравматического стрессового расстройства.Psychol. Бык. 2014; 140: 69–97. [PubMed] [Google Scholar] 67. Хакманн А., Холмс Э. Размышляя над образами: клиническая перспектива и обзор специального выпуска Memory о ментальных образах и памяти в психопатологии. Объем памяти. 2004; 12: 389–402. [PubMed] [Google Scholar] 68. Холмс Э.А. Перескрипт изображений в когнитивно-поведенческой терапии: изображения, методы лечения и результаты. J. Behav. Ther. Exp. Психиатрия. 2007. 38: 297–305. [PubMed] [Google Scholar] 69. Брюин К.Р.Навязчивые образы при психологических расстройствах: характеристики, нейронные механизмы и последствия лечения.Psychol. Ред. 2010; 117: 210–232. [Бесплатная статья PMC] [PubMed] [Google Scholar] 71. Блэквелл С.Э. Модификация когнитивных предубеждений на основе положительных образов как веб-инструмент лечения депрессивных взрослых: рандомизированное контролируемое исследование. Clin. Psychol. Sci. 2015; 3: 91–111. [Бесплатная статья PMC] [PubMed] [Google Scholar] 72. Врана С.Р. Бойтесь изображений и обработки текста. Психофизиология. 1986; 23: 247–253. [PubMed] [Google Scholar] 73. Холмс Э.А., Мэтьюз А. Ментальные образы и эмоции: особые отношения? Эмоции.2005; 5: 489–497. [PubMed] [Google Scholar] 74. Холмс Э.А. Разработка модификации предвзятости интерпретации как «когнитивной вакцины» от депрессивного настроения: воображение позитивных событий заставляет вас чувствовать себя лучше, чем вербальные размышления о них. J. Abnorm. Psychol. 2009. 118: 76–88. [PubMed] [Google Scholar] 75. Холмс Э.А. Тренировка позитивной интерпретации: влияние мысленных образов по сравнению с вербальной тренировкой на позитивное настроение. Behav. Ther. 2006. 37: 237–247. [PubMed] [Google Scholar] 76. Арнц А. Эмоциональная память перцептивна.J. Behav. Ther. Exp. Психиатрия. 2005; 36: 19–34. [PubMed] [Google Scholar] 77. Мэтьюз А. Чувствует себя настоящим: образы более реалистичны и эмоциональны, чем словесные мысли. Cogn. Эмот. 2013; 27: 217–229. [Бесплатная статья PMC] [PubMed] [Google Scholar] 78. Мешок А. Повышенная яркость ментальных образов как признак шизофрении? Schizophr. Бык. 2005; 31: 97–104. [PubMed] [Google Scholar] 79. Шайн Дж. М. Представьте себе: повышенная сенсорная сила мысленных образов у ​​людей с болезнью Паркинсона и зрительными галлюцинациями.Proc. Биол. Sci. 2015; 282: 20142047. [Бесплатная статья PMC] [PubMed] [Google Scholar] 80. Шпунар К.К., Шактер Д.Л. Стань реальностью: влияние повторяющихся симуляций и эмоций на предполагаемую правдоподобность будущих событий. J. Exp. Psychol. Gen.2013; 142: 323–327. [Бесплатная статья PMC] [PubMed] [Google Scholar] 81. Рауне Д. Эвристическая симуляция и визуальные образы в пессимизме для будущих негативных событий в тревоге. Clin. Psychol. Psychother. 2005; 12: 313–325. [Google Scholar] 82. Гарри М. Раздувание воображения: представление события в детстве увеличивает уверенность в том, что оно произошло.Психон. Бык. Ред. 1996; 3: 208–214. [PubMed] [Google Scholar] 83. Либби Л.К. Представьте себя на опросах: визуальная перспектива в мысленных образах влияет на самовосприятие и поведение. Psychol. Sci. 2007. 18: 199–203. [PubMed] [Google Scholar] 84. Кавана Д.Дж. Воображаемое наслаждение и изысканная пытка: разработанная теория вторжения желания. Psychol. Ред. 2005; 112: 446–467. [PubMed] [Google Scholar] 85. Мэй Дж. Образ и сила тяги к еде, питью и занятиям спортом. Cogn. Эмот. 2008. 22: 633–650.[Google Scholar] 87. Холмс Э.А. Дефицит предполагаемых и позитивных мысленных образов при дисфории. Behav. Res. Ther. 2008; 46: 976–981. [PubMed] [Google Scholar] 88. МакЛауд А.К. Безнадежность и позитивное и негативное мышление о будущем при парасуициде. Br. J. Clin. Psychol. 2005; 44: 495–504. [PubMed] [Google Scholar] 89. Foa E.B. Эффекты воображаемого воздействия страшных бедствий при обсессивно-компульсивных шашках. Behav. Res. Ther. 1980; 18: 449–455. [PubMed] [Google Scholar] 90. Хирш К.Р. Самообразование играет причинную роль в социальной фобии.Behav. Res. Ther. 2003; 41: 909–921. [PubMed] [Google Scholar] 91. Вольпе Дж. Издательство Стэнфордского университета; 1958. Психотерапия взаимным торможением. [Google Scholar] 92. ван ден Хаут М.А. Тоны, уступающие движению глаз при лечении посттравматического стрессового расстройства с помощью EMDR. Behav. Res. Ther. 2012; 50: 275–279. [PubMed] [Google Scholar] 93. Холмс Э.А. Стабильность настроения против нестабильности настроения при биполярном расстройстве: возможная роль эмоциональных ментальных образов. Behav. Res. Ther. 2011; 49: 707–713. [Бесплатная статья PMC] [PubMed] [Google Scholar] 94.Уильямс А.Д. Сочетание воображения и разума в лечении депрессии: рандомизированное контролируемое испытание интернет-модификации когнитивных предубеждений и интернет-CBT для лечения депрессии. J. Консультации. Clin. Psychol. 2013; 81: 793–799. [Бесплатная статья PMC] [PubMed] [Google Scholar] 96. Холмс Э.А. Ключевые шаги в разработке когнитивной вакцины против травматических воспоминаний: зрительно-пространственный тетрис против словесной викторины в пабе. PLoS ONE. 2010; 5: e13706. [Бесплатная статья PMC] [PubMed] [Google Scholar] 97. Джеймс Э. Компьютерная игра уменьшает навязчивые воспоминания об экспериментальной травме с помощью механизмов обновления реконсолидации.Psychol. Sci. 2015; 26: 1201–1215. [Бесплатная статья PMC] [PubMed] [Google Scholar] 98. Робертс Н.П. Ранние психологические вмешательства для лечения симптомов острого травматического стресса. Кокрановская база данных Syst. Ред. 2010 г. Опубликовано в Интернете 17 марта 2010 г. [PubMed] [Google Scholar] 100. Кларк И.А. Первые шаги в использовании машинного обучения на данных фМРТ для предсказания навязчивых воспоминаний о травматических кадрах фильма. Behav. Res. Ther. 2014; 62: 37–46. [Бесплатная статья PMC] [PubMed] [Google Scholar] 101. Холмс Э.А. Психологические методы лечения: призыв к науке о психическом здоровье.Природа. 2014; 511: 287–289. [PubMed] [Google Scholar] 102. Моултон С.Т., Кослин С.М. Воображая предсказания: мысленные образы как мысленное подражание. Филос. Пер. R. Soc. Лондон. В: Биол. Sci. 2009; 364: 1273–1280. [Бесплатная статья PMC] [PubMed] [Google Scholar] 103. Гилберт Д.Т., Уилсон Т.Д. Проспекция: опыт будущего. Наука. 2007; 317: 1351–1354. [PubMed] [Google Scholar] 104. Уилсон Т.Д., Гилберт Д.Т. Аффективное прогнозирование: знать, чего хотеть. Curr. Реж. Psychol. Sci. 2005. 14: 131–134. [Google Scholar] 105.Гарри М., Полащек Д.Л.Л. Воображение и память. Curr. Реж. Psychol. Sci. 2000; 9: 6–10. [Google Scholar] 106. Амит Э., Грин Дж. Д. Видите ли, цель не оправдывает средства: визуальные образы и моральное суждение. Psychol. Sci. 2012; 23: 861–868. [PubMed] [Google Scholar] 107. Кок П. Априорные ожидания вызывают шаблоны стимулов в первичной зрительной коре. J. Cogn. Neurosci. 2014; 26: 1546–1554. [PubMed] [Google Scholar] 108. Дихоф Э.К. Сила воображения — как упреждающие мысленные образы изменяют восприятие устрашающих выражений лица.Нейроизображение. 2011; 54: 1703–1714. [PubMed] [Google Scholar] 109. Фернандес-Эспехо Д., Оуэн А.М. Обнаружение осознания после тяжелой черепно-мозговой травмы. Nat. Rev. Neurosci. 2013; 14: 801–809. [PubMed] [Google Scholar] 110. Хорикава Т. Нейронная расшифровка визуальных образов во сне. Наука. 2013; 340: 639–642. [PubMed] [Google Scholar] 111. Барсалоу Л.В. Обоснованное познание: прошлое, настоящее и будущее. Вершина. Cogn. Sci. 2010; 2: 716–724. [PubMed] [Google Scholar] 112. Бизиах Э., Луццатти К. Одностороннее пренебрежение репрезентативным пространством.Cortex. 1978; 14: 129–133. [PubMed] [Google Scholar] 113. Фара М.Дж. Угол зрения перед мысленным взором до и после односторонней лобэктомии затылочной части. J. Exp. Psychol. Гм. Восприятие. Выполнять. 1992; 18: 241. [PubMed] [Google Scholar] 115. Рао Р.П., Баллард Д.Х. Прогностическое кодирование в зрительной коре: функциональная интерпретация некоторых внеклассических эффектов рецептивного поля. Nat. Neurosci. 1999; 2: 79–87. [PubMed] [Google Scholar] 116. Кослин С.М. Издательство Оксфордского университета; 2006. Случай для ментальных образов.[Google Scholar] 117. Кослин С.М. Индивидуальные различия в мозговом кровотоке в области 17 предсказывают время для оценки визуализированных букв. J. Cogn. Neurosci. 1996; 8: 78–82. [PubMed] [Google Scholar] 118. Franconeri S.L. Гибкие когнитивные ресурсы: карты конкурентного контента для внимания и памяти. Trends Cogn. Sci. 2013; 17: 134–141. [Бесплатная статья PMC] [PubMed] [Google Scholar] 120. Национальный институт здоровья и клинического совершенства. 2005. Посттравматическое стрессовое расстройство (ПТСР): ведение посттравматического стрессового расстройства у взрослых и детей в первичной и вторичной помощи.с http://www.nice.org.uk/CG26. [Google Scholar]

    Распутывание визуальных образов и восприятие объектов реального мира

    Abstract

    Во время мысленных образов визуальные представления могут быть вызваны в отсутствие сенсорной информации «снизу вверх». В предыдущих исследованиях сообщалось об аналогичных нейронных субстратах для образов и восприятия, но исследования пациентов с повреждением головного мозга выявили двойную диссоциацию: некоторые пациенты демонстрируют сохраненные образы, несмотря на нарушение восприятия, а другие — наоборот.Здесь мы использовали фМРТ и анализ множественных вокселей, чтобы исследовать специфичность, распределение и сходство информации для отдельных видимых и воображаемых объектов, чтобы попытаться разрешить это очевидное противоречие. В дизайне, связанном с событием, участники либо просматривали, либо воображали отдельные изображения именованных объектов, на которых они были обучены перед сканированием. Мы обнаружили, что идентичность как видимых, так и воображаемых объектов может быть расшифрована по паттерну активности вентрального потока обработки зрительной информации.Кроме того, было достаточно соответствия между образами и восприятием, чтобы позволить различать отдельные воображаемые объекты на основе реакции во время восприятия. Однако распределение объектной информации по визуальным областям разительно отличалось во время изображения и восприятия. Хотя для видимых объектов был очевидный задне-передний градиент вдоль вентрального зрительного потока, для воображаемых объектов был противоположный градиент. Более того, структура представлений (то есть образец сходства между ответами на все объекты) была более похожа во время изображения, чем восприятие во всех регионах вдоль визуального потока.Эти результаты предполагают, что, хотя образы и восприятие имеют похожие нейронные субстраты, они включают в себя разную динамику сети, снимая противоречие между предыдущими исследованиями в области визуализации и нейропсихологией.

    Ключевые слова: Распознавание объектов, фМРТ, человек, ментальные образы, зрение, сверху вниз

    Введение

    Наше повседневное визуальное восприятие отражает взаимодействие извне управляемой сенсорной информации «снизу вверх» и внутренней генерируемой информации «сверху вниз» ”Сигналы, которые определяют интерпретацию сенсорного ввода (Hsieh et al., 2010; Кастнер и др., 1998). Однако даже при отсутствии восходящих сигналов все еще возможно генерировать внутренние визуальные представления, используя только нисходящие сигналы, обычно называемые ментальными образами. Здесь мы исследуем степень, в которой образы разделяют один и тот же нервный субстрат и механизмы с восприятием вентрального зрительного пути (Farah, 1999; Kosslyn et al., 2001; Pylyshyn, 2002).

    Предыдущие исследования с использованием психофизики (Ishai and Sagi, 1995; Pearson et al., 2008; Winawer et al., 2010), функциональная визуализация мозга (Ganis et al., 2004; Kosslyn et al., 1997) и внутричерепные записи (Kreiman et al., 2000) предложили аналогичные механизмы для изображения и восприятия. Например, общий паттерн активации мозга как в образах, так и в восприятии удивительно похож (Ganis et al., 2004; Kosslyn et al., 1997). Кроме того, образы могут вызывать специфические для категории реакции в визуальных областях высокого уровня (Ishai et al., 2000; O’Craven and Kanwisher, 2000; Reddy et al., 2010) и ретинотопически специфическую активность в первичной зрительной коре (Klein et al., 2004; Слотник и др., 2005; Thirion et al., 2006). Наконец, недавнее исследование показало, что идентичность одного из двух возможных воображаемых стимулов (‘X’ или ‘O’) может быть расшифрована на основе паттерна реакции, вызванной наблюдением тех же самых стимулов на высоком уровне. объектно-избирательная кора головного мозга, предполагающая перекрытие представлений, вызванных во время образов и восприятия (Stokes et al., 2011; Stokes et al., 2009).

    Тем не менее, несмотря на эти сходства, образы и восприятие четко различаются. Видение и воображение очень отличаются феноменологически, и исследования людей с повреждением головного мозга показывают, что образы и восприятие могут быть диссоциированы (Bartolomeo, 2002, 2008; Behrmann, 2000).Например, объектно-агнозный пациент CK, у которого есть повреждение вентрального зрительного пути (Behrmann et al., 1994; Behrmann et al., 1992), не может распознавать объекты, но может воспроизводить подробные рисунки по памяти и сохраняет визуальные образы. Напротив, о дефиците визуальных образов сообщалось при отсутствии агнозии, дефиците восприятия на низком уровне или нарушении образов в других модальностях (Farah et al., 1988; Moro et al., 2008). Таким образом, образы и восприятие, кажется, имеют общий нейронный субстрат, но, тем не менее, диссоциированы.Следовательно, критический вопрос заключается в том, что отличает использование ткани двумя процессами вдоль вентрального зрительного пути.

    Здесь мы исследовали специфичность (различение объектов), распределение (сравнение зрительных областей от V1 до зрительной коры высокого уровня) и различий между визуальными представлениями во время восприятия и образами 10 отдельных реальных- изображения объектов мира. Хотя в большинстве предыдущих исследований использовались стимулы (например,грамм. Фильтры Габора) или сравнения (например, категории), адаптированные для определенных областей вентрального зрительного пути, мы обеспечили возможность перцептивного декодирования по всему пути, позволяя систематически сравнивать образы и восприятие как внутри, так и между визуальными областями. Мы обнаруживаем, что, хотя есть сходства в представлениях видимых и воображаемых объектов, что позволяет декодировать во время изображения по всему вентральному пути, есть существенные различия. В частности, распределение информации от V1 до зрительной коры высокого уровня показало противоположные градиенты.Кроме того, структура представлений (паттерн корреляций между изображениями объектов) в визуальных областях была более похожей во время изображения, чем во время восприятия. Таким образом, хотя образы и восприятие имеют, по крайней мере, часть одного и того же нейронного субстрата, они задействуют различные нейронные механизмы и задействуют разную сетевую динамику вдоль вентрального зрительного пути, обеспечивая потенциальное разрешение противоречия между предыдущими визуализационными и нейропсихологическими исследованиями.

    Материал и методы

    Участники

    В исследовании приняли участие 11 неврологически интактных правшей (5 мужчин, 6 женщин, возраст 25 ± 1 год) (2 дополнительных участника были исключены из-за невозможности локализации раннего зрительного восприятия). корковые области).Все участники предоставили письменное информированное согласие на процедуру в соответствии с протоколами, утвержденными наблюдательным советом института NIH.

    Stimuli

    Мы использовали десять изображений обычных предметов: сумки, машины, стула, часов, струи, лампы, ожерелья, ручки, зонтика и скрипки (). Эти объекты были выбраны так, чтобы они сильно различались по своей ориентации, форме и цвету, так что во время восприятия были бы очень отчетливые паттерны активности в ретинотопных визуальных областях в дополнение к областям, отобранным для объекта.Включение перцептивного декодирования как в ретинотопной, так и в объектно-селективной коре головного мозга позволяет нам напрямую сравнивать эти области в восприятии и образе. Однако любое декодирование в объектно-избирательной коре может по-прежнему отражать ретинотопные различия стимулов, а не высокоуровневые представления форм.

    A, 10 изображений объектов, используемых в основной задаче. B, экспериментальный дизайн. Основная задача состояла из двух чередующихся типов проб: образность и восприятие. В каждом испытании белый крест фиксации сначала менял цвет, указывая либо испытание восприятия (синий), либо испытание образов (красный), а затем следовало слуховое представление названий одного из объектов.В испытаниях восприятия участникам было предложено рассмотреть визуально представленный объект. В испытаниях изображений участников просили представить изображение объекта, соответствующее звуковому сигналу. Интервал между испытаниями (ITI) был рандомизирован от 3 до 13 с.

    Обучение перед сканированием

    Перед сканированием участники были ознакомлены с десятью изображениями объектов и практиковались в создании ярких мысленных образов. Это обучение состояло из трех отдельных этапов. На первом этапе участники практиковали общие мысленные образы и оценивали субъективную яркость своих мысленных образов.В частности, участники оценивали яркость мысленных образов о конкретных сценах или ситуациях, проинструктированных «Опросником яркости визуальных образов» (VVIQ) (Cui et al., 2007; Marks, 1973). Оценка 1 указала на наиболее совершенное яркое изображение, настолько хорошее, насколько хорошо видно изображение, а 5 означало отсутствие изображения (только «знаю»). На втором этапе участники были ознакомлены с набором из 10 изображений объектов (). Каждое изображение объекта представлялось в течение 4 секунд, после чего следовали три вопроса, чтобы побудить участников задуматься о визуальных деталях (цвет, форма, узор и т. Д.)) объектов. Например: «Какой узор на зонтике?», «Какого цвета ручка зонта?» И «С какой стороны обращена ручка?». После вопросов было еще две презентации каждого из изображений объекта. Заключительный этап тренинга представлял собой практику экспериментальных проб (блокированных образами или восприятием) и состоял из 3 повторений блока восприятия и блока изображений. Во время блока восприятия участникам последовательно представляли каждое из 10 изображений объектов в сочетании со слуховыми представлениями имен объектов со скоростью 1 изображение каждые 3 секунды в случайном порядке.Во время блока изображений участников просили представить каждый из 10 объектов, когда они слышали названия объекта, со скоростью 1 проба изображения объекта каждые 3 секунды в случайном порядке.

    Эксперимент с фМРТ

    Основная задача состояла из шести прогонов по 480 с каждый. Каждый запуск включал два типа испытаний, восприятие и образы, представленные в полностью чередующемся, связанном с событиями виде. Участников просили сохранять фиксацию на центральном кресте на протяжении каждого пробега. Во всех презентациях использовался средний серый фон.В каждом испытании белый крест фиксации сначала менял цвет, указывая либо испытание восприятия (синий), либо испытание изображений (красный). Через 500 мс участники услышали запись произнесенного имени объекта, который будет представлен или вообразим в ходе этого испытания, длительностью 500 мс. В условиях восприятия за слуховой репликой сразу же следовало двухсекундное представление объекта, соответствующего реплике из 10 объектов, замеченных во время тренировки. В условиях визуализации участникам было предложено представить в течение 2 секунд конкретное изображение объекта, заданное слуховым сигналом, когда они увидели красный крест фиксации.Каждое испытание длилось 3 с с переменным интервалом между испытаниями от 3 до 13 с. Во время каждого прогона каждый объект участвовал в 3 испытаниях восприятия и 3 испытаниях изображений, всего 60 испытаний за запуск. Порядок условий и объектов был рандомизирован и уравновешен между прогонами ().

    Дизайн локализатора

    Каждый участник выполнил два сканирования локализатора. Первый локализатор использовался для идентификации объектно-селективных участков коры. Участники просматривали чередующиеся 16-секундные блоки изображений объектов в оттенках серого и ретинотопически согласованные скремблированные изображения (Kourtzi and Kanwisher, 2000; Kravitz et al., 2010). Полученный объектно-селективный латеральный затылочный комплекс (LOC) был разделен на заднее подразделение (латеральный затылочный; LO) и переднее подразделение (задний веретенообразный, pFs), потому что было высказано предположение, что боковой затылочный комплекс может быть пространственно и функционально сегрегирован вдоль передне-задняя ось (Grill-Spector et al., 2001; Lerner et al., 2001) (). Второй локализатор использовался для идентификации областей ретинотопической ранней зрительной коры (включая V1, V2, V3 и V4), соответствующих центральному полю зрения, в котором были представлены изображения объектов.Участники просматривали чередующиеся 16-секундные блоки центрального диска (5 °) и кольцевого пространства (6-15 °). Выявленная область центральной ранней зрительной коры была разделена на V1 (заднюю) и экстрастриатную (переднюю) ретинотопную кору (ES) с использованием метода, разработанного Hinds и его коллегами для идентификации V1 (Hinds et al., 2008) ().

    Интересующие области (ROI). Для наглядности ROI, полученные для каждого участника, были преобразованы в стандартное пространство. Зеленая (V1), синяя (ES), красная (LO) или желтая (pFs) области указывают на воксели, которые имели ROI как минимум у 3/11 субъектов (27%).

    Сбор данных фМРТ

    Участников сканировали на сканерах 3T General Electric в помещении фМРТ в кампусе Национального института здоровья в Бетесде. Изображения были получены с использованием 8-канальной катушки для головы с разрешением в плоскости 2 × 2 мм и 19 срезов по 2 мм (зазор между срезами 0,2 мм, время повторения [TR] = 2 с, время эхо-сигнала [TE] = 30 мс, размер матрицы = 96 × 96, поле зрения (FOV) = 192 мм). Учитывая небольшой размер вокселя, мы смогли получить только частичные объемы височной и затылочной коры.Наши срезы были ориентированы примерно параллельно основанию височной доли. Таким образом, наши данные не включали теменную или височную долю или области слуховой коры. Все запуски функционального локализатора и основных задач чередовались. Во время основной задачи были измерены сигналы fMRI BOLD, когда участники либо просматривали, либо представляли каждый из 10 объектов ().

    Анализ данных фМРТ

    Анализ данных проводился с использованием AFNI (http://afni.nimh.nih.gov/afni) с SUMA (AFNI surface mapper) и пользовательскими скриптами MATLAB.Предварительная обработка данных включала временную коррекцию среза, коррекцию движения и сглаживание (сглаживание выполнялось только для данных локализатора, а не данных, связанных с событием, с размытием по Гауссу на полувысоте 5 мм на полную ширину). Для деконволюции ответов, связанных с событиями, была проведена стандартная общая линейная модель с использованием программного пакета AFNI. Мы исследовали паттерны нейронной активности как в ранней зрительной коре (V1 и ES), так и в объектно-селективных областях (LO и pF). Поскольку результаты были одинаковыми для левого и правого полушария во всех 4 областях интереса (ROI), мы здесь свернули по полушарию.В пределах каждой из областей интереса использовался анализ многовоксельного паттерна (MVPA) для оценки информации о стимулах, доступной в паттерне ответа.

    Для исследования различения отдельных объектов мы использовали метод корреляционного анализа с разделением половин в качестве стандартной меры информации (Chan et al., 2010; Haxby et al., 2001; Kravitz et al., 2010; Reddy and Kanwisher, 2007; Williams et al., 2008). Вкратце, 6 пробежек, связанных с событием, для каждого участника были разделены на две половины (каждая по 3 пробега) всеми возможными 10 способами.Для каждого из разделений мы оценили значение t между каждым условием и базовой линией в каждой половине данных, а затем извлекли значения t из вокселей в каждой области интереса. Перед вычислением корреляций t-значения были нормализованы отдельно в каждом вокселе для условий восприятия и изображения путем вычитания среднего значения для всех условий («коктейльный бланк») (Haxby et al., 2001). Эта нормализация проводилась отдельно для восприятия и образов, учитывая большую разницу в величине ответа между этими двумя разными типами испытаний.В частности, среднее значение t для всех условий восприятия вычиталось из значения t для каждого отдельного условия восприятия, и аналогичным образом среднее значение t для всех условий изображения вычиталось из индивидуального значения t для каждого условия изображения. .

    Коэффициенты корреляции (Пирсон) были рассчитаны путем сравнения нормализованных t-значений состояния объекта со значениями всех остальных условий.

    Чтобы сравнить структуру представлений по ROI, мы объединили данные всех 6 прогонов.Как и в случае анализа разделенных половин, мы отдельно вычитали пробел из всех условий восприятия или образов. В результате были получены матрицы сходства как для воспринимаемых, так и для воображаемых объектов, которые мы затем коррелировали внутри и между областями интереса. Поскольку этот анализ проводился для всех 6 прогонов, диагональные значения матрицы сходства не были определены и, таким образом, были исключены. Для матрицы корреляции между изображениями и восприятием мы усреднили по обоим направлениям, в которых структура изображений ROI коррелировала со структурой восприятия другой ROI и в которых структура восприятия бывшей ROI коррелировала со структурой изображений в ROI. последний.Полученные корреляции отражают сходство структуры представлений видимых и воображаемых объектов в РИ.

    Мы повторили наш анализ дискриминации для образов и восприятия с многоклассовой классификацией, используя подход линейной машины опорных векторов (SVM). В этих классификациях мы использовали пакет LIBSVM, разработанный Чангом и Лином (http://www.csie.ntu.edu.tw/~cjlin/libsvm/)(Cox and Savoy, 2003). Мы использовали процедуру «оставить-один-выход» с 5 запусками для обучения классификаторов и одним запуском для тестирования классификатора, повторяя все возможные и обучающие и тестовые наборы.

    Многомерное масштабирование (MDS) было выполнено на основе полной матрицы корреляций изображений и восприятия с неметрическим масштабированием. Сначала мы рассчитали среднюю матрицу несходства между участниками, а затем построили графики MDS. Эти графики MDS проецируют различия между условиями на физические расстояния в двух измерениях. Таким образом, расстояние между любой парой условий на каждом графике MDS представляет собой несходство их паттернов реакции.

    Чтобы исключить какое-либо влияние размера ROI на наблюдаемые нами результаты, мы также провели все анализы с одинаковым размером ROI для каждого участника.Наблюдалась точно такая же картина результатов. Точно так же, чтобы контролировать любые отклонения от нормы в распределении значений корреляции, мы провели все корреляционные анализы с использованием преобразованных значений Фишера z ‘. Опять же, это никак не повлияло на структуру результатов, которые мы здесь сообщаем.

    Результаты

    Перед сканированием участники были обучены (см. Материалы и методы) запоминать и представлять детали 10 полноцветных изображений объектов (). Эти изображения объектов были выбраны так, чтобы они были различны как ретинотопно, так и категориально, чтобы максимально увеличить потенциальный вклад как ранней зрительной, так и объектно-селективной коры.Обучение требовало от участников обработки и сохранения как можно большего количества деталей из изображений объектов, чтобы их более поздние изображения изображений объектов были точными.

    Во время сканирования участникам были представлены полностью перемежающиеся испытания восприятия и образов в дизайне, связанном с событием (). Ответы были изучены как в ретинотопных, так и в высокоуровневых областях интереса, локализованных в независимых сканированиях (см. Материалы и методы). Фовеальная часть ретинотопной ранней зрительной коры была разделена на заднюю (V1) и переднюю (экстрастриатная кора, ES) области с использованием вероятностного атласа расположения V1 (Hinds et al., 2008) у каждого участника. Объектно-селективная кора головного мозга была разделена на переднюю (задняя веретенообразная борозда, pFs) и задняя (латеральная затылочная, LO) области интереса ().

    Величина отклика

    Сначала мы исследовали среднюю величину отклика по всем вокселям и условиям объекта в каждой области интереса для условий восприятия и изображения. Как и ожидалось, сильные отклики были получены во всех ROI в условиях восприятия. Однако во время съемки ответы в среднем были намного меньше и только значительно больше нуля в ES ().Кроме того, хотя во время восприятия ответы, как правило, были сильнее в объектно-селективных, чем в ретинотопных областях, во время изображения наблюдалась противоположная картина. Трехфакторный дисперсионный анализ с селективностью (ретинотопный, объект), расположением (задний, передний) и типом (восприятие, образ) в качестве факторов выявил очень значимый основной эффект типа (F 1,10 = 146,211, p <0,01 ) отражая более сильные реакции во время восприятия. Также наблюдалась значительная взаимосвязь между типом и селективностью (F 1,10 = 6.759, p <0,05), что отражает различные профили ответов во время воображения и восприятия.

    Средняя величина ответа в ретинотопных (V1, ES) и объектно-селективных (LO и pFs) областях во время восприятия и визуализации. Во время восприятия реакция была примерно в 10 раз больше, чем при воображении. Планки погрешностей представляют собой ± 1 стандартную ошибку среднего, рассчитанную для всех участников (для плановых t-тестов с одной выборкой, *: p <0,05; **: p <0,01).

    Перцепционное декодирование

    Затем мы использовали MVPA для исследования специфики нейронных представлений во время восприятия изображений отдельных объектов.Обратите внимание, что отсутствие значительной средней активации по ROI (см. Выше) не препятствует получению информации в мелкозернистой структуре ответа по ROI (например, Williams et al., 2008). Для каждого объекта мы извлекли образец ответа в каждой области интереса в двух независимых половинах данных (см. Материалы и методы). Корреляции внутри (например, кресло-стул) и между изображениями (например, кресло-часы) были извлечены для каждого из 10 изображений объекта. Для каждого объекта корреляции между изображениями затем усреднялись и вычитались из корреляции внутри изображения, чтобы получить индексы дискриминации (; левая панель) (Haxby et al., 2001; Kravitz et al., 2010). Хотя индексы дискриминации были значительно больше нуля во всех областях интереса (плановые t-тесты для одной выборки, все p <0,01), что указывает на значительное декодирование идентичности изображения объекта, декодирование не было эквивалентным для всех областей интереса. Двусторонний дисперсионный анализ с селективностью и местоположением в качестве факторов дал очень значимый основной эффект селективности (F 1,10 = 68,784, p <0,01), а также главный эффект местоположения (F 1,10 = 27,127). , р <0,01). Этот результат отражает тот факт, что ретинотопные области продемонстрировали лучшее перцепционное декодирование, чем объектно-селективные области, и что задняя часть была лучше, чем передняя, ​​как для ретинотопной, так и для объектно-селективной коры.Последующие парные t-тесты между областями интереса показали, что дискриминация в V1 была значительно выше, чем дискриминация в LO или pF (все p <0,001). Кроме того, дискриминация по ES была значительно больше, чем дискриминация по LO или pF (все p <0,01).

    Специфика объектной информации во время изображения и восприятия в ретинотопных и объектно-селективных областях. A, средние индексы дискриминации по 10 объектам во время восприятия (левая панель; синие полосы) и изображений (правая панель; красные полосы).Дискриминация была сильной во время восприятия с заметным задним и передним градиентом. Во время изображения дискриминация была значительной в ES, LO или pF. Примечательно, однако, что градиент либо отсутствовал, либо был обратным по сравнению с восприятием. B. Производительность классификации с SVM показала аналогичный образец для индексов дискриминации. Уровень шанса составлял 10%. Все планки погрешностей представляют собой ± 1 стандартную ошибку среднего, рассчитанную для всех участников (для плановых t-критериев с одной выборкой, *: p <0,05; **: p <0,01) (для парных t-тестов, #: p <0.05; ##: p <0,01).

    Чтобы воспроизвести этот результат с помощью другого подхода, мы также выполнили анализ классификации нескольких классов с использованием машины опорных векторов (SVM) (). В соответствии с индексами дискриминации, серия t-тестов для одной выборки показала, что производительность была значительно выше вероятности во всех областях интереса (; левая панель; все p <0,01), а двухфакторный дисперсионный анализ показал основной эффект селективности (F 1,10 = 16,978, p <0,01), но нет основного эффекта местоположения (F 1,10 = 0.726, p> 0,41). Серия парных t-тестов показала, что производительность в V1 была значительно выше, чем в LO или pF (все p <0,01), а производительность в ES также была выше, чем в LO или pF (все p <0,01).

    Взятые вместе, эти результаты показывают, что, хотя как ранняя зрительная (V1, ES), так и объектно-избирательная кора (LO, pFs) содержат информацию об идентичности видимых объектов, ранняя зрительная кора имеет значительно более четкие представления для каждого воспринимаемого изображения объекта. чем объектно-селективные регионы.

    Декодирование изображений

    Далее мы исследовали специфику нейронных репрезентаций во время изображения. Индексы дискриминации (; правая панель) были значимо положительными в ES, LO и pFs (плановые t-тесты для одной выборки: ES, LO p <0,05; pFs, p <0,01), но не V1 (p = 0,11). Двусторонний дисперсионный анализ с избирательностью и местоположением в качестве факторов не выявил значимого эффекта (все F 1,10 <1,812, p> 0,20). Производительность классификатора SVM показала аналогичную картину со слабым, но значительно превышающим вероятность различения отдельных объектов в объектно-селективной и ES-коре головного мозга (; правая панель; t-тесты одного образца: ES, p <0.05; LO, пФс, p <0,01), но не в V1 (p> 0,46). Таким образом, и индексы дискриминации, и классификация SVM демонстрируют, что визуальные области за пределами V1 содержат информацию об идентичности воображаемых объектов.

    Для сравнения декодирования изображений и восприятия мы непосредственно проверили различия в показателях дискриминации. Трехфакторный дисперсионный анализ с селективностью, расположением и типом в качестве факторов выявил значительный главный эффект типа (F 1,10 = 54,113, p <0,01), отражающий гораздо более сильную дискриминацию во время восприятия, чем изображения.Также наблюдалось значительное взаимодействие между типом и избирательностью (F 1,10 = 57,727, p <0,01), что отражает различные профили декодирования во время восприятия и образов: сильный задне-передний градиент во время восприятия, но отсутствие или даже обратный градиент во время изображения. Фактически, когда способность каждой области интереса декодировать воображаемые объекты рассматривается относительно декодирования видимых объектов, градиент от V1 к высокоуровневой зрительной коре становится еще сильнее (). В то время как дискриминация во время изображения составляет примерно 40% дискриминации во время восприятия в областях, отобранных по объекту, это только 10% дискриминации во время восприятия в ретинотопных областях.Двусторонний дисперсионный анализ с избирательностью и местоположением в качестве факторов выявил значительный главный эффект избирательности (F 1,10 = 7,251, p <0,05), отражающий большее относительное декодирование изображений в объектно-селективном режиме по сравнению с ретинотопической корой.

    Относительная сила декодирования: от образа к восприятию. Отношение индексов дискриминации во время изображения к показателям во время восприятия было значительно больше в объектно-селективных областях, чем в ретинотопных областях. Все планки ошибок представляют собой ± 1 стандартную ошибку среднего, рассчитанную для всех участников (для парных t-критериев, #: p <0.05).

    В целом, эти результаты демонстрируют, что паттерны реакции в зрительных областях коры могут использоваться для декодирования идентичности как видимых, так и воображаемых объектов. Однако важно отметить, что распределение информации по визуальным областям во время изображения значительно отличается от того, что наблюдается во время восприятия, предполагая, что относительные роли ретинотопной и объектно-избирательной коры во время изображения и восприятия меняются местами.

    Декодирование между образами и восприятием

    Чтобы исследовать взаимосвязь между реакциями, наблюдаемыми во время образов и восприятием, мы сначала использовали MDS (см. Материал и методы), чтобы качественно визуализировать взаимосвязь между восприятием и образами репрезентаций () перед проведением более количественного анализа отношения между образами и восприятием (см. ниже).

    Сходство между визуальными образами и восприятием. A, Отношения между условиями объекта на основе многомерного масштабирования (MDS). Синий и красный фон указывают на условия восприятия и изображения соответственно, а серые линии указывают на соответствующие условия объекта. Согласованы условия изображения и восприятия, особенно в пФ. MDS также подчеркивает большее сходство между условиями изображения по сравнению с условиями восприятия в V1, намного меньше, чем в pFs. B: индексы различения между видимыми и соответствующими воображаемыми объектами в V1, ES, LO и pFs.Различие объектов между изображениями и восприятием было значительным во всех ROI. C, Классификация с помощью SVM показала аналогичный образец для индексов различения между изображениями и условиями восприятия. Уровень шанса составлял 10%. Все планки погрешностей представляют собой ± 1 SEM, рассчитанную для всех участников (для плановых t-критериев с одной выборкой, *: p <0,05; **: p <0,01).

    MDS учитывает корреляцию между каждой парой объектов как внутри, так и между изображениями и восприятием.Этот анализ позволяет выявить две интересные закономерности. Во-первых, существует общее соответствие между образами (; красный фон) и восприятием (; синий фон) во всех визуальных областях, хотя это обычно сильнее в областях, отобранных для объекта. Например, и для сумки, и для ручки изображения и восприятие каждого объекта лежат близко друг к другу на графиках MDS для всех визуальных областей. Кроме того, как в pF, так и в LO, ближайший к воображаемому объекту видимый объект был подходящим объектом для четырех объектов.Для всех объектов средний ранг условий соответствия между образами и восприятием был меньше ранга вероятности в каждой области интереса (V1: 3,5; ES: 3,0; LO: 4,5; pFs: 2,5; ранг вероятности: 5,5).

    Во-вторых, есть изменения в общем разделении как внутри, так и между условиями восприятия и образа. В частности, в pF видимые и воображаемые объекты хорошо перемешаны, тогда как в V1 они в значительной степени разделены с условиями изображения ближе к центру пространства. Этот эффект можно измерить соотношением среднего расстояния между образами и условиями восприятия (образ / восприятие; V1: 0.56; ES: 0,61; LO: 0,78; пФс: 0,81). Таким образом, в V1 условия изображения кажутся более близкими друг к другу, чем условия восприятия, тогда как в pF расстояния в пределах восприятия и изображения более похожи. В целом, этот паттерн предполагает, что существует большее сходство между восприятием и образами в передних селективных областях, особенно в pFs.

    Затем, чтобы более количественно изучить соответствие между образами и восприятием, мы рассчитали индексы дискриминации, основанные на корреляциях между образами и восприятием (например,грамм. корреляция между визуально представленным и воображаемым стулом за вычетом средней корреляции между визуально представленным стулом и всеми другими воображаемыми объектами). Эти индексы позволяют определить, достаточно ли схожи представления видимых и воображаемых объектов, чтобы их можно было декодировать. В соответствии с качественным паттерном, наблюдаемым в MDS, перекрестное декодирование было значимым во всех областях интереса (; плановые t-тесты для одной выборки: V1, ES, LO, p <0,05; pFs, p <0,01). Производительность классификатора SVM также показала аналогичную картину со значительно более высоким шансом различения отдельных объектов во всех областях интереса (; t-тесты для одного образца: V1, LO, p <0.05; ES, пФс, p <0,01). Кроме того, двухфакторный дисперсионный анализ результатов перекрестного декодирования индексов дискриминации и SVM-классификатора с селективностью и местоположением в качестве факторов не выявил значительных эффектов (все F 1,10 <3,126, p> 0,10), а t-тесты не выявили попарных различия (p> 0,13), предполагая эквивалентное перекрестное декодирование для всех регионов и областей интереса. Интересно, что этот результат показывает, что было возможно декодировать идентичность изображения объекта через восприятие и образы даже в ретинотопных областях интереса, где декодирование изображений само по себе не имело значения.Этот результат возникает из-за гораздо более сильного декодирования воспринимаемых, чем воображаемых объектов, что делает сравнение образов и восприятия более стабильным, чем сравнение образов с образами.

    Взятые вместе, эти результаты предполагают, что есть по крайней мере некоторое согласие между репрезентациями видимых и воображаемых объектов через вентральный зрительный путь. Обратите внимание, однако, что и видимым, и воспринимаемым объектам предшествовало идентичное произносимое слово, которое могло способствовать наблюдаемому перекрестному декодированию.Однако произносимые слова являются сложными стимулами, и на сегодняшний день нет доказательств того, что они могут быть расшифрованы на основе реакции первичной слуховой коры, не говоря уже о ранних визуальных областях. Кроме того, мы отмечаем, что если бы мы представили слуховые метки только во время состояния образов (как в Stokes et al, 2009, 2011), любая область, которая показывала образы, но не перцептивное декодирование, могла бы быть связана исключительно со слуховыми сигналами, а не с ними. образы.

    Сравнение структуры представлений между областями интереса

    Далее мы непосредственно сравнили структуру представлений в областях интереса во время изображения и восприятия.Для каждой области интереса существует определенный шаблон корреляций между каждым из 10 объектов и всеми другими объектами, составляющий общую матрицу сходства. Эта матрица подобия определяет структуру представлений этих объектов для конкретной комбинации ROI и типа. Эти матрицы можно напрямую сравнивать. Например, в pFs и LO структура представлений была очень похожа во время восприятия (). В частности, в обоих ROI «часы» показали высокую корреляцию со «скрипкой», но гораздо более низкую корреляцию со «стулом».Точно так же в обеих рентабельности инвестиций «лампа» показала гораздо более высокую корреляцию с «зонтиком», чем с «часами».

    Сравнение структуры представлений между ROI через изображения и восприятие. A, матрицы сходства LO и pF во время восприятия участником. Обратите внимание на аналогичные закономерности корреляции между двумя областями интереса. B, Корреляции между матрицами подобия ROI. Корреляция между ROI во время изображения или восприятия, как правило, была высокой, но корреляция между изображениями и восприятием была слабой.Обратите внимание на различную шкалу корреляций между образами и восприятием в случаях с образами или восприятием. Каждый недиагональный элемент на крайней правой панели B представляет собой среднее значение корреляции между матрицами изображений в одной области интереса (R1) и матрицами восприятия в другой области интереса (R2): (Корреляция (R1: изображения, R2: восприятие) ) + Корреляция (R1: восприятие, R2: образы)) / 2. C, отношения между областями интереса как для восприятия (синие метки), так и для изображений (красные метки) на основе MDS. Обратите внимание на большое разделение между восприятием и образами и большее разделение внутри восприятия, чем внутри образов.D, Корреляции между V1 и другими областями интереса (ES, LO или pF), а также между pF и другими областями интереса (V1, ES или LO), подчеркивая более сильные корреляции во время изображения, чем во время восприятия. Все планки погрешностей представляют собой ± 1 стандартную ошибку среднего, рассчитанную для всех участников.

    Важно отметить, что проведенный нами ранее дискриминационный анализ основан на измерении воспроизводимости паттерна реакции в пределах региона через независимые представления видимых / воображаемых объектов относительно сходства паттерна реакции с различными видимыми / воображаемыми объектами.Однако структурный анализ проводится по всему набору данных и оценивает, как структура представлений коррелирует между независимыми регионами во время, по сути, единственного представления каждого видимого / воображаемого объекта.

    Чтобы систематически сравнивать структуру представлений для изображений и восприятия по РИ, мы коррелировали матрицы сходства (). Это выявило значительные корреляции между всеми областями интереса как во время восприятия, так и во время изображения (все p <0,01), причем корреляции во время изображения были сильнее, чем во время восприятия (см. Ниже).Сравнение изображений и восприятия (правая панель) выявило значимые корреляции в пределах ROI для LO и pF (все p <0,05), но не V1 и ES (p> 0,15). Таким образом, в соответствии с нашим предыдущим анализом, представления во время восприятия и образы имеют тенденцию быть более похожими в верхних, чем нижних визуальных областях. Структура представлений между изображениями и восприятием также коррелировала по ROI со значительными корреляциями для всех сравнений, за исключением V1 (все p <0,05).

    MDS, выполненный на корреляциях между областями интереса (), выявил сильное разделение между восприятием (синие метки) и изображениями (красные метки) с большим разделением между областями интереса при восприятии, чем при изображениях. Чтобы исследовать разделение в восприятии или образе более внимательно, мы сначала сосредоточились на значениях корреляции между V1 и другими областями интереса (ES, LO или pF) (, левая панель). Как в восприятии, так и в изображениях был градиент от заднего к переднему, причем ES показывал самую высокую корреляцию, а pFs — самую низкую корреляцию с V1.Более того, корреляция между областями интереса во время визуализации была значительно выше, чем корреляция во время восприятия. Двусторонний дисперсионный анализ с ROI (ES, LO, pFs) и типом (изображение, восприятие) в качестве факторов выявил значительный основной эффект типа (F 1,10 = 7,909, p <0,05), возникающий из-за более высоких корреляций во время изображения, а также ROI (F 2,20 = 37,477, p <0,01), что отражает более слабые корреляции с увеличением разделения ROI.

    Затем мы исследовали корреляцию между pF и другими областями интереса (V1, ES или LO) (, правая панель).Мы наблюдали градиент, противоположный тому, который наблюдался с V1 выше. Самая высокая корреляция была с LO, а самая низкая — с V1. Как указано выше, корреляция между областями интереса во время изображения была значительно выше, чем корреляция во время восприятия. Эти два эффекта привели к значительным основным эффектам типа (F 1,10 = 11,299, p <0,01) и ROI (F 2,20 = 25.607, p <0,01), снова отражая более сильные корреляции во время изображения, чем восприятие и более слабые корреляции с увеличением разделения ROI.

    Эти результаты демонстрируют разительную разницу между изображениями и восприятием: общая структура представлений между областями интереса гораздо более похожа во время изображения, чем во время восприятия. Это различие, вероятно, отражает различия в нейронной динамике, действующей во время восприятия и воображения (см. Обсуждение).

    Корреляция с поведением

    В рамках обучения работе с изображениями перед сканированием мы попросили участников заполнить стандартную батарею вопросов визуализации (VVIQ) (Cui et al., 2007; Marks, 1973), а в предыдущих исследованиях сообщалось о корреляции между этим показателем VVIQ и показателями активности мозга во время изображения (Amedi et al., 2005; Cui et al., 2007). VVIQ — это мера субъективной яркости ментальных образов, что сродни оценке сходства ментального и фактического образа, что делает перекрестное декодирование между образами и восприятием идеальной мерой визуализации для сравнения. Мы исследовали, было ли соответствие между образами и восприятием коррелированным с VVIQ.Чтобы увеличить мощность, мы объединили две ранние визуальные и объектно-селективные области интереса в две большие области интереса (ретинотопную и объектно-селективную). Мы извлекли средний индекс дискриминации по изображениям и восприятию в ранней зрительной и объектно-селективной коре головного мозга для каждого участника и коррелировали их с оценками VVIQ (). Как в ретинотопной, так и в объектно-селективной областях наблюдалась положительная корреляция между индексами дискриминации и VVIQ, хотя эта корреляция была значимой только в ранних визуальных областях (r = 0.691, p <0,01), а не в объектно-избирательной коре (r = 0,378, p = 0,126). VVIQ не был достоверно коррелирован с декодированием чистого изображения ни в EVC (r = 0,007, p = 0,49), ни в объектно-селективной коре головного мозга (r = 0,329, p = 0,162). Таким образом, только наша мера сходства между восприятием и образами отражает субъективные измерения силы образов, особенно в ранней зрительной коре.

    Корреляция между фМРТ и стандартизированной анкетой для оценки яркости изображений (VVIQ).Как в объектно-селективной (нижняя панель), так и в ранней визуальной (верхняя панель) коре наш показатель различения образов и восприятия коррелировал с поведенческой мерой яркости образов. Однако эта корреляция была значимой только в ранней зрительной коре.

    Обсуждение

    В настоящем исследовании мы использовали фМРТ для подробного сравнения визуальных представлений во время изображения и восприятия. Во-первых, мы исследовали специфичность репрезентаций и обнаружили, что как во время восприятия, так и во время изображения, шаблоны реакции в визуальных областях могут использоваться для декодирования отдельного видимого или воображаемого объекта (из 10 возможных изображений объекта), хотя декодирование было намного слабее во время образа, чем при восприятии.Кроме того, было достаточно соответствия между образами и восприятием, чтобы позволить перекрестное декодирование объектов по всему вентральному зрительному пути. Во-вторых, мы исследовали распределение информации о восприятии и образах. В то время как был сильный задне-передний градиент по ROI в силе декодирования видимых объектов, этот градиент отсутствовал или даже был обратным для воображаемых объектов. В-третьих, мы исследовали различий между перцептивными и образными представлениями отдельных объектов.Прямое сравнение структуры представлений между областями интереса во время восприятия и изображениями обнаружило большее сходство между областями интереса во время изображения, чем восприятие. Наконец, мы обнаружили, что перекрестное декодирование между восприятием и образами коррелирует с субъективной мерой яркости визуальных образов, особенно в ретинотопной коре головного мозга. Эти результаты подчеркивают, что, хотя образы и восприятие могут включать одни и те же области зрительной коры, даже при тонком анализе, все же существуют разительные различия в реакции этих областей на изображения и восприятие.

    Отчетливое кодирование отдельных объектов во время визуальных образов

    Наши результаты ясно демонстрируют, что существует определенный паттерн нейронной активации во всех визуальных областях для отдельных объектов как во время визуальных образов, так и во время восприятия, и что эти паттерны связаны (и). Эти результаты значительно расширяют предыдущую работу, показывающую активацию по категориям в визуальных областях высокого уровня во время изображения (Ishai et al., 2000; O’Craven and Kanwisher, 2000; Reddy et al., 2010) или декодирование двух простых воображаемых стимулов ( буквы «X» и «O») (Stokes et al., 2009). Во-первых, мы провели строгий тест на специфичность представлений визуальных образов, используя набор из 10 возможных изображений объектов, ни одно из которых не соответствует категориям (например, лица, дома), для которых в коре головного мозга были идентифицированы селективные по категориям регионы (см. Reddy и др., 2010). Во-вторых, мы систематически сравнивали распределение визуальных образов в различных областях вентрального зрительного пути, включая V1 и экстрастриатную ретинотопную кору. Такое подробное сравнение вентрального зрительного пути не проводилось в предыдущих исследованиях, которые часто фокусировались на конкретных визуальных областях с использованием стимулов или сравнений, адаптированных для этой области (например,грамм. Фильтры Габора в V1, Thirion et al. 2006; категории в объектно-избирательной коре, Reddy et al., 2010). Во многих случаях перцептивное декодирование присутствовало не во всех визуальных областях, что делало невозможным сравнение взаимосвязи между восприятием и образами в разных областях (например, Stokes et al. 2009).

    Хотя наши результаты согласуются с результатами, показывающими некоторое декодирование букв «X» и «O» во время изображений, а также с некоторыми доказательствами перекрестного декодирования между изображениями и восприятием (Stokes et al., 2009), есть количество расхождений между результатами двух исследований.В частности, хотя Стокс и его коллеги обнаружили доказательства некоторого перекрестного декодирования только в левых pF, мы обнаружили значительное декодирование между изображениями и восприятием во всех визуальных областях (V1, ES, LO, pF). Кроме того, Стоукс и его коллеги обнаружили небольшую разницу между образами и восприятием в визуальных областях ни с точки зрения декодирования, ни с точки зрения активации. Фактически они обнаружили, что декодирование было более надежным во время изображения, чем во время восприятия, особенно в pFs. Напротив, мы обнаружили лучшую дискриминацию во время восприятия, чем образы, и гораздо более сильную активацию восприятия, чем образы во всех визуальных областях.Эти различия между нашими выводами и выводами Стоукса и его коллег могут отражать тот факт, что в их исследовании i) слуховые сигналы подавались только во время экспериментов с образами, а не с восприятием; ii) перцептивные стимулы предъявлялись только в течение 250 мс, тогда как образы, вероятно, были последними. намного дольше, iii) испытания изображений и восприятия были заблокированы, а не полностью чередованы, как в нашем дизайне, или iv) простые буквенные стимулы могут не идеально подходить для зондирования репрезентаций в объектно-избирательной коре головного мозга (Joseph et al., 2003; Sergent et al., 1992).

    Взаимосвязь между образами и восприятием

    Хотя мы обнаружили сходство в представлении отдельных объектов во время образа и восприятия, эти два процесса также были различными, что позволяет предположить, что образ — это не просто слабая форма восприятия. Эта диссоциация между образами и восприятием была выявлена ​​при подробном сравнении результатов в нескольких визуальных областях (и). В частности, мы обнаружили, что различение во время изображения и между восприятием и изображением было одинаковым для всех визуальных областей, тогда как во время восприятия был сильный градиент декодирования от V1 до pFs.Эта разница в градиентах аналогична той, о которой ранее сообщалось для другого нисходящего процесса, «обновления» (Johnson et al., 2007). Кроме того, структура представлений по областям интереса была больше похожа на изображениях, чем на восприятии (). Эти результаты значительно расширяют предыдущий отчет, предполагающий, что зрительное восприятие и образы различимы по дезактивации слуховой коры во время визуализации, но не восприятия (Амеди и др., 2005). Здесь мы показываем, что образы и восприятие различны даже при обработке визуальных модальностей.

    Различия, которые мы обнаруживаем между изображениями и восприятием, вероятно, отражают различия в динамике сети во время изображения и восприятия. Во время визуального восприятия вся визуальная информация о воспринимаемых стимулах доступна на уровне сетчатки, и каждая визуальная область трансформирует это представление, чтобы выделить определенные аспекты этой информации (DiCarlo and Cox, 2007; Kravitz et al., В печати). Это уникальное представление создается в каждой области на основе трех основных динамических характеристик: 1) восходящий ввод, несущий перцепционную информацию, 2) модулирующая обратная связь сверху вниз, и 3) внутренняя обработка, которая объединяет восходящие и нисходящие сигналы для получения уникальное представление.Во время изображения ввод снизу вверх отсутствует, оставляя каждый регион только с обратной связью сверху вниз в качестве ввода. Это сокращение информации, вероятно, имеет два эффекта. Во-первых, это снижает сложность внутренней обработки в любой заданной области, а, во-вторых, из-за этой сокращенной обработки, вероятно, меньше преобразование сигнала между областями. Эти эффекты приведут к тому, что отдельные регионы будут иметь менее уникальные представления. Кроме того, нисходящий сигнал, несомненно, беден информацией по сравнению с полной детализацией реальных изображений объектов.Следовательно, информация, критическая для создания уникального представления в любой конкретной области во время восприятия, вероятно, уменьшена или даже недоступна в нисходящем сигнале. В общем, удаление восходящего ввода изменит динамику внутренней обработки в каждом регионе и коммуникации между регионами, что приведет к усилению корреляции в представлениях между регионами.

    Эта модель предполагает, что хотя образы и восприятие зависят от сходных нейронных субстратов (), вклад субстратов в каждый процесс различается (и).Это обеспечивает разрешение давнего конфликта между результатами, предполагающими, что одни и те же регионы активируются во время изображения и восприятия, и обнаружением двойной диссоциации между этими процессами. Двойная диссоциация обычно рассматривается как свидетельство неперекрывающихся нейронных субстратов, но повреждение одной и той же общей области может по-разному нарушить процессы, использующие один и тот же субстрат, в зависимости от того, насколько это прерывает обработку, критичную для любого из них (Plaut, 1995) (Plaut and Shallice , 1993).Наше открытие повышенной корреляции между областями во время изображения свидетельствует о различной обработке изображений и восприятия в пределах одного и того же нейронного субстрата, предполагая, что поражения в одной и той же области могут выборочно ухудшать и то и другое.

    Представления визуальных образов в ранней зрительной коре

    Давно ведутся дискуссии о том, активируется ли ранняя зрительная кора, зрительная структура низкого уровня, во время визуальных образов (Kosslyn et al., 2001). Эти дебаты также переплетаются с природой визуальных образов.Один класс теорий образов утверждает, что визуальные образы опираются на изобразительные (похожие на картинки) представления (Kosslyn and Thompson, 2003; Slotnick et al., 2005), тогда как другой класс теорий утверждает, что визуальные образы полностью полагаются на символические (языковые) ) представления (Пилишин, 2002). Таким образом, только изобразительный вид предсказывает изобразительную роль ранней зрительной коры в визуальных образах. Мы обнаружили значительное декодирование в ES для изображений () и перекрестное декодирование между изображениями и восприятием как в V1, так и в ES ().Эти результаты декодирования подтверждают изобразительное представление изображений (Kosslyn and Thompson, 2003), показывая декодирование воображаемых объектов в ранней зрительной коре, а также уменьшенное или отсутствующее перекрестное декодирование с менее яркими изображениями. Наши результаты согласуются с предыдущими сообщениями о декодировании в ранней зрительной коре во время изображения (Thirion et al., 2006) и в контексте обработки более высокого уровня, такой как семантическое знание или рабочая память (Harrison and Tong, 2009; Hsieh et al. , 2010; Kosslyn et al., 1995; Serences et al., 2009). Однако V1 показал только слабое, незначительное декодирование во время визуальных образов (), а когда учитывается способность ранней зрительной коры декодировать видимые объекты, слабость декодирования изображений становится еще более поразительной (). В целом, эти результаты показывают, что, хотя ранняя зрительная кора действительно содержит сигналы во время визуальных образов, ее относительный вклад во время изображения сложных объектов по сравнению с другими визуальными областями намного слабее, чем во время восприятия тех же самых объектов. Это не означает, что ранняя зрительная кора не играет критической и, возможно, даже центральной роли в образе других более простых зрительных стимулов (например,грамм. ориентированные линии или четко выраженные ретинотопные паттерны) (Thirion et al., 2006). Фактически, наш поведенческий результат () предполагает, что ранняя зрительная кора головного мозга играет ключевую роль в создании визуальных мысленных образов даже сложных визуальных стимулов.

    Границы | Распознавание объектов в ментальных репрезентациях: инструкции по изучению диагностических функций с помощью визуальных ментальных образов

    Введение

    Традиционные исследования по распознаванию объектов часто фокусируются на восходящей обработке зрительных стимулов, начиная от определения свойств стимула клетками сетчатки до электрической трансдукции и окончательной нервной реакции.Это направление исследований было успешным в выявлении физиологических и нервных путей, участвующих в обнаружении и обработке свойств визуальных объектов, ведущих к когнитивному восприятию. Таким образом, визуальные ментальные образы представляют собой поток информации, противоположный потоку визуальных перцептивных явлений; тот, который требует отхода от традиционных взглядов снизу вверх, чтобы быть полностью понятым.

    С появлением усовершенствованных технологий и улучшенных методов тестирования исследования визуальных ментальных образов превратились из простых предположений о в значительной степени недоступном теоретическом явлении в эффективную и достоверную область исследований с богатым эмпирическим опытом.Все больше исследований демонстрируют функциональную роль визуальных образов в различных задачах, таких как память (Slotnick et al., 2005; Albers et al., 2013), творческий дизайн (Dahl et al., 1999; D’Ercole et al., 2010) и эмоциональные расстройства (Holmes and Mathews, 2010). В недавнем обзоре Pearson et al. (2015) изложили очень практическое значение ментальных образов в исследовании и лечении психических заболеваний, что привело к призыву продвигать поиск ментальных образов в качестве основной цели психопатологических вмешательств.Подобные обсуждения не только иллюстрируют развивающееся отношение к значимости ментальных образов, но также подчеркивают потенциальные преимущества дальнейшего исследования этого сложного процесса. Однако, несмотря на значительный рост, достигнутый в этой области исследований, нынешнее понимание ментальных образов часто ограничивается общими операциями и характеристиками; И в разговорной, и в научной терминологии визуальные ментальные образы обычно служат широким и несколько абстрактным определением любой визуальной субстанции, существующей в «мысленном взоре».Но что именно человек «видит» во время воображаемых переживаний? Почему — это определенные изображения или подкомпоненты изображений, визуализируемые более четко, чем другие, и что это говорит о процессе восприятия? На такие вопросы еще предстоит дать какой-либо окончательный или конкретный ответ, и цель этого обзора — оценить возможные пути работы над объяснением. Повышая точность, с которой мы идентифицируем визуальное содержание мысленных образов, может быть достигнуто более полное понимание его интерактивной связи с визуальным восприятием, что приведет к более совершенным выводам относительно создания когнитивных представлений.

    Психические образы предлагают уникальное преимущество перед визуальным восприятием в том, что объем потенциальной информации, доступной при последующем воспроизведении стимула, намного меньше количества, доступного во время перцептивного просмотра того же стимула. По определению, мысленные образы относятся к способности испытывать знакомые или новые визуальные стимулы в отсутствие соответствующей одновременной физической стимуляции (Pearson and Kosslyn, 2013). Поскольку ментальные образы основаны на восприятии воспоминаний в более позднее время и в более позднем месте, они неразрывно связаны с процессами памяти.Исследования показывают, что на нейронном уровне ментальные образы задействуют сети, перекрывающиеся с визуальной рабочей памятью (Albers et al., 2013), предполагая, что ментальные образы задействуют процесс, подобный восприятию, чтобы вспомнить сохраненную информацию и вернуть ее в текущее сознание для манипуляций. (Borst, Kosslyn, 2008; Borst et al., 2012). Однако процессы, по-видимому, по крайней мере частично различны, в том числе их зависимость от сенсорных визуальных сетей, которые коррелируют с силой базовых ментальных образов (Keogh and Pearson, 2011; см. Также Borst et al., 2012). Поэтому мысленные образы можно рассматривать как часть вывода памяти, особенно в тех случаях, когда воображается ранее просмотренный стимул.

    Естественные ограничения внимания и способности запоминания в процессе перехода с сенсорного уровня на перцепционный неизбежно приводят к потере и искажению некоторой визуальной информации. Другими словами, количество информации, доступной во время визуального воспоминания, как количественно, так и качественно уменьшается по сравнению с состоянием восприятия.Несмотря на это, многочисленные эмпирические исследования показали, что можно понять, назвать и описать свойства объекта только с помощью мысленных образов (например, Kosslyn et al., 1995; Walker et al., 2006; Palmiero et al., 2014). Следовательно, разумно сделать вывод, что уменьшенная информация, доступная в мысленном образе, должна быть по крайней мере достаточной, если не необходимой, для успешного распознавания объекта. Таким образом, процессы мысленных образов могут служить полезным и естественным фильтром, с помощью которого можно определить особенности изображения, которые имеют наибольшее когнитивное значение для зрителя.Изучая результат перцептивного просмотра в форме мысленных образов, количество альтернативных факторов, которые следует учитывать, значительно сокращается по сравнению с теми, которые присутствуют в сложной визуальной среде, основанной на ощущениях. Вместо того, чтобы пытаться измерить относительную классификационную ценность всех доступных характеристик в данном стимуле, исследователь может использовать содержание, сохраняемое в мысленном образе наблюдателя, для определения значимых визуальных сигналов.

    Цель этого обзора — предположить, что визуальные мысленные образы, содержимое которых подверглось естественному процессу фильтрации с целью отсеивания информации об объекте, не имеющей отношения к распознаванию или категоризации в данном сценарии, обладают значительным потенциалом для идентификации характеристик объекта, критически важен для восприятия распознавания.Эти признаки, называемые отличительными или диагностическими признаками, представляют собой визуальные компоненты с классификационной значимостью, которые способствуют быстрому и эффективному распознаванию объектов (Baruch et al., 2014). В связи с отсутствием в настоящее время эмпирических исследований, которые непосредственно исследуют идентификацию диагностических признаков в ментальных образах, в этой статье вместо этого исследуется и обсуждается практическая ценность такого исследования:

    (1) обзор известных поведенческих и нейровизуализационных методов, которые использовались для успешного доступа к ментальным визуальным репрезентациям;

    (2) оценка потенциала каждого метода для выявления диагностических признаков на основе эффективности и специфичности, которых они, как было показано, достигают;

    (3), предлагая возможные направления и последствия для изучения отличительных черт с помощью мысленных образов в будущих исследованиях.

    Теоретические основы

    Распознавание объектов в визуальном восприятии

    Значение свойств объекта в визуальном восприятии признано давно. В одной из старейших и наиболее известных теорий, подчеркивающих важность отдельных визуальных частей, Бидерман (1987) предположил, что распознавание любого данного объекта зависит от взаимодействия между отдельными структурными компонентами и их общей конфигурацией в контексте целого. Хотя теория распознавания по компонентам (RBC) Бидермана основана на структурных геометрических формах, дальнейшие исследования показали, что общие визуальные характеристики не должны ограничиваться пространственно дискретными структурными частями.Характеристики можно интерпретировать как любую композиционную единицу визуального стимула, включая контуры (Loffler, 2008), цвета или текстуры (Bramão et al., 2011a) или минимальные элементы контраста, такие как пятна Габора (Dong and Ren, 2015). . Настоящая статья учитывает это широкое разнообразие, принимая широкую концептуальную концепцию визуальных характеристик как любых «дискретных компонентов изображения, которые обнаруживаются независимо друг от друга» (Pelli et al., 2006). Однако из-за их доступности (в том смысле, что они оба легко понимаются и могут быть зафиксированы в когнитивных и нейронных измерениях), исследования и выводы, обобщенные в этом обзоре, наиболее подходят для выявления сложных форм, используемых для распознавания.Независимо от уровня специфичности, на котором они охарактеризованы, любые существенные особенности должны быть обнаружены и интегрированы в контексте окружающей информации (например, дополнительные характеристики объекта, семантический или ситуационный контекст, цели наблюдателя, набор объектов и т. Д .; Померанц и др. ., 1977; Мартелли и др., 2005).

    Несмотря на обширную литературу, посвященную роли визуальных характеристик в восприятии объекта, точная степень, в которой различные индивидуальные особенности способствуют распознаванию, остается неубедительной.Некоторые теории предполагают, что отличительные особенности играют решающую роль в облегчении эффективной идентификации и категоризации объектов. Эти уникальные информативные визуальные компоненты ускоряют определение идентичности объекта в конкретном контексте, позволяя наблюдателю быстро и эффективно различать возможные альтернативы (Baruch et al., 2014). Подобно общим визуальным признакам, визуальное содержание отличительного или диагностического признака варьируется и может включать автономные компоненты, такие как структурная форма, или более распределенные элементы, такие как цвет (Bramão et al., 2011а, б). Важно отметить, что свойства отличительной черты в любой данной ситуации различаются в зависимости от контекста сценария просмотра (Baruch et al., 2014; Schlangen and Barenholtz, 2015), а также от внешних когнитивных факторов (например, избирательное внимание; Ballesteros и Mayas, 2015).

    Существование отличительных черт в визуальном восприятии и их роль в распознавании объектов получили некоторую эмпирическую поддержку, хотя результаты ни в коем случае не являются окончательными. Первоначально считалось, что они играют неотъемлемую роль в распознавании новой точки зрения, диагностические особенности подтверждали контраргумент теории структурного описания, предложенной Бидерманом (1987).В то время как теория RBC предсказывала относительно стабильную производительность распознавания для новых точек зрения, пока соответствующие структурные особенности, или геоны, оставались видимыми, контраргумент варианта точки зрения утверждал, что эта закономерность возникает только тогда, когда различные диагностические функции были доступны наблюдателю (Tarr et al. , 1997). Считается, что эти информативные визуальные компоненты облегчают принятие решений как по классификации, так и по распознаванию, обеспечивая диагностическое различение возможных альтернатив.Обратите внимание, что значимость или степень, в которой особенность выделяется, является заметной или привлекающей внимание, не подразумевает диагностику, которая указывает на полезность в процессах распознавания или классификации. Рассмотрим, например, разницу между тигром и зеброй; хотя полосы заметны и очень заметны, простого присутствия полос недостаточно, чтобы отличить одну от другой. В отличие от этого, когда задают задачу идентифицировать зебру в толпе крупного рогатого скота, полосы являются более исключающими; значимость и диагностичность частично совпадают.

    Тенденция к повышенному вниманию к определенным функциям, наряду с их потенциалом для быстрого и эффективного распознавания объектов в динамических сценариях, поддерживает правдоподобную перцептивную и когнитивную значимость отличительных черт. Эти результаты также предполагают, что основные отличительные черты, вероятно, останутся относительно нетронутыми в ментальных репрезентациях по нескольким причинам:

    (1) их классификационная значимость снижает вероятность того, что они будут отфильтрованы как нерелевантная информация во время начального кодирования ментального представления;

    (2) разумно предсказать, что отличительные признаки представляют значительную часть информации семантического объекта в пространственно сжатой визуальной единице;

    (3) их когнитивная релевантность, по-видимому, увеличивает их устойчивость к деградации информации и эффектам предвзятости, которые возникают между стадиями визуального восприятия и генерации мысленных образов.

    Следовательно, отличительные особенности объекта являются главным кандидатом для эмпирического исследования, поскольку они представляют собой упрощенные, надежные единицы, которые представляют или закрепляют более крупное и сложное мысленное представление визуального стимула. Для иллюстрации рассмотрим пример молотка. Скорее всего, при чтении слова на ум приходит образ молотка. Есть ли части или особенности, которые кажутся более четкими, чем другие? Рассмотрим простой эксперимент по распознаванию, в котором участнику показывают изображение молотка с удаленной металлической головкой.Маловероятно, что нечетко определенная деревянная рукоятка «активировала» (что отражается в любой данной мере интереса) представление о молотке так же эффективно, как и весь объект, с неповрежденной головкой молотка. Однако, если бы манипуляции были обратными, с удаленной рукояткой и сохраненной головкой молотка, можно было бы ожидать гораздо большей «активации» абстрактной концепции «молотка», а также всех ассоциаций, которые эта концепция влечет за собой (см. Распространяющуюся теорию активации память; Андерсон, 1983).Способность подкомпонента более сильного стимула эффективно достигать когнитивной репрезентации в отсутствие некоторых из его типичных контекстов предполагает, что определенные характеристики являются более когнитивно диагностическими, чем другие. После того, как указанные диагностические признаки идентифицированы (например, головка молота в этом сценарии), процесс уменьшения — как это было сделано путем удаления сначала головки молота, а затем рукоятки — можно систематически продвигать, чтобы определить наименьший компонент или группу компонентов, способных эффективного представления познавательной концепции.Таким образом, можно идентифицировать визуальные особенности, необходимые для активации когнитивного представления любого данного объекта. При сравнении нескольких образцов и категорий стимулов можно идентифицировать любые сходства в отличительных признаках (например, структура формы, контраст, края и т. Д.). Эта уникальная способность дискретных диагностических элементов служить связующим звеном с более целостными или сложными когнитивными представлениями делает их ценным предметом изучения, способным осветить не только механизмы, лежащие в основе образов ментальных объектов, но и их связь с восприятием распознавания.Способность сокращать сложные объекты до их основных и самых основных компонентов может потенциально привести к усовершенствованным теориям и методам, способным приспособиться к широкому спектру взаимодействий между сценариями просмотра и характеристиками естественных визуальных стимулов — постоянной проблемой, с которой в настоящее время сталкиваются традиционные сенсорные восприятия. исследования в области распознавания объектов.

    Здесь стоит отметить обширную работу, проделанную в области компьютерного зрения, связанную именно с вопросами, рассматриваемыми в этом обзоре.Недавнее исследование Ullman et al. (2016) краудсорсинговая диагностическая информация об отличительных особенностях, которые оказали значительное влияние на распознавание человеческих объектов. Ответы более чем 14000 человек-наблюдателей дали минимальные распознаваемые конфигурации (MIRC) на 10 изображениях в градациях серого, изображающих объекты разных классов. Множественные MIRC, каждый из которых содержал минимальную избыточную информацию об объекте относительно полного изображения объекта, были идентифицированы для каждого из изображений и позволили успешно классифицировать по ограниченным визуальным областям.Их исследование также показало, что текущие вычислительные модели не в состоянии точно воспроизводить процессы распознавания, основанные на особенностях человека (например, распознавание моделей для суб-MIRC по сравнению с MIRC не уменьшилось так резко, как у людей-наблюдателей, и модели не могут распознать другие подчиненные функции в MIRC). Репрезентативное исследование Ullman et al. (2016) показывает, что можно уменьшить сложные объекты до минимально распознаваемого уровня, согласованного большой группой наблюдателей, до такой степени, что вклад каждой особенности критически влияет на распознавание.Другие исследования, проведенные с помощью компьютерных игр, показывают многообещающие стимулы для стимулирования крупномасштабных «алгоритмов» данных и вычислений, выполняемых людьми под предлогом развлечения (von Ahn, 2006), и собирают данные для меток объектов, а также их местоположения в пределах сцена. Эти методы и их потенциал для определения поведения распознавания, связанного с особенностями, у большого и разнообразного круга субъектов стоит помнить по мере продвижения обзора.

    Хотя компьютерное зрение работает, детали которого выходят за рамки текущего обсуждения (см. Nixon and Aguado, 2012; Shokoufandeh et al., 2012 для недавних обзоров), актуален и информативен для понимания визуального познания, современные вычислительные модели не могут точно воспроизводить человеческие зрительные процессы и поэтому не будут подробно обсуждаться здесь. В следующем обзоре основное внимание уделяется методам, направленным на непосредственный доступ к процессам ментальных образов у ​​людей прямым и поддающимся количественной оценке образом, с признанием того, что результаты обсуждаемых здесь методов могут быть надлежащим образом применены к сетевым вычислительным методам для повышения не только точности. компьютерных симуляторов, но понимание восприятия, связанного с особенностями, и более поздних ментальных образов.

    Представления объектов в ментальных образах

    Долгая и сложная история исследования ментальных образов привела как минимум к двум различным взглядам на их связь с визуальным восприятием. Согласно одной точке зрения, нейронные и феноменологические процессы, происходящие во время визуального восприятия и ментальных образов, схожи по функциям и структуре из-за общих основных нейронных механизмов. Эти общие черты простираются на ранние, ретинотопически картированные зрительные области, такие как первичная зрительная кора головного мозга (V1; Slotnick et al., 2005; Альберс и др., 2013; Пирсон и др., 2015). Эксперименты с использованием трансмагнитной черепной стимуляции дали подтверждающие доказательства нейронного перекрытия между восприятием и образами (Cattaneo et al., 2012). Общие механизмы также были предложены исследованиями сходного времени реакции в ответ на визуально воспринимаемые и мысленно генерируемые изображения, устойчивые к эффектам яркости, контраста, движения и ориентации (Broggin et al., 2012). Дальнейшие исследования даже продемонстрировали, что яркость воображаемого стимула способна вызвать непроизвольную реакцию сужения зрачка, согласующуюся с паттернами, наблюдаемыми во время перцептивного просмотра (Laeng and Sulutvedt, 2014).Однако даже те исследования, которые сообщают о значительном совпадении паттернов поведенческих реакций или нейронной активации между восприятием и образами, часто отмечают несоответствия в их полноте и единообразии. Например, манипуляции с пространственной частотой приводили к разным моделям времени реакции на реальные стимулы по сравнению с воображаемыми (Broggin et al., 2012). Было обнаружено, что в кортикальном плане общая активация, наблюдаемая во время образов и процессов восприятия, более последовательна в лобных и теменных областях коры, чем в ретинотопных визуальных областях, хотя и в этих областях были выявлены значительные уровни взаимной активации (Ganis et al., 2004). Однако сравнения с использованием более гибких аналитических методов, таких как многомерный анализ паттернов (MVPA), выявили более надежное перекрытие в ранних визуальных областях (Albers et al., 2013). Считается, что эти общие нейронные механизмы лежат в основе феноменологического сходства между визуальным восприятием и ментальными образами. Например, есть свидетельства того, что мысленные образы обладают несколькими пространственными качествами, присущими объектам, воспринимаемым в поле зрения (Kosslyn et al., 1983), на что указывают наблюдаемые эффекты мысленного пространственного вращения, мысленного сканирования и времени, необходимого для проверки размеров. задачи (D’Ercole et al., 2010). Структурные теории ментальных образов далее предполагают, что, подобно перцепционным стимулам, воображаемые образы поддерживают ограниченное разрешение и определенное ощущение пространственной протяженности (см. Обзор Finke, 1985), включая пространственно эквивалентные отдельные единицы (Kosslyn et al., 1983) и в целом. похожий визуальный контент (Нанай, 2014).

    Природа и степень общих нейронных основ, лежащих в основе процессов восприятия и воображения, ставятся под сомнение в нескольких уникальных клинических случаях.Яркие мысленные образы были идентифицированы по крайней мере у одного пациента, демонстрирующего сильно локализованное корковое повреждение V1, что привело к серьезным нарушениям выполнения перцептивных задач (Bridge et al., 2011). Нейронные записи, собранные с помощью функциональной магнитно-резонансной томографии (фМРТ), также показали, что модели активации пациента во время эпизодов мысленных образов были подобны таковым у здоровых зрячих субъектов; поведенческое тестирование подтвердило эти результаты. Дополнительные оценки показали значительно ослабленные способности к восприятию, предполагая, что визуальные ментальные образы остались нетронутыми в отсутствие здоровых ранних зрительных корковых сетей.Было обнаружено, что пациенты, страдающие зрительной агнозией (Behrmann et al., 1994; Servos and Goodale, 1995), а также пациенты с врожденной глазной слепотой или пожизненным нарушением зрения, сохраняют способность к визуальным образам, хотя снижение работоспособности различается в зависимости от характера нарушения. в последнем (см. обзор Cattaneo et al., 2008). Недавно выявленное нейропсихологическое расстройство демонстрирует противоположную картину. Афантазия характеризуется неспособностью производить визуальные ментальные образы, в то время как производительность распознавания перцептивных объектов остается неизменной (Bartolomeo, 2008; Zeman et al., 2015). Это интригующее состояние было зарегистрировано у нескольких здоровых людей, которые сообщали о внезапной потере способности создавать формы, формы и цвета в своем воображении (Bartolomeo, 2008; Moro et al., 2008; Zeman et al., 2010) . Хотя кортикальное поражение (Zeman et al., 2010), врожденное (Zeman et al., 2015) и психогенное (de Vito, Bartolomeo, 2015) происхождение обычно подозревается, в настоящее время это заболевание плохо изучено. Тем не менее, точная двойная диссоциация, предлагаемая этими уникальными клиническими случаями, предполагает, что нейронные корреляты перцептивного распознавания и ментальных образов, по крайней мере, частично различны.Однако выводы, сделанные из этих исследований, ограничены из-за непредсказуемой природы корковых повреждений и их влияния на когнитивные функции, а происхождение и последствия афантазии только начали получать тщательную эмпирическую оценку.

    В совокупности существующая литература значительно разнится в отношении нейронной природы репрезентаций объектов в ментальных образах. Отсутствие убедительной поддержки какой-либо одной теории по сравнению с другой способствует агностической позиции в отношении точной природы ментальных репрезентаций и их нейронной основы.Этот обзор включает статьи независимо от того, в каком спектре теорий совпадают их выводы, и воздерживается от суждений о достоверности или точности выводов, основанных исключительно на теоретической перспективе.

    Диагностические функции в ментальных образах

    Хотя отличительные черты еще не идентифицированы напрямую в мысленных образах, соответствующие исследования подтверждают их существование в этой модальности. Несколько исследований фМРТ успешно предсказали категориальную классификацию воображаемого стимула с помощью вычислительного анализа, такого как классификаторы паттернов (Reddy et al., 2010) и модели воксельного кодирования для настройки на низкоуровневые визуальные функции во время задач просмотра (Naselaris et al., 2015). Принимая во внимание важную роль, которую отличительные черты, как полагают, играют в задачах перцепционной категоризации (Baruch et al., 2014), можно предположить, что высокодиагностические визуальные компоненты являются основными участниками этого типа нейронного декодирования. Однако наиболее информативные места, из которых могут быть приняты решения о декодировании, варьируются в разных исследованиях. Паттерны активации вентрально-височной коры оказались более надежными для декодирования категоризации изображений, чем паттерны в пределах ранних ретинотопных кортикальных областей (Reddy et al., 2010). Другое исследование сообщило о доказательствах того, что низкоуровневые визуальные особенности ментальных образов для запоминающихся сцен закодированы в ранних визуальных областях (Naselaris et al., 2015). Поведенческие данные, такие как время отклика и частота ошибок, указывают на то, что действительно возможно извлечь частичные особенности низкого уровня, такие как Т-образные переходы, из целостных мысленных представлений с таким же мастерством, как перцепционные оценки, хотя свойства высокого уровня, включая глобальную симметрию, легче оцениваются в обоих условиях (Rouw et al., 1997). В совокупности эти эмпирические данные добавляют содержание давним теориям, предполагающим, что составляющие единицы доступны в рамках целостных ментальных образов (Kosslyn et al., 1983).

    Несмотря на несогласованность нейронных регионов, о которых сообщалось в исследованиях декодирования, способность предсказывать информацию о категориях из записей нейронной активности вообще имеет важное значение для выявления диагностической информации о признаках в ментальных образах:

    (1), поскольку диагностические функции облегчают эффективную классификацию категорий восприятия посредством уникального распознавания визуальных признаков, нейронная активность, которая поддерживает классификацию категорий, может быть связана с информацией диагностических признаков, что указывает на то, что визуальная информация на основе компонентов напрямую представлена ​​через нейронные субстраты;

    (2), поскольку точные местоположения в потоке нейронной визуальной обработки, в которых представлены отличительные признаки, остаются неясными, можно предположить, что содержимое диагностических признаков может существовать как в областях с высоким, так и с низким уровнем зрения.

    Исследование и оценка методов

    Поведенческие методы

    Анкеты

    Несмотря на то, что мысленные образы — это сложная и абстрактная концепция, для которой можно нацеливаться, несколько инструментов опроса самоотчета продемонстрировали успешное и надежное измерение различных аспектов визуальных представлений. Особо следует отметить широко используемый Опросник яркости визуальных ментальных образов (VVIQ; Marks, 1973) и его более поздние версии, Опросник яркости визуальных ментальных образов-2 (VVIQ-2; Marks, 1995) и Яркость визуальных умственных образов. Пересмотренная версия вопросника к изображениям (VVIQ-RV; Marks, 1995; Campos, 2011).В каждом из этих опросов участникам предлагается визуализировать определенные сцены, такие как закат, и сообщать о четкости и детализации сгенерированных изображений с использованием ответов по шкале Лайкерта. Варианты VVIQ различаются тем, требуют ли они от участника визуализации с открытыми или закрытыми глазами. Критическое статистическое тестирование исходного VVIQ и обоих его вариантов указывает на высокую внутреннюю валидность для измерения конструкта мысленных образов (Campos, 2011). Кроме того, Plymouth Sensory Imagery Questionnaire (Psi-Q) — это уникальная оценка, способная обеспечить высоконадежные измерения индивидуальной склонности к восприятию ярких образов в различных модальностях (Andrade et al., 2014). Продемонстрированная внутренняя валидность элементов оценки, которые требуют от участников создания подробных сцен, указывает на то, что люди способны воспринимать множественные и конкретные визуальные компоненты в ментальных представлениях, и что эти компоненты могут быть надежно зафиксированы с помощью простых элементов опроса.

    По крайней мере, один инструмент опроса попытался определить конкретную информацию о форме, представленную в визуальных мысленных образах. Шкала ментальных образов (MIS; D’Ercole et al., 2010) был разработан, чтобы использовать взаимосвязь между вербальными описаниями и ментальными образами, чтобы напрямую преобразовать структурные особенности, присутствующие в ментальных репрезентациях, в точные вербальные описания. Как отмечают создатели, такая шкала выгодна для визуальных и коммуникативных областей, таких как архитектура и дидактика искусства. Чтобы протестировать MIS, участникам дали словесное описание произведения искусства и попросили ответить на вопросы, связанные с одним из шести факторов, описывающих аспекты ментальных образов и процесс формирования изображения: скорость формирования изображения, стабильность, размеры, уровень детализации. , Расстояние и перспектива (D’Ercole et al., 2010). Результаты исследования показали, что ответы участников подтверждают предложенную шестифакторную модель, предполагающую, что на мысленные образы влияют внутренние пространственные свойства. Что касается изучения диагностических признаков, этот инструмент демонстрирует, что надежная и подробная оценка визуальных ментальных образов достижима только с помощью словесных описаний. Если эту специфичность увеличить до уровня независимых дискретных компонентов объекта, возможно, что MIS или аналогичные инструменты смогут нацеливать и идентифицировать дискретные классифицирующие визуальные признаки посредством самоотчета.

    Опросник объектно-пространственных изображений (OSIQ; Blajenkova et al., 2006) приближается к уровню специфичности, необходимому для выявления отличительных черт, путем оценки предпочтений объектных изображений на уровне индивида. Однако цель OSIQ состоит в том, чтобы выявить индивидуальные тенденции к представлению изображений целостным, подобным картинкам образом или пространственно, посредством компиляции отдельных частей; анкета не включает точную оценку формы. Тесты OSIQ демонстрируют различные уровни предпочтения целостного и частичного представления у разных людей.Эти результаты имеют важное значение для любого исследования, изучающего ментальные образы, потому что индивидуальное предпочтение целостных представлений может привести к увеличению количества ошибок типа II при попытке доступа к визуальной информации на основе частей. По сравнению с OSIQ, не было показано, что VVIQ характеризует эти пространственные предпочтения (Blajenkova et al., 2006), что может быть результатом сосредоточения VVIQ на контекстных визуальных образах сцены, а не на независимых объектах. Тем не менее, в будущих исследованиях было бы разумно учитывать возможность индивидуальных различий в стиле репрезентации при выборе меры анкеты, а также при анализе и интерпретации результатов исследования.

    Есть несколько преимуществ и недостатков в использовании анкет для изучения ментальных образов. С одной стороны, опросы позволяют собирать большой объем подробных данных за относительно короткий промежуток времени, гораздо больше, чем физиологические или биологические измерения; Описанные выше анкеты содержат в среднем 32 пункта. Все элементы состоят из простой шкалы Лайкерта, варьирующейся от 5 до 7 ступеней. Кроме того, эти меры практически не требуют технических навыков или критериев приемлемости, что делает инструменты доступными для широкого и представительного населения.Надежность самоотчетных ответов этого типа также подтверждается поведенческими результатами, указывающими на то, что люди, как правило, имеют надежное и точное метапознание своего собственного воображаемого опыта (Pearson et al., 2011). Однако возникает ряд сложностей, когда человека просят устно описать или физически воссоздать визуальный контент. Например, искажения восприятия и отсутствие художественных способностей могут исказить рисунки участников, а словесные описания могут быть неверно истолкованы или неполными.Действительно, исследования рисунков нехудожников показали, что ошибки рисования положительно коррелируют с искажениями восприятия, закодированными во время первоначального наблюдения за изображением (Ostrofsky et al., 2015). Что наиболее важно, сама природа анкет затрудняет изучение конкретных отличительных черт без искусственной систематической ошибки. Более того, даже когда предвзятость сведена к минимуму, ответы, вероятно, будут захватывать только те пространственно дискретные формы, которые поддаются канонической лексической маркировке.

    Несмотря на эти недостатки, высокий уровень владения письменными анкетами для доступа к конструкту ментальных образов требует их рассмотрения в качестве отражателей отличительных черт ментальных образов. Чтобы максимально использовать преимущества, предоставляемые их экономичным и портативным форматом, вопросники, оценивающие конкретную структуру формы визуализированных изображений, лучше всего применять к большой группе респондентов. Использование обширной популяции снижает влияние индивидуальных предубеждений и репрезентативных предпочтений на ответы.Затем можно выявить любые существенные закономерности, наблюдаемые в ответах и ​​между ответами, и нацелить их на дальнейший более глубокий анализ. Между тем, индикаторы индивидуальных предпочтений, такие как Psi-Q и OSIQ, следует рассматривать для использования в качестве ковариат при измерении частичной информации об объекте в мысленных образах, независимо от используемой основной методологии. Даже искажения восприятия, выявленные с помощью рисунков, могут быть полезны для вывода визуальных аспектов, которым уделяется наибольшее внимание во время кодирования, тем самым предлагая особенности большей относительной когнитивной значимости.Если диагностические признаки очень информативны для идентификации данного объекта, шаблоны среди признаков или аспектов формы, о которых сообщает большая и разнообразная группа, обладают потенциалом для идентификации естественных признаков диагностического объекта. Хотя отличительные признаки, зафиксированные с помощью анкет, скорее всего, будут ограничены пространственно дискретными, именуемыми компонентами объекта, эти данные затем могут быть использованы для направления дальнейших эмпирических исследований для оценки качества, надежности и валидности этих компонентов в качестве перцепционных диагностических признаков.

    Поведение двигателя

    Жестовые двигательные движения также исследовались как индикатор содержания репрезентации ментального объекта. Следуя установленной связи между функциональными двигательными действиями и использованием инструментов, в одном из таких исследований было изучено, может ли человек приобретать функциональные репрезентации объектов, просто представляя использование новых объектов и визуализируя соответствующие соответствующие жесты рук (Paulus et al., 2012). Участникам были показаны изображения четырех искусственно созданных объектов с уникальными функциональными концами, которые требовали особых захватов для рук, чтобы их можно было поднести к уху или носу.Перед тренировкой участников проинструктировали о правильном действии, связанном с каждым объектом, и попросили представить заметный эффект, возникающий в результате этого действия (например, почувствовать запах запаха или услышать звук). Каждый участник был обучен двум из четырех новых объектов в течение трех обучающих блоков, перемежающихся между тремя чередующимися тестовыми блоками. Тренировочные блоки состояли из изображения стимула, отображаемого на экране, с последующим представлением фотографии, на которой актер изобразил объект в его правильном месте финального действия.Представления объектов оценивались в последующих тестовых испытаниях, во время которых участников просили указать нажатием кнопки, соответствует ли объект, показанный в демонстрации действия, изображению объекта, которое было отображено непосредственно перед этим. Результаты исследования выявили более медленное время реакции на изображения, на которых обучаемый объект был изображен в неправильном конечном месте, а не в правильном. Однако это время отклика не зависело от того, удерживался ли объект в демонстрации действия правильным или неправильным захватом (Paulus et al., 2012). Чувствительность к конечному местоположению, связанному с действием, предлагаемая шаблонами времени ответа, указывает на то, что участники успешно получили представления объектов, которые включали информацию о типичном местоположении конечной цели. Авторы исследования предполагают, что надлежащий захват не был так сильно закодирован в репрезентациях объекта, как двигательное действие, из-за того, что участники были проинструктированы только визуализировать заметный эффект, возникающий в результате манипуляции захватом, и никогда не получали физического, конкретного опыта в этом аспекте.Однако исследователи отмечают, что этот эффект также может быть связан с новизной объектов, включенных в их исследование, и предсказывают, что захват может быть более актуальным и раскрывать представления объектов, когда они связаны со стимулами, с которыми участники имели предыдущий опыт.

    Результаты исследования, проведенного Paulus et al. (2012) служат, чтобы проиллюстрировать важность цели объекта как ключевой особенности функциональных представлений объекта. Поскольку двигательное планирование требует понимания объекта, с которым нужно взаимодействовать, которое в некоторых случаях полностью определяется уникальной функциональной целью, весьма вероятно, что двигательные образы связаны с типом визуальных мысленных образов, выполняемых во время распознавания объекта.Взаимодействие между зрительным восприятием и эффективным двигательным планированием наблюдается как у взрослых (Janczyk and Kunde, 2012), так и у младенцев (Barrett et al., 2008). Хотя моторное планирование считается аналитическим по сравнению с восприятием объекта, которое, как утверждается, обычно основывается на комбинированных характеристиках (Janczyk and Kunde, 2012), это может способствовать развитию моторного планирования как более доступного пути, с помощью которого можно идентифицировать отдельные особенности, важные для визуального восприятия управляемое поведение. Paulus et al. (2012) исследование добавляет дополнительную поддержку относительной диагностике (в данном случае диагностике для классификации соответствующего захвата или движения) конкретных характеристик объекта по сравнению с другими, а также предлагает потенциальный способ идентификации интегральных компонентов объекта через связанное двигательное поведение.Предыдущие исследования показывают, что конечные цели объектов, скорее всего, несут категориальную информацию, связанную с их использованием и средствами или поведением действий, с помощью которых это использование эффективно достигается (например, Creem and Proffitt, 2001). Многочисленные исследования моторных образов, исследованные с помощью технологии ближнего инфракрасного диапазона, дополнительно проливают свет на эти открытия; они обсуждаются в разделе «Нейронная активность».

    Неявная связь между жестами и когнитивным пониманием объектов имеет интригующий потенциал для изучения отличительных черт, но также имеет значительные недостатки.Подобно анкетам, задачи на двигательное поведение представляют собой неинвазивный и недорогой метод оценки различных частей объекта, которые определяют естественное интерактивное поведение. Однако такое тестирование занимает значительно больше времени, чем проведение опроса, а полученные данные требуют сложной оценки и тщательной интерпретации. Чтобы избежать смешения новизны и неопытности, исследования моторного поведения в отношении отличительных черт лучше всего применять к экологически значимым объектам, с которыми участники ранее имели физические взаимодействия.Категориальная классификация, подразумеваемая определенными жестами, может позволить эффективное декодирование объекта, основанное только на наблюдении (Rosenbaum et al., 1992). Однако этот тип жестовых отношений резко ограничен объектами, которыми можно манипулировать, и, более того, объектами, которыми можно манипулировать, которые связаны с четко узнаваемым стереотипным жестом. Тем не менее, неявная оценка характеристик или категорий объекта посредством функциональных двигательных движений может пролить свет на пространственное расположение и качества характеристик, которые обычно используются в двигательных движениях.Основываясь на установленной функциональной связи между двигательными действиями, такими как захват, и конечным местоположением объекта (Rosenbaum et al., 1992), двигательное поведение, следовательно, может указывать на важные структурные особенности инструментов и других объектов, которыми можно манипулировать. Этот метод может быть объединен с данными, собранными с помощью других методов, используемых для оценки диагностических характеристик объекта, таких как анкеты или нейрофизиологические измерения, чтобы сформировать более полное понимание ментального представления объекта и его когнитивно информативных отличительных черт.

    Отслеживание взгляда

    Движения глаз, связанные с воображаемыми визуальными задачами, аналогичны тем, которые наблюдаются во время перцептивных задач. Спонтанные движения глаз во время визуализации сцены отражают паттерны направленности, сравнимые с теми, которые связаны с перцепционным наблюдением (Laeng and Teodorescu, 2002). Участники сообщают, что испытывают повышенные трудности в создании визуальных мысленных образов, когда им приказывают ограничить движения глаз при этом. При визуализации в условиях этого ограничения описания воображаемой сцены участниками становятся менее подробными и ограничиваются элементарными особенностями (Laeng and Teodorescu, 2002).Повышенная сложность, с которой создаются подробные визуальные ментальные образы при ограничении движений глаз, означает автоматическую, возможно, взаимозависимую связь между движениями глаз и обработкой визуальных воображаемых сцен.

    Предсказание связи между содержанием мысленных образов и сопутствующими глазодвигательными движениями ни в коем случае не ново, и оно получило эмпирическую поддержку, датированную несколькими десятилетиями (Brandt and Stark, 1997; Spivey and Geng, 2001; Laeng and Teodorescu, 2002). ; Йоханссон и др., 2006; Хольм и Мянтюля, 2007; Райан и др., 2007; Ханнула и Ранганат, 2009; Уильямс и Вудман, 2010; Йоханссон и Йоханссон, 2014; Martarelli et al., 2016). При прямом сравнении между визуальным осмотром и мысленной визуализацией повторяющиеся последовательности фиксации на схематических стимулах в виде шахматной доски были записаны и проанализированы по отношению к путям сканирования, наблюдаемым во время мысленных образов одних и тех же стимулов (Brandt and Stark, 1997). Сначала участников ознакомили со стимулом в виде шахматной доски в течение 20 секунд, а затем предложили визуализировать узор на пустой сетке в течение 10 секунд, после чего последовал второй период просмотра продолжительностью 10 секунд.Протокол был повторен трижды; стимулы поворачивались на 90 ° в каждом последующем испытании, а движения глаз регистрировались с помощью устройства для видеонаблюдения за глазами. Анализ редактирования строки наблюдаемых путей сканирования в двух условиях выявил высокую степень сходства саккадических паттернов, предполагая, что движения глаз могут играть роль в организации визуального содержания ментального представления в отсутствие физических стимулов. Хотя указание размера сетки и местоположения оставалось относительно постоянным, пути сканирования, наблюдаемые во время испытаний изображений, оказались примерно на 20% меньше, чем наблюдаемые во время испытаний, что указывает на аналогичную, но не идентичную взаимосвязь между саккадами и представлениями, которые они отражают (Brandt and Stark, 1997), возможно, из-за несоответствия между изображениями и их физическими аналогами.Тем не менее, параллели, наблюдаемые в глазодвигательных паттернах в этом эксперименте, убедительно подтверждают использование поведения движения глаз в качестве показателя характеристик объекта.

    Хотя точная природа взаимосвязи между саккадами и восприятием объекта все еще обсуждается, есть некоторые свидетельства того, что саккады индексируют внимание к определенным характеристикам объекта во время визуального поиска. Данные отслеживания взгляда предполагают, что на саккадические паттерны влияет информация о периферийных объектах, полученная во время визуального поиска, что отражает внимание к конкретным визуальным особенностям на основе доступной информации об объектах (Herwig and Schneider, 2014).Ранние фиксации также выполняются объектами, которые сохраняют неизменные низкоуровневые визуальные свойства, но изменяются, чтобы проявлять присущие объекту аномалии, такие как неестественное вращение или распределение цвета, что подразумевает влияние анализа периферийных объектов на саккадическое движение глаз (Becker et al., 2007). Эти данные подтверждают возможность того, что саккады индексируют релевантные объектно-специфические особенности, основанные на досаккадической обработке изображения наблюдателем.

    Есть несколько ограничений, которые необходимо учитывать при применении отслеживания движения глаз для изучения обнаружения особенностей объекта как в задачах восприятия, так и в задачах воображения.Первым из них является потенциальное смешение скрытого внимания, во время которого наблюдатель распределяет увеличенные когнитивные ресурсы внимания на определенное место в поле зрения, не совершая саккадических движений глаз (Mccarley et al., 2002). Способность манипулировать вниманием при отсутствии изменений в физическом поведении дополнительно снижает надежность движений глаз как прямого и надежного индикатора активной когнитивной обработки. Исследования, показывающие плохую работу памяти, несмотря на точные саккады для расположения ранее отображаемых стимулов, предполагают, что свойства объекта не обязательно кодируются в сочетании с пространственным расположением (Richardson and Spivey, 2000; Johansson and Johansson, 2014).Точно так же тесты, включающие манипуляции движениями глаз во время мысленных образов, показали более сильное неблагоприятное воздействие на пространственные аспекты умственных образов, чем на визуальные детали (de Vito et al., 2014). Этим проблемам способствуют отсутствие пространственной чувствительности и точности как в оборудовании для отслеживания движения глаз, так и в фовеа человека.

    Тем не менее, взаимосвязь между глазодвигательными движениями и пространственным расположением может быть использована в интересах исследования особенностей объекта. Если бы отдельные особенности объекта были приравнены к независимым, отдельным пространственным местоположениям, аналогично дизайну, используемому Брандтом и Старком (1997), эта связь могла бы предоставить возможность индексировать внимание отдельных особенностей посредством отслеживания взгляда.Приравнивая дискретные зрительные компоненты к уникальным местоположениям за пределами фовеального поля зрения, участники с большей вероятностью будут выполнять глазодвигательные движения, чтобы зафиксировать отдельные зрительные особенности, тем самым увеличивая пространственное разрешение, с которым могут быть идентифицированы конкретные отличительные особенности. Порядок, частота или продолжительность фиксации на определенных единицах могут указывать на особенность, которая является более заметной, чем другие, и затем могут быть проверены на эффективность при категоризации для определения диагностичности.Этот тип исследования можно применить к поиску визуальных объектов и впоследствии сравнить с аналогичным условием мысленных образов. Перед попыткой такого эксперимента со стимулами реальных объектов необходимо решить несколько проблем, включая решение о подходящем размере, при котором части объекта должны быть очерчены, таким образом управляя объемом общей информации об объекте, которую содержит каждая единица. Кроме того, изменение размера объекта может изменить восприятие объекта Sterzer and Rees (2006), а изменение пространственной конфигурации изображения может иметь пагубные последствия для его целостных свойств, тем самым влияя на способ его обработки (например, .г., Martelli et al., 2005). Поскольку цель исследования распознавания объектов — получить доступ к естественному восприятию стимулов и определить свойства, которые способствуют этому восприятию, важно минимизировать количество систематической ошибки, вносимой экспериментальными манипуляциями. Эти проблемы должны быть тщательно рассмотрены, чтобы сделать уверенные выводы из ассоциации между характеристиками объекта и пространственным расположением, но преимущества для понимания внимания к классификационным визуальным компонентам могут быть существенными.

    Нейронная активность

    Функциональная магнитно-резонансная томография

    Большое количество исследований нейровизуализации предполагает, что информация об отличительных объектах представлена ​​на нейронном уровне и, следовательно, может быть обнаружена записывающим оборудованием мозга. Данные, собранные с помощью фМРТ, использовались для успешного декодирования как идентичности объекта, так и классификации категорий не только визуально воспринимаемых стимулов, но и мысленно генерируемых изображений (Thirion et al., 2006; Reddy et al., 2010). С точки зрения восприятия низкоуровневые визуальные особенности, столь же точные, как ориентация краев, были декодированы на основе нейронной активности и использованы для надежной классификации того, какая из небольшого набора ориентаций стимулов просматривалась участником (Kamitani and Tong, 2005). Исследование, включающее мысленные образы 60 линейных рисунков объектов, каждый из которых относится к одной из 12 категорий, показало, что каждая категория была отмечена аналогичным распределением активированных вокселов, которое оставалось стабильным для категорий и субъектов, особенно в височной, затылочной и веретенообразной извилине кортикального слоя. регионах (Behroozi, Daliri, 2014).Последовательность активации вокселей, наблюдаемая у разных людей, предполагает, что записанные нейронные реакции были вызваны каким-то внутренним свойством или особенностями самого стимула, которые указывают на его принадлежность к определенной категории, тем самым снижая вероятность того, что индивидуальные различия или факторы смещения повлияли на паттерн нервной системы. отклик. В других исследованиях были обнаружены аналогичные отличные результаты в отсутствие визуальной стимуляции, такие как диссоциация воображаемого лица и стимулов места на основе соответствующих специфичных для стимулов корковых областей (O’Craven and Kanwisher, 2000), классификация категорий воображаемых объектов, отраженная в вентральная височная кора (Reddy et al., 2010), воссоздание простых стимулов в виде шахматной доски на основе активации, обнаруженной в ранних ретинотопных областях (Thirion et al., 2006), и даже декодирования категории и идентичности содержания сновидений (Horikawa et al., 2013). По крайней мере, некоторые исследования мысленных образов, включающих воображение простых стимулов, достигли ограниченного успеха в этой области благодаря использованию MVPA (Reddy et al., 2010; Albers et al., 2013; Behroozi and Daliri, 2014). Эти результаты предполагают, что информация, относящаяся к категории и идентичности воображаемых стимулов, отражается в нейронной активности аналогично тому, как это происходит во время просмотра, и которая доступна с помощью существующих технологий, хотя дифференцировать ее может быть сложнее, чем при перцепционной активности.

    Впечатляющая точность и гибкость, с которой данные фМРТ, как было показано, фиксируют информацию о конкретных характеристиках, подтверждают возможность того, что различимые компоненты объекта отражаются в нейронной активности, связанной с ментальными образами, тем самым обеспечивая прямые средства доступа к диагностическим характеристикам через ментальные представления. Если отличительных черт действительно достаточно для классификации по категориям, как предполагает теория, они могут вносить значительный вклад в нейронные паттерны, наблюдаемые в исследованиях, подобных тем, которые описаны выше.Чтобы проверить это, категориальные стимулы, которые, как обнаружено, вызывают сходные паттерны нейронной активации, могут быть систематически сегментированы на набор визуальных составляющих частей (аналогично Ullman et al., 2016). Затем эти части могут быть представлены индивидуально во время фМРТ, чтобы определить, какие из естественных единиц, если таковые имеются, способны вызывать нейронную реакцию, аналогичную той, которая связана с исходным, неповрежденным объектом. Хотя этот метод сегментации исключает случаи, в которых целостная информация служит диагностическим признаком, до тех пор, пока перцепционные сравнения ограничиваются групповым уровнем, а не индивидуальным уровнем, отличительные визуальные признаки, полезные для распознавания в этом типе задач, должны быть общими. через несколько экземпляров.Это связано с тем, что глобальная информация включает в себя конкретную конфигурацию нескольких функций и поэтому менее полезна для эффективной категоризации нескольких объектов, некоторые из которых могут не разделять все характеристики, содержащиеся в целостном представлении.

    Электроэнцефалография

    В дополнение к фМРТ, электроэнцефалография (ЭЭГ) использовалась для изучения ментальных репрезентаций, выраженных через электрическую нейронную активность (например, Shourie et al., 2014). Исследования в области ментальных образов, связанных с объектами, с использованием ЭЭГ сравнительно немногочисленны, но проделанная работа успешно использовалась для декодирования образов движения с целью управления интерфейсом мозг-компьютер (например,г., Townsend et al., 2004; см. обзор Choi, 2013), предполагая, что ЭЭГ способна различать общие категории воображаемых действий. В заметном и значительном отклонении от общей тенденции сосредоточиться на целостной информации в мысленных образах, в одном исследовании была предпринята попытка изучить роль частичной информации об объекте через изменения, наблюдаемые в спектре ЭЭГ (Li et al., 2010). Участникам были показаны серые линейные рисунки 60 общих объектов, содержащих то, что исследователи определили как отдельные, именуемые, пространственно дискретные особенности.Во время экспериментальной задачи были собраны данные ЭЭГ, в то время как участникам предъявляли стимул рисования линий в течение 500 мс. После паузы в 4000 мс участников просили сгенерировать мысленное изображение ранее просмотренного рисунка линии в соответствии с отображаемой репликой слова целостного или частичного изображения. Эти лексические подсказки ссылаются либо на каноническое имя всего объекта, либо на имя одной из его семантически значимых частей (например, слово «лампа» указывает на состояние целостного образа, тогда как «абажур» указывает на образ только для определенной области объекта. стимул; Ли и др., 2010). Нажатие кнопки в поле ответа указывает начальную точку времени для каждого воображаемого эпизода. Результаты исследования показали, что наибольшие различия между задачами восприятия и воображаемыми существуют в пределах спектров тета- и альфа-диапазона. Хотя оба состояния вызвали ответы, значительно превышающие пороговые значения, частичные изображения показали более раннее «время всплеска» и более низкую альфа-мощность, чем целостное состояние, а различия когерентности наблюдались в лобных и центрально-височных областях электродов (Li et al., 2010). Авторы предполагают, что раннее начало времени, связанное с состоянием частичного изображения, указывает на то, что частичная визуальная информация проявляется независимо от генерации целостного изображения, и что более сильная тета-сила в этом состоянии отражает более сложную обработку, необходимую для получения деталей объекта. Тем не менее, одновременное уменьшение энергии альфа-диапазона в задаче частичного изображения предлагается отражать «творческий или модифицирующий процесс», который не требуется для простого восстановления в памяти целостных изображений (Li et al., 2010). Эти результаты предполагают, что, несмотря на очевидную независимость от целостной информации, формирование частичных образов, по-видимому, включает сложные взаимодействия с соответствующим целостным контекстом. Это может иметь важные последствия для понимания взаимосвязи между отдельными диагностическими функциями и всем представлением, с которым они связаны. Подобно Ullman et al. (2016), эти результаты также предполагают, что отличительные особенности могут быть встроены в более крупную конфигурацию, или диагностическая функция может фактически включать набор отдельных функций.Это важное соображение при попытке идентифицировать минимально диагностические области, но исследование Li et al. (2010) предполагает, что ЭЭГ может быть чувствительной к этому процессу.

    Подход с использованием словесных подсказок, используемый для манипулирования экспериментальным условием мысленных образов в Li et al. (2010) еще предстоит пройти валидацию как надежный метод для создания целостных и частичных изображений, и он является основной проблемой при интерпретации результатов исследования. Использование словесных реплик, основанных на именованных частях объекта, вызывает искусственное разделение изображения на пространственно дискретные особенности, определяемые узнаваемыми, но произвольными структурными особенностями, интерактивные отношения между ними и общим целостным представлением неясны.Однако есть свидетельства того, что вербальные реплики способны вызывать мысленные образы с некоторой степенью точности, как демонстрируют инструменты письменного опроса, такие как MIS (D’Ercole et al., 2010), и что категория мысленного образа может быть различимым в данных ЭЭГ (Симанова и др., 2010). Кроме того, вычислительная модель, используемая для декодирования активности человеческого мозга для прогнозирования активации фМРТ, связанной со значением существительных (Mitchell et al., 2008), показывает, что словесные сигналы могут изменять нервную и, соответственно, когнитивную активность.Следовательно, хотя манипуляции с частью объекта, примененные в Li et al. (2010) требует тщательного изучения, открытие исследования, что паттерны в спектре активности ЭЭГ были способны различать некоторый уровень вариации ментальных представлений, по-прежнему заслуживает рассмотрения при исследовании частичных особенностей ментальных образов.

    Функциональная спектроскопия в ближнем инфракрасном диапазоне

    Функциональная ближняя инфракрасная спектроскопия (fNIRS) — это относительно новая технология, которая быстро набирает популярность благодаря своей портативности и гибкости экспериментального применения.Эта система сочетает в себе пространственную чувствительность фМРТ с удобством и временным разрешением ЭЭГ за счет неинвазивного измерения скорости диффузии ближнего инфракрасного света, когда он проецируется через череп. На записи, полученные с помощью fNIRS, влияет относительная концентрация оксигенированного и деоксигенированного гемоглобина в корковом кровотоке, и поэтому они концептуализируются как косвенное измерение нервной активности (Kamran and Hong, 2013). Эту сравнительно недавнюю методологию еще предстоит напрямую применить к задачам, связанным с генерацией визуальных мысленных образов.Однако исследования восприятия младенцев, а также значительная база литературы по декодированию моторных образов показывают смешанные доказательства гемодинамических реакций, записанных с помощью fNIRS, в качестве индекса личных психических и зрительных процессов.

    В исследовании обработки изображений у младенцев использовалась fNIRS для исследования нейронных коррелятов, лежащих в основе индивидуализации объекта (Wilcox et al., 2005). Используя вариант задания с узким экраном (Wilcox and Baillargeon, 1998), младенцев знакомили с двумя совершенно разными объектами, мячом и коробкой, которые последовательно появлялись с противоположных сторон узкого или широкого экрана.Время поведенческой реакции показало, что младенцы дольше смотрели в условиях узкого экрана, что позволяет предположить, что младенцы были способны различать стимулы как два отдельных объекта, которые не могли логически поместиться за экраном по одной оси одновременно. Вариации гемодинамического ответа, измеренные с помощью NIRS во время узких скрининговых испытаний, были локализованы в первичной зрительной и нижней височной коре, что указывает на то, что индивидуализация объекта связана с уникальными, обнаруживаемыми паттернами нейронной активности в этих областях (Wilcox et al., 2005). Хотя исследователи признают, что еще предстоит проделать большую работу, прежде чем связь между вариациями оксигенированного и деоксигенированного гемоглобина и когнитивных функций будет хорошо изучена (но см. Chen et al., 2015), их исследование действительно поддерживает fNIRS как жизнеспособное средство индексации частных визуальные явления, связанные с процессами распознавания объектов. Кроме того, способность fNIRS различать нейронную активность, на которую влияют вариации в различных локальных особенностях, дает надежду на обнаружение отличительных признаков при распознавании объектов.

    Некоторые проблемы остаются при рассмотрении fNIRS как меры ментальных образов. С одной стороны, относительно устоявшаяся работа по исследованию образов движения может содержать ключи для руководства будущим применением этой технологии к репрезентациям объектов. Большая часть этой литературы посвящена декодированию образов движения для применения в технологии интерфейса мозг-компьютер (см. Обзор Naseer and Hong, 2015). Соответственно, измерения NIRS часто регистрируются из областей моторной коры, которые, как правило, легко проникают в ближнюю инфракрасную область.Хотя эксперименты, которые применяют fNIRS к декодированию образов движения, не пытаются напрямую получить доступ к визуальным мысленным образам, их результаты демонстрируют потенциал данных fNIRS для облегчения надежного декодирования частных внутренних событий. Это может указывать на то, что те же методы могут быть применены к ментальным образам зрительного объекта, пока могут быть достигнуты соответствующие корковые поверхности (будет обсуждаться позже в этом разделе). Если к нейронным субстратам ментальных образов действительно можно получить доступ, высокое временное и пространственное разрешение, обеспечиваемое технологией fNIRS, может стать полезным средством для поиска диагностических функций, представленных в ментальных образах.К сожалению, скептицизм в отношении точности и полезности записей fNIRS, даже в отношении изображений движения, остается (например, Waldert et al., 2012), что не позволяет с уверенностью рекомендовать применение технологии fNIRS в ее нынешнем состоянии для декодирования изображений объектов.

    Сводка показателей нейронной активности

    Исследование ментальных образов посредством мозговой активности явно выгодно, поскольку эти методы не требуют, чтобы люди открыто сообщали о своих личных ментальных переживаниях.Несмотря на продемонстрированный успех нейрофизиологических методов записи в доступе к мысленным образам, все же существует ряд ограничений, которые необходимо учитывать при изучении их значения для идентификации отличительных черт в репрезентациях объектов. Например, аналогично набору стимулов, используемому Бехрузи и Далири (2014), успешное декодирование информации о категории или идентичности в фМРТ часто зависит от набора изображений, из которых можно декодировать ответы, за некоторыми исключениями (например,г., Тирион и др., 2006). Это требование ограничивает гибкость, с которой методы нейронной визуализации могут индексировать создание естественных образов в реальных сценариях, которые содержат несколько переменных и огромный набор возможностей для визуальных стимулов. Однако следует отметить, что некоторым исследованиям удалось раздвинуть границы этого набора до впечатляющих пределов и по-прежнему сообщать об успехах в декодировании компонентов ментальных образов (например, Miyawaki et al., 2008; Horikawa et al., 2013). В дополнение к фМРТ, динамика ЭЭГ, вероятно, способна улавливать эффекты, вызванные обработкой пространственно определенных компонентов объекта (Li et al., 2010). Однако, как упоминалось выше, манипулирование пространственным разрешением определенных признаков с помощью словесных сигналов создает несколько проблем, и на данный момент ЭЭГ продемонстрировала успех в основном на уровне общей или вышестоящей классификации. Проблема предотвращения искусственных предубеждений, вызванных произвольным выделением структурных особенностей, распространяется на любую перцептивную оценку ментальных образов. Требуются тщательные и творческие экспериментальные разработки, чтобы разработать метод, позволяющий получить доступ к дискретным диагностическим визуальным признакам в том виде, в каком они возникают естественным образом и на уровне, доступном для ЭЭГ.

    Хотя результаты исследований fNIRS показывают ограниченную способность классифицировать двигательные образы и процессы зрительного восприятия, есть несколько проблем, которые влияют на эту область исследований применительно к обнаружению признаков в ментальных образах объектов. Во-первых, характер проникновения инфракрасного света, используемого fNIRS, ограничивает записи областями коры, лежащими близко под черепом, примерно на 2–3 см ниже кортикальной поверхности (Wilcox et al., 2005). К счастью, есть свидетельства того, что корковые области обработки изображений доступны через ближний инфракрасный диапазон.В дополнение к записям, полученным от первичной и вентральной зрительной коры у младенцев (Meek et al., 1998; Wilcox et al., 2005), было показано, что fNIRS успешно индексирует гемодинамические изменения в зрительной коре взрослого человека во время задач восприятия (Takahashi et al. ., 2000). Кроме того, записи fNIRS, собранные в первичной зрительной коре головного мозга взрослых, и дополнительные нейрофизиологические измерения показывают, что fNIRS способна выявлять закономерности избирательности стимулов, а также специфичности области (Chen et al., 2015). Эти исследования показывают потенциал для применения методологий fNIRS и гибридных fNIRS для визуального представления функций в ментальных образах взрослых. Однако, учитывая многочисленные находки, которые указывают на то, что области за пределами ранней зрительной коры головного мозга вносят значительный вклад в визуальные ментальные образы (см. Vetter et al., 2014), остаются сомнения относительно того, можно ли использовать fNIRS для надежного и тщательного исследования нейронные корреляты дискретных черт в ментальных представлениях.

    Дополнительным преимуществом методов нейровизуализации является то, что их данные поддаются широкому спектру статистического анализа, который позволяет интерпретировать сложные паттерны активации для выявления корреляций между визуальной и семантической информацией. Многие из этих методов, включая MVPA и поддержку векторного машинного обучения, позволяют учитывать несколько факторов при корреляции активности мозга с информацией о категориях (см. De Martino et al., 2008; Kriegeskorte, 2011; Chen et al., 2014; Haxby et al. ., 2014 для обзоров). Другие статистические методы, такие как наивное байесовское моделирование, дали надежные прогнозы классификации семантических категорий для изображений и слов (Behroozi and Daliri, 2014). Разнообразие статистических методов, которые могут быть применены к данным нейровизуализации, увеличивает их потенциал для вывода выводов между нейронной активностью и процессами распознавания семантических объектов, что в конечном итоге может позволить делать конкретные прогнозы относительно информации о характеристиках объекта в ментальных образах.

    В целом, фМРТ нейронные записи перцепционной и ментальной визуальной обработки обладают большим потенциалом для индексации отличительных черт в репрезентациях объектов, тогда как ЭЭГ и fNIRS кажутся более слабыми методами. Чувствительность к содержанию объекта, продемонстрированная данными фМРТ, ясно указывает на их полезность для доступа к дискретным визуальным элементам, необходимым для различения различных категорий объектов. Результаты ЭЭГ отражают эффекты частичных образов в динамике мозговых волн, но текущая работа ограничивается общими и несопоставимыми эффектами в целостном vs.нецелостные эффекты. Кроме того, есть основания полагать, что технология fNIRS может быть способна записывать мысленные образы, выраженные в первичных зрительных корковых областях взрослых. Однако еще предстоит проделать большую работу, прежде чем fNIRS можно будет уверенно применять к воображаемым представлениям в области моторных или объектных изображений. Учитывая, что fNIRS и EEG очень совместимы и повышают точность при совместном использовании для исследования процессов восприятия (например, Putze et al., 2014), сочетание пространственной чувствительности и широкого диапазона fMRI с временным разрешением EEG или fNIRS может улучшить слабые стороны каждого из них улучшают их успех в доступе к диагностическим функциям, преобладающим во время визуальных образов.

    Выводы и выводы

    Цель этого обзора двоякая: предположить, что ментальные образы являются выгодным и действенным методом оценки характеристик диагностических объектов, и продемонстрировать, что, несмотря на отсутствие в настоящее время прямых исследований диагностических признаков в ментальных образах, свидетельства их отношения и инструменты, наиболее подходящие для их изучения, предлагаются существующей литературой. Каждый метод измерения имеет свои уникальные преимущества и недостатки для изучения роли диагностических визуальных компонентов в обработке объектов (см. Таблицу 1).Раннее, недостаточно развитое состояние этой области способствует систематическому методологическому подходу, способному фиксировать широкий спектр информации. Для достижения этого подходы к измерению должны сочетаться с целью извлечения выгоды из методологических сильных сторон и компенсации недостатков с упором на сбор больших и разнообразных объемов данных. Здесь обобщены общие значения и полезность каждого метода для изучения отличительных черт в визуальных образах, а также сделаны предложения для будущих направлений.

    ТАБЛИЦА 1. Методологические плюсы и минусы для доступа к содержанию мысленных образов объектов.

    Инструменты письменного опроса, такие как опросник яркости визуальных ментальных образов, MIS (Marks, 1973, 1995) и опросник объектно-пространственных образов (Blajenkova et al., 2006), полезны для сбора большого количества подробных и умеренно надежных самоанализа. данные отчета. Фундаментальные методологические проблемы, связанные с просьбой воссоздать или выразить словами свой внутренний опыт, ограничивают возможности применения этого инструмента в качестве прямой индивидуальной оценки диагностических признаков.Объединение ответов в большой группе дает лучшую возможность выявить значимые тенденции, касающиеся природы классификационных характеристик объекта. Кроме того, простота использования и быстрое администрирование инструментов самооценки облегчает их сочетание с другими формами измерения. Рассмотрение ответов на анкету вместе с нейрофизиологическими данными, собранными с помощью таких методов, как отслеживание глаз, ЭЭГ и фМРТ, дает несколько преимуществ:

    (1) способствует быстрому росту относительно неразвитой области семантически обозначенных визуальных признаков;

    (2) позволяет идентифицировать важные индивидуальные различия в стиле создания изображений и учитывать их при интерпретации дополнительных косвенных измерений;

    (3) он дает представление о когнитивных процессах, выявленных самоотчетом, что может обеспечить информативные, конкретные связи между семантической классификацией и биологической активностью, тем самым дополняя интерпретации, полученные из физиологических или неврологических записей.

    Исследования двигательного поведения указывают на значительную взаимосвязь между целенаправленными действиями и ментальными представлениями, которая опосредована функциональной стороной манипулируемых объектов. Однако при освоении без физической практики эти отношения, по-видимому, ограничиваются крупномасштабным целенаправленным поведением, которое, как ожидается, приведет к соответствующим последствиям. Поскольку точное двигательное поведение, такое как захват, не было показано, чтобы разделять прямую корреляцию с полученными образами мысленными представлениями, этот подход может подходить только для предметов, которые связаны с очевидными и уникальными целенаправленными движениями, таких как инструменты.Тем не менее наблюдаемая корреляция между пространственно дискретными структурными компонентами объекта и двигательным поведением поддерживает вероятность того, что в ментальных репрезентациях существуют отдельные черты, и что когнитивно значимые черты могут косвенно выражаться через физические действия.

    Результаты отслеживания взгляда показывают, что саккады похожи между состояниями восприятия и мысленных образов и, таким образом, отражают значимые когнитивные процессы. Хотя саккадические движения глаз в любом состоянии могут вовлекать внимание к пространственному расположению в большей степени, чем к индивидуальным особенностям, эта взаимосвязь может быть использована для исследования диагностических признаков.Если бы характеристики объекта были надежно приравнены к различным пространственным местоположениям таким образом, чтобы искусственно не изменять целостное представление объекта, саккадические движения глаз могли бы позволить более прямой указатель внимания на характерные особенности объекта, а не на пространственное положение, которое затем может быть протестированным на классификационную полезность. Кроме того, такой метод может предотвратить возможные затруднения скрытого внимания, требуя явных движений глаз для фиксации отдельных особенностей. Этот подход может быть применен к задачам распознавания перцептивных объектов, результаты которых могут служить ориентиром и сравниваться с аналогичными исследованиями ментальных образов.Непосредственная оценка диагностических характеристик в условиях восприятия и образов, таких как это, может привести к более глубокому пониманию более широких взаимодействий между характеристиками объекта, обработкой восприятия и ментальными образами.

    Записи нейронной активности, полученные с помощью фМРТ, составляют наиболее широко используемую область исследований внутренних зрительных образов. Этот метод обеспечивает прямой указатель содержания мысленных образов, избегая при этом сложностей, связанных с вербальным или визуальным переводом личных мысленных переживаний.Классификация категорий, достигнутая с помощью зависимых от уровня кислорода в крови колебаний, измеренных с помощью фМРТ, в значительной степени подразумевает наличие диагностической информации о признаках в мысленных образах, а также их выражение посредством нейронной активности. Были идентифицированы отчетливые паттерны активности, связанные с определенными категориями воображаемых объектов, и было обнаружено, что они остаются стабильными у разных людей. В целом, методы фМРТ демонстрируют заметные перспективы для улучшения понимания роли диагностических характеристик объекта в репрезентации объекта через нейронные механизмы, лежащие в основе ментальных образов.Предварительные результаты исследований ЭЭГ также предполагают, что целостные и неголистические изображения частичных компонентов объекта могут отражаться в динамике мозговых волн, но информация о конкретных характеристиках еще не идентифицирована, что позволяет предположить, что ее лучше всего сочетать с такими методами, как фМРТ. Детальный уровень специфичности, достигаемый с помощью фМРТ, ограничен отсутствием временного разрешения, тогда как ЭЭГ ограничивается пространственным разрешением.

    Работа с восприятием, проведенная с помощью fNIRS, дает неубедительные доказательства того, что гемодинамические реакции являются надежным индикатором активности, связанной с изображениями.Хотя исследования восприятия с использованием fNIRS все еще находятся на начальной стадии, исследования индивидуализации объектов и двигательных образов предполагают потенциал для будущего применения fNIRS к событиям мысленных образов. К сожалению, ближняя инфракрасная область в настоящее время ограничена мелкими областями коры головного мозга, участвующими в визуальной обработке, и надежность гемодинамического ответа для нейронного декодирования еще предстоит подтвердить. Чтобы приспособиться к широко распространенным и разнообразным нейронным коррелятам формирования мысленных образов, fNIRS следует комбинировать с более широкими измерительными инструментами, такими как ЭЭГ или фМРТ, чтобы способствовать эффективному индексированию визуализируемых характеристик объекта.

    Методы и результаты, рассмотренные в этой статье, призваны подтвердить осуществимость и ценность исследования перцептивных диагностических функций с помощью визуальных ментальных репрезентаций. Внутренний визуальный опыт, возникающий в отсутствие перцептивного ввода, потенциально может быть уникально информативным для понимания того, каким образом визуальная информация преобразуется и транслируется для создания семантически значимых представлений объектов. Воспользовавшись естественными процессами фильтрации информации, налагаемыми физическими и когнитивными ограничениями человеческих зрительных и нейронных систем, можно получить доступ к большому количеству семантической информации через сжатый, концентрированный источник в виде отличительных признаков.Ментальные образы предлагают значительные преимущества по сравнению с прямыми перцептивными оценками, поскольку во время естественного восприятия потенциальный объем идентифицирующей информации об объекте намного больше, чем когда объект вызывается только с помощью образов, отчасти потому, что нерелевантная информация была отброшена — или, по крайней мере, , не подчеркнутые — в мысленных представлениях. Изучая распознавание объекта исключительно в том виде, в каком оно происходит во время процессов восприятия, исследователь вынужден учитывать чрезмерное количество возможностей при определении свойств стимула, наиболее важных для его идентификации.Однако эта процедура плохо отражает естественные зрительные процессы. Подходя к визуальному восприятию с уровня его конечной цели — ментального представления — и оценивая взаимосвязь между исходным входом и его конечным выходом, исследователь может достичь более полного и точного понимания взаимодействия между зрением и познанием.

    Вклад автора

    SR разработал концепцию, провел исследование и написал текст этой рукописи.

    Заявление о конфликте интересов

    Автор заявляет, что исследование проводилось при отсутствии каких-либо коммерческих или финансовых отношений, которые могут быть истолкованы как потенциальный конфликт интересов.

    Рецензент DL и ведущий редактор заявили о своей общей принадлежности, а ведущий редактор заявляет, что процесс, тем не менее, соответствовал стандартам справедливой и объективной проверки.

    Благодарности

    Автор благодарит Dr.Энтони Кейт за его руководство во время планирования и подготовки этой работы, а также докторов. Дайане, Беллу и ЛаКонту за их помощь в разработке концепций и поиске соответствующих исследований. Автор выражает благодарность OASF Технологического института Вирджинии за поддержку публикации этой статьи.

    Список литературы

    Альберс, А. М., Кок, П., Тони, И., Дейкерман, Х. К., и де Ланге, Ф. П. (2013). Общие представления рабочей памяти и мысленных образов в ранней зрительной коре. Curr.Биол. 23, 1427–1431. DOI: 10.1016 / j.cub.2013.05.065

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Андерсон, Дж. Р. (1983). Распространяющаяся теория активации памяти. J. Словесное обучение. Вербальное поведение. 22, 261–295. DOI: 10.1016 / S0022-5371 (83)-3

    CrossRef Полный текст | Google Scholar

    Андраде, Дж., Мэй, Дж., Дипроуз, К., Боуг, С.-Дж., и Ганис, Г. (2014). Оценка яркости ментальных образов: опросник сенсорных образов Плимута. Br. J. Psychol. 105, 547–563. DOI: 10.1111 / bjop.12050

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Баллестерос, С., и Майас, Дж. (2015). Избирательное внимание влияет на восприятие и распознавание концептуального объекта: исследование с участием молодых и пожилых людей. Фронт. Psychol. 5: 1567. DOI: 10.3389 / fpsyg.2014.01567

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Барретт Т.М., Траупман Э. и Нидхэм А. (2008).Визуальное ожидание младенцами структуры объекта при планировании схватывания. Infant Behav. Dev. 31, 1–9. DOI: 10.1016 / j.infbeh.2007.05.004

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Барух, О., Кимчи, Р., Голдсмит, М. (2014). Внимание к отличительным особенностям при распознавании объектов. Vis. Cogn. 22, 1184–1215. DOI: 10.1080 / 13506285.2014.987860

    CrossRef Полный текст | Google Scholar

    Берманн, М., Москович, М.и Винокур Г. (1994). Неповрежденные зрительные образы и нарушение зрительного восприятия у пациента с зрительной агнозией. J. Exp. Psychol. Гм. Восприятие. Выполнять. 20, 1068–1087. DOI: 10.1037 / 0096-1523.20.5.1068

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Бидерман И. (1987). Распознавание по компонентам: теория понимания человеческого образа. Psychol. Ред. 94, 115–117. DOI: 10.1037 / 0033-295X.94.2.115

    CrossRef Полный текст | Google Scholar

    Блаженкова, О., Кожевников М., Мотс М.А. (2006). Объектно-пространственные образы: новая анкета с самоотчетом по изображениям. Заявл. Cogn. Psychol. 20, 239–263. DOI: 10.1002 / acp.1182

    CrossRef Полный текст | Google Scholar

    Борст, Г., Ганис, Г., Томпсон, В. Л., и Косслин, С. М. (2012). Представления в мысленных образах и рабочей памяти: свидетельства от различных типов визуальных масок. Mem. Cogn. 40, 204–217. DOI: 10.3758 / s13421-011-0143-7

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Борст, Г., и Кослин, С. М. (2008). Визуальные ментальные образы и визуальное восприятие: структурная эквивалентность, выявленная процессами сканирования. Mem. Cogn. 36, 849–862. DOI: 10.3758 / MC.36.4.849

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Bramão, I., Inacio, F., Faisca, L., Reis, A., and Petersson, K. M. (2011a). Влияние цветовой информации на распознавание объектов цветовой и нецветной диагностики. J. Gen. Psychol. 138, 49–65.DOI: 10.1080 / 00221309.2010.533718

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Bramão, I., Reis, A., Petersson, K. M., and Faísca, L. (2011b). Роль цветовой информации в распознавании объектов: обзор и метаанализ. Acta Psychol. 138, 244–253. DOI: 10.1016 / j.actpsy.2011.06.010

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Брандт, С.А., и Старк, Л.В. (1997). Спонтанные движения глаз во время визуальных образов отражают содержание визуальной сцены. J. Cogn. Neurosci. 9, 27–38. DOI: 10.1162 / jocn.1997.9.1.27

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Бридж, Х., Харролд, С., Холмс, Э. А., Стокс, М., и Кеннард, К. (2011). Яркие визуальные ментальные образы при отсутствии первичной зрительной коры. J. Neurol. 259, 1062–1070. DOI: 10.1007 / s00415-011-6299-z

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Broggin, E., Savazzi, S., and Marzi, C.А. (2012). Подобные эффекты визуального восприятия и образов на время простой реакции. Q. J. Exp. Psychol. 65, 151–164. DOI: 10.1080 / 17470218.2011.594896

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Кампос, А. (2011). Внутренняя непротиворечивость и конструктивная достоверность двух версий пересмотренной анкеты яркости визуальных образов. Восприятие. Mot. Навыки 113, 454–460. DOI: 10.2466 / 04.22.PMS.113.5.454-460

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Каттанео, З., Бона, С., Сильванто, Дж. (2012). Кросс-адаптация в сочетании с TMS выявляет функциональное перекрытие между зрением и образами в ранней зрительной коре. Neuroimage 59, 3015–3020. DOI: 10.1016 / j.neuroimage.2011.10.022

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Cattaneo, Z., Vecchi, T., Cornoldi, C., Mammarella, I., Bonino, D., Ricciardi, E., et al. (2008). Образные и пространственные процессы при слепоте и нарушении зрения. Neurosci. Biobehav.Ред. 32, 1346–1360. DOI: 10.1016 / j.neubiorev.2008.05.002

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Чен, Л.-К., Сандманн, П., Торн, Дж. Д., Херрманн, К. С., Дебенер, С. (2015). Ассоциация одновременных сигнатур fNIRS и ЭЭГ в ответ на слуховые и зрительные стимулы. Brain Topogr. 28, 710–725. DOI: 10.1007 / s10548-015-0424-8

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Чен, М., Хан, Дж., Ху, X., Цзян, X., Го, Л., и Лю, Т. (2014). Обзор кодирования и декодирования визуальных стимулов с помощью FMRI: перспектива анализа изображений. Brain Imaging Behav. 8, 7–23. DOI: 10.1007 / s11682-013-9238-z

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Крим, С. Х., и Проффитт, Д. Р. (2001). Захват предметов за ручки: необходимое взаимодействие между познанием и действием. J. Exp. Psychol. Гм. Восприятие. Выполнять. 27, 218–228. DOI: 10.1037 / 0096-1523.27.1.218

    CrossRef Полный текст | Google Scholar

    Даль Д. В., Чаттопадхай А. и Горн Г. Дж. (1999). Использование визуальных мысленных образов в дизайне новых продуктов. J. Mark. Res. 36, 18–28. DOI: 10.2307 / 3151912

    CrossRef Полный текст | Google Scholar

    Де Мартино, Ф., Валенте, Г., Стаерен, Н., Эшбернер, Дж., Гебель, Р., и Формизано, Э. (2008). Объединение многовариантного выбора вокселей и вспомогательных векторных машин для отображения и классификации пространственных паттернов фМРТ. Neuroimage 43, 44–58. DOI: 10.1016 / j.neuroimage.2008.06.037

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    де Вито, С., и Бартоломео, П. (2015). Отказываясь представить? О возможности психогенной афантазии. Комментарий к Zeman et al. (2015). Cortex 74, 334–335. DOI: 10.1016 / j.cortex.2015.06.013

    PubMed Аннотация | CrossRef Полный текст

    де Вито С., Буонокоре А., Боннефон Ж.-Ф. и Сала С. Д. (2014).Движения глаз нарушают пространственные, но не визуальные ментальные образы. Cogn. Процесс. 15, 543–549. DOI: 10.1007 / s10339-014-0617-1

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Д’Эрколе М., Кастелли П., Джаннини А. М. и Сбрилли А. (2010). Шкала ментальных образов: новый инструмент измерения для оценки структурных особенностей ментальных представлений. Измер. Sci. Technol. 21: 54019. DOI: 10.1088 / 0957-0233 / 21/5/054019

    CrossRef Полный текст | Google Scholar

    Донг, Б., и Рен, Г. (2015). Новый метод классификации сцен, основанный на локальных особенностях габора. Math. Пробл. Англ. 2015: 109718. DOI: 10.1155 / 2015/109718

    CrossRef Полный текст | Google Scholar

    Ганис, Г., Томпсон, В. Л. и Косслин, С. М. (2004). Области мозга, лежащие в основе визуальных мысленных образов и визуального восприятия: исследование фМРТ. Cogn. Brain Res. 20, 226–241. DOI: 10.1016 / j.cogbrainres.2004.02.012

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Ханнула, Д.Э. и Ранганат К. (2009). Это есть в глазах: активность гиппокампа предсказывает выражение памяти в движениях глаз. Нейрон 63, 592–599. DOI: 10.1016 / j.neuron.2009.08.025

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Хэксби, Дж. В., Коннолли, А. К., и Гунтупалли, Дж. С. (2014). Расшифровка нейронных репрезентативных пространств с использованием многомерного анализа паттернов. Annu. Rev. Neurosci. 37, 435–456. DOI: 10.1146 / annurev-neuro-062012-170325

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Хервиг, А., и Шнайдер, В. X. (2014). Прогнозирование характеристик объекта по саккадам: свидетельства распознавания объектов и визуального поиска. J. Exp. Psychol. Gen. 143, 1903–1922. DOI: 10.1037 / a0036781

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Янчик, М., Кунде, В. (2012). Визуальная обработка действий препятствует сходству релевантных и нерелевантных характеристик объекта. Психон. Бык. Rev. 19, 412–417. DOI: 10.3758 / s13423-012-0238-6

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Йоханссон, Р., Холсанова, Дж., И Холмквист, К. (2006). Изображения и устные описания вызывают сходные движения глаз во время мысленных образов. И при свете, и в полной темноте. Cogn. Sci. 30, 1053–1079. DOI: 10.1207 / s15516709cog0000_86

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Камран М.А., Хонг К.-С. (2013). «Косвенное измерение активации мозга с помощью fNIRS», Труды 13-й Международной конференции по контролю, автоматизации и системам (ICCAS) 2013 г., , Кванджу, 1633–1636.DOI: 10.1109 / ICCAS.2013.6704193

    CrossRef Полный текст | Google Scholar

    Кослин, С. М., Райзер, Б. Дж., Фара, М. Дж., И Флигель, С. Л. (1983). Создание визуальных образов: единицы и отношения. J. Exp. Psychol. Gen. 112, 278–303. DOI: 10.1037 / 0096-3445.112.2.278

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Кослин, С. М., Томпсон, В. Л., Ким, И. Дж., И Альперт, Н. М. (1995). Топографические представления ментальных образов в первичной зрительной коре. Природа 378, 496–498.

    PubMed Аннотация | Google Scholar

    Лаенг, Б., Теодореску, Д.-С. (2002). Пути сканирования глаз во время визуальных образов воспроизводят пути восприятия той же визуальной сцены. Cogn. Sci. 26, 207–231. DOI: 10.1016 / S0364-0213 (01) 00065-9

    CrossRef Полный текст | Google Scholar

    Ли, Дж., Тан, Ю., Чжоу, Л., Ю, К., Ли, С., и Дан-ни, С. (2010). Динамика ЭЭГ отражает частичные и целостные эффекты в генерации мысленных образов. J. Zhejiang Univ. Sci. B 11, 944–951. DOI: 10.1631 / jzus.B1000005

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Маркс, Д. Ф. (1973). Различия в визуальных образах при запоминании картинок. Br. J. Psychol. 64, 17–24. DOI: 10.1111 / j.2044-8295.1973.tb01322.x

    CrossRef Полный текст | Google Scholar

    Маркс, Д. Ф. (1995). Новые направления исследования ментальных образов. J. Ment. Изображения 19, 153–167.

    Google Scholar

    Мартарелли, К.С., Чике, С., Лаенг, Б. и Маст, Ф. В. (2016). Использование пространства для представления категорий: понимание с позиции взгляда. Psychol. Res. DOI: 10.1007 / s00426-016-0781-2 [Epub перед печатью].

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Маккарли Дж. С., Крамер А. Ф. и Петерсон М. С. (2002). Открытое и скрытое объектно-ориентированное внимание. Психон. Бык. Ред. 9, 751–758. DOI: 10.3758 / BF03196331

    CrossRef Полный текст | Google Scholar

    Мик, Дж.Х., Фирбанк, М., Элвелл, К. Э., Аткинсон, Дж., Брэддик, О., и Вятт, Дж. С. (1998). Региональные гемодинамические реакции на визуальную стимуляцию у бодрствующих младенцев. Pediatr. Res. 43, 840–843. DOI: 10.1203 / 00006450-199806000-00019

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Митчелл, Т.М., Шинкарева, С.В., Карлсон, А., Чанг, К.-М., Малав, В.Л., Мейсон, Р.А., и др. (2008). Прогнозирование активности человеческого мозга, связанной со значениями существительных. Наука 320, 1191–1195.DOI: 10.1126 / science.1152876

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Мияваки Ю., Утида, Х., Ямасита, О., Сато, М., Морито, Ю., Танабе, Х. С. и др. (2008). Реконструкция визуального изображения на основе активности человеческого мозга с использованием комбинации многомасштабных локальных декодеров изображений. Нейрон 60, 915–929. DOI: 10.1016 / j.neuron.2008.11.004

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Моро В., Берлучки Г., Лерх Дж., Томайуоло Ф. и Аглиоти С. М. (2008). Избирательный дефицит мысленных зрительных образов при сохранности первичной зрительной коры и зрительного восприятия. Cortex 44, 109–118. DOI: 10.1016 / j.cortex.2006.06.004

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Нанай Б. (2014). Перцептивное содержание и содержание мысленных образов. Philos. Stud. 172, 1723–1736. DOI: 10.1007 / s11098-014-0392-y

    CrossRef Полный текст | Google Scholar

    Населарис, Т., Олман, К. А., Стэнсбери, Д. Э., Угурбил, К., и Галлант, Дж. Л. (2015). Воксельная модель кодирования для ранних визуальных областей декодирует мысленные образы запомненных сцен. Neuroimage 105, 215–228. DOI: 10.1016 / j.neuroimage.2014.10.018

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Никсон М., Агуадо А. С. (2012). Извлечение функций и обработка изображений для компьютерного зрения (3). Сент-Луис, Миссури: Academic Press.

    Google Scholar

    О’Крэвен, К.М. и Канвишер Н. (2000). Мысленные образы лиц и мест активируют соответствующие области мозга, специфичные для стимулов. J. Cogn. Neurosci. 12, 1013–1023. DOI: 10.1162 / 089892

    137549

    CrossRef Полный текст | Google Scholar

    Острофский Дж., Козбельт А., Коэн Д. Дж. (2015). Предвзятость при рисовании при наблюдении предсказывается предвзятостью восприятия: эмпирическое подтверждение гипотезы неправильного восприятия точности рисования в отношении двух угловых иллюзий. В.J. Exp. Psychol. 68, 1007–1025. DOI: 10.1080 / 17470218.2014.973889

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Пальмиеро, М., Маттео, Р. Д., Белардинелли, М. О. (2014). Представление концептуальных знаний: визуальные, слуховые и обонятельные образы по сравнению с семантической обработкой. Cogn. Процесс. 15, 143–157. DOI: 10.1007 / s10339-013-0586-9

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Пирсон, Дж., Населарис, Т., Холмс, Э.А., Кослин, С.М. (2015). Ментальные образы: функциональные механизмы и клиническое применение. Trends Cogn. Sci. 19, 590–602. DOI: 10.1016 / j.tics.2015.08.003

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Померанц, Дж. Р., Сагер, Л. К., и Стоувер, Р. Дж. (1977). Восприятие целого и их составных частей: некоторые эффекты конфигурационного превосходства. J. Exp. Psychol. Гм. Восприятие. Выполнять. 3, 422–435. DOI: 10.1037 / 0096-1523.3.3.422

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Putze, F., Hesslinger, S., Tse, C.-Y., Huang, Y., Herff, C., Guan, C., et al. (2014). Гибридная классификация процессов слухового и зрительного восприятия на основе фНИРС-ЭЭГ. Фронт. Neurosci. 8: 373. DOI: 10.3389 / fnins.2014.00373

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Редди, Л., Цучия, Н., Серр, Т. (2010). Чтение мысленным взором: расшифровка информации о категории во время мысленных образов. Neuroimage 50, 818–825. DOI: 10.1016 / j.neuroimage.2009.11.084

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Ричардсон Д. К. и Спайви М. Дж. (2000). Репрезентация, пространство и Голливудские площади: взгляд на вещи, которых больше нет. Познание 76, 269–295.

    Google Scholar

    Розенбаум, Д. А., Воган, Дж., Барнс, Х. Дж., И Йоргенсен, М. Дж. (1992). График движения планирования: выбор рукояток для манипулирования предметом. J. Exp. Psychol. Учить. Mem. Cogn. 18, 1058–1073. DOI: 10.1037 / 0278-7393.18.5.1058

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Rouw, R., Kosslyn, S.M, and Hamel, R. (1997). Обнаружение высокоуровневых и низкоуровневых свойств в визуальных образах и визуальном восприятии. Познание 63, 209–226. DOI: 10.1016 / S0010-0277 (97) 00006-1

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Сервос П. и Гудейл М. А.(1995). Сохранились зрительные образы в зрительной форме агнозии. Neuropsychologia 33, 1383–1394. DOI: 10.1016 / 0028-3932 (95) 00071-A

    CrossRef Полный текст | Google Scholar

    Шокуфанде, А., Кесельман, Ю., Демирчи, М. Ф., Макрини, Д., и Дикинсон, С. (2012). Сопоставление функций многие-ко-многим в распознавании объектов: обзор трех подходов. IET Comput. Vis. 6, 500–513.

    Google Scholar

    Шури, Н., Фироозабади, М., и Бади, К.(2014). Анализ сигналов ЭЭГ художников и нехудожников во время визуального восприятия, мысленных образов и отдыха с использованием приблизительной энтропии. Biomed Res. Int. 201: 764382. DOI: 10.1155 / 2014/764382

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Симанова И., ван Гервен М., Остенвельд Р. и Хагоорт П. (2010). Определение категорий объектов из событийной ЭЭГ: к расшифровке концептуальных представлений. PLoS ONE 5: e14465. DOI: 10.1371 / journal.pone.0014465

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Слотник, С. Д., Томпсон, В. Л., и Косслин, С. М. (2005). Визуальные ментальные образы вызывают ретинотопически организованную активацию ранних зрительных областей. Cereb. Cortex 15, 1570–1583. DOI: 10.1093 / cercor / bhi035

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Спайви, М. Дж., И Гэн, Дж. Дж. (2001). Глазодвигательные механизмы активируются образами и памятью: движения глаз к отсутствующим объектам. Psychol. Res. 65, 235–241. DOI: 10.1007 / s004260100059

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Такахаши К., Огата С., Ацуми Ю., Ямамото Р., Шиоцука С., Маки А. и др. (2000). Активация зрительной коры, отображаемая с помощью 24-канальной ближней инфракрасной спектроскопии. J. Biomed. Опт. 5, 93–96. DOI: 10.1117 / 1.429973

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Tarr, M.J., Bülthoff, H.H., Забинский М. и Бланц В. (1997). В какой степени уникальные детали влияют на узнаваемость при изменении точки зрения? Psychol. Sci. 8, 282–289.

    Google Scholar

    Тирион Б., Дюшене Э., Хаббард Э., Дюбуа Дж., Полайн Ж.-Б., Лебихан Д. и др. (2006). Обратная ретинотопия: вывод визуального содержания изображений из паттернов активации мозга. Neuroimage 33, 1104–1116. DOI: 10.1016 / j.neuroimage.2006.06.062

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Таунсенд, Г., Graimann, B., and Pfurtscheller, G. (2004). Непрерывная классификация ЭЭГ при моделировании воображения движения асинхронного ИМК. IEEE Trans. Neural Syst. Rehabil. Англ. 12, 258–265. DOI: 10.1109 / TNSRE.2004.827220

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Ульман, С., Ассиф, Л., Фетая, Э., и Харари, Д. (2016). Атомы распознавания в человеческом и компьютерном зрении. Proc. Natl. Акад. Sci. США 113, 2744–2749. DOI: 10.1073 / pnas.1513198113

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Вальдерт, С., Тюшаус, Л., Каллер, К. П., Аэрцен, А., и Меринг, К. (2012). fNIRS демонстрирует слабую настройку на направление движения руки. PLoS ONE 7: e49266. DOI: 10.1371 / journal.pone.0049266

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Уокер П., Гэвин Бремнер Дж., Меррик К., Коутс С., Купер Э., Лоули Р. и др. (2006). Визуальные мысленные представления, поддерживающие рисование объекта: как наименование нового объекта новым счетным существительным влияет на рисование объекта маленькими детьми. Vis. Cogn. 13, 733–788. DOI: 10.1080 / 13506280544000318

    CrossRef Полный текст | Google Scholar

    Wilcox, T., and Baillargeon, R. (1998). Индивидуализация объекта в младенчестве: использование особой информации в рассуждениях о событиях окклюзии. Cogn. Psychol. 37, 97–155. DOI: 10.1006 / cogp.1998.0690

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Уилкокс, Т., Бортфельд, Х., Вудс, Р., Рук, Э., и Боас, Д. А. (2005).Использование ближней инфракрасной спектроскопии для оценки нейронной активации во время обработки объектов у младенцев. J. Biomed. Опт. 10, 11010. DOI: 10.1117 / 1.1852551

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    Уильямс, М., и Вудман, Г. (2010). Использование движений глаз для измерения внимания к объектам и функциям в зрительной рабочей памяти. J. Vis. 10, 764–764. DOI: 10.1167 / 10.7.764

    CrossRef Полный текст | Google Scholar

    Земан, А.З. Дж., Делла Сала, С., Торренс, Л. А., Гунтуна, В.-Э., МакГонигл, Д. Дж., И Логи, Р. Х. (2010). Феноменология потери образов при неизменном выполнении зрительно-пространственного задания: случай «слепого воображения». Neuropsychologia 48, 145–155. DOI: 10.1016 / j.neuropsychologia.2009.08.024

    PubMed Аннотация | CrossRef Полный текст | Google Scholar

    перцептивных наборов в психологии

    Набор восприятия относится к предрасположенности воспринимать вещи определенным образом.Другими словами, мы часто склонны замечать только определенные аспекты объекта или ситуации, игнорируя другие детали.

    Что такое перцепционный набор?

    Когда дело доходит до нашего восприятия мира вокруг нас, вы можете предположить, что то, что вы видите, и есть то, что вы получаете. Однако, по правде говоря, исследования показывают, что то, как вы видите мир, в значительной степени зависит (и предвзято) вашим собственным прошлым опытом, ожиданиями, мотивациями, убеждениями, эмоциями и даже вашей культурой.

    Например, вспомните, когда вы в последний раз начинали новый урок.Были ли у вас вначале какие-либо ожидания, которые могли повлиять на ваш опыт в классе? Если вы ожидаете, что уроки будут скучными, вас больше не заинтересует занятие?

    В психологии это то, что называется перцептивным набором.

    Перцептивная установка — это, по сути, тенденция смотреть на вещи только определенным образом.

    Установки восприятия могут влиять на то, как мы интерпретируем мир вокруг нас и реагируем на него, и на них может влиять ряд различных факторов.Взаимодействие с другими людьми

    Что такое перцептивный набор, почему он возникает и как он влияет на то, как мы воспринимаем окружающий мир?

    Как это работает

    Как психологи определяют перцептивные установки?

    «На восприятие также могут влиять ожидания, мотивы и интересы человека. Термин« перцептивный набор »относится к тенденции воспринимать объекты или ситуации с определенной точки зрения», — объясняет автор учебника Discovering Psychology Сандра Хокенбери.Взаимодействие с другими людьми

    Иногда могут быть полезны перцептивные установки, которые часто приводят нас к довольно точным выводам о том, что существует в мире вокруг нас. В тех случаях, когда мы ошибаемся, мы часто разрабатываем новые более точные наборы восприятия.

    Иногда наши установки восприятия могут сбить нас с пути.

    Например, если у вас есть большой интерес к военной авиации, странное образование облаков на расстоянии можно интерпретировать как флот истребителей.

    В одном эксперименте, который иллюстрирует эту тенденцию, участникам были представлены разные не-слова, такие как sael . Те, кому сказали, что они будут читать слова, связанные с лодкой, читают это слово как «парус», в то время как те, кому сказали ожидать слов, связанных с животными, читают его как «печать».

    Обработка сверху вниз

    Набор восприятия — хороший пример так называемой обработки сверху вниз. При нисходящей обработке восприятие начинается с самого общего и движется к более конкретному.На такое восприятие сильно влияют ожидания и предыдущие знания.

    Если мы ожидаем, что что-то появится определенным образом, мы с большей вероятностью воспримем это в соответствии с нашими ожиданиями.

    Существующие схемы, ментальные рамки и концепции часто определяют перцептивные установки. Например, у людей есть строгая схема для лиц, что упрощает распознавание знакомых человеческих лиц в окружающем нас мире. Это также означает, что когда мы смотрим на неоднозначное изображение, мы с большей вероятностью увидим в нем лицо, чем какой-либо другой тип объекта.

    Исследователи также обнаружили, что когда несколько элементов появляются в одной визуальной сцене, перцептивные наборы часто приводят к тому, что люди пропускают дополнительные элементы после обнаружения первого. Например, сотрудники службы безопасности аэропорта могут заметить в сумке бутылку с водой, но затем пропустить, что в сумке есть огнестрельное оружие.

    Силы влияния

    Ниже приведены примеры различных сил влияния:

    • Мотивация может играть важную роль в установках восприятия и в том, как мы интерпретируем окружающий мир. Если мы болеем за нашу любимую спортивную команду, у нас может быть мотивация рассматривать членов противоположной команды как чрезмерно агрессивных, слабых или некомпетентных. В одном классическом эксперименте исследователи лишали участников еды на несколько часов. Когда им позже показали набор неоднозначных изображений, те, кто лишился еды, с гораздо большей вероятностью интерпретировали изображения как предметы, связанные с едой. Поскольку они были голодны, они были более мотивированы, чтобы увидеть изображения в определенных способ.
    • Ожидания тоже играют важную роль. Если мы ожидаем, что люди будут вести себя определенным образом в определенных ситуациях, эти ожидания могут повлиять на то, как мы воспринимаем этих людей и их роли. Один из классических экспериментов по влиянию ожиданий на перцептивные наборы заключался в том, что участникам показывали серию цифр или букв. Затем участникам показывали неоднозначное изображение, которое можно было интерпретировать как число 13 или букву B. те, кто смотрел числа, с большей вероятностью увидели это как 13, в то время как те, кто смотрел буквы, с большей вероятностью увидели это как букву B.
    • Культура также влияет на то, как мы воспринимаем людей, предметы и ситуации. Удивительно, но исследователи обнаружили, что люди, принадлежащие к разным культурам, по-разному воспринимают перспективу и глубину.
    • Эмоции могут сильно повлиять на то, как мы воспринимаем окружающий мир. Например, если мы злимся, мы можем с большей вероятностью почувствовать враждебность в других. Один эксперимент продемонстрировал, что когда люди начинали ассоциировать бессмысленный слог с легким поражением электрическим током, они испытывали физиологические реакции на слог, даже когда он подавался подсознательно.
    • Отношения также могут иметь сильное влияние на восприятие. В одном эксперименте Гордон Олпорт продемонстрировал, что предрассудки могут влиять на то, насколько быстро люди классифицируют людей разных рас.

    Примеры из жизни

    Исследователи показали, что перцептивные установки могут иметь огромное влияние на повседневную жизнь.

    В одном эксперименте было обнаружено, что маленькие дети больше наслаждаются картофелем фри, когда их подают в пакете McDonald’s, а не просто в простом белом пакете.В другом исследовании люди, которым сказали, что изображение было знаменитым «Лох-несским чудовищем», с большей вероятностью увидели мифическое существо на этом изображении, в то время как другие, которые позже просмотрели изображение, видели только изогнутый ствол дерева.

    Как упоминалось ранее, наша установка восприятия лиц настолько сильна, что на самом деле заставляет нас видеть лица там, где их нет. Подумайте, как люди часто описывают, что видели лицо на Луне или во многих неодушевленных объектах, с которыми мы сталкиваемся в своем теле. повседневная жизнь.

    Слово от Verywell

    Как видите, восприятие — это не просто видение того, что находится в окружающем нас мире. На то, как мы воспринимаем информацию и как мы ее интерпретируем, могут влиять различные факторы, и наборы восприятия — лишь один из многих факторов.

    Нейрокорреляты эпизодического кодирования картинок и слов

    Абстракция

    Поразительной особенностью человеческой памяти является то, что картинки запоминаются лучше, чем слова.Мы исследовали нейронные корреляты памяти изображений и слов в контексте кодирования эпизодической памяти, чтобы определить специфические для материала различия в моделях активности мозга. Для этого мы использовали позитронно-эмиссионную томографию для картирования областей мозга, активных во время кодирования слов и изображений объектов. Кодирование осуществлялось с использованием трех различных стратегий для изучения возможных взаимодействий между спецификой материала и типами обработки. Кодирование изображений привело к большей активности двусторонней зрительной и медиальной височной коры по сравнению с кодированием слов, тогда как кодирование слов было связано с повышенной активностью в префронтальной и височно-теменной областях, связанной с функцией языка.Каждая стратегия кодирования характеризовалась особым паттерном активности, но эти паттерны были в основном одинаковыми для изображений и слов. Таким образом, улучшенная общая память для изображений может быть опосредована более эффективным и автоматическим задействованием областей, важных для зрительной памяти, включая медиальную височную кору, тогда как механизмы, лежащие в основе конкретных стратегий кодирования, по-видимому, действуют аналогичным образом с изображениями и словами.

    Люди обладают замечательной способностью запоминать картинки.Несколько десятилетий назад было показано, что люди могут запоминать более 2000 изображений с точностью не менее 90% в тестах на распознавание в течение нескольких дней, даже при коротком времени представления во время обучения (1). Эта отличная память на картинки постоянно превосходит нашу способность запоминать слова (2, 3). Кроме того, различные манипуляции, влияющие на производительность памяти, по-разному влияют на изображения и слова. Одна из таких манипуляций — это уровни эффекта обработки, что является преимуществом для последующего извлечения более сложной или семантической обработки стимулов во время кодирования (4, 5).Этот эффект уровней больше для слов, чем для изображений, из-за превосходной памяти изображений даже после неглубокого или несемантического кодирования (6). Одна из теорий механизма, лежащего в основе превосходной памяти изображений, заключается в том, что картинки автоматически включают множественные представления и ассоциации с другими знаниями о мире, тем самым поощряя более сложное кодирование, чем это происходит со словами (2, 5, 7). Эта теория предполагает, что существуют качественные различия между способами обработки слов и изображений во время запоминания.

    С эволюционной точки зрения способность запоминать различные аспекты визуальной среды должна быть жизненно важной для выживания, поэтому неудивительно, что память на изобразительный материал особенно хорошо развита. Однако механизмы мозга, лежащие в основе этого явления, до конца не изучены. Эксперименты по нейровизуализации с использованием вербальных или невербальных материалов в качестве стимулов показали, что существуют различия в областях мозга, участвующих в обработке этих двух видов стимулов.Например, предыдущие эксперименты по нейровизуализации показали медиальную временную активацию во время кодирования лиц и других невербальных зрительных стимулов (8–13), но не постоянно во время кодирования слов (14–16). Напротив, активация медиальных височных областей была обнаружена во время поиска слов (17, 18), но не всегда во время поиска невербального материала (10, 11, 19, 20). При сравнении запоминания слов и изображений не было обнаружено никакой разницы между ними, но поскольку требовалось вспомнить имя, соответствующее картинке, различия между этими двумя условиями могли быть уменьшены (21).Эти результаты предполагают различия между функциональной нейроанатомией памяти слов и картинок, но отсутствуют достаточные прямые сравнения. Мы исследовали нейронные корреляты памяти для изображений и слов в контексте кодирования памяти, чтобы определить, можно ли идентифицировать специфические для материала мозговые сети для памяти. Кроме того, кодирование выполнялось с использованием трех различных наборов инструкций, чтобы увидеть, является ли специфичность материала общим свойством памяти или зависит от того, как материал обрабатывается.

    МАТЕРИАЛЫ И МЕТОДЫ

    Двенадцать молодых правшей (шесть мужчин, шесть женщин, средний возраст ± стандартное отклонение = 23,0 ± 3,5 года) участвовали в эксперименте. Еще 12 субъектов участвовали в пилотном эксперименте, и их данные были включены в поведенческий анализ. В качестве стимулов в эксперименте использовались конкретные, часто встречающиеся слова или штриховые рисунки знакомых объектов (22). Все стимулы предъявлялись на мониторе компьютера черным цветом на белом фоне.Было три задачи кодирования как для слов, так и для изображений, требующих трех списков изображений и трех списков слов. Все списки были сопоставлены по частоте слов, длине слова, знакомству и сложности изображения, независимо от того, был ли список представлен в виде слов или изображений. Для двух условий кодирования испытуемых просили принять определенные решения относительно стимулов, но не просили их запоминать; поэтому память на предметы, представленные в этих условиях, была случайной.Одно случайное условие включало несемантическую или поверхностную обработку стимулов (размер изображения или регистр букв), а другое требовало семантической или глубокой обработки стимулов (живое / неживое решение). Эти два условия были выбраны, потому что предыдущая работа показала, что информация, которая была обработана во время глубокого кодирования, то есть с большей проработкой или связью ее через семантические ассоциации с другими знаниями, запоминается лучше, чем информация, обработанная поверхностным способом, т.е.г., чисто на основе восприятия (4, 5). Во время третьего условия, преднамеренного обучения, испытуемых проинструктировали запомнить картинки или слова и сказали, что они будут проверены по этим предметам. После сканирования испытуемые выполнили две задачи на распознавание памяти, одну для стимулов, закодированных в виде слов, и одну для стимулов, закодированных в виде изображений. Эти задачи состояли из 10 целей из каждого из трех условий кодирования для слов или изображений и 30 отвлекающих факторов (то есть всего 60 элементов). Все стимулы в задачах распознавания были представлены в виде слов, независимо от того, были ли они изначально представлены в виде слов или изображений, чтобы предотвратить эффекты потолка для распознавания изображений.

    Шесть сканирований позитронно-эмиссионной томографии с инъекциями 40 мКи H 2 15 O каждый и с интервалом 11 минут были выполнены для всех испытуемых, когда они кодировали стимулы, описанные выше. Сканирование проводилось на томографе GEMS PC2048–15B с восстановленным разрешением 6,5 мм как в поперечной, так и в аксиальной плоскостях. Этот томограф позволяет снимать одновременно 15 плоскостей, разделенных расстоянием 6,5 мм (от центра к центру). Данные об излучении были скорректированы на ослабление посредством сканирования передачи, полученного на тех же уровнях, что и сканирование излучения.Движение головы во время сканирования было минимизировано за счет использования термопластической маски, которая была прикреплена к голове каждого субъекта и прикреплена к платформе сканера. Каждая задача начиналась за 20 секунд до введения изотопа и продолжалась в течение 1-минутного периода сканирования.

    Для шести сканирований три списка были отнесены к трем условиям кодирования уравновешенным образом, и порядок условий также был уравновешен для разных субъектов. Во время всех сканирований испытуемые нажимали кнопку правым указательным или средним пальцем, чтобы либо указать свое решение относительно стимула, либо, во время условия преднамеренного обучения, просто произвести двигательную реакцию.

    Поведенческие данные были проанализированы с использованием ANOVA с повторными измерениями с типом стимула и условием кодирования в качестве повторных измерений. Сканирование позитронно-эмиссионной томографии регистрировалось с помощью воздуха (23), пространственно нормализовано (в системе координат атласа Талаира и Турну, ссылка 24) и сглажено (до 10 мм) с помощью spm95 (25). Отношения регионального мозгового кровотока (rCBF) к глобальному мозговому кровотоку (CBF) в рамках каждого сканирования для каждого субъекта были вычислены и проанализированы с использованием частичных наименьших квадратов (PLS) (26) для определения пространственно распределенных паттернов мозговой активности, связанных с различными условия задачи.PLS — это многомерный анализ, который работает на ковариации между вокселями мозга и планом эксперимента для определения нового набора переменных (так называемых скрытых переменных или LV), которые оптимально связывают два набора измерений. Мы использовали PLS для анализа ковариации значений вокселей мозга с кодированием ортонормированных контрастов для экспериментального дизайна. Результатом являются наборы взаимно независимых моделей пространственной активности, изображающие области мозга, которые в целом демонстрируют наиболее сильную связь с (т.е., ковариантны) с контрастами. Эти паттерны отображаются в виде отдельных изображений (рис. 1), которые показывают области мозга, которые зависят от контраста или контрастов, которые вносят вклад в каждый LV. Каждый воксель мозга имеет вес, известный как значимость, который пропорционален этим ковариациям, и умножение значения rCBF в каждом вокселе мозга для каждого субъекта на значимость для этого вокселя, а суммирование по всем вокселям дает оценку для каждого субъекта. данный LV. Значимость для каждого LV в целом определялась с помощью перестановочного теста (26, 27).В этом эксперименте были идентифицированы пять LV, все из которых были значимыми с помощью перестановочного теста ( P <0,001). Первые три LV идентифицировали области мозга, связанные с основными эффектами типа стимула и условия кодирования, а четвертый и пятый LV идентифицировали взаимодействия между типом стимула и условием кодирования. Поскольку значимость выводится на одном аналитическом шаге, коррекция множественных сравнений, как при одномерном анализе изображений, не требуется.

    Рисунок 1

    Вокселы, показанные цветом, — это те, которые лучше всего характеризуют паттерны активности, идентифицированные LV 1–3 из анализа PLS (см. Материалы и методы ).На стандартном магнитно-резонансном изображении отображаются области от -28 мм до +48 мм относительно линии передняя комиссура-задняя комиссура (AC-PC) (с шагом 4 мм). Цифры, показанные слева, указывают уровень в мм

    .

    В дополнение к тесту перестановки, вторым и независимым шагом в анализе PLS является определение стабильности выступов для вокселей мозга, характеризующих каждый паттерн, идентифицированный LV. Для этого все значения были подвергнуты начальной оценке стандартных ошибок (28, 29).Эта оценка включает случайную повторную выборку субъектов с заменой и вычисление стандартной ошибки значимости после достаточного количества выборок начальной загрузки. Пиковые воксели с отношением заметности / SE ≥ 2,0 считались стабильными. Локальные максимумы для областей мозга со стабильными выступами на каждом LV были определены как воксель с отношением заметности / SE выше, чем у любого другого воксела в 2-сантиметровом кубе с центром в этом вокселе. Расположение этих максимумов указывается в области мозга, или извилины, и в области Бродмана (BA), как это определено в атласе Талаира и Турну.Выбранные локальные максимумы показаны в таблицах 2 и 3 с результатами соответствующих контрастов из SPM95 (то есть, основные эффекты и взаимодействия) в качестве сравнения. Одномерные тесты были выполнены на выбранных максимумах в качестве дополнения к анализу PLS, чтобы помочь в интерпретации эффектов взаимодействия, а не в качестве теста значимости. Логический компонент нашего анализа исходит из теста перестановки и надежности, оцениваемой с помощью оценок бутстрапа.

    РЕЗУЛЬТАТЫ

    Картинки запоминались лучше, чем слова в целом (таблица 1), и как семантическая обработка, так и преднамеренное обучение привели к лучшему распознаванию, чем несемантическое кодирование.Кроме того, наблюдалось значительное взаимодействие типа стимула и стратегии кодирования с производительностью распознавания, вызванное большей разницей между памятью для изображений и слов во время несемантического состояния.

    Таблица 1

    Эффективность распознавания изображений и слов, оставляющих большую часть изображения в каждой строке относительно строки AC-PC. Правая часть изображения представляет собой правую часть мозга. ( A ) Области мозга с повышенным rCBF во время кодирования изображений показаны желтым и красным цветом, а области с повышенной активностью во время кодирования слов показаны синим (LV1).( B ) Области мозга с повышенным rCBF во время семантического кодирования по сравнению с двумя другими состояниями (LV2) показаны красным. ( C ) Области мозга с повышенным rCBF во время преднамеренного обучения по сравнению с двумя другими состояниями (LV3) показаны красным. Выбранные максимумы из этих регионов показаны в Таблице 2.

    Были идентифицированы три паттерна активности rCBF, преимущественно связанных с основными эффектами типа стимула и условий кодирования. Один паттерн отличал кодирование изображений от кодирования слов, один характеризовал семантическое кодирование от несемантической обработки и преднамеренного обучения, а третий отделял преднамеренное обучение от двух других условий.Была большая активация во время кодирования изображений, по сравнению со словами, в обширной области двусторонней вентральной и дорсальной экстрастриарной коры и в двусторонней медиальной височной коре, особенно в вентральной части (рис. 1 A и таблица 2). В обоих этих регионах увеличение rCBF было более значительным в правом полушарии. В экстрастриатной коре rCBF увеличивалось во время кодирования изображения по сравнению с кодированием слов одинаково во всех трех условиях стратегии кодирования, тогда как в медиальной височной коре эта специфическая для стимула разница была больше во время несемантической обработки (рис.2 A и C ). С другой стороны, кодирование слов было связано с более высоким rCBF при всех состояниях в двусторонней префронтальной коре и передних частях средней височной коры (рис. 1 A и таблица 2). В отличие от увеличения rCBF во время кодирования изображения, увеличение префронтальной и височной коры во время кодирования слова было более значительным в левом полушарии. Повышенный rCBF также был обнаружен в левой теменной коре при кодировании слов.

    Таблица 2

    Отдельные области коры с различной активностью во время кодирования: основные эффекты

    фигура 2

    Отношение rCBF к CBF всего мозга в областях мозга, которые показали взаимодействие между типом стимула и условием кодирования. Средние височные области от LV1 ( A и C , координаты показаны в скобках) показали более высокий rCBF во время кодирования изображения по сравнению с кодированием слова ( P <0,001 для правого полушария и P <0.02 слева). Эти области также имели взаимодействия условие × стимул по одномерному тесту (оба P <0,05), что указывает на большую разницу между картинками и словами в несемантических условиях. B и D показывают медиальные височные области от LV4, которые показали взаимодействия стимула × кодирование, включая несемантические и преднамеренные условия обучения (одномерное взаимодействие для правого полушария P = 0,02; левое полушарие P = 0.07). E и F показывают области из LV5 с взаимодействиями стимула × кодирования, включающими несемантические и семантические условия (одномерное взаимодействие для левой моторной области, P = 0,01; взаимодействие для левой орбитофронтальной области, P = 0,006). Дополнительные области с взаимодействиями «стимул × кодирование» показаны в таблице 3. Несемантическое, несемантическое кодирование; сем, семантическое кодирование; учиться, преднамеренное обучение.

    Области мозга с повышенной активностью во время условия семантического кодирования по сравнению с двумя другими состояниями находились в основном в левом полушарии.Эти области включали вентральную и дорсальную части медиальной префронтальной коры, а также область, которая включала как медиальную височную область, так и заднюю часть островка (рис. 1 B и таблица 2). Семантическое кодирование также привело к увеличению rCBF в двусторонней задней экстрастриатной коре головного мозга. Такая закономерность увеличения rCBF при семантическом кодировании была обнаружена как для изображений, так и для слов. Увеличение rCBF во время преднамеренного обучения по сравнению с обоими случайными условиями кодирования также наблюдалось в левой префронтальной коре, но в левой вентролатеральной префронтальной коре, в отличие от медиальной и передней областей, активируемых во время семантического кодирования (рис.1 C и таблица 2). Кроме того, увеличение rCBF было обнаружено в левой премоторной коре и хвостатом ядре, а также в двусторонней вентральной экстрастриарной коре во время преднамеренного обучения. Как и в случае с семантическим кодированием, паттерн rCBF, наблюдаемый в этих областях во время преднамеренного обучения, характеризует как изображения, так и слова.

    Было несколько областей мозга, которые показали взаимодействие между типом стимула и условиями кодирования (таблица 3), особенно медиальные височные области.В дополнение к разнице, уже отмеченной в этих областях во время несемантического кодирования, была еще одна область в правой медиальной височной коре, которая показала взаимодействие, включающее несемантические и преднамеренные условия обучения (идентифицированные на LV4). Это взаимодействие было вызвано устойчивой активностью в этой области в условиях кодирования изображения со снижением активности во время преднамеренного заучивания слов по сравнению с несемантическим условием (рис. 2 B ). Также была область в левой медиальной височной коре, которая показывала противоположное взаимодействие, заключающееся в большем увеличении активности во время заучивания слов по сравнению с несемантическим состоянием (рис.2 D ). Наконец, было взаимодействие в левой моторной коре (идентифицированное на LV5), вызванное увеличением активности в семантическом состоянии для изображений по сравнению с несемантическим состоянием с противоположным паттерном для слов (рис. 2 E ). Напротив, при семантическом кодировании в левой орбитофронтальной коре происходило усиление активности, но только для слов (рис. 2 F ).

    Таблица 3

    Отдельные области коры с различной активностью во время кодирования: взаимодействия

    ОБСУЖДЕНИЕ

    Результаты этого эксперимента касаются трех вопросов о нейробиологии памяти, первый из которых — почему картинки запоминаются лучше, чем слова.Поведенческие результаты показали общую разницу в точности распознавания изображений и слов, которая была наибольшей для тех элементов, которые были обработаны с помощью несемантического кодирования. Измерения активности мозга выявили области, которые показали общую картину различий между изображениями и словами, а также области, которые имели различия в основном во время несемантической обработки. Повышенный rCBF в условиях кодирования изображения был обнаружен в двусторонней экстрастриарной и вентральной медиальной височной коре.Экстрастриальная кора головного мозга активируется во время зрительного восприятия как вербального, так и невербального материала (30–33) и, возможно, была более активной во время кодирования изображения, потому что картинки, хотя и простые линейные рисунки, вероятно, были визуально более сложными, чем слова. Эта разница в визуальных характеристиках могла также повлиять на медиальную височную активность. С другой стороны, медиальная височная кора головного мозга давно известна из экспериментов с поражениями как важная для эпизодической памяти (34–38) и может быть особенно важна для кодирования новой информации (39).Большая активность медиальной височной коры во время кодирования изображений по сравнению со словами предполагает, что изображения более непосредственно или эффективно задействуют эти связанные с памятью области мозга, что приводит к более качественному запоминанию этих элементов. Этот эффект может быть отчасти связан с отличительностью или новизной, которая, как было показано, активирует медиальную височную кору (13), учитывая, что изображения, даже если они были знакомыми объектами, могли быть более новыми, чем знакомые слова. Кроме того, поскольку лучшая память для изображений и активация медиальной височной коры были более очевидны в условиях несемантического кодирования, включение сетей памяти изображениями может быть автоматическим и привести к более прочным следам памяти (40).Следовательно, этот тип информации, по-видимому, лучше представлен и более доступен для механизмов поиска, независимо от предполагаемой задачи кодирования. Слова, с другой стороны, активируют области левого полушария, которые, как ранее было показано, участвуют в речевых задачах, включая левую лобную, височную и теменную области (30, 41, 42). Этот результат подразумевает, что кодирование слов в первую очередь задействует распределенную систему регионов, участвующих в лингвистической обработке, которая менее способна поддерживать последующее извлечение из эпизодической памяти.Также следует отметить, что в дополнение к любым преимуществам, предоставляемым изображениям во время первоначальной обработки, во время поиска также, вероятно, будет обнаружена специфичность материала. То есть, в реальных ситуациях, отчасти причина превосходной памяти изображения, вероятно, вызвана особенностями соответствия между внутренними представлениями изображения и самим изображением, когда оно повторно встречается и распознается.

    Второй вопрос: приводят ли разные стратегии кодирования к участию разных областей мозга.Результаты тестов на распознавание показали, что память изображений и слов практически эквивалентна после семантической обработки или преднамеренного обучения. Однако паттерны мозговой активности во время этих двух состояний были совершенно разными, показывая различную активность в основном в префронтальной и экстрастриарной области коры головного мозга. Предыдущие эксперименты по нейровизуализации показали активацию левой префронтальной области как во время семантической обработки, так и во время преднамеренного обучения, которая отличается от правой префронтальной активации во время восстановления памяти, что привело к развитию HERA или модели асимметрии полушарного кодирования / извлечения (43, 44).В нашем эксперименте семантическая обработка сопровождалась повышенной активностью в вентромедиальной и дорсомедиальной областях левой префронтальной коры, которые показали повышенную активность во время семантической или языковой обработки в других экспериментах (45–49). Преднамеренное обучение показало увеличение rCBF в различных частях левой префронтальной коры, прежде всего в вентролатеральных областях, которые ранее были активными во время преднамеренного обучения (15, 16) и эпизодического поиска (13, 50). Таким образом, хотя и семантическая обработка, и преднамеренное обучение, несомненно, включают в себя некую детальную обработку, которая преимущественно задействует левую префронтальную кору, наши результаты показывают, что существует диссоциация между частями левой префронтальной коры, которые участвуют в этих двух стратегиях.Экстрастриатная кора также проявляла различную активность при семантическом и намеренном кодировании. Семантическое кодирование активировало задние экстрастриальные области, аналогичные областям, активируемым во время беззвучного называния стимулов, подобных тем, которые используются здесь (51). Напротив, преднамеренное обучение активировало больше вентральных частей экстрастриарной коры, аналогично исследованию, в котором сообщалось об активации левой вентральной затылочно-височной коры во время преднамеренного обучения лиц (10). Таким образом, в настоящее время существуют сходные доказательства, подтверждающие дифференциальную реакцию как префронтальной, так и экстрастриарной коры во время кодирования, в зависимости от конкретной стратегии кодирования, которая используется.Этот результат, вместе с поведенческими данными, показывает, что разные механизмы мозга, лежащие в основе разных стратегий кодирования, могут обеспечивать одинаково эффективную поддержку обработки памяти.

    Последний вопрос, решаемый в этом эксперименте, заключается в том, существует ли взаимодействие между типом кодируемого стимула и стратегией, используемой для кодирования, т.е. являются ли области мозга, активные в различных условиях кодирования, одинаковыми или разными для изображений и слов? Поведенческие результаты показывают четкое взаимодействие, поскольку наибольшие различия в производительности проявляются во время несемантической обработки.Паттерны мозговой активности демонстрируют что-то от этого взаимодействия, потому что есть вентральные медиальные височные области, где разница rCBF также наибольшая во время несемантического состояния (обсуждалось выше). Однако во время семантического кодирования и преднамеренного обучения многие области мозга демонстрируют аналогичное изменение активности, связанное с кодированием, для изображений и слов, что указывает на то, что в этих областях эти два механизма кодирования могут работать одинаково, независимо от природы поступающих сообщений. стимул.Этот паттерн активности мозга отражается в результатах распознавания, которые аналогичны для изображений и слов во время семантического кодирования и преднамеренного обучения. Тем не менее, шаблоны не идентичны. Активность медиальной височной коры особенно чувствительна как к типу стимула, так и к условию кодирования. Правое полушарие показало устойчивую активность для изображений и более изменчивую активность для слов (в зависимости от условий кодирования), тогда как левое полушарие продемонстрировало повышенную активность с более глубокой обработкой слов и более изменчивым шаблоном для кодирования изображений.Эта асимметрия согласуется с описанием различных эффектов поражения правого и левого полушария в медиальной височной коре на невербальную и вербальную память соответственно (например, ссылки 52 и 53). Это также согласуется с активацией левых медиальных височных структур во время семантического кодирования слов (14, 54) или извлечением семантически закодированных слов (17) и активацией правой медиальной височной коры во время кодирования лиц (10). Кроме того, хотя левая медиальная префронтальная кора активна во время семантической обработки как изображений, так и слов, вентральная часть этой области в большей степени участвует во время кодирования слов.Эти данные подтверждают другие исследования, в которых сообщалось об участии левой вентральной префронтальной коры в обработке речи (42) и вербальном поиске (50).

    Наша способность запоминать картинки лучше, чем слова, особенно в ситуациях, которые не обеспечивают адекватной поддержки для последующего извлечения, таким образом, оказывается опосредованной медиальной височной и экстрастриальной корой, которые имеют сильные взаимосвязи друг с другом (55, 56). Неясно, какую именно пользу дает изображениям активация областей зрительной памяти.Вышеупомянутая теория предполагает, что изображения вызывают более сложное или ассоциативное кодирование, чем это происходит со словами. Если предположить, что этот процесс создания ассоциаций в определенном контексте осуществляется медиальной височной корой (57, 58), то наши результаты подтвердят эту гипотезу. Независимо от конкретного механизма, наши результаты показывают, какие области мозга могут иметь решающее значение для превосходной памяти изображений, и дают направление для будущих исследований в отношении того, какой аспект изображений необходим и достаточен для преимущественного использования этих областей, связанных с памятью.

    Благодарности

    Мы благодарим сотрудников центра ПЭТ при Институте психиатрии Кларка за их техническую помощь в проведении этого эксперимента. Работа поддержана грантом Фонда психического здоровья Онтарио.

    СОКРАЩЕНИЯ

    rCBF,
    регионарный церебральный кровоток;
    CBF,
    мозговой кровоток;
    PLS,
    частичные наименьшие квадраты;
    LV,
    латентная переменная
    • Поступила 15 августа 1997 г.
    • Принято 8 декабря 1997 г.
    • Авторские права © 1998, Национальная академия наук

    Глубокая реконструкция изображения на основе активности человеческого мозга

    Abstract

    Считается, что ментальное содержание восприятия и образов закодировано в иерархических представлениях в мозгу, но предыдущие попытки визуализировать воспринимаемое содержимое не смогли извлечь выгоду из нескольких уровней иерархии, что усложняло восстановление внутренних образов.Недавняя работа показала, что зрительная корковая активность, измеренная с помощью функциональной магнитно-резонансной томографии (фМРТ), может быть декодирована (переведена) в иерархические характеристики предварительно обученной глубокой нейронной сети (DNN) для того же входного изображения, что дает возможность использовать информация из иерархических визуальных объектов. Здесь мы представляем новый метод реконструкции изображения, в котором значения пикселей изображения оптимизированы, чтобы сделать его функции DNN аналогичными тем, которые декодируются на основе активности человеческого мозга на нескольких уровнях.Мы обнаружили, что наш метод позволяет надежно создавать реконструкции, которые напоминают просматриваемые естественные изображения. Предварительное естественное изображение, введенное нейронной сетью глубокого генератора, эффективно визуализировало семантически значимые детали для реконструкций. Оценка реконструкций, сделанная человеком, подтвердила эффективность объединения нескольких слоев DNN для улучшения визуального качества сгенерированных изображений. Хотя наша модель была обучена исключительно на естественных изображениях, она успешно обобщена на искусственные формы, что указывает на то, что наша модель не просто соответствовала образцам.Тот же анализ, примененный к ментальным образам, продемонстрировал рудиментарные реконструкции субъективного содержания. Наши результаты показывают, что наш метод может эффективно комбинировать иерархические нейронные представления для реконструкции перцептивных и субъективных изображений, обеспечивая новое окно во внутреннее содержимое мозга.

    Сведения об авторе

    Основанный на машинном обучении анализ паттернов функциональной магнитно-резонансной томографии человека (фМРТ) на основе машинного обучения позволил визуализировать воспринимаемый контент.Однако предыдущая работа по визуализации перцептивного содержимого мозговой активности не смогла объединить визуальную информацию нескольких иерархических уровней. Здесь мы представляем метод реконструкции визуального изображения из мозга, который может выявить как видимое, так и воображаемое содержимое, используя несколько уровней визуальных корковых репрезентаций. Мы декодировали активность мозга в иерархические визуальные признаки глубокой нейронной сети (DNN) и оптимизировали изображение, чтобы сделать его функции DNN похожими на декодированные.Наш метод успешно произвел перцептивно похожие изображения на просматриваемые естественные изображения и искусственные изображения (цветные формы и буквы), тогда как декодер был обучен только на независимом наборе естественных изображений. Это также распространено на реконструкцию ментальных образов запоминаемых образов. Наш подход позволяет изучать субъективное содержание, представленное в иерархических нейронных репрезентациях, объективируя их в изображения.

    Образец цитирования: Шен Г., Хорикава Т., Мадзима К., Камитани Ю. (2019) Глубокая реконструкция изображения на основе активности человеческого мозга.PLoS Comput Biol 15 (1): e1006633. https://doi.org/10.1371/journal.pcbi.1006633

    Редактор: Джилл О’Рейли, Оксфордский университет, СОЕДИНЕННОЕ КОРОЛЕВСТВО

    Поступила: 5 июля 2018 г .; Одобрена: 8 ноября 2018 г .; Опубликовано: 14 января 2019 г.

    Авторские права: © 2019 Shen et al. Это статья в открытом доступе, распространяемая в соответствии с условиями лицензии Creative Commons Attribution License, которая разрешает неограниченное использование, распространение и воспроизведение на любом носителе при условии указания автора и источника.

    Доступность данных: Экспериментальные данные и коды, использованные в настоящем исследовании, доступны в нашем репозитории (https://github.com/KamitaniLab/DeepImageReconstruction) и в OpenfMRI (https://openneuro.org/datasets/ ds001506).

    Финансирование: Это исследование было поддержано грантами Организации по развитию новой энергетики и промышленных технологий (NEDO), грантом JSPS KAKENHI номер JP26119536, JP15H05920, JP15H05710, JP17K12771 и программой ImPACT Совета по науке, технологиям и инновациям (Кабинет министров). , Правительство Японии).Финансирующие организации не играли никакой роли в дизайне исследования, сборе и анализе данных, принятии решения о публикации или подготовке рукописи.

    Конкурирующие интересы: Авторы заявляют об отсутствии конфликта интересов.

    Введение

    Хотя экстернализация состояний сознания является давней темой в научной фантастике, только недавно появление основанного на машинном обучении анализа данных функциональной магнитно-резонансной томографии (фМРТ) расширило его потенциал в реальный мир.Хотя сложные модели декодирования и кодирования были разработаны для визуализации активности человеческого мозга в изображениях или фильмах, методы по существу ограничены реконструкциями изображений с низкоуровневыми базами изображений [1, 2] или сопоставлением с образцами изображений или фильмов [3, 4], не сумев объединить визуальные особенности нескольких иерархических уровней. Хотя несколько недавних подходов представили глубокие нейронные сети (DNN) для задач реконструкции изображений, они не смогли полностью использовать иерархическую информацию для восстановления визуальных изображений [5, 6].Кроме того, несмотря на то, что категориальное декодирование содержимого изображений было продемонстрировано [7, 8], восстановление изображений, генерируемых внутри, было сложной задачей.

    Недавний успех DNN обеспечил технические инновации для изучения иерархической обработки изображений в вычислительной нейробиологии [9]. В нашем недавнем исследовании использовались визуальные особенности DNN в качестве прокси для иерархических нейронных представлений зрительной системы человека, и было обнаружено, что паттерн активности мозга, измеренный с помощью фМРТ, может быть декодирован (переведен) в паттерны ответа единиц DNN на нескольких уровнях, представляющих иерархическую визуальную систему. функции даны те же исходные данные [10].Это открытие выявило гомологию между иерархическими представлениями мозга и DNN, предоставив новую возможность использовать информацию из иерархических визуальных функций.

    Здесь мы представляем новый подход, называемый глубокой реконструкцией изображения, для визуализации перцептивного содержания, получаемого от деятельности человеческого мозга. Этот метод сочетает в себе декодирование функций DNN из сигналов фМРТ с недавно разработанными методами генерации изображений из области машинного обучения (рис. 1) [11]. Алгоритм реконструкции начинается с заданного исходного изображения и итеративно оптимизирует значения пикселей, так что особенности DNN текущего изображения становятся похожими на те, которые декодируются на основе активности мозга на нескольких уровнях DNN.Полученное оптимизированное изображение считается реконструкцией мозговой активности. Мы дополнительно ввели сеть глубокого генератора (DGN) [12], чтобы ограничить реконструированные изображения, чтобы они выглядели похожими на естественные изображения, путем выполнения оптимизации во входном пространстве DGN.

    Рис. 1. Глубокая реконструкция изображения.

    Показан обзор реконструкции глубокого изображения. Значения пикселей входного изображения оптимизированы так, чтобы характеристики DNN изображения были аналогичны тем, которые были декодированы из активности fMRI.Сеть глубоких генераторов (DGN) необязательно комбинируется с DNN для создания естественных изображений, в которых оптимизация выполняется во входном пространстве DGN.

    https://doi.org/10.1371/journal.pcbi.1006633.g001

    Результаты

    Мы обучили декодеры, которые предсказывали особенности DNN просматриваемых изображений на основе паттернов активности фМРТ, следуя процедурам Хорикавы и Камитани (2017) [10]. В настоящем исследовании мы использовали модель VGG19 DNN [13], которая состояла из шестнадцати сверточных слоев и трех полностью связанных слоев и была предварительно обучена с изображениями в ImageNet [14] для классификации изображений по 1000 категориям объектов ( подробнее см. Материалы и методы: «Глубокие нейронные сети»).Мы построили один декодер для одного блока DNN, чтобы предсказать выходные данные блока. Мы обучили декодеры, соответствующие всем единицам на всех уровнях (подробности см. В разделе «Материалы и методы:« Анализ декодирования характеристик DNN »).

    Анализ декодирования признаков был выполнен с помощью паттернов активности фМРТ в зрительной коре (VC), измеренных, когда субъекты просматривали или воображали визуальные изображения. Наши эксперименты состояли из тренировочных сессий, в которых были представлены только естественные изображения, и тестовых сессий, в которых были представлены независимые наборы естественных изображений, искусственных форм и букв алфавита.В другом тестовом сеансе была выполнена задача мысленного образа. Декодеры были обучены с использованием данных fMRI из тренировочных сессий, а затем обученные декодеры были использованы для прогнозирования значений характеристик DNN из данных fMRI из тестовых сессий (точность показана на S1 Fig).

    Декодированные признаки были затем отправлены в алгоритм реконструкции для генерации изображения с использованием вариантов оптимизации градиентного спуска (подробности см. В материалах и методах: «Реконструкция из одного слоя DNN» и «Реконструкция из нескольких слоев DNN»).Оптимизация была выполнена, чтобы минимизировать ошибку между многоуровневыми функциями DNN, декодированными из паттернов активности мозга, и теми, которые вычисляются из входного изображения путем итеративного изменения входного изображения. Для реконструкций естественных изображений, чтобы улучшить «естественность» реконструированных изображений, мы дополнительно ввели ограничение, используя глубокую генераторную сеть (DGN), полученную из алгоритма генеративной состязательной сети (GAN) [15], который, как известно, захватывает скрытое пространство объяснение естественных изображений [16] (подробности см. в разделе «Материалы и методы:« Приоритет естественного изображения »).

    Примеры реконструкций естественных изображений показаны на рис. 2 (дополнительные примеры см. На рис. S2, а реконструкции с помощью процессов оптимизации см. В разделе «Фильм S1»). Реконструкции, полученные с помощью DGN, фиксируют доминирующие структуры объектов на изображениях. Кроме того, на нескольких изображениях были созданы тонкие структуры, отражающие семантические аспекты, такие как лица, глаза и текстурные узоры. Наш обширный анализ по каждому из отдельных субъектов продемонстрировал воспроизводимые результаты для всех субъектов.Более того, тот же анализ на ранее опубликованном наборе данных [10] также воспроизводил качественно аналогичные реконструкции, что и в настоящем исследовании (S3 Рис.).

    Рис. 2. Восстановленные естественные изображения.

    Черные и серые окружающие рамки обозначают представленные и восстановленные изображения соответственно (восстановленные из активности VC с использованием DNN1–8). Восстановленные изображения, полученные в процессе оптимизации, показаны вместо видимых естественных изображений. Реконструкции были ограничены DGN.

    https://doi.org/10.1371/journal.pcbi.1006633.g002

    Чтобы исследовать влияние DGN, мы оценили качество реконструкций, созданных как с его использованием, так и без него (рис. 3A и 3B; см. рис. S4 для отдельные предметы; см. Материалы и методы: «Оценка качества реконструкции»). В то время как реконструкции, полученные без DGN, также успешно воспроизводили грубые силуэты доминирующих объектов, они не показали семантически значимого внешнего вида (см. S5 Fig для дополнительных примеров; также см. S6 Fig для реконструкций из разных начальных состояний как с DGN, так и без DGN).Оценки с использованием пространственной корреляции по пикселям и человеческого суждения показали почти сравнимую точность для реконструкций с и без DGN (точность попиксельной пространственной корреляции с DGN и без него, 76,1% и 79,7%; точность человеческого суждения, с и без DGN). без ДГН 97,0% и 96,0%). Однако точность реконструкции, оцененная с использованием попиксельной пространственной корреляции, показала немного более высокую точность с реконструкциями, выполненными без DGN, чем с DGN (двусторонний знаковый ранговый тест, P <0.01), тогда как противоположное наблюдалось для оценок на основе человеческого суждения (двусторонний знаковый ранговый тест, P <0,01). Эти результаты предполагают полезность DGN, которая увеличивает перцептивное сходство реконструированных изображений с целевыми изображениями за счет визуализации семантически значимых деталей в реконструкциях.

    Рис. 3. Влияние глубокой генераторной сети (DGN).

    ( A ) Реконструкция с DGN и без нее. В первой, второй и третьей строках показаны представленные изображения и реконструкции с DGN и без него соответственно (восстановленные на основе активности VC, DNN1–8).( B ) Качество реконструкции видимых естественных изображений (объединение трех субъектов, N = 150; уровень вероятности, 50%).

    https://doi.org/10.1371/journal.pcbi.1006633.g003

    Чтобы охарактеризовать «глубокий» характер нашего метода, эффективность объединения нескольких слоев DNN была протестирована с использованием как объективных, так и субъективных оценок [5, 17, 18]. Для каждого из 50 тестовых естественных изображений были сгенерированы восстановленные изображения с переменным количеством нескольких слоев (рис. 4A; только DNN1, DNN1–2, DNN1–3,…, DNN1–8; см. S7 рис. Для дополнительных примеров).При объективной оценке попиксельные пространственные корреляции с исходным изображением сравнивались между двумя комбинациями слоев DNN. При субъективной оценке независимому оценщику были представлены исходное изображение и пара восстановленных изображений, оба из одного и того же исходного изображения, но сгенерированные с различными комбинациями нескольких слоев, и от него требовалось указать, какое из восстановленных изображений выглядело более похожим на исходное изображение. В то время как объективная оценка показала более высокий процент выигрыша только для самого раннего уровня (DNN1), субъективная оценка показала увеличение процента выигрыша для большего количества слоев DNN (рис. 4B).Наш дополнительный анализ показал низкое качество реконструкции из отдельных слоев, особенно из более высоких слоев (см. S8 Рис. Для реконструкций из отдельных слоев). Эти результаты предполагают, что объединение нескольких уровней визуальных характеристик улучшило качество перцепционной реконструкции, даже несмотря на потерю точности по пикселям.

    Рис 4. Влияние многоуровневых визуальных характеристик.

    ( A ) Реконструкции с использованием различных комбинаций слоев DNN (без DGN).Черные и серые окружающие рамки обозначают представленные и восстановленные изображения соответственно (восстановленные на основе активности VC). ( B ) Объективные и субъективные оценки реконструкций из различных комбинаций слоев DNN (планки ошибок, 95% доверительный интервал [ДИ] по выборкам, N = 50; см. Материалы и методы: «Оценка качества реконструкции» для процедура расчета процента выигрыша).

    https://doi.org/10.1371/journal.pcbi.1006633.g004

    Учитывая истинные особенности DNN, а не декодированные признаки, в качестве входных данных алгоритм реконструкции производит почти полные реконструкции исходных изображений (S8 Рис.), указывая на то, что точность декодирования признаков DNN будет определять качество восстановленных изображений. изображений. Чтобы еще раз подтвердить это, мы вычислили корреляцию между точностью декодирования признаков и качеством восстановления для отдельных изображений (S9 Рис). Анализ показал положительную корреляцию как для объективных, так и для субъективных оценок, предполагая, что повышение точности декодирования признаков может улучшить качество реконструкции.

    Мы обнаружили, что яркостный контраст реконструкции часто был обратным (например, изображения в цветном стекле на рис. 2), предположительно из-за отсутствия (абсолютной) информации о яркости в сигналах фМРТ, даже в ранних областях зрения [19 ]. Дополнительный анализ показал, что значения характеристик фильтров с высоким яркостным контрастом в самых ранних слоях DNN (conv1_1 в VGG19) лучше декодировались, когда они были преобразованы в абсолютные значения (рис. 5A и 5B), демонстрируя явное несоответствие между fMRI и raw DNN. сигналы.Значительные уровни улучшения демонстрируют нечувствительность сигналов фМРТ к яркости пикселей, предполагая линейно-нелинейное несоответствие ответов DNN и фМРТ на яркость пикселей. Это расхождение может объяснить инверсию яркости, наблюдаемую на нескольких реконструированных изображениях. Хотя это может ограничить возможность реконструкций по сигналам фМРТ, неоднозначность может быть разрешена путем моделирования DNN, чтобы заполнить пробелы между сигналами DNN и фМРТ. В качестве альтернативы дальнейшее выделение визуальной информации высокого уровня в иерархических визуальных характеристиках может помочь разрешить неоднозначность яркости путем включения информации о семантическом контексте.

    Рис. 5. DNN признак точности декодирования необработанных и абсолютных признаков.

    Анализ проводился с функциями из слоя conv1_1 модели VGG19 с использованием тестового набора данных естественного изображения (планка ошибок, 95% ДИ для разных субъектов). ( A ) Средняя точность декодирования характеристик всех устройств. ( B ) Средняя точность декодирования признаков для отдельных фильтров. Точности декодирования признаков для единиц в рамках одних и тех же фильтров были усреднены индивидуально. Фильтры были отсортированы в соответствии с порядком возрастания точности декодирования необработанных признаков, усредненной для отдельных фильтров.

    https://doi.org/10.1371/journal.pcbi.1006633.g005

    Чтобы подтвердить, что наш метод не был ограничен определенной областью изображения, используемой для обучения модели, мы проверили, можно ли обобщить реконструкцию на искусственные изображений. Это было сложно, потому что и DNN, и наши модели декодирования были обучены исключительно на естественных изображениях. Реконструкции искусственных форм и букв алфавита показаны на рис. 6A и 6B (также см. Рис. S10 и видеоролик S2 для получения дополнительных примеров искусственных форм и см. Рис. S11 для дополнительных примеров букв алфавита).Результаты показывают, что искусственные формы были успешно реконструированы с умеренной точностью (рис. 6C слева; 70,5% по пиксельной пространственной корреляции, 91,0% по оценке человека; см. S12 рис. Для отдельных субъектов), а буквы алфавита также были реконструированы с высокой точностью (рис. 6C справа; 95,6% по пиксельной пространственной корреляции, 99,6% по оценке человека; см. S13 рис. Для отдельных субъектов). Эти результаты показывают, что наша модель действительно «реконструировала» или «генерировала» изображения на основе активности мозга, а не просто сопоставляла их с образцами.Более того, успешные реконструкции букв алфавита демонстрируют, что наш метод может расширить возможные состояния визуализаций с улучшением разрешения по сравнению с реконструкциями, выполненными в предыдущих исследованиях [1, 20].

    Рис. 6. Видимые реконструкции искусственных изображений.

    Черные и серые окружающие рамки обозначают представленные и восстановленные изображения соответственно (активность VC, DNN 1–8, без DGN). ( A ) Реконструкция видимых искусственных форм.( B ) Реконструкция увиденных букв алфавита. Реконструированные буквы складывались в слово «НЕЙРОН». ( C ) Качество реконструкции искусственных форм и букв алфавита (объединены три объекта, N = 120 и 30 для искусственных фигур и букв алфавита соответственно; уровень вероятности 50%).

    https://doi.org/10.1371/journal.pcbi.1006633.g006

    Чтобы оценить, как были восстановлены формы и цвета изображений стимулов, мы по отдельности оценили качество восстановления каждой формы и цвета, сравнивая восстановленные изображения такие же цвета и формы.Анализ с различными визуальными областями показал разные тенденции в качестве реконструкции для форм и цветов (рис. 7A и см. Рис. S14 для дополнительных примеров). Оценки человеческого суждения показали, что формы лучше реконструировались из ранних зрительных областей, тогда как цвета лучше реконструировались из зрительной зоны среднего уровня V4 (рис. 7B и см. Рис. S15 для отдельных субъектов; ANOVA, взаимодействие между типом задачи [форма против цвета] и области мозга [V1 по сравнению с V4], P <0,01), хотя эффект взаимодействия был незначительным при рассмотрении оценок с помощью пиксельной пространственной корреляции ( P = 0.06). Эти контрастирующие паттерны дополнительно подтверждают успех реконструкций формы и цвета и указывают на то, что наш метод может быть полезным инструментом для характеристики информационного содержания, закодированного в паттернах активности отдельных областей мозга, посредством визуализации.

    Рис. 7. Реконструкции формы и цвета из нескольких визуальных областей.

    ( A ) Реконструкция искусственных фигур из нескольких визуальных областей (DNN 1–8, без DGN). Черные и серые окружающие рамки обозначают представленные и восстановленные изображения соответственно.( B ) Качество реконструкции формы и цвета для различных зрительных областей (объединены три объекта, N = 120; уровень вероятности 50%).

    https://doi.org/10.1371/journal.pcbi.1006633.g007

    Наконец, чтобы изучить возможность визуальной реконструкции субъективного содержания, мы провели эксперимент, в котором участников просили создать мысленные образы естественных и искусственных изображений. перед сеансом задачи. Реконструкции, созданные на основе мозговой активности из-за мысленных образов, показаны на рис. 8 (дополнительные примеры см. На рис. S16 и видеоролик S3).Хотя качество реконструкции варьировалось для разных субъектов и изображений, элементарные реконструкции были получены для некоторых искусственных форм (рис. 8A и 8B для изображений с высокой и низкой точностью, соответственно). Напротив, воображаемые естественные изображения не были хорошо реконструированы, возможно, из-за трудности представления сложных естественных изображений (Рис. 8C; см. S17 Рис. Для оценки яркости изображений). В то время как попиксельные оценки пространственной корреляции восстановленных искусственных изображений не показали высокой точности (рис. 8D; 51.9%; см. S18 рис. для отдельных субъектов), это могло быть связано с возможными несоответствиями в положениях, цветах и ​​яркости между целевым и восстановленным изображениями. Между тем, оценки человеческого суждения показали точность выше, чем уровень вероятности, предполагая, что воображаемые искусственные изображения можно было распознать по восстановленным изображениям (рис. 8D; 83,2%; односторонний знаковый ранговый тест, P <0,01; см. S18 рис. отдельные предметы). Кроме того, отдельные оценки реконструкций цвета и формы искусственных изображений показали, что форма, а не цвет, вносили основной вклад в высокую долю правильных ответов оценщиков-людей (рис. 8E; цвет, 64.8%; форма 87,0%; двусторонний знаковый ранговый тест, P <0,01; см. S19 рис. для отдельных субъектов). Кроме того, плохие, но достаточно узнаваемые реконструкции были получены даже из паттернов мозговой активности в первичной зрительной области (V1; 63,8%; объединение трех субъектов; односторонний знаковый ранговый тест, P <0,01; см. S20 рис. Для реконструированных изображений и S21 Fig и S22 Fig для количественной оценки), возможно, подтверждая представление о том, что зрительные особенности низкого уровня кодируются в ранней зрительной корковой активности во время ментальных образов [21].Взятые вместе, эти результаты подтверждают возможность визуализации воображаемого контента на основе моделей активности мозга.

    Рис 8. Реконструкции изображений.

    Черные и серые окружающие рамки обозначают представленные и восстановленные изображения соответственно (активность VC, DNN 1–8, без DGN). ( A ) Реконструкция воображаемых искусственных форм с помощью процессов оптимизации. Восстановленные изображения, полученные с помощью процессов оптимизации, показаны для изображений с высокой точностью человеческого суждения.( B ) Реконструкция воображаемых искусственных форм с низкой точностью человеческого суждения. ( C ) Реконструкция воображаемых естественных изображений. ( D ) Качество реконструкции воображаемых искусственных форм (объединены три объекта, N = 45; уровень вероятности 50%). ( E ) Качество реконструкции воображаемых искусственных форм, оцениваемое отдельно по цвету и форме на основе человеческого суждения (объединение трех субъектов, N = 45; уровень вероятности 50%).

    https: // doi.org / 10.1371 / journal.pcbi.1006633.g008

    Обсуждение

    Мы представили новый подход к воссозданию перцептивного и ментального содержания на основе активности человеческого мозга, объединяя визуальные характеристики из нескольких слоев DNN. Мы успешно реконструировали просматриваемые естественные изображения, особенно в сочетании с DGN. Результаты обширного анализа по каждому предмету были воспроизведены на разных предметах. Реконструкция искусственных форм также прошла успешно, хотя использованные модели реконструкции обучались только на естественных изображениях.Тот же метод был применен к ментальным образам и выявил элементарные реконструкции ментального содержания.

    Наш метод способен восстанавливать различные типы изображений, включая естественные изображения, цветные искусственные формы и буквы алфавита, даже несмотря на то, что каждый компонент нашей модели реконструкции, модели DNN и декодеры функций DNN были обучены исключительно на естественных изображениях. Результаты убедительно продемонстрировали, что наш метод, безусловно, был в состоянии «реконструировать» или «генерировать» изображения из активности мозга, что отличает наш метод от предыдущих попыток визуализировать перцептивное содержимое с использованием подхода сопоставления образцов, который страдает от ограничений, связанных с заранее выбранным изображением. / набор фильмов [3, 4].

    Мы ввели основанное на GAN ограничение с использованием DGN для реконструкций естественных изображений, чтобы повысить естественность реконструированных изображений, отображая семантически значимые детали для реконструкций. Вариант подхода на основе GAN также продемонстрировал полезность в предыдущем исследовании реконструкции изображения лица [22]. Пространство признаков, производное от GAN, по-видимому, обеспечивает эффективные ограничения на результирующие изображения, чтобы улучшить восприятие сходства с набором изображений, на котором обучается GAN.

    Хотя одной из сильных сторон настоящего метода является его обобщение для разных типов изображений, остается возможность для существенного улучшения производительности реконструкции. Поскольку мы использовали модели (DNN и декодеры), обученные с естественными изображениями «объектов» из базы данных ImageNet [14], изображения которых содержат объекты вокруг центра, это не было бы оптимальным для реконструкции других типов изображений. Более того, поскольку мы использовали модель DNN, обученную классифицировать изображения по 1000 категориям объектов, представления, полученные в DNN, будут специально подходить для конкретных объектов.Можно обучать модели с различными типами изображений, такими как сцены, текстуры и искусственные формы, а также изображения объектов, чтобы улучшить общую производительность реконструкции. Если тип целевого изображения известен ранее, можно использовать определенный набор изображений и соответствующую ему задачу обучения модели DNN.

    Другие модели DNN с другой архитектурой также могут быть использованы для улучшения общей производительности реконструкции. Поскольку качество реконструкции положительно коррелирует с точностью декодирования признаков (S9 рис.), DNN с хорошо декодируемыми блоками, вероятно, улучшат реконструкцию.В недавних исследованиях оценивали различные типы DNN с точки зрения точности прогнозирования активности мозга с учетом их значений характеристик (или точности кодирования) [23–25]. Хотя еще предстоит увидеть, насколько тесно связаны точности кодирования и декодирования, ожидается, что более «мозговые» модели DNN дадут высококачественные реконструкции.

    Наш подход открывает уникальное окно в наш внутренний мир, преобразуя активность мозга в изображения с помощью иерархических визуальных функций. Наш метод также может быть расширен для декодирования мысленного содержимого, отличного от визуального восприятия и образов.Выбирая подходящую архитектуру DNN, имеющую существенную гомологию с нейронными представлениями, декодированные мозгом функции DNN могут быть преобразованы в фильмы, звуки, текст или другие формы сенсорных / ментальных представлений. Экстернализация ментального содержания с помощью этого подхода может оказаться полезным для общения с нашим внутренним миром через интерфейсы мозг-машина / компьютер.

    Материалы и методы

    Заявление о соблюдении этических норм

    Все субъекты предоставили письменное информированное согласие на участие в наших экспериментах в соответствии с Хельсинкской декларацией, а протокол исследования был одобрен этическим комитетом ATR.

    Субъекты

    В наших экспериментах участвовали три здоровых субъекта с нормальным зрением или зрением с исправленным зрением: субъект 1 (мужчина, 33 года), субъект 2 (мужчина, 23 года) и субъект 3 (женщина, 23 года). Этот размер выборки был выбран на основе предыдущих исследований фМРТ с аналогичными экспериментальными планами [1, 10].

    Зрительные стимулы

    Визуальные стимулы состояли из естественных изображений, искусственных форм и букв алфавита. Естественные изображения были идентичны тем, которые использовались в Horikawa & Kamitani (2017) [10], которые первоначально были собраны из онлайн-базы данных изображений ImageNet (2011, осенний выпуск) [14].Изображения были обрезаны по центру и уменьшены до 500 × 500 пикселей. Искусственные формы состояли из 40 комбинаций 5 форм и 8 цветов (красный, зеленый, синий, голубой, пурпурный, желтый, белый и черный), в которых формы были идентичны тем, которые использовались в Miyawaki et al. (2008) [1], и яркость была сопоставлена ​​для всех цветов, кроме белого и черного. Изображения букв алфавита состояли из 10 черных букв A, C, E, I, N, O, R, S, T и U.

    Опытный образец

    Мы провели два типа экспериментов: эксперименты по представлению изображений и эксперимент с мысленными образами.Эксперименты по представлению изображений состояли из четырех различных типов сессий, в которых были представлены различные варианты визуальных образов (тренировка естественных образов, тестовых естественных образов, искусственных форм и букв алфавита). Все визуальные стимулы проецировались на экран в отверстии фМРТ сканера с использованием жидкокристаллического проектора с калибровкой яркости. Чтобы свести к минимуму движения головы во время сканирования с помощью фМРТ, испытуемые должны были фиксировать голову с помощью прикусной планки, изготовленной по индивидуальному заказу для каждого пациента.Данные от каждого субъекта были собраны в течение нескольких сеансов сканирования, продолжавшихся примерно 10 месяцев. В каждый экспериментальный день проводился один последовательный сеанс не более 2 часов. Испытуемым давали достаточно времени для отдыха между запусками (каждые 5–8 мин) и разрешали сделать перерыв или прекратить эксперимент в любое время.

    Эксперимент по презентации изображения

    Эксперименты по представлению изображений состояли из четырех различных типов сессий: тренировочные сессии с естественным изображением, тестовые сессии с естественным изображением, сессии с искусственными формами и сессии с алфавитными буквами.Каждый сеанс состоял из 24, 24, 20 и 12 отдельных прогонов соответственно. Для этих четырех сеансов каждый прогон включал 55, 55, 44 и 11 блоков стимулов, соответственно, при этом они состояли из 50, 50, 40 и 10 блоков с разными изображениями и 5, 5, 4 и 1 случайным образом перемежающихся повторением. блоки, в которых было представлено то же изображение, что и в предыдущем блоке (7 мин 58 с для тренировочного и тестового сеансов с естественным изображением, 6 мин 30 с для сеансов искусственной формы и 5 мин 2 с для сеансов с алфавитными буквами, за каждый прогон).Каждый блок стимулов длился 8 с (тренировка естественных образов, тестовых естественных образов и искусственных форм) или 12 с (буквы алфавита), за которыми следовали 12-секундные периоды отдыха для букв алфавита, в то время как нет. Период отдыха использовался для обучения естественным изображениям, тестовым естественным изображениям и искусственным формам. Изображения представлялись в центре дисплея с центральным пятном фиксации и мигали с частотой 2 Гц (12 × 12 и 0,3 × 0,3 градуса угла обзора для визуальных изображений и пятна фиксации соответственно).Цвет пятна фиксации менялся с белого на красный за 0,5 с до начала каждого блока стимулов, что указывает на начало блока. Дополнительные 32- и 6-секундные периоды отдыха были добавлены к началу и концу каждого бега соответственно. Испытуемых просили поддерживать устойчивую фиксацию на протяжении каждого прогона, и они выполняли одноразовую задачу обнаружения повторения на изображениях, отвечая нажатием кнопки для каждого повторяющегося изображения, чтобы гарантировать, что они сохраняют свое внимание на представленных изображениях (среднее выполнение задачи по трем субъектам. : чувствительность 0.9820; специфичность 0,9995; объединены по сеансам). В одной серии тренировок с естественным изображением всего 1200 изображений были представлены только один раз. Этот набор обучающих сеансов естественного изображения был повторен пять раз (1200 × 5 = 6000 образцов для обучения). В тестовых сеансах естественного изображения, искусственной формы и алфавитного письма 50, 40 и 10 изображений были представлены 24, 20 и 12 раз соответственно. Порядок представления изображений был рандомизирован по запускам.

    Эксперимент с мысленными образами

    В эксперименте с мысленными образами испытуемые должны были визуально представить (вспомнить) одно из 25 изображений, выбранных из представленных в тестовых сеансах естественного изображения и искусственной формы в эксперименте по представлению изображений (10 естественных изображений и 15 искусственных изображений).Перед экспериментом испытуемых просили связать слова с визуальными образами, чтобы они могли вспомнить визуальные образы по словесным подсказкам. Эксперимент с изображениями состоял из 20 отдельных прогонов, каждый из которых содержал 26 блоков (7 мин 34 с для каждого прогона). 26 блоков состояли из 25 испытаний изображений и испытания фиксации, в котором испытуемые должны были поддерживать устойчивую фиксацию без каких-либо образов. Каждый блок образов состоял из 4-секундного периода реплики, 8-секундного периода мысленного образа, 3-секундного периода оценки и 1-секундного периода отдыха.Дополнительные 32- и 6-секундные периоды отдыха были добавлены к началу и концу каждого бега соответственно. В периоды покоя в центре дисплея отображалось белое пятно фиксации. За 0,8 с перед каждым периодом метки цвет пятна фиксации менялся с белого на красный на 0,5 с, указывая на начало блоков. Во время периода подсказки слова, определяющие визуальные образы, которые нужно представить, визуально представлялись вокруг центра дисплея (1 цель и 25 отвлекающих факторов). Положение каждого слова в блоках случайным образом изменялось, чтобы избежать специфических эффектов, влияющих на фМРТ-ответ во время периодов мысленного воображения.Слово, соответствующее воображаемому изображению, было выделено красным цветом (цель), а другие слова — черным цветом (отвлекающие факторы). Испытуемые должны были начать воображать целевое изображение сразу после исчезновения ключевых слов. За периодом изображения последовал трехсекундный оценочный период, в котором было представлено слово, соответствующее целевому изображению, и масштабная линейка, чтобы позволить испытуемым оценить правильность и яркость своих мысленных образов по пятибалльной шкале очень яркий, довольно яркий, довольно яркий, не яркий, не может правильно распознать цель).Это выполнялось нажатием левой и правой кнопок на кнопочном блоке, помещенном в их правую руку, чтобы изменить счет с его случайного начального значения. В качестве вспомогательного средства для запоминания ассоциаций между словами и изображениями испытуемые могли использовать кнопки управления для просмотра пар слова и визуального изображения во время каждого периода отдыха между запусками.

    МРТ

    данных фМРТ были собраны с использованием сканера Siemens MAGNETOM Verio с мощностью 3,0 тесла, расположенного в исследовательском центре Кокоро, Киотский университет.Было выполнено сканирование планарной визуализации (EPI) с чередованием T2 * -взвешенного градиентного эхо-эха для получения функциональных изображений, охватывающих весь мозг (TR, 2000 мс; TE, 43 мс; угол поворота, 80 градусов; FOV, 192 × 192 мм; размер вокселя 2 × 2 × 2 мм; зазор между срезами — 0 мм; количество срезов — 76; коэффициент многополосности — 4). Анатомические изображения с высоким разрешением тех же срезов, полученные для EPI, были получены с использованием T2-взвешенной последовательности турбо спинового эхо-сигнала (TR, 11000 мс; TE, 59 мс; угол поворота, 160 градусов; FOV, 192 × 192 мм; размер вокселя). , 0.75 × 0,75 × 2,0 мм). Также были получены тонкоструктурные изображения всей головы, подготовленные с помощью T1-взвешенного намагничивания, быстрого получения градиент-эхо (MP-RAGE) (TR, 2250 мс; TE, 3,06 мс; TI, 900 мс; угол поворота, 9 градусов, FOV). 256 × 256 мм; размер вокселя 1.0 × 1.0 × 1.0 мм).

    Предварительная обработка данных МРТ

    Первые 8 секунд сканирования каждого цикла отбрасывались, чтобы избежать эффектов нестабильности МРТ сканера. Затем мы использовали SPM (http://www.fil.ion.ucl.ac.uk/spm) для выполнения трехмерной коррекции движения на данных фМРТ.Затем данные с коррекцией движения были зарегистрированы в анатомических изображениях высокого разрешения внутри сеанса с теми же срезами, что и EPI, а затем в анатомические изображения с высоким разрешением всей головы. Затем зарегистрированные данные были повторно интерполированы в воксели размером 2 × 2 × 2 мм.

    Выборки данных были созданы путем регрессии мешающих параметров из каждой амплитуды вокселей для каждого прогона, включая любой линейный тренд и временные компоненты, пропорциональные шести параметрам движения, вычисленным во время процедуры коррекции движения.После этого амплитуды вокселов были нормализованы относительно средней амплитуды начальных 24-секундного периода отдыха каждого прогона и отброшены для уменьшения крайних значений (за пределами ± 3 SD для каждого прогона). Затем амплитуды вокселей усреднялись в пределах каждых 8-секундных (обучающие сеансы естественных изображений) или 12-секундных (тестовые сеансы естественного изображения, искусственной формы и алфавитных букв) блока стимулов (четыре или шесть объемов) и в пределах 16-секундный блок мысленных образов (восемь томов, эксперимент с мысленными образами) после сдвига данных на 4 секунды (два объема) для компенсации задержек гемодинамики.

    Интересующие регионы (ROI)

    V1, V2, V3 и V4 были выделены в соответствии со стандартным ретинотопическим экспериментом [26, 27]. Латеральный затылочный комплекс (LOC), веретенообразная область лица (FFA) и парагиппокампальная область (PPA) были идентифицированы с помощью обычных функциональных локализаторов [28–30] (см. Дополнительную информацию S1). Смежная область, покрывающая LOC, FFA и PPA, была вручную очерчена на плоских корковых поверхностях, и эта область была определена как верхняя зрительная кора головного мозга (HVC).Вокселы, перекрывающиеся с V1 – V3, были исключены из HVC. Воксели из V1 – V4 и HVC были объединены для определения зрительной коры (VC). В регрессионном анализе воксели, показывающие наивысший коэффициент корреляции с целевой переменной в сеансе обучающего изображения, были выбраны для декодирования каждой функции (максимум 500 вокселей).

    Особенности глубокой нейронной сети

    Мы использовали реализацию Caffe модели глубокой нейронной сети (DNN) VGG19 [13], которая была предварительно обучена с изображениями в ImageNet [14] для классификации 1000 категорий объектов (предварительно обученная модель доступно по адресу https: // github.com / BVLC / caffe / wiki / Model-Zoo). Модель VGG19 состояла из шестнадцати сверточных слоев и трех полностью связанных слоев. Чтобы вычислить выходные данные модели VGG19, все визуальные изображения были изменены до 224 × 224 пикселей и предоставлены модели. Выходы от блоков в каждом из 19 слоев (сразу после сверточных или полностью связанных слоев, перед выпрямлением) обрабатывались как вектор в последующем анализе декодирования и реконструкции. Количество блоков в каждом из 19 уровней следующее: conv1_1 и conv1_2, 3211264; conv2_1 и conv2_2, 1605632; conv3_1, conv3_2, conv3_3 и conv3_4, 802816; conv4_1, conv4_2, conv4_3 и conv4_4, 401408; conv5_1, conv5_2, conv5_3 и conv5_4, 100352; fc6 и fc7, 4096; и fc8, 1000.В этом исследовании мы назвали пять групп сверточных слоев как DNN1–5 (DNN1: conv1_1 и conv1_2; DNN2: conv2_1 и conv2_2; DNN3: conv3_1, conv3_2, conv3_3 и conv3_4; DNN4: conv4_1, conv4_2, conv4_3 и conv4_4; и DNN5: conv5_1, conv5_2, conv5_3 и conv5_4) и три полносвязных уровня как DNN6–8 (DNN6: fc6; DNN7: fc7; и DNN8: fc8). Мы использовали исходную предварительно обученную модель VGG19 для вычисления действий функциональных единиц, но для анализа с данными фМРТ из эксперимента мысленных изображений мы изменили модель DNN так, чтобы максимальные уровни объединения были заменены средними уровнями объединения, а активация ReLU Функция была заменена негерметичной функцией активации ReLU с отрицательным наклоном 0.2 (подробности оригинальной архитектуры DNN см. В Simonyan & Zisserman (2015) [13]).

    Анализ декодирования признаков DNN

    Мы использовали набор моделей линейной регрессии для создания мультивоксельных декодеров для декодирования вектора характеристик DNN видимого изображения из паттернов активности фМРТ, полученных в тренировочных сессиях с естественным изображением (обучающий набор данных). В этом исследовании мы использовали алгоритм разреженной линейной регрессии (SLR) [31], который может автоматически выбирать важные вокселы для декодирования путем введения разреженности в оценку веса посредством байесовской оценки параметров с предварительным автоматическим определением релевантности (ARD) (см. Horikawa & Kamitani (2017) [10] для подробного описания).Обучающий набор данных использовался для обучения декодеров декодированию значений отдельных единиц в векторах признаков всех слоев DNN (один декодер для одного объекта DNN), а затем обученные декодеры применялись к тестовым наборам данных. Подробнее об общей процедуре декодирования признаков см. Horikawa & Kamitani (2017) [10].

    Для тестовых наборов данных образцы фМРТ, соответствующие одному и тому же стимулу или мысленному образу, были усреднены по испытаниям, чтобы увеличить отношение сигнал / шум сигналов фМРТ.Чтобы компенсировать возможные различия в отношении сигнал / шум между обучающей и тестовой выборками, декодированные характеристики отдельных слоев DNN были нормализованы путем умножения их на один скаляр, так что норма декодированных векторов отдельных слоев DNN согласовывалась с средняя норма истинных векторов признаков DNN, вычисленная из независимых 10 000 естественных изображений. Затем этот скорректированный по норме вектор был впоследствии предоставлен алгоритму реконструкции (см. Дополнительную информацию для получения подробной информации о процедуре коррекции нормы).

    Реконструкция из нескольких слоев DNN

    Чтобы объединить функции DNN из нескольких уровней, мы взяли взвешенную сумму функций стоимости для отдельных слоев DNN, заданную следующим образом: (3) где L — это набор слоев DNN, а β l — параметр, определяющий вклад l -го слоя. Мы установили β l , чтобы сбалансировать вклад отдельных слоев DNN. Эта функция стоимости была минимизирована алгоритмом L-BFGS.Слои DNN, включенные в L , были объединены. В основном анализе мы объединили все сверточные (DNN1–5) и полносвязные слои (DNN6–8), если не указано иное.

    Естественное изображение до

    Чтобы улучшить «естественность» восстановленных изображений, мы изменили алгоритм восстановления, введя ограничение. Чтобы ограничить получаемые изображения от всех возможных паттернов контраста пикселей, мы уменьшили степени свободы, введя генераторную сеть, полученную с использованием генеративного алгоритма состязательной сети (GAN) [15], который, как недавно было показано, имеет хорошую производительность при захвате скрытых пространство, объясняющее естественные образы [16].В рамках GAN обучается набор из двух нейронных сетей, которые называются генератором и дискриминатором. Генератор — это функция для отображения скрытого пространства в пространство данных (то есть пространство пикселей), а дискриминатор — это классификатор, который предсказывает, является ли данное изображение выборкой из реальных естественных изображений или выходом из генератора. Дискриминатор обучен увеличивать свою предсказательную способность, а генератор — уменьшать ее. Мы рассмотрели ограничение наших восстановленных изображений, чтобы они находились в подпространстве, состоящем из изображений, которые могут быть созданы генератором, обученным создавать естественные изображения [12, 36].Это выражается (4) а также (5) G — это генератор, как функция отображения скрытого пространства в пространство изображения, которое мы назвали глубокой генераторной сетью (DGN). В нашем анализе реконструкции мы использовали предварительно обученную DGN, предоставленную Dosovitskiy & Brox (2016; доступно по адресу https://github.com/dosovits/caffe-fr-chairs; обученная модель для fc7) [36].

    Вышеупомянутая функция стоимости реконструкции относительно z была минимизирована градиентным спуском с импульсом.Мы использовали нулевой вектор в качестве начального значения. Чтобы сохранить z в умеренном диапазоне, мы ограничили диапазон каждого элемента z , следуя методу предыдущего исследования [36].

    Оценка качества реконструкции

    Качество реконструкции оценивали по объективной или субъективной оценке [5, 17, 18]. Для объективной оценки мы выполнили анализ сравнения попарного сходства, в котором восстановленное изображение сравнивалось с двумя изображениями-кандидатами (его исходным изображением и случайно выбранным изображением), чтобы проверить, соответствует ли его пиксельный коэффициент пространственной корреляции (корреляция Пирсона между векторизованными изображениями). значения пикселей) с исходным изображением было выше, чем для случайно выбранного изображения.Для субъективной оценки мы провели поведенческий эксперимент с группой из 13 оценщиков (5 женщин и 8 мужчин в возрасте от 19 до 37 лет). В каждом испытании эксперимента оценщики просматривали дисплей, представляющий восстановленное изображение (внизу) и два изображения-кандидата (отображаемые вверху; исходное изображение и случайно выбранное изображение), и их просили выбрать наиболее подходящее изображение. аналогичен реконструированному, представленному внизу. Каждое испытание продолжалось до тех пор, пока оценщики не дали ответа.Для обоих типов оценок в качестве меры качества рассчитывалась доля испытаний, в которых исходное изображение было выбрано как более похожее. Как при объективной, так и при субъективной оценке, каждое реконструированное изображение тестировалось со всеми парами изображений из одних и тех же типов изображений (естественные изображения, искусственные формы и буквы алфавита для изображений из сеансов презентации изображений, а также естественные изображения и искусственные формы для изображений из сеанса мысленных образов; например, для тестовых естественных изображений одна из 50 реконструкций была протестирована с 49 парами, каждая из которых состояла из одного исходного изображения и другого изображения из остальных 49, в результате 50 × 49 = 2450 сравнений).Качество отдельного реконструированного изображения оценивалось по проценту правильных ответов, который рассчитывался как доля правильных проб среди всех испытаний, в которых было протестировано восстановленное изображение (т. Е. Всего 49 испытаний для каждого из тестовых естественных изображений. ). Полученные проценты правильных ответов затем использовались для следующих статистических тестов.

    Для сравнения качества реконструкции при различных комбинациях слоев DNN мы также использовали объективные и субъективные оценки.Для субъективной оценки мы провели еще один поведенческий эксперимент с другой группой из 7 оценщиков (2 женщины и 5 мужчин в возрасте от 20 до 37 лет). В каждом испытании эксперимента оценщики просматривали дисплей, представляющий одно исходное изображение (вверху) и два реконструированных изображения одного и того же исходного изображения (внизу), полученных из различных комбинаций слоев DNN, и их просили решить, какое из них из двух восстановленных изображений было лучше. Это попарное сравнение проводилось для всех пар комбинаций слоев DNN (28 пар) и для всех изображений стимулов, представленных в тестовой сессии естественного изображения (50 образцов).Каждое испытание продолжалось до тех пор, пока оценщики не дали ответа. Мы рассчитали долю испытаний, в которых восстановленное изображение, полученное из определенной комбинации слоев DNN, было признано лучшим, а затем это значение было обработано как процент выигрыша этой комбинации слоев DNN. Для объективной оценки такое же попарное сравнение проводилось с использованием попиксельных пространственных корреляций, в которых попиксельные пространственные корреляции с исходным изображением сравнивались между двумя комбинациями слоев DNN, чтобы определить лучшую комбинацию слоев DNN.Результаты, полученные для всех тестовых образцов (50 образцов из тестового набора данных с естественным изображением), были использованы для расчета процента выигрыша каждой комбинации слоев DNN таким же образом, что и субъективная оценка.

    Эти оценки были выполнены индивидуально для каждого набора реконструкций от разных субъектов и наборов данных (например, тестовые естественные изображения от Субъекта 1). Для субъективной оценки один набор реконструированных изображений был протестирован не менее чем с тремя оценщиками.Результаты оценки от разных экспертов были усреднены в рамках одного набора реконструкций и обрабатывались таким же образом, как и результаты объективной оценки.

    Статистика

    Мы использовали двусторонние знаковые ранговые тесты для изучения различий в оцененном качестве реконструкции в зависимости от различных условий ( N = 150, 120 и 45 для тестовых естественных изображений, искусственных форм и изображений изображений, соответственно) и использовали ANOVA для изучения эффектов взаимодействия между типами задач и областями мозга для искусственных фигур ( F (1,1) = 28.40 по человеческому суждению; F (1,1) = 3,53 по пиксельной пространственной корреляции). Мы использовали односторонние знаковые ранговые тесты, чтобы проверить значимость правильной классификации с точки зрения человеческого суждения для оценок реконструкций изображений изображений ( N = 45).

    Вспомогательная информация

    S1 Рис. Точность декодирования признака DNN.

    Точность декодирования признаков DNN, полученная на основе активности VC, оценивалась коэффициентом корреляции между истинными и декодированными значениями признаков каждой единицы признака в соответствии с процедурой, описанной в Horikawa & Kamitani (2017) [10].Оценка проводилась индивидуально для каждого из трех типов видимых изображений (естественные изображения, искусственные формы и буквы алфавита) и каждого из двух типов изображений-изображений (естественные изображения и искусственные формы). Коэффициенты корреляции были усреднены по единицам в каждом слое DNN. Средние коэффициенты корреляции показаны для каждого типа слоев (планки ошибок, 95% доверительный интервал [ДИ] по единицам; N каждого слоя равно количеству единиц в каждом слое; см. Материалы и методы: «Глубокая нейронная сеть» особенности »для подробностей).

    https://doi.org/10.1371/journal.pcbi.1006633.s002

    (PDF)

    S2 Рис. Примеры реконструкций естественных изображений, полученных с помощью DGN.

    Черные и серые окружающие рамки обозначают представленные и восстановленные изображения соответственно (активность VC, DNN 1–8, с DGN). Три столбца реконструированных изображений соответствуют реконструкциям по трем объектам. По соображениям авторского права мы представляем только часть из 50 тестовых естественных изображений; те, на использование которых правообладатели дали нам разрешение.

    https://doi.org/10.1371/journal.pcbi.1006633.s003

    (PDF)

    S3 Рис. Реконструкции из набора данных декодирования универсального объекта.

    Такой же анализ реконструкции был выполнен с ранее опубликованным набором данных [10] (активность VC, DNN 1–8, с DGN). См. Подробности данных в Horikawa & Kamitani (2017) [10]. Черные и серые окружающие рамки обозначают представленные и восстановленные изображения соответственно. Пять столбцов реконструированных изображений соответствуют реконструкциям по пяти предметам.

    https://doi.org/10.1371/journal.pcbi.1006633.s004

    (PDF)

    S4 Рис. Качество реконструкции видимых естественных изображений для отдельных объектов.

    Оценки результатов отдельных субъектов показаны отдельно (активность ВК; DNN1–8; N = 50; уровень вероятности 50%; см. Рис. 3B), что указывает на то, что общая тенденция была почти одинаковой для разных субъектов, за исключением что человеческое суждение о реконструкциях от Субъекта 3 показало немного более высокую точность без DGN, чем с DGN.Оценка реконструкций с использованием попиксельной пространственной корреляции для субъектов 1–3 показала 78,4%, 74,2% и 75,7% с DGN и 80,4%, 77,2% и 81,3% без DGN, соответственно. Оценка реконструкций с использованием человеческого суждения для Субъекта 1-3 показала 98,5%, 97,3% и 95,3% с DGN и 96,6%, 94,7% и 96,7% без DGN, соответственно.

    https://doi.org/10.1371/journal.pcbi.1006633.s005

    (PDF)

    S5 Рис. Другие примеры реконструкций естественных изображений, полученных без DGN.

    Черные и серые окружающие рамки обозначают представленные и восстановленные изображения соответственно (активность VC, DNN 1–8, без DGN). Три столбца реконструированных изображений соответствуют реконструкциям по трем объектам.

    https://doi.org/10.1371/journal.pcbi.1006633.s006

    (PDF)

    S6 Рис. Реконструкции из разных начальных состояний.

    Черные и серые окружающие рамки обозначают представленные и восстановленные изображения соответственно (активность ВК, DNN 1–8).Мы использовали разные начальные состояния для реконструкций с DGN и без него. Для реконструкций с помощью DGN мы дополнительно выполнили анализ реконструкции, используя вектор гауссовских случайных значений (среднее значение = 0, стандартное отклонение = 1) в качестве начального состояния, а также вектор нулевого значения (основной анализ; например, рис. ). Для реконструкций без DGN мы также выполнили реконструкции из изображения со случайными однородными значениями (в диапазоне от 0 до 255) и изображения с нулевым значением в дополнение к пространственно однородному изображению со средними значениями RGB естественных изображений (основной анализ; е.г., рис 3). Для сравнения, реконструированные изображения из разных исходных состояний сравниваются у одних и тех же субъектов. Результаты показали немного разные, но почти эквивалентные изображения из разных начальных состояний, демонстрируя стабильность наших реконструкций.

    https://doi.org/10.1371/journal.pcbi.1006633.s007

    (PDF)

    S8 Рис. Примеры реконструкций из отдельных слоев DNN.

    Черные и серые окружающие рамки обозначают представленные и восстановленные изображения соответственно (без DGN).Мы использовали функции DNN из отдельных слоев (DNN1, DNN2,… или DNN8), а также комбинацию всех слоев DNN (DNN1–8) для анализа реконструкции, в котором были представлены либо истинные, либо декодированные функции (активность VC). к алгоритму реконструкции. В то время как реконструкции из отдельных слоев, особенно из более высоких слоев, показали худшее качество реконструкции даже по истинным объектам, объединение нескольких слоев привело к почти полной реконструкции исходных изображений по истинным объектам и хорошим реконструкциям по декодированным объектам (см., Рис 4 и S7 Рис).

    https://doi.org/10.1371/journal.pcbi.1006633.s009

    (PDF)

    S9 Рис. Корреляция между точностью декодирования признаков и качеством восстановления.

    Чтобы исследовать взаимосвязь между точностью декодирования признаков и качеством реконструкции, мы сначала оценили точность декодирования признаков для отдельных выборок, а не для отдельных единиц DNN (см. S1 рис; см. Материалы и методы: «Оценка качества реконструкции», чтобы узнать, как для оценки качества реконструкции отдельных образцов).Чтобы оценить точность декодирования признаков для каждой выборки, были рассчитаны коэффициенты корреляции Пирсона между декодированными и истинными значениями признаков для одного изображения стимула с использованием всех единиц в пределах каждого слоя. Чтобы избежать оценки ложно высоких корреляций из-за различий в базовых линиях и масштабах между единицами, значения характеристик каждой единицы тестовых данных (тестовое естественное изображение) были нормализованы по оси z с использованием средних и стандартных отклонений, оцененных на основе обучающих данных (обучающее естественное изображение) перед расчетом корреляций.Используя оценочную точность декодирования признаков и качество восстановления для отдельных выборок ( N = 50), коэффициенты корреляции Пирсона были дополнительно рассчитаны между качеством реконструкции (активность VC; с или без DGN, DNN1-8) и точностью декодирования признаков из отдельные слои или средняя точность по 19 слоям. Хотя корреляции варьировались между слоями и объектами, результаты в среднем показали положительную корреляцию между точностью декодирования признаков и качеством реконструкции для всех комбинаций оценок и алгоритмов реконструкции, предполагая, что более высокая точность декодирования приведет к лучшему качеству реконструкции.Интересно, что анализ показал отчетливые паттерны корреляции между слоями между двумя типами оценки, показывая, что высокие корреляции конкретно наблюдались на ранних слоях с пиксельными пространственными корреляциями, хотя умеренно высокие корреляции наблюдались довольно равномерно на большинстве слоев с человеческим суждением. Эти результаты могут отражать различные характеристики двух оценок, указывая на то, что пиксельная корреляция подходит для оценки точности низкоуровневых функций, тогда как человеческое суждение способно оценивать точность на нескольких уровнях визуальных функций.

    https://doi.org/10.1371/journal.pcbi.1006633.s010

    (PDF)

    S10 Рис. Все примеры реконструкций искусственных форм.

    Черные и серые окружающие рамки обозначают представленные и восстановленные изображения соответственно (активность VC, DNN 1–8, без DGN). Три ряда реконструированных изображений соответствуют реконструкциям по трем объектам.

    https://doi.org/10.1371/journal.pcbi.1006633.s011

    (PDF)

    S11 Фиг.Все примеры реконструкций букв по алфавиту.

    Черные и серые окружающие рамки обозначают представленные и восстановленные изображения соответственно (активность VC, DNN 1–8, без DGN). Три ряда реконструированных изображений соответствуют реконструкциям по трем объектам.

    https://doi.org/10.1371/journal.pcbi.1006633.s012

    (PDF)

    S12 Рис. Качество реконструкции искусственных форм по отдельным предметам.

    Оценки результатов отдельных испытуемых показаны отдельно (активность ВК; DNN1–8; без DGN; N = 40; уровень вероятности 50%; ср., Рис. 6C слева). Оценка реконструкций с использованием попиксельной пространственной корреляции показала 69,6%, 72,1% и 69,8% для субъектов 1–3 соответственно. Оценка реконструкций с использованием человеческого суждения показала 91,7%, 91,3% и 90,1% для Субъекта 1-3, соответственно.

    https://doi.org/10.1371/journal.pcbi.1006633.s013

    (PDF)

    S13 Рис. Качество восстановления букв алфавита по отдельным предметам.

    Оценки результатов отдельных испытуемых показаны отдельно (активность ВК; DNN1–8; без DGN; N = 10; уровень вероятности 50%; ср., Рис 6C справа). Оценка реконструкций с использованием попиксельной пространственной корреляции показала 98,9%, 87,8% и 100,0% для субъектов 1–3 соответственно. Оценка реконструкций с использованием человеческого суждения показала 100,0%, 98,9% и 100,0% для Субъекта 1-3, соответственно.

    https://doi.org/10.1371/journal.pcbi.1006633.s014

    (PDF)

    S14 Рис. Все примеры реконструкций искусственных форм, полученные из разных зрительных областей (Тема 1).

    Черные и серые окружающие рамки обозначают представленные и восстановленные изображения соответственно (DNN 1–8, без DGN).

    https://doi.org/10.1371/journal.pcbi.1006633.s015

    (PDF)

    S15 Рис. Качество реконструкции формы и цвета различных зрительных зон для отдельных предметов.

    Оценки результатов отдельных испытуемых показаны отдельно (DNN1–8; без DGN; N = 40; уровень вероятности 50%; см. Рис. 7B). Оценка с помощью корреляций по пикселям и человеческого суждения показала почти постоянную тенденцию у разных субъектов, показывая, что формы лучше реконструировались из ранних зрительных областей, тогда как цвета лучше реконструировались из относительно более высоких зрительных зон.

    https://doi.org/10.1371/journal.pcbi.1006633.s016

    (PDF)

    S16 Рис. Другие примеры реконструкций изображений изображений.

    Черные и серые окружающие рамки обозначают представленные и восстановленные изображения соответственно (активность VC, DNN 1–8, без DGN). Три ряда реконструированных изображений соответствуют реконструкциям по трем объектам. Крайние правые изображения в нижнем ряду показывают реконструкции во время сохранения фиксации без изображений.

    https://doi.org/10.1371/journal.pcbi.1006633.s017

    (PDF)

    S17 Рис. Показатели яркости изображений, представленных испытуемыми.

    Показатели яркости, полученные в ходе эксперимента с изображениями, показаны в порядке убывания средних показателей яркости по испытаниям для отдельных изображений. Для каждого объекта оценки яркости были усреднены по испытаниям для одних и тех же изображений изображений ( N = 20). Для объединенных результатов, чтобы устранить различия исходного уровня и вариабельности между субъектами, оценки яркости, полученные от отдельных субъектов, сначала были преобразованы в z-баллы для каждого субъекта, а затем усреднены по всем испытаниям с участием трех субъектов ( N = 60).Два крайних правых столбца, обозначенные как «искусственный» и «естественный», показывают средние оценки яркости, отдельно объединенные для искусственных форм (15 искусственных форм) и естественных изображений (10 естественных изображений). Планки погрешностей указывают 95% доверительные интервалы между испытаниями.

    https://doi.org/10.1371/journal.pcbi.1006633.s018

    (PDF)

    S18 Рис. Качество реконструкции воображаемых искусственных форм для отдельных предметов.

    Оценки результатов отдельных испытуемых показаны отдельно (активность ВК; DNN 1–8; без DGN; N = 15; уровень вероятности 50%; ср., Рис 8D). Оценка реконструкций с использованием попиксельной пространственной корреляции показала 49,5%, 52,4% и 53,8% для субъектов 1–3 соответственно. Оценка реконструкций с использованием человеческого суждения показала 85,6%, 84,4% и 79,5% для Субъекта 1-3, соответственно.

    https://doi.org/10.1371/journal.pcbi.1006633.s019

    (PDF)

    S19 Рис. Качество реконструкции воображаемых искусственных форм для отдельных субъектов, оцениваемых по цвету и форме отдельно по оценке человека.

    Оценки результатов отдельных испытуемых показаны отдельно (активность ВК; DNN 1–8; без DGN; N = 15; уровень вероятности 50%; ср., Рис 8E). Оценка реконструкций по цвету показала 71,1%, 56,7% и 66,7% для испытуемых 1–3 соответственно. Оценка реконструкций по форме составила 91,1%, 88,9% и 81,1% для субъектов 1–3 соответственно.

    https://doi.org/10.1371/journal.pcbi.1006633.s020

    (PDF)

    S20 Рис. Реконструкция изображений из V1.

    Черные и серые окружающие рамки обозначают представленные и восстановленные изображения соответственно (активность V1, DNN 1–8, без DGN).Три ряда реконструированных изображений соответствуют реконструкциям по трем объектам. Крайние правые изображения в нижнем ряду показывают реконструкции во время сохранения фиксации без изображений.

    https://doi.org/10.1371/journal.pcbi.1006633.s021

    (PDF)

    S21 Рис. Качество реконструкции воображаемых искусственных форм (реконструированных из V1).

    Оценки результатов отдельных субъектов и их объединенный результат показаны отдельно (активность V1; DNN 1–8; без DGN; N = 15 для отдельных субъектов и N = 45 для объединенного результата; уровень вероятности, 50%; ср., Рис 8D). Оценка реконструкций с использованием попиксельной пространственной корреляции показала 48,2%, 51,3%, 48,4% и 48,8% для субъектов 1–3 и объединенный результат, соответственно. Оценка реконструкций с использованием человеческого суждения показала 57,7%, 73,5%, 60,1% и 63,8% для Субъекта 1–3 и объединенный результат, соответственно.

    https://doi.org/10.1371/journal.pcbi.1006633.s022

    (PDF)

    S22 Рис. Качество реконструкции воображаемых искусственных форм, оцениваемых отдельно по цвету и форме по мнению человека (реконструировано из V1).

    Оценки результатов отдельных субъектов и их объединенный результат показаны отдельно (активность V1; DNN 1–8; без DGN; N = 15 для отдельных субъектов и N = 45 для объединенного результата; уровень вероятности, 50%; см. Рис. 8E). Оценка реконструкций по цвету показала 60,0%, 56,7%, 55,6% и 57,4% для Субъекта 1–3 и объединенный результат, соответственно. Оценки реконструкций по форме показали 63,9%, 77,8%, 63,3% и 68.3% для субъектов 1–3 и объединенный результат, соответственно. Как показано с реконструированными изображениями из VC (см. Рис. 8E), отдельные оценки реконструкций цвета и формы искусственных изображений из V1 также показали, что форма, а не цвет, вносят основной вклад в высокую долю правильных ответов людей-оценщиков ( объединены три субъекта; двусторонний знаковый ранговый тест, P <0,05).

    https://doi.org/10.1371/journal.pcbi.1006633.s023

    (PDF)

    Благодарности

    Авторы благодарят Митсуаки Цукамото и Хироаки Ямане за помощь в сборе данных, а также Мохамеда Абдельхака и Карла Эмблтона из Edanz Group (www.edanzediting.com/ac) за комментарии к рукописи. Это исследование было проведено с использованием сканера МРТ и сопутствующего оборудования Исследовательского центра Кокоро, Университет Киото.

    Ссылки

    1. 1. Miyawaki Y, Uchida H, Yamashita O, Sato M, Morito Y, Tanabe HC и др. Реконструкция визуального изображения на основе активности человеческого мозга с использованием комбинации многомасштабных локальных декодеров изображений. Нейрон . 2008; 60: 915–929. pmid: 1

      84
    2. 2. Вэнь Х, Ши Дж, Чжан И, Лу К., Цао Дж, Лю З.Нейронное кодирование и декодирование с глубоким обучением для динамического естественного зрения. Цереб Кортекс . 2017; 1–25.
    3. 3. Naselaris T, Prenger RJ, Kay KN, Oliver M, Gallant JL. Байесовская реконструкция естественных изображений по активности мозга человека. Нейрон . 2009; 63: 902–915. pmid: 19778517
    4. 4. Нисимото С., Ву А.Т., Населарис Т., Бенджамини Ю., Ю Б., Галлант Дж. Реконструкция визуальных впечатлений от мозговой активности, вызванной естественными фильмами. Курр Биол .2011; 21: 1641–1646. pmid: 21945275
    5. 5. Селигер К., Гючлю У., Амброгиони Л., Гучлютюрк Й., ван Гервен МАЙ. Генеративные состязательные сети для восстановления естественных изображений по активности мозга; 2017. Препринт. Доступно по ссылке: 30 декабря 2017 г.
    6. 6. Хан К., Вэнь Х., Ши Дж., Лу К., Чжан Ю., Лю З. Вариационный автоэнкодер: неконтролируемая модель для моделирования и декодирования активности фМРТ в зрительной коре головного мозга; 2017. Препринт. Доступно по адресу: цитируется 30 декабря 2017 г.
    7. 7. Тирион Б., Дюшене Э., Хаббард Э., Дюбуа Дж., Полин Дж., Лебихан Д. и др. Обратная ретинотопия: вывод визуального содержания изображений из паттернов активации мозга. Нейроизображение . 2006; 33: 1104–1116. pmid: 17029988
    8. 8. Хорикава Т., Тамаки М., Мияваки Ю., Камитани Ю. Нейронное декодирование визуальных образов во время сна. Наука . 2013; 340: 639–642. pmid: 23558170
    9. 9. Яминь Д.Л., ДиКарло Дж. Дж. Использование целевых моделей глубокого обучения для понимания сенсорной коры головного мозга. Нат Neurosci . 2016; 19: 356–365. pmid: 26

      2

    10. 10. Хорикава Т., Камитани Ю. Общее декодирование видимых и воображаемых объектов с использованием иерархических визуальных функций. Нац Коммуна . 2017; 8: 15037. pmid: 28530228
    11. 11. Махендран А., Ведальди А. Понимание глубинных представлений изображений путем их инвертирования. Proc IEEE Comput Soc Conf Comput Vis Pattern Recognit . 2015; 5188–5196.
    12. 12. Нгуен А., Досовицкий А., Йосински Дж., Брокс Т., Клун Дж.Синтез предпочтительных входов для нейронов в нейронных сетях через глубокие сети генераторов. Система Adv Neural Inf Process Syst . 2016; 29: 3387–3395. Доступно по ссылке: https://arxiv.org/abs/1605.09304
    13. 13. Симонян К., Зиссерман А. Очень глубокие сверточные сети для распознавания крупномасштабных изображений; 2014. Препринт. Доступно по ссылке: arXiv: 1409.1556v1. Цитировано 30 декабря 2017 г.
    14. 14. Дэн Дж., Донг В., Сочер Р., Ли Л., Ли К., Фей-Фей Л. Imagenet: крупномасштабная иерархическая база данных изображений. Proc IEEE Comput Soc Conf Comput Vis Pattern Recognit . 2009; 248–255.
    15. 15. Гудфеллоу И.Дж., Пуже-Абади Дж., Мирза М., Сюй Б., Вард-Фарли Д., Озаир С. и др. Генеративные состязательные сети. Система Adv Neural Inf Process Syst . 2014; 2: 2672–2680. Доступно по ссылке: https://arxiv.org/abs/1406.2661
    16. 16. Рэдфорд А., Мец Л., Чинтала С. Обучение представлению без учителя с помощью глубоких сверточных порождающих состязательных сетей; 2015. Препринт.Доступно по ссылке: arXiv: 1511.06434v1. Цитировано 30 декабря 2017 г.
    17. 17. Cowen AS, Chun MM, Kuhl BA. Нейронные портреты восприятия: восстановление изображений лиц на основе вызванной мозговой активности. Нейроизображение . 2014; 1–11. pmid: 24650597
    18. 18. Ли Х, Кул Б.А. Реконструкция воспринимаемых и извлеченных лиц из паттернов активности в латеральной теменной коре головного мозга. Журнал неврологии . 2016; 36: 6069–6082. pmid: 27251627
    19. 19. Haynes JD, Lotto RB, Rees G.Реакции зрительной коры человека на однородные поверхности. Proc Natl Acad Sci USA . 2004; 101: 4286–4291. pmid: 15010538
    20. 20. Schoenmakers S, Barth M, Heskes T, van Gerven MAJ. Линейная реконструкция воспринимаемых изображений по активности человеческого мозга. Нейроизображение . 2013; 83: 951–961. pmid: 23886984
    21. 21. Naselaris T, Olman CA, Stansbury DE, Ugurbil K, Gallant JL. Воксельная модель кодирования для ранних визуальных областей декодирует мысленные образы запомненных сцен. Нейроизображение . 2015; 105: 215–228. pmid: 25451480
    22. 22. Güçlütürk Y, Güçlü U, Seeliger K, Bosch S, Van Lier R, van Gerven MAJ. Глубокое состязательное нейронное декодирование. 31-я конференция по системам обработки нейронной информации . 2017. 1–12.
    23. 23. Яминь ДЛК, Хонг Х., Кадье К.Ф., Соломон Э.А., Зайберт Д., ДиКарло Дж. Дж. Оптимизированные по производительности иерархические модели предсказывают нейронные реакции в высших зрительных кортексах. Proc . Нац. Акад. . Sci . США . 2014; 111: 8619–8624. pmid: 24812127
    24. 24. Келл AJE, Яминс DLK, Шук EN, Norman-Haignere SV, McDermott JH. Оптимизированная для задач нейронная сеть воспроизводит слуховое поведение человека, прогнозирует реакции мозга и выявляет иерархию корковой обработки. Нейрон . 2018; 98: 630–644. pmid: 29681533
    25. 25. Schrimpf M, Kubilius J, Hong H, Majaj NJ, Rajalingham R, Issa EB, et al. Brain-Score: какая искусственная нейронная сеть для распознавания объектов больше всего похожа на мозг? 2018.Препринт. Доступно по адресу: цитируется 7 сентября 2018 г.
    26. 26. Engel SA, Rumelhart DE, Wandell BA, Lee AT, Glover GH, Chichilnisky E, et al. ФМРТ зрительной коры головного мозга человека. Природа . 1994; 369: 525. pmid: 8031403
    27. 27. Серено М. И., Дейл А. М., Реппас Дж. Б., Квонг К. К., Белливо Дж. В., Брэди Т. Дж. И др. Границы множественных зрительных зон у человека выявляются с помощью функциональной магнитно-резонансной томографии. Наука . 1995; 268: 889–893. pmid: 7754376
    28. 28.Курци З., Канвишер Н. Области коры, участвующие в восприятии формы объекта. Дж. Neurosci . 2000; 20: 3310–3318. pmid: 10777794
    29. 29. Канвишер Н, Макдермотт Дж., Чун ММ. Веретенообразная область лица: модуль в экстрастриальной коре головного мозга человека, специализирующийся на восприятии лица. Дж. Neurosci . 1997; 17: 4302–4311. pmid: 47
    30. 30. Эпштейн Р., Канвишер Н. Кортикальное представление локальной визуальной среды. Природа .1998; 392: 598–601. pmid: 9560155
    31. 31. Епископ СМ. Распознавание образов и машинное обучение . 1-е изд. Нью-Йорк: Спрингер-Верлаг; 2006.
    32. 32. Le QV, Ngiam J, Coates A, Lahiri A, Prochnow B, Ng AY. О методах оптимизации для глубокого обучения. Proc Int Conf Mach Learn (Белвью, Вашингтон, США). 2011; 265–272.
    33. 33. Лю Д.К., Нокедал Дж. О методе BFGS с ограниченной памятью для крупномасштабной оптимизации. Математическая программа .1989; 45: 503–528.
    34. 34. Гэтис Л.А., Эккер А.С., Бетге М. Передача стиля изображения с помощью сверточных нейронных сетей. Proc IEEE Comput Soc Conf Comput Vis Pattern Recognit . 2016; 2414–2423.
    35. 35. Цянь Н. О члене импульса в алгоритмах обучения градиентного спуска. Нейронная сеть . 1999; 12: 145–151. pmid: 12662723
    36. 36. Досовицкий А., Брокс Т. Генерация изображений с метриками перцептивного сходства на основе глубоких сетей. Система Adv Neural Inf Process Syst . 2016; 29: 658–666. Доступно по ссылке: https://arxiv.org/abs/1602.02644

    Как социальные сети влияют на имидж тела?

    Социальные сети могут повлиять на образ вашего тела и отношение к еде из-за более частого воздействия на стройные и подтянутые типы тела и определенные диеты

    Исследования показывают, что 88% женщин сравнивают себя с изображениями, которые они видят в социальных сетях, причем более половины из них подчеркивают, что сравнение неблагоприятное.

    Исследования также показывают, что 65% мужчин сравнивают себя с изображениями, которые они видят в социальных сетях, при этом 37% из них указали, что сравнение неблагоприятное.

    Это чрезвычайно проблематично, поскольку может привести к снижению самооценки, несбалансированному питанию, дефициту витаминов и минералов и, возможно, расстройствам пищевого поведения.


    Что такое изображение тела?

    Восприятие вашего физического «я», мыслей и эмоций, возникающих в результате этого восприятия, известно как образ тела.

    Есть 4 важных фактора, которые могут определить образ тела:

    • Воспринимаемый образ тела (как вы воспринимаете свое тело)
    • Аффективный образ тела (как вы относитесь к своему телу)
    • Когнитивный образ тела (как вы думаете о своем образе тела)
    • Поведенческий образ тела (как вы ведете себя как результат вашего образа тела)

    Визуальная обработка телом других тел также включает обработку собственного тела, а изображение тела связано с восприятием и мысленным представлением тела.

    Очень важно признать, что то, как вы воспринимаете свое тело, не всегда может отражать реальность. Искаженное восприятие собственного тела может проявляться в искажении образа тела, что может привести к расстройствам пищевого поведения.


    Закажите бесплатный 15-минутный оценочный звонок


    Влияние социальных сетей на изображение тела

    Вы с большей вероятностью, чем раньше, столкнетесь с влиянием и позором своего тела из-за постоянного воздействия на определенные типы телосложения в социальных сетях.

    ОТРИЦАТЕЛЬНОЕ СОЦИАЛЬНОЕ ДАВЛЕНИЕ И СРАВНЕНИЕ

    Социальные сети позволяют вам почувствовать, что у вас есть личная связь с людьми, которые делятся определенным контентом (например, худые / подтянутые тела и здоровая еда), что упрощает влияние.

    Выбранная экспозиция и влияние определенного контента могут заставить вас поверить в то, что худой / подтянутый тип тела или определенная диета более естественны, чем есть на самом деле.

    В социальных сетях определенные типы телосложения считаются идеальными типами телосложения, и это может привести к тому, что общество будет рассматривать это время тела и определенные пищевые привычки как более привлекательные и здоровые, чем другие.

    Большинство социальных сетей позволяют пользователям оценивать контент, созданный другими; часто идеализированные тела и определенные модные диеты получают много лайков. Другими словами, определенные тела и диеты воспринимаются как более привлекательные.

    Это также способствует объективизации тел, когда тела, наблюдаемые в социальных сетях, обрабатываются как объекты, а не как человеческие тела.

    Эти социальные нормы могут повлиять на то, как вы смотрите на свое тело, потому что люди в целом стремятся получить одобрение от других и избегать их неодобрения.В результате может соответствовать социальным нормам, связанным с внешним видом.

    Пользователи социальных сетей часто делятся с миром лучшими моментами своей жизни. Мы можем начать чувствовать, что мы недостаточно хороши по сравнению с людьми, которых мы видим в Instagram.

    Этот опыт в сочетании с отфотошопленными изображениями, пропагандирующими тонкие идеалы, может заставить нас почувствовать, что, имея «идеальный» образ тела, мы можем чувствовать себя более достойными и счастливыми в себе.

    # ФИТДПИРАЦИЯ И ДВИЖЕНИЕ ЗА ЗДОРОВОЕ ПИТАНИЕ

    В социальных сетях, и особенно в Instagram, ожидается, что вы запомните изображения больше, чем слова, из-за того, что социальная сеть ориентирована на изображения.

    Вы, вероятно, столкнетесь с различными тенденциями в социальных сетях, которые могут иметь разрушительный эффект. Например, тег #fitspiration в Instagram используется для показа фотографий худых и подтянутых телосложений.

    Хотя цель этого тега — вдохновить вас стать более здоровыми и подтянутыми, исследования тега #fitspiration в Instagram показывают, что эти объективирующие черты тела негативно влияют на образ тела и самооценку людей.

    Недавно в Instagram стало популярным движение за здоровое питание.На первый взгляд это может быть сделано из лучших побуждений, но может иметь негативные последствия для вашего физического здоровья.

    Некоторые влиятельные лица могут не предоставить никаких научных доказательств, когда они призывают вас исключить определенные группы продуктов питания или следовать определенной диете для достижения идеального типа телосложения, что может привести к формированию неосведомленных и нездоровых пищевых привычек.

    СОЦИАЛЬНЫЕ СЕТИ, ИЗОБРАЖЕНИЕ ТЕЛА И НАРУШЕНИЯ ПИТАНИЯ

    Влияние социальных сетей на образ вашего тела может привести к серьезным негативным последствиям для вашего психологического и физического благополучия.

    Наш образ мышления может быть взломан, и мы можем начать замечать преувеличенные или воображаемые недостатки в своей внешности. Это называется телесным дисморфическим расстройством, при котором мы можем постоянно проверять наличие недостатков и обнаруживаем, что нам трудно избавиться от негативных мыслей о своем теле.

    Мы также можем развить неупорядоченное пищевое поведение, пытаясь достичь идеальной формы нашего тела. Мы можем бороться с нервной анорексией, пытаясь похудеть, ограничивая пищу, которую мы едим, и перенапрягаясь.

    Движение за здоровое питание в социальных сетях также было связано с Orthorexia Nervosa, которая характеризуется одержимостью здоровым питанием и ограничением «плохой» пищи, что может привести к недоеданию.

    Расстройства пищевого поведения могут привести к изоляции от друзей и семьи, потому что мы можем чувствовать, что нас не понимают. Мы можем обнаружить, что проводим больше времени в социальных сетях и все глубже погружаемся в цикл негативных сравнений, вины и низкой самооценки, а также в дальнейшем нарушении пищевого поведения.

    Также могут быть негативные последствия для вашего физического здоровья. Исключение групп продуктов питания также может привести к несбалансированному питанию и дефициту основных минералов и витаминов.

    Из-за недоедания наш организм может потреблять определенные продукты для получения энергии. Помимо психологических симптомов, недостаток питательных веществ может вызывать у нас чувство истощения, головокружения и неспособности сосредоточиться. В серьезных случаях недоедание может стать причиной ломкости костей, выпадения волос и многого другого.

    Уход за телом

    Наша опытная команда терапевтов может помочь вам изменить ваше отношение к образу тела и еде.Сеансы терапии могут включать:

    • Понимание основных триггеров, эмоций и переживаний, которые влияют на ваш образ тела
    • Бросить вызов негативным мыслям о себе и своем теле
    • Научиться ощущать свое тело без осуждения и интернализировать социальное давление
    • Развитие большей самооценки и здорового решения механизмы борьбы со сложными эмоциями

    Наш разум и тело связаны, и часто пища, которую мы едим, влияет на наше настроение, а наше настроение влияет на наши пищевые привычки.

    Наша интегрированная программа MindHealth сочетает в себе психологическую и диетическую поддержку, чтобы помочь вам улучшить психологическое отношение к образу тела и еде, а также помочь вам оптимизировать свое физическое благополучие.

    Мы предлагаем бесплатный 30-минутный сеанс с терапевтом, чтобы вы могли проверить, подходит ли вам это, прежде чем двигаться дальше с поддержкой.

    Закажите бесплатный 15-минутный оценочный звонок в нашей дружелюбной команде поддержки клиентов, чтобы организовать некоторую поддержку. Мы выслушаем вашу историю и объясним, как наши услуги могут вам помочь.

    Позвольте нам помочь вам почувствовать себя лучше.

    Команда EmotionMatters.


    .

    About the Author

    Добавить комментарий

    Ваш адрес email не будет опубликован. Обязательные поля помечены *

    Related Posts