Тест Розенцвейга
Методика предназначена для исследования реакций на неудачу и способов выхода из ситуаций, препятствующих деятельности или удовлетворению потребностей личности.
Описание теста
Фрустрация – состояние напряжения, расстройства, беспокойства, вызываемое неудовлетворенностью потребностей, объективно непреодолимыми (или субъективно так понимаемыми) трудностями, препятствиями на пути к важной цели.
Методика состоит из 24 схематических контурных рисунков, на котором изображены два человека или более, занятые еще незаконченным разговором. Ситуации, изображенные на рисунках, можно разделить на две основные группы.
Ситуации «препятствия». В этих случаях какое-либо препятствие, персонаж или предмет обескураживает, сбивает с толку словом или еще каким-либо способом. Сюда относятся 16 ситуаций. Изображения: 1, 3, 4, 6, 8, 9, 11, 12, 13, 14, 15, 18, 20, 22, 23, 24.
Ситуации «обвинения». Субъект при этом служит объектом обвинения. Таких ситуаций 8.
Изображения: 2, 5, 7, 10, 16, 17, 19, 21.
Между этими группами ситуаций имеется связь, так как ситуация «обвинения» предполагает, что ей предшествовала ситуация «препятствия», где фрустратор был, в свою очередь, фрустрирован. Иногда испытуемый может интерпретировать ситуацию «обвинения» как ситуацию «препятствия» или наоборот.
Рисунки предъявляются испытуемому. Предполагается, что «отвечая за другого», испытуемый легче, достовернее изложит свое мнение и проявит типичные для него реакции выхода из конфликтных ситуаций. Исследователь отмечает общее время опыта.Тест может быть применен как в индивидуальном, так и в групповом исполнении. Но в отличие от группового в индивидуальном исследовании используется еще один важный прием: просят прочесть вслух написанные ответы.
Экспериментатор отмечает особенности интонации и прочее, что может помочь в уточнении содержания ответа (например, саркастический тон голоса). Кроме того, испытуемому могут быть заданы вопросы относительно очень коротких или двусмысленных ответов (это также необходимо для подсчета). Иногда случается, что испытуемый неправильно понимает ту или иную ситуацию, и, хотя такие ошибки сами по себе значимы для качественной интерпретации, все же после необходимого разъяснения от него должен быть получен новый ответ. Опрос следует вести по возможности осторожнее, так, чтобы вопросы не содержали дополнительной информации.Инструкция к тесту
Для взрослых: «Вам сейчас будут показаны 24 рисунка. На каждом из них изображены два говорящих человека. То, что говорит первый человек, написано в квадрате слева. Представьте себе, что может ответить ему другой человек. Напишите самый первый пришедший Вам в голову ответ на листе бумаги, обозначив его соответствующим номером.
Старайтесь работать как можно быстрее. Отнеситесь к заданию серьезно и не отделывайтесь шуткой. Не пытайтесь также воспользоваться подсказками».
Тестовый материал (см. распечатки)
Обработка результатов теста
Каждый из полученных ответов оценивается, в соответствии с теорией Розенцвейга по двум критериям: по направлению реакции (агрессии) и по типу реакции.
По направлению реакции подразделяются на:
Экстрапунитивные : реакция направлена на живое или неживое окружение, осуждается внешняя причина фрустрации, подчеркивается степень фрустрирующей ситуации, иногда разрешения ситуации требуют от другого лица.
Интропунитивные : реакция направлена на самого себя, с принятием вины или же ответственности за исправление возникшей ситуации, фрустрирующая ситуация не подлежит осуждению. Испытуемый принимает фрустрирующую ситуацию как благоприятную для себя.
Импунитивные : фрустрирующая ситуация рассматривается как нечто незначительное или неизбежное, преодолимое «со временем, обвинение окружающих или самого себя отсутствует.
По типу реакции делятся на:
Препятственно-доминантные . Тип реакции «с фиксацией на препятствии». Препятствия, вызывающие фрустрацию, всячески акцентируются, независимо от того, расцениваются они как благоприятные, неблагоприятные или незначительные.
Самозащитные . Тип реакции «с фиксацией на самозащите». Активность в форме порицания кого-либо, отрицание или признание собственной вины, уклонения от упрека, направленные на защиту своего«Я», ответственность за фрустрацию никому не может быть приписана.
Необходимо-упорствующие . Тип реакции «с фиксацией на удовлетворение потребности». Постоянная потребность найти конструктивное решение конфликтной ситуации в форме либо требования помощи от других лиц, либо принятия на себя обязанности разрешить ситуацию, либо уверенности в том, что время и ход событий приведут к ее разрешению.
Для обозначения направления реакции используются буквы:
Е – экстрапунитивные реакции,
I – интропунитивные реакции,
М – импунитивные.
Типы реакций обозначаются следующими символами:
OD – «с фиксацией на препятствии»,
ED – «с фиксацией на самозащите»,
NP – «с фиксацией на удовлетворение потребности».
Из сочетаний этих шести категорий получают девять возможных факторов и два дополнительных варианта.
Вначале исследователь определяет направление реакции, содержащееся в ответе испытуемого (Е, I или М), а затем выявляет тип реакции: ED, OD или NP.
Карточечное описание методики:
Название: Методика рисуночной фрустрации Розенцвейга (Rosenzweig Picture-Frustration Study, PF Study).
Автор: С. Розенцвейг, 1945 год. На основе разработанной им теории фрустрации(лат. Frustration –обман, расстройство)
Литература:
Данилова Е.Е. Методика изучения фрустрационных реакций у детей // Иностранная психология. 1996. № 6. С. 69–81.
Тарабрина П.В. Экспериментально-психологическая методика изучения фрустрационных реакций: Методические рекомендации. Л., 1984.
Фрустрация: Понятие и диагностика: Учеб.-метод. пособие: Для студентов специальности 020400 «Психология» / Сост. Л.И. Дементий. – Омск: Изд-во ОмГУ, 2004. – 68 с.
Тест Розенцвейга. Методика рисуночной фрустрации (модификация Н.В.Тарабриной) / Диагностика эмоционально-нравственного развития. Ред. и сост. Дерманова И.Б. – СПб., 2002. С.150-172.
Контингент испытуемых: взрослые, дети. Детский вариант методики предназначен для детей 4–13 лет. Взрослая версия теста применяется с 15 лет, в интервале же 12–15 лет возможно использование как детской, так и взрослой версии теста, поскольку они сопоставимы по характеру содержащихся в каждой из них ситуаций.
Предмет диагностики: личностные особенности(прежде всего, особенности поведения в ситуациях, связанных с появлением трудностей, помех, препятствующих достижению цели).
Операциональный статус: проективная методика, интерпретативная
Сопряженные практические задачи: индивидуальное консультирование, психологическое исследование. Возможно групповое обследование
Надежность и валидность: по данным зарубежных исследователей, коэффициент надежности ретестовой составляет 0,60 – 0,80. Достаточна высока валидность, например по параметру экстрапунитивности, выявленному независимо по методике, составляет 0, 747. Задания, составляющие тест Розенцвейга, неоднородны. Будут варьироваться переживания (и действия) в отношении ситуаций теста в различных обстоятельствах. Розенцвейг смог выявить достаточно высокие показатели ретестовой надежности методики, для взрослого варианта методики коэффициенты варьировались от +0,71 для испытуемых мужского пола ( по шкале импунитивной реакции) до +0,21 для испытуемых женского пола (по рейтингу групповой конформности).
Комплектность и состав методики:
Стимульный материал:
Тест состоит из 24 рисунков с персонажами, которые находятся в ситуации фрустрационной. Персонаж, изображенный слева, произносит слова, которыми описывается собственная фрустрация или другого индивидуума.
Над персонажем, изображенным слева, имеется пустой квадрат, в который обследуемый должен вписать первый пришедший на ум ответ.Обработка теста состоит из следующих этапов:
Оценка ответов
Определение показателя «степень социальной адаптивности».
Определение профилей.
Определение образцов.
Анализ тенденций.
На рисунках изображены 2 группы ситуаций:
1)ситуации-препятствия (эгоблокинговые)
2)ситуации-обвинения (суперэгоблокинговые).
Испытуемому дается инструкция, экспериментатор регистрирует ответы; время, затраченное на ответы; реакции испытуемого
При помощи методики выявляются следующие психологические характеристики:
3 типа реакций:
-доминантный тип реагирования(OD),
-самозащитный тип реагирования (ED),
-упорствующий тип реагирования(NP).
Обработка результатов теста
Каждый из полученных ответов оценивается, в соответствии с теорией, Розенцвейга, по двум критериям: по направлению реакции (агрессии) и по типу реакции.
По направлению реакции подразделяются на:
Экстрапунитивные : реакция направлена на живое или неживое окружение, осуждается внешняя причина фрустрации, подчеркивается степень фрустрирующей ситуации, иногда разрешения ситуации требуют от другого лица.
Интропунитивные : реакция направлена на самого себя, с принятием вины или же ответственности за исправление возникшей ситуации, фрустрирующая ситуация не подлежит осуждению. Испытуемый принимает фрустрирующую ситуацию как благоприятную для себя.
Импунитивные : фрустрирующая ситуация рассматривается как нечто незначительное или неизбежное, преодолимое «со временем, обвинение окружающих или самого себя отсутствует.
По типу реакции делятся на:
Препятственно-доминантные . Тип реакции «с фиксацией на препятствии». Препятствия, вызывающие фрустрацию, всячески акцентируются, независимо от того, расцениваются они как благоприятные, неблагоприятные или незначительные.
Самозащитные . Тип реакции «с фиксацией на самозащите». Активность в форме порицания кого-либо, отрицание или признание собственной вины, уклонения от упрека, направленные на защиту своего«Я», ответственность за фрустрацию никому не может быть приписана.
Необходимо-упорствующие . Тип реакции «с фиксацией на удовлетворение потребности». Постоянная потребность найти конструктивное решение конфликтной ситуации в форме либо требования помощи от других лиц, либо принятия на себя обязанности разрешить ситуацию, либо уверенности в том, что время и ход событий приведут к ее разрешению.
Для обозначения направления реакции используются буквы:
Е – экстрапунитивные реакции,
I – интропунитивные реакции,
М – импунитивные.
Типы реакций обозначаются следующими символами:
OD – «с фиксацией на препятствии»,
ED – «с фиксацией на самозащите»,
NP – «с фиксацией на удовлетворение потребности».
Из сочетаний этих шести категорий получают девять возможных факторов и два дополнительных варианта.
Сочетанию тех или иных двух вариантов присваивается собственное буквенное значение.
Если в ответе с экстрапунитивной, интропунитивной или импунитивной реакцией доминирует идея препятствия, добавляется значок «прим» (Е’, I’, М’).
Тип реакции «с фиксацией на самозащите» обозначается прописными буквами без значка (Е, I, M).
Тип реакции «с фиксацией на удовлетворение потребности» обозначается строчными буквами (е, i, m).
Экстра- и интропунитивные реакции самозащитного типа в ситуациях обвинения имеют еще два дополнительных варианта оценки, которые обозначаются символами Е и I.
Появление дополнительных вариантов подсчета Е и I обусловлено разделением ситуации теста на два типа. В ситуациях «препятствия» реакция субъекта обычно направлена на фрустрирующую личность, а в ситуациях «обвинения» она чаще является выражением протеста, отстаивания своей невиновности, отвержения обвинения или упрека, короче – настойчивого самооправдания.
Проиллюстрируем все эти обозначения на примере ситуации №1. В этой ситуации персонаж слева (шофер) произносит: «Мне очень жаль, что мы забрызгали Ваш костюм, хотя очень старались объехать лужу».
Возможные варианты ответов на эти слова с оценкой их с помощью вышеописанных символов:
Е’ – «Как это неприятно».
I’ — «Я совсем не испачкался». (Субъект подчеркивает как неприятно вовлекать во фрустрирующую ситуацию другое лицо).
М’ – «Ничего не случилось, он немного забрызган водой».
Е – «Вы неуклюжи. Вы недотепа».
I – «Ну конечно, мне надо было остаться на тротуаре».
М – «Ничего особенного».
е – «Вам придется почистить».
i — «Я почищу».
m – «Ничего, высохнет».
Вначале исследователь определяет направление реакции, содержащееся в ответе испытуемого (Е, I или М), а затем выявляет тип реакции: ED, OD или NP
Полученные данные в виде буквенных выражений (Е, I, М, Е’, М’, I ’, е, i, m) выносятся в таблицу.
Далее вычисляется GCR – коэффициент групповой конформности, или, иначе говоря, мера индивидуальной адаптации субъекта к своему социальному окружению. Он определяется путем сравнения ответов испытуемого со стандартными величинами, полученными путем статистического подсчета. Ситуаций, которые используются для сравнения, всего 14. Их значения представлены в таблице. В детском варианте количество ситуаций другое.
Если ответ испытуемого идентичен стандартному, ставится знак «+».
Когда в качестве стандартного ответа даются два типа ответов на ситуацию, то достаточно, чтобы хотя бы один из ответов испытуемого совпадал со стандартным. В этом случае ответ также отмечается знаком «+».
Если ответ субъекта дает двойную оценку, и одна из них соответствует стандартному, он оценивается в 0,5 балла.
Если же ответ не соответствует стандартному, его обозначают знаком «-».
Оценки суммируются, считая каждый плюс за единицу, а минус за ноль. Затем, исходя из 14 ситуаций (которые принимаются за 100%), вычисляется процентная величина GCR испытуемого.
Анализ тенденций
Анализ тенденций проводится на основании листа ответов испытуемого и ставит целью выяснение того, имело ли место изменение направления реакции или типа реакции испытуемого во время проведения опыта. Во время проведения опыта испытуемый может заметно изменить свое поведение, переходя из одного типа или направления реакций к другому. Наличие таких перемен свидетельствует об отношении испытуемого к своим собственным ответам, (реакциям). К примеру, реакции испытуемого экстрапунитивной направленности, (с агрессией на окружение), под влиянием пробужденного чувства вины могут смениться ответами, содержащими агрессию на самого себя.
Анализ предполагает выявить существование таких тенденций и выяснить их причины, которые могут быть различны и зависят от особенности характера испытуемого.
Тенденции записываются в виде стрелы, над которой указывается численная оценка тенденции, определяемая знаком «+» (положительная тенденция) или знаком «-» (отрицательная тенденция), и вычисляемая по формуле:
(а-б) / (а+б), где
«а» – количественная оценка проявления фактора в первой половине протокола (ситуации 1-12),
«б» – количественная оценка во второй половине (от 13 до 24).
Тенденция может быть рассмотрена как показатель в том случае, если содержится как минимум в четырех ответах испытуемого, и имеет минимальную оценку ±0,33.
Анализируются пять типов тенденций:
Тип 1. Рассматривается направление реакции в графе ОD. Например фактор Е’ появляется шесть раз: три раза в первой половине протокола с оценкой, равной 2,5 и три раза во второй половине с оценкой в 2 балла. Соотношение равно + 0,11. Фактор I’ появляется в целом только один раз, фактор М’ появляется три раза. Тенденция 1-го типа отсутствует.
Тип 2. Аналогично рассматриваются факторы Е, I, M.
Тип 3. Аналогично рассматриваются факторы е, i, m.
Тип 4. Рассматриваются направления реакций, не учитывая графы.
Тип 5. Поперечная тенденция – рассматривают распределение факторов в трех графах, не учитывая направления, например, рассмотрение графы OD указывает на наличие 4 факторов в первой половине (оценка, обозначенная 3) и 6 во второй половине (оценка 4). Аналогично рассматриваются графы ED и NP. В целях выявления причин той или иной тенденции рекомендуется проведение беседы с испытуемым, в процессе которой с помощью дополнительных вопросов экспериментатор может получить необходимую, интересующую его информацию.
Интерпретация результатов теста
Первый этап интерпретации заключается в изучении GCR, уровня социальной адаптации испытуемого. Анализируя полученные данные, можно предположить, что испытуемый, имеющий низкий процент GCR, часто конфликтует с окружающими, поскольку недостаточно адаптирован к своему социальному окружению.
Данные, касающиеся степени социальной адаптации испытуемого, могут быть получены с помощью повторного исследования, которое заключается в следующем: испытуемому повторно предъявляются рисунки, с просьбой дать в каждом задании такой ответ, который по его мнению было бы нужно дать в этом случае, т. е. «правильный», «эталонный» ответ. «Индекс рассогласования» ответов испытуемого в первом и во втором случаях дает дополнительную информацию о показателе «степени социальной адаптации».
На втором этапе, изучаются полученные оценки шести факторов в таблице профилей. Выявляются устойчивые характеристики фрустрационных реакций испытуемого, стереотипы эмоционального реагирования, которые формируются в процессе развития, воспитания и становления человека и составляют одну из характеристик его индивидуальности. Реакции испытуемого могут быть направлены на окружающую его среду, выражаясь в форме различных требований к ней, либо на самого себя как виновника происходящего, либо человек может занять своеобразную примиренческую позицию. Так, например, если в исследовании мы получаем у испытуемого оценку М – нормальную, Е – очень высокую и I – очень низкую, то на основании этого можно сказать, что субъект в фрустрационной ситуации будет с повышенной частотой отвечать в экстрапунитивной манере и очень редко в интропунитивной. То есть, можно сказать, что он предъявляет повышенные требования к окружающим, и это может служить признаком неадекватной самооценки.
Оценки, касающиеся типов реакций, имеют разный смысл.
Оценка OD (тип реакции «с фиксацией на препятствии») показывает, в какой степени препятствие фрустрирует субъекта. Так, если мы получили повышенную оценку OD, то это говорит о том, что во фрустрационных ситуациях у субъекта преобладает более чем нормально идея препятствия.
Оценка ED (тип реакции «с фиксацией на самозащите») означает силу или слабость «Я» личности. Повышение ED означает слабую, уязвимую личность. Реакции субъекта сосредоточены на защите своего «Я».
Оценка NP – признак адекватного реагирования, показатель той степени, в которой субъект может разрешать фрустрационные ситуации.
Третий этап интерпретации – изучение тенденций. Изучение тенденций может иметь большое значение в понимании отношения испытуемого к своим собственным реакциям.
В целом можно добавить, что на основании протокола обследования можно сделать выводы относительно некоторых аспектов адаптации испытуемого к своему социальному окружению. Методика ни в коем случае не дает материала для заключений о структуре личности. Можно лишь с большей долей вероятности прогнозировать эмоциональные реакции испытуемого на различные трудности или помехи, которые встают на пути к удовлетворению потребности, к достижению цели.
Счётные факторы классификации ответов:
Типы реакций | |||
Направленность реакций | О-D препятственно-доминантный | Е-D эго-защитный | N-P потребностно-неустойчивый |
Е — экстрапунитивная | Е’ — определённо выделяется, подчёркивается наличие фрустрирующего обстоятельства, препятствия. | Е — обвинение. Враждебность и т. п. проявляется в отношении внешнего окружения (иногда -сарказм). Субъект активно отрицает свою вину, проявляя враждебность к обвинителю. | E — содержится требование к другому конкретному лицу исправить фрустрирующую ситуацию. |
I — интропунитивная | I’ — фрустрирующая ситуация истолковывается как благоприятная или как заслуженное наказание, или же подчёркивается смущённость беспокойством других. | I — обвинение, осуждение объект предъявляет самому себе. Субъект признаёт свою вину, но отрицает ответственность, ссылаясь на смягчающие обстоятельства. | I — субъект, признавая свою ответственность, берётся самостоятельно исправить положение, компенсировать потери другому лицу. |
М — импунитивная | М’ — отрицает значимость или неблагоприятность препятствия, обстоятельств фрустрации. | М — осуждение кого-либо явно избегается, объективный виновник фрустрации оправдывается субъектом. | M — субъект надеется на благополучное разрешение проблем со временем, характерны уступчивость и конформность. |
Пересчет в проценты для взрослых
14 = 100 %
9,5 = 68 %
5 = 35,7 %
13,5 = 96,5
9 = 64,3
4,5 = 32,2
13 = 93
8,5 = 60,4
4 = 28,6
12,5 = 90
8 = 57,4
3,5 = 25
12 = 85
7,5 = 53,5
3 = 21,5
11,5 = 82
7 = 50
2,5 = 17,9
11 = 78,5
6,5 = 46,5
2 = 14,4
10,5 = 75
6 = 42,8
1,5 = 10,7
10 = 71,5
5,5 = 39,3
1 = 7,2
Средние статистические данные теста для групп здоровых лиц (в %)
Автор исследования | Направление реакции | Тип реакции | ||||
E | I | M | O-D | E-D | N-P | |
С. Розенцвейг 75 (9/12) | 40 | 30 | 30 | 20 | 50 | 30 |
Н.В. Тарабрина 62-64 (8/14) | 46-52 | 25-27 | 23-26 | 32-34 | 35-39 | 27-30 |
Таблица для пересчета баллов профилей в проценты
Балл Проц. Балл Проц. Балл Процент
0,5 2,1 8,5 35,4 16,5 68,7
1,0 4,2 9,0 37,5 17,0 70,8
1,5 6,2 9,5 39,6 17,5 72,9
2,0 8,3 10,0 41,6 18,0 75,0
2,5 10,4 10,5 43,7 18,5 77,1
3,0 12,5 11,0 45,8 19,0 79,1
3,5 14,5 11,5 47,9 19,5 81,2
4,0 16,6 12,0 50,0 20,0 83,3
4,5 18,7 12,5 52,1 20,5 85,4
5,0 20,8 13,0 54,1 21,0 87,5
5,5 22,9 13,5 56,2 21,5 89,6
6,0 25,0 14,0 58,3 22,0 91,6
6,5 27,0 14,5 60,4 22. 5 93,7
7,0 29,1 15,0 62,5 23,0 95,8
7,5 31,2 15,5 64,5 23,5 97,9
Профили
Суммарные баллы каждого из девяти счётных факторов записываются в таблицу профилей на протокольном бланке. В этой же таблице указывают общий суммарный балл и процент (от 24) всех ответов каждого направления (в строчке) и каждого типа (в столбик)
Таблица профилей:
Тип реакции | O-D | E-D | N-P | Сумма | % | Станд. |
E | ||||||
I | ||||||
M | ||||||
Сумма | ||||||
% | ||||||
Станд. |
Общая таблица GCR для взрослых
Номер ситуации | OD | ED | NP |
1 | M’ | E | |
2 | I | ||
3 | |||
4 | |||
5 | i | ||
6 | e | ||
7 | E | ||
8 | |||
9 | |||
10 | E | ||
11 | |||
12 | E | m | |
13 | e | ||
14 | |||
15 | E’ | ||
16 | E | i | |
17 | |||
18 | E’ | e | |
19 | I | ||
20 | |||
21 | |||
22 | M’ | ||
23 | |||
24 | M’ |
Таблица для пересчета в проценты GCR для взрослых
GCR Проц GCR Проц GCR Проц
14 100 9,5 68 5 35,7
13,5 96,5 9 64,3 4,5 32,2
13 93 8,5 60,4 4 28,6
12,5 90 8 57,4 3,5 25
12 85 7,5 53,5 3 21,5
11,5 82 7 50 2,5 17,9
11 78,5 6,5 46,5 2 14,4
10,5 75 6 42,8 1,5 10,7
10 71,5 5,5 39,3 1 7,2
Testing, Testing… – Элизабет А.
РозенцвейгОпубликованоearosenzweig
Опубликовано в Элизабет Розенцвейг MS CCC-SLP LSLS Cert. AVT
Теги:Аудиология, Слуховое развитие, Слуховая вербальная терапия, Дети, Когнитивное развитие, Образование, IEPs, IFSPs, Младенцы, Развитие речи, Грамотность, Родители, Специалисты, Социально-эмоциональное, Развитие речи, Подростки, Малыши
Тестирование и оценки вызывают множество эмоций как у родителей, так и у детей. При правильном использовании всесторонняя оценка обеспечивает меру прогресса ребенка и дорожную карту для дальнейших действий. Но как распутать паутину жаргона и вопросов, связанных с тестированием вашего ребенка? Давайте обсудим…
Тесты, основанные на критериях, в сравнении с нормами Тесты, основанные на критериях измеряют, знает ли испытуемый определенный материал или может выполнить определенное задание. Для маленьких детей эти тесты часто выглядят как контрольные листы (знает ли ваш ребенок следующие слова: собака, утка, медведь, овца и т. д.). Оценка тестируемого сравнивается с правильным ответом, а не с другими тестируемыми. Оценки, основанные на критериях, позволяют нам узнать, что делает ребенок, основываясь на своих собственных знаниях, а не по отношению к своим сверстникам или другим тестируемым. Результаты таких тестов могут дать нам информацию, например, «[Ребенок] демонстрирует навыки 15/25 в этом контрольном списке слухового развития» или «[Ребенок] выполняет все задания в возрасте 12–18 месяцев» или «[Ребенок] правильно назвал 85 % слов в этом списке».
Стандартные тесты, , с другой стороны, сравнивают успеваемость ребенка со средней выборкой населения и сравнивают ребенка с другими, прошедшими этот тест. Результаты таких тестов больше похожи на «[Ребенок] выполнил языковые задания на уровне 50-го процентиля по сравнению со сверстниками того же возраста». (Не волнуйтесь, если это звучит как запутанный жаргон — продолжайте читать, я объясню через минуту!)
Вопросы по тестированию Что оценивает этот тест? Что именно мы здесь тестируем? На рынке имеется больше коммерчески доступных тестов, чем я могу сосчитать (или чем вам хотелось бы прочитать), но прежде чем какой-либо профессионал даст оценку вашему ребенку, он должен сделать это вам (и ребенку, если он/она достаточно взрослый, чтобы понять, получив объяснение на уровне их развития), чтобы дать подробное объяснение того, о чем тест. Измеряет ли он язык (грамматика, словарный запас, прагматика/социальный язык), навыки чтения/письма, слуховые способности, общее развитие (крупная и мелкая моторика, навыки самопомощи, когнитивное развитие) и т. д.? Ориентирован ли тест на рецептивные (понимание) или выразительные (использование) языковые способности? Чтобы данные, которые мы получаем из теста, были значимыми, сначала мы должны быть уверены, что именно мы пытаемся измерить.
Пример объяснения для родителей будет выглядеть следующим образом:
«Сегодня мы собираемся провести тест, который называется EVT-2, тест на экспрессивную лексику, второе издание. Это тест для измерения навыков выразительного словарного запаса Лии. Это означает, что этот тест будет смотреть на то, сколько слов она использует сама по себе в своей речи. Я покажу ей картинку и попрошу подписать ее. Оценка позволит нам узнать, как количество слов, которые она знает и использует, сравнивается с другими детьми ее возраста с типичным слухом и развитием».Пример объяснения ребенку будет таким:
«Сегодня мы рассмотрим картинки в этой книге. Я покажу тебе картинку, а ты скажешь мне название того, что ты видишь. Если не знаешь, можно догадаться. Просто делай все возможное».Какая группа выборки используется для нормирования этого теста? Для стандартизированного теста (см. выше) стандарты оценки устанавливаются на основе показателей выборочной совокупности. Эта выборочная группа должна быть репрезентативной для большей группы людей, которые будут проходить тест с точки зрения географического положения, расы/этнической принадлежности, возраста, способностей и т. д. испытуемого, насколько это возможно, чтобы исключить предвзятость. Некоторые тесты нормированы специально для детей с нарушением слуха , но я бы их избегал. Почему? Ну, откровенно говоря, я не хочу, чтобы дети в моей практике чувствовали себя хорошо для ребенка с потерей слуха. Я хочу, чтобы у них все было хорошо. Период. Наши дети с потерей слуха не будут ходить в школу только с другими детьми с потерей слуха, и они, конечно же, не будут конкурировать за поступление в колледж или за работу в реальном мире только с другими людьми с потерей слуха, поэтому я хотят знать, как их навыки складываются по сравнению с населением в целом. В конце концов, нашей целью являются соответствующие возрасту речь, язык и навыки слушания.
Как насчет двуязычных детей? Некоторые тесты нормированы для детей, владеющих более чем одним устным языком, чаще всего английским и испанским. Другие не были нормированы для детей, говорящих на двух языках, поэтому мы должны интерпретировать оценки с осторожностью. Общее эмпирическое правило таково: если ребенок не был представлен в выборке, вы должны относиться к его баллам с недоверием, потому что в этих случаях мы сравниваем яблоки и апельсины, а не яблоки с яблоками. Вы по-прежнему можете проводить эти стандартизированные тесты для двуязычных детей, но вы можете получить больше информации из исходной оценки (увеличивается ли количество правильных элементов со временем?) и анализа элементов (см. ниже), чем из стандартной оценки.
Что мы будем делать с информацией, полученной в результате этого теста? Какой смысл? Как информация, которую мы здесь обнаружим, повлияет на цели терапии или образовательную программу моего ребенка? Как мы будем использовать эти данные, чтобы продолжать продвигать его вперед?
Учитывает ли этот тест диалектические различия? Как я уже говорил в этой статье, на самом деле существует множество разных способов говорить на английском (или на любом другом языке), которые так же подчиняются правилам и «правильны», как и стандартный диалект. Для ребенка из семьи, где афроамериканский (народный) английский (AA(V)E) является нормой, произнесение «the girl hair» вместо стандартного американского английского (SAE) «the girl’s hair» является столь же правильным притяжательным словом. форме, и ребенок не должен получать баллы за этот ответ. Оценщикам необходимо иметь четкое представление об общем развитии речи ребенка, а также о развитии речи в особых группах населения и диалектах, чтобы убедиться, что они не ошибочно занижают или завышают оценки детей за предполагаемые «ошибки», которые на самом деле вполне приемлемы в их сообществе. Теперь, когда наша область расширилась в нашем понимании и исследовании диалектов (узнав, что они на самом деле не являются
Подсчет баллов
Большинство оценок, основанных на нормах, оцениваются по «кривой нормы» или «кривой нормального распределения». По форме напоминающий колокол, утолщенный посередине, он отражает тот факт, что практически при любом человеческом поведении подавляющее большинство людей проявляют себя в среднем диапазоне, и все меньше и меньше людей относятся как к наиболее отсроченным, так и к наиболее продвинутым группам.
Оценка 100 — это среднее значение (подробнее об этом ниже), а затем мы отнимаем от среднего значения пятнадцать баллов в любом направлении, чтобы получить стандартное отклонение (сумма от среднего).
Большинство оценок дают несколько различных оценок и информацию об успеваемости тестируемого. Некоторые могут быть:
- Исходный балл: это количество вопросов, на которые испытуемый ответил правильно. Думайте об этом как о количестве «заработанных очков». Для двуязычных детей или детей с очень большой задержкой (настолько отсроченной, что невозможно определить стандартную оценку) сравнение изменений исходной оценки с течением времени может быть еще одним способом измерения успеваемости.
- Стандартная оценка: Это оценка того, как ребенок справился с выборкой. средний балл , давайте подумаем об этом как о «самом среднем ребенке в мире», набрал бы 100 баллов. Но мы знаем, что такого ребенка не существует. Например, для всех восьмилетних детей существует диапазон того, что считается нормальным. Если вы возьмете класс третьеклассников, около 50% будут читать на уровне третьего класса, 25% ниже этого уровня и 25% выше. Таким образом, стандартные баллы по тестам имеют «средний диапазон» 85-115. ПРЕДОСТЕРЕЖЕНИЕ: Я слышал, как специалисты говорят родителям, что дети с потерей слуха, набравшие 85 баллов по стандартизированным тестам, означают, что они полностью готовы конкурировать в основной среде и получают «наравне со слышащими сверстниками». Это 100% абсолютно не так. Еле-еле проскочить — это тяжелый, трудный способ пройти школу. «Просто хорошо» — это не нормально, и не позволяйте никому говорить вам по-другому. Оценка 85 означает, что вы едва достигаете нижнего предела того, что считается нормальным по сравнению с вашими коллегами по слуху… и это в идеальной, стерильной среде тестирования. Добавьте к этому шумный класс или учителя, который говорит слишком тихо, и у вас не останется места для маневра, прежде чем вы перейдете от «нормального» к «задержанному». За исключением других нарушений, расстройств обучения или когнитивных проблем, я хочу, чтобы дети в моей практике набирали от 100 до 115+ баллов по этим тестам. Это дает им пространство для маневра, необходимое для конкуренции. Их навыки достаточно хороши, чтобы у них было несколько «запасных» очков, чтобы компенсировать многие далеко не идеальные ситуации прослушивания, которые, как мы знаем, существуют в реальном мире.
- Стандартное отклонение: Как объяснялось выше, для нормальной кривой это представляет собой фрагменты в пятнадцать точек от среднего значения в любом направлении. Отклонение от среднего значения на одно стандартное отклонение +/- создает этот «средний диапазон» 85-115. Мы называем это подсчетом очков WNL, в пределах нормы. Все, что превышает одно стандартное отклонение выше или ниже 100, представляет собой исключительную производительность.
- Диапазон: Каждая стандартная оценка обычно имеет диапазон на несколько баллов выше и ниже, что также отражает успеваемость ребенка. Например, его SS может быть 92 с «доверительным интервалом» +/- 5 баллов, что означает 87-99. Это объясняет тот факт, что каждый из нас работает по-разному изо дня в день. Может, ребенок просто выздоравливает от простуды, а может, он действительно сегодня «в деле». В любом случае, мы знаем, что поведение меняется, поэтому этот диапазон представляет собой наше наилучшее предположение о том, куда он упадет в тот или иной день. Обратите внимание и на это, в свете того, что описано выше. Если доверительный интервал в баллах вашего ребенка иногда ставит его ниже этого диапазона 85-115, даже если его балл в день тестирования был, скажем, 89, тогда есть над чем работать!
- Процентиль: Процентиль говорит нам, где находится ребенок по отношению к своим сверстникам. Например, ребенок в 99-м процентиле означает, что 99 % других детей его возраста будут иметь баллы ниже него.
- Эквиваленты возраста и класса. Многие тесты также переводят оценку успеваемости ребенка в эквивалент возраста или класса. Предостережение: Хотя они могут быть несколько полезными, важно относиться к ним с долей скептицизма. Как обсуждалось выше, существует широкий диапазон того, что считается «нормальным развитием» для детей в каждом возрасте и классе. Кроме того,
Что следует учитывать при обследовании детей с потерей слуха
Как обсуждалось выше, я считаю важным оценивать детей с потерей слуха по сравнению с их слышащими сверстниками, а не по сравнению с детьми с потерей слуха. Вот еще несколько вещей, о которых следует подумать в отношении детей с потерей слуха и обследованиях:
- Проверьте ребенка в его лучших условиях. Слуховые аппараты ребенка работают? Соответствуют ли они золотому стандарту? Если нет, то это нечестная ситуация тестирования. Также лучше оценивать детей, когда они счастливы, здоровы, хорошо отдохнули и сыты. Мы все делаем все возможное в этих условиях. Кроме того, когда я осматриваю детей с потерей слуха, я не пытаюсь использовать «подсказки руками» или методы визуального отвлечения, распространенные в ПВТ, чтобы предотвратить использование чтения речи. Я хочу, чтобы ребенок получил всю возможную информацию (даже несмотря на то, что большинство детей, воспитанных с ПАВ, настолько аудиальны, что в любом случае не склонны искать рот говорящего). Я также хочу сесть со стороны ребенка, которому лучше всего помогают, если есть разница между ушами, и провести тест в акустически благоприятной среде. Если ребенок использует и FM-систему, используйте ее и для теста.
- Сравните хронологический возраст и возраст слуха. Хотя мы хотим добиться быстрого прогресса, чтобы сократить разрыв между хронологическим возрастом и возрастом слуха, также важно смотреть на результаты тестов в свете того, как долго ребенок имел хороший доступ к звуку И доступ к хорошему слушанию и разговорной речи. Четырехлетний ребенок, у которого в течение первых трех лет жизни была невыявленная потеря слуха, вполне может получить намного меньше своего хронологического возраста в своем первом раунде тестирования. Это не обязательно указывает на какую-то большую когнитивную проблему, просто на нехватку времени, опыта и доступа. Хронологический возраст по сравнению с возрастом слуха не должен быть оправданием для низких баллов или плохой успеваемости, а скорее объяснением, которое помогает нам лучше понять, где ребенок в настоящее время и как нам нужно работать, чтобы наверстать упущенное.
Что искать в Тестирование вашего ребенка
- Рост с течением времени. Ваш ребенок делает успехи более чем на один месяц в месяц? Это то, что необходимо, чтобы сократить языковой разрыв и помочь ей не отставать от своих слышащих сверстников. Большинство тестов недействительны, если их проводить слишком часто, но всестороннее тестирование каждые шесть месяцев должно выявить прогресс более чем за шесть месяцев. Если этого не происходит, пришло время перемен! См. ЭТУ статью для советов.
- Имеются ли зазоры или отверстия? Ваш ребенок преуспевает в рецептивных (понимание языка) задачах, но отстает в выразительных (использование языка) способностях? Хотя это нормально, что рецептивная речь развивается раньше выразительной (например, вы должны понимать слово «собака», прежде чем начнете использовать его самостоятельно), слишком большой пробел или пробел, который сохраняется с течением времени, является красный флаг.
- Анализ предмета. Хороший оценщик не только выставит вам баллы, но и проанализирует вопросы, на которые ваш ребенок ответил правильно, и те, которые он пропустил. Многие тесты на самом деле состоят из подтестов, каждый из которых измеряет свою область (например, один измеряет понимание основных понятий, один измеряет способность ребенка следовать слуховым указаниям, один измеряет словарный запас ребенка и т. д.). Анализ этих подтестов может позволить вам узнать конкретные области, в которых ваш ребенок может улучшить свои навыки. Анализ предметов позволит вам узнать слабые и сильные стороны и поможет вам и вашей терапевтической команде сформулировать цели, чтобы залатать эти дыры!
- Комплексная оценка. Всесторонняя оценка не позволяет сделать вывод о вашем ребенке на основе только одного теста. Вместо этого мы хотим рассмотреть все аспекты развития ребенка… и со всех сторон! Стандартные тесты должны охватывать все области речи, языка, аудирования и академических навыков. Контрольные списки навыков слушания и общения, заполненные родителями и учителями, дополняют картину. Портфолио академической работы учащегося может дополнить картину того, как ребенок использует свои навыки в классе. Все эти аспекты важны, и их следует учитывать при принятии решений о целях или размещении ребенка.
- Цели, ориентированные на результат. Если ребенок что-то пропустил на тесте, я хочу, чтобы для этого была написана конкретная цель. Мы сами виноваты как родители и специалисты, если видим, как ребенок совершает одну и ту же ошибку дважды, не пытаясь исправить ее другим способом!
Ничего не помогает!
Хотя слухо-вербальная терапия направлена на обучение родителей и помощь родителям в обучении быть первыми и лучшими учителями для своих детей, тестирование — это один из случаев, когда терапевт должен занять место в первом ряду. Чтобы сохранить валидность теста, мы не можем давать ребенку никаких подсказок, подсказок или помощи в выполнении заданий.
Ведь мы хотим знать то, что ребенок знает сам, а не то, что он знает с помощью мамы, или, в ситуациях крайнего родительского вмешательства, то, что знает сама мама. Даже похвала во время теста должна быть тщательно продумана. Можно говорить нейтральные комментарии, например: «Хорошая работа!» или «Мне нравится, как ты концентрируешься» или «Спасибо за терпение!» но давая оценочную обратную связь, например: «Вы поняли!» или «Этот был не прав» сводит на нет достоверность теста. Как бы тяжело это ни было, в тестовых ситуациях мы должны хранить молчание.Однако это не означает, что родители не участвуют во время тестирования. Как я упоминал выше, хороший профессионал должен убедиться, что и родители, и ребенок понимают цель и процедуру тестирования, и подробно объясняет результаты таким образом, чтобы это было удобно для родителей и было легко для понимания. Кроме того, хотя я не могу позволить родителям помогать своему ребенку с тестом, я люблю после него задавать вопросы, например: «Как вы думаете, он бы знал об этом дома?» или «Как вы думаете, его сегодняшнее выступление равно тому, что вы видите в реальной жизни, лучше или хуже?» Эти родительские наблюдения не влияют на окончательную оценку, но дают представление о ребенке в целом и помогают нам оценить его действия в контексте.
Помните, дети не развиваются в вакууме!Аудиологическое тестирование
Мы часто думаем о базовом аудиологическом тестировании как о «проверке слуха». но на самом деле есть множество других тестов, которые может выполнить ваш аудиолог. С точки зрения развития аудирования и разговорной речи наиболее важными из них являются тесты
на восприятие речи , которые измеряют способность ребенка понимать речь со своими устройствами и без них в тишине и в шуме. В этой категории есть много разных тестов. Одни измеряют способность ребенка указывать на картинку, которую он слышит из набора из четырех, другие проверяют способность повторять слова и звуки, третьи способность слышать и повторять предложения в шуме. Если ваш аудиолог не добавляет эти тесты к регулярным посещениям вашего ребенка, попросите их! Слышать тоны на аудиограмме — это здорово, но она не говорит нам, как ребенок на самом деле слышит самое важное — речь!Другие виды тестирования
Иногда ребенку полезно позвонить кому-то, кто не умеет слушать и говорить.
Часто эрготерапевт, нейропсихолог, специалист по чтению или другой специалист могут предоставить дополнительное измерение, которое поможет нам понять потребности ребенка, особенно если у ребенка помимо потери слуха есть дополнительные нарушения.
У вас есть вопросы о росте и развитии вашего ребенка? Вы изо всех сил пытаетесь сделать правильный выбор для его или ее академической программы? Ваш ребенок делает медленный или непоследовательный прогресс в обучении тому, как слушать и говорить? Консультации специалиста по аудированию и разговорной речи могут помочь вам сориентироваться. Свяжитесь со мной! Я могу помочь!
Нравится:
Нравится Загрузка…
Опубликованоearosenzweig Опубликовано вЭлизабет Розенцвейг MS CCC-SLP LSLS Cert. AVTTags:Аудиология, Слуховое развитие, Слуховая вербальная терапия, Дети, Когнитивное развитие, Образование, IEP, IFSP, Младенцы, Развитие речи, Грамотность, Родители, Профессионалы, Социально-эмоциональное, Развитие речи, Подростки, МалышиНи один компьютер не останется без внимания — Центр истории и новых медиа Роя Розенцвейга
«Я ненавижу Скантрон», — написал один раздраженный старшеклассник на онлайн-доске объявлений в начале этого года, имея в виду вездесущие формы с несколькими вариантами ответов, обведенные овалами. назван в честь корпорации, которая производит их с 1972. Старший ученик ответил: «Привыкайте к ним. Все колледжи посвящены Скантронам». Отметив, что оценка вопроса сочинения может занять 30 минут, старший ученик объяснил: «Вот почему большинство инструкторов используют Scantron или, по крайней мере, множественный выбор для большинства своих тестов».
Но тесты с несколькими вариантами ответов не только мучают учащихся; они также занимают центральное место во все более ожесточенных дебатах по поводу стандартизированного тестирования. Адекватно ли они измеряют обучение учащихся? Они просто заставляют учителей «учить на экзамене»? В нашей собственной дисциплине истории политики, учителя и ученые начали спорить о том, следует ли добавить историю в список предметов, изучаемых в школах в соответствии с Законом «Ни одного отстающего ребенка». И мы можем с уверенностью предсказать, что, когда в этом году снова будут проводиться тесты по истории Национальной оценки образовательного прогресса, мы увидим новый раунд заламывания рук по поводу того, «почему студенты не знают никакой истории». Теперь национальная комиссия, призывающая к ответственности, поднимает уровень дебатов, рассматривая возможность распространения стандартизированного тестирования на высшее образование.
Такие студенческие жалобы и споры взрослых о стандартизированных тестах могут скоро устареть, если, как мы утверждаем, цифровая технология, которая позволяет студентам делиться своими жалобами в Интернете, подрывает саму природу экзаменов с несколькими вариантами ответов. Калькулятор навсегда изменил математическое образование — в конце концов, пробиваясь в тестовую комнату, когда стало ясно, что деление в длинных числах стало бесполезным пережитком прошлого — что, если современные технологии собираются сделать формат этих тестов таким же причудливым, как слайд? правило? Что, если у школьников будет в кармане устройство, способное быстро и точно ответить, скажем, на вопросы по истории с несколькими вариантами ответов? Будут ли учителя сталкиваться с бунтом со стороны (и без того беспокойных) учеников, которые будут удивляться, почему их проверяют на способность ответить на что-то, о чем они могут быстро узнать с помощью этого волшебного устройства?
Оказывается, у большинства студентов такое устройство уже есть в кармане, и для них оно не столько волшебное, сколько обыденное. Это называется мобильный телефон. Этот карманный коммуникатор быстро становится порталом для других одновременно замечательных и обычных современных технологий, которые, по крайней мере, в нашей области истории, позволят устройствам с удивительно высокой степенью точности отвечать на вопросы с несколькими вариантами ответов, используемые в тысячи уроков истории в старших классах и колледжах, а также значительная часть стандартизированных тестов, которые используются для оценки того, правильно ли школы «обучают» наших учеников. Эти технологические разработки, вероятно, поставят тест с множественным выбором на грань устаревания, создав существенную проблему для представления истории и других дисциплин в виде набора фактов или интерпретаций одного предложения, а также для механического заучивания, которое неизбежно уходит в прошлое. вместе с таким подходом.
Удивительно, но тестированию с множественным выбором меньше века. По словам психолога Франца Самельсона, вопрос с несколькими вариантами ответов впервые был опубликован в 1915 году в «тесте на чтение про себя», разработанном Фредериком Дж. Келли, директором Учебной школы при Государственной педагогической школе в Эмпории, Кан. Келли. Инновация частично отреагировала на растущие жалобы на субъективность оценок в стандартизированных тестах, которые становились все более распространенными на рубеже веков. Но что не менее важно, он хотел сделать тесты дешевле и быстрее. Как можно проводить массовые стандартизированные тесты и устанавливать «объективные» нормы тестов без какого-либо быстрого и простого метода оценивания? Потребность в легко поддающихся оценке экзаменах стала еще более насущной два года спустя, когда Соединенные Штаты вступили в Первую мировую войну, и психологи убедили военачальников, что измерение «интеллектуальных способностей» почти двух миллионов солдат повысит эффективность вооруженных сил.
В середине 1920-х годов Совет колледжей добавил вопросы с несколькими вариантами ответов к своим тестам SAT, которые раньше представляли собой набор вопросов для эссе, и закрепил триумф нового формата. «Тест с множественным выбором — эффективный, количественный, способный охватить обширные области предмета и легко генерировать данные для сложного статистического анализа, — пишет Самельсон, — стал «символом… американского образования». Попутно технологии тестирования становились все более изощренными — от трафаретов для подсчета очков, разработанных во время Первой мировой войны, до машины для подсчета тестов IBM 805, появившейся в конце XIX века.30-х годов и мог читать карандашные пометки на бланках и машинах Scantron, которые сегодня являются проклятием для старшеклассников и студентов колледжей.
IBM 805 и Scantron были эффективными и широко распространенными технологиями 20-го века. Но они меркнут по сравнению с мощью и повсеместностью двух технологических разработок 21-го века, которые могут изменить дебаты по поводу тестирования с множественным выбором. Первая — это Всемирная паутина — не только крупнейший архив человеческих знаний за всю историю нашего вида, но и самый открытый и доступный.
Мы уже слышим смешки наших коллег: «Вы хотите отправить студентов в дебри Сети, чтобы найти ответы на экзаменационные вопросы?» Ученые в области истории (а также в других областях) обычно скептически относятся к состоянию знаний в Интернете. В 2004 году Леон Ботштейн, президент Бард-колледжа, а также историк, сказал The New York Times , что поиск Google в Интернете «перегружает вас слишком большим количеством информации, большая часть которой безнадежно ненадежна или не имеет отношения к делу. Это как искать потерянное кольцо в вакуумном пакете. В итоге вы получите в основном крошки от рогаликов и грязь». Такие ученые, как Ботштейн, привыкшие к подробному анализу отдельных документов на предмет достоверности и важности, с ужасом смотрят на множество веб-страниц с фактическими ошибками или откровенными выдумками. Даже если бы студенты могли погуглить любую тему со своего мобильного телефона, они наверняка выбрали бы некоторые из этих заблудших веб-страниц, отобрали бы «крошки от рогаликов и грязь» и завалили бы свои экзамены.
Но что, если, как в статистике, крайности уравновешивают друг друга, а ошибки заглушаются правдой? Достаточно ли исторической правды в Сети, чтобы это затопить, или психиатрическая лечебница заправляется?
У компьютерщиков есть оптимистичный ответ для обеспокоенных ученых. Они утверждают, что огромный масштаб и связанный характер Интернета позволяют ему быть «правильным» в совокупности, но иногда очень ошибочным на конкретных страницах. Сеть «побудила миллионы пользователей вводить триллионы символов для создания миллиардов веб-страниц с содержанием в среднем низкого качества», — пишут ученые-компьютерщики Руди Чилибрази и Пол Витаньи в эссе 2004 года. сама масса информации, доступной почти по каждой мыслимой теме, делает вероятным, что крайности отменяются, а большинство или среднее имеет смысл в низкокачественном приблизительном смысле». Другими словами, хотя в Сети много плохо написанных и ошибочных страниц, в целом носитель на самом деле неплохо справляется с кодированием значимых данных.
В то время как открытость Сети позволяет любому получить доступ, она также позволяет любой машине, подключенной к ней, сканировать эти миллиарды документов, что приводит ко второму развитию, которое ставит под угрозу тесты с множественным выбором: средства для обработки и манипулировать Интернетом для получения значимой информации или ответов на вопросы. Ученые-компьютерщики давно мечтали о достаточно большом корпусе текста, который можно было бы подвергнуть множеству алгоритмов, которые могли бы выявить лежащий в его основе смысл и связи. Теперь у них есть этот корпус, более чем достаточно большой, чтобы совершать новые замечательные подвиги с помощью теории информации.
Например, исследователи Google продемонстрировали (но еще не представили широкой публике) мощный метод создания «достаточно хороших» переводов — не путем понимания грамматики каждого отрывка, а путем быстрого сканирования и сравнения похожих фраз на бесчисленных электронных носителях. документов на оригинальном и втором языках. При наличии достаточно больших объемов слов на разных языках машинная обработка может найти параллельные фразы и сократить любой документ до серии перестановок слов. Там, где когда-то казалось необходимым, чтобы человек помогал компьютеру переводить навыки или обучал эту машину основам языка, теперь достаточно быстрых алгоритмов, работающих с невообразимо большими объемами текста. Так ли хороши такие новые компьютерные переводы, как квалифицированный двуязычный человек? Конечно, нет. Достаточно ли они хороши, чтобы понять суть текста? Абсолютно. Так хорошо, что Агентство национальной безопасности и Центральное разведывательное управление все чаще полагаются на такого рода технологии для сканирования, сортировки и добычи гигантских объемов текста и сообщений (независимо от того, нравится это остальным или нет).
Как оказалось, «достаточно хорошо» — это именно то, что касается экзаменов с несколькими вариантами ответов. Простая, механическая оценка стала возможной благодаря ограничению возможных ответов, подобно тому, как переводчик получает четыре возможных перевода предложения. Эти четыре возможности не только значительно облегчили бы работу переводчика, но и толковый переводчик — даже тот, у кого нет понимания переводимого языка — мог бы найти правильный ответ, распознав неловко (или правильно) звучащие фрагменты в каждом из возможных вариантов. отвечать. Ограничивая ответы определенными возможностями, вопросы с несколькими вариантами ответов обеспечивают ограниченную область информации, где тонкие подсказки как в вопросе, так и в нескольких ответах позволяют проницательным испытуемым делать полезные ассоциации и исключать определенные ответы (на протяжении десятилетий подготовка к экзаменам такие компании, как Kaplan Inc., хорошо зарабатывают на жизнь, обучая студентов этому трюку). «Игра» вопроса может иметь место, даже если испытуемый не знает правильного ответа и не совсем знаком с предметом.
Существуют ли алгоритмы, которые могли бы идентифицировать связь между вопросом с несколькими вариантами ответов и правильным ответом, предоставляя таким образом средства эффективного извлечения этих миллиардов слов, внезапно доступных бесплатно для всех, у кого есть подключение к Интернету — группа, которая уже включает многих людей с мобильными телефонами? ? Чтобы проверить соотношение точной и неточной исторической информации в Интернете и развить идею о том, что машинное мышление может, как и в случае с новыми службами компьютерного перевода, давать «достаточно хорошие» ответы на исторические вопросы, один из нас, Дэниел, создал программное обеспечение. агент по имени «H-Bot». На веб-сайте Центра истории и новых медиа у нас есть общедоступное бета-тестирование этого программного обеспечения, которое вы можете использовать, чтобы отвечать на простые фактические вопросы об истории, используя естественный язык (http://chnm.gmu.edu/tools/h-bot). ). Например, спросите его: «Когда родился Нельсон Мандела?» Он отвечает: «Нельсон Мандела родился 18 июля 1918». Хотя у него есть быстрый режим, который сначала просматривает «надежные источники» (то есть онлайн-энциклопедии и словари), он также может использовать всю сеть для ответов на вопросы, используя алгоритмы, взятые из компьютерных наук.
Предположим, вы хотите узнать, когда Чарльз Линдберг совершил свой знаменитый полет в Париж. Спросите H-Bot: «Когда Чарльз Линдберг прилетел в Париж?» заставит программное обеспечение (используя его «чистый» режим, который не просто пытается найти достоверную статью в энциклопедии) запросить у Google веб-страницы, содержащие слова «Чарльз Линдберг», «полет» и «Париж». Затем H-Bot сканировал эти страницы как единую массу необработанного текста о Линдберге. Он будет искать, в частности, слова, похожие на годы (т. е. положительные трех- и четырехзначные числа), и действительно найдет много примеров «1902» и «1974» (годы рождения и смерти Линдберга). Но самое главное, статистически показательный всплеск произошел в районе «1927 года», года, когда Линдберг совершил свой новаторский полет в Париж. Сканируя и обрабатывая множество веб-сайтов — такие сайты, как официальный сайт Фонда Линдберга и сайт энтузиастов-любителей Ace Pilots, на одном дыхании — H-Bot мог бы точно ответить на исторический вопрос пользователя, игнорируя как статистические выбросы несколько сайтов, которые неправильно указывают год. своего полета.
В то время как простые статистические методы могут обрабатывать сырой материал Сети, чтобы ответить на основные исторические вопросы, более сложные алгоритмы могут дать ответы на более сложные вопросы. Используя теорию под названием «нормализованное информационное расстояние», специальная версия H-Bot, запрограммированная на выполнение тестов с множественным выбором, может решать не только пары вопросов и ответов, подобные вопросу Линдберга, но и вопросы из экзамена по истории США NAEP, которые предположительно ссылаться на процессы исторического мышления более высокого порядка, и на это можно ответить только в том случае, если вы действительно понимаете предмет и способны рассуждать о прошлом. Например, 1994 Вопрос NAEP: «Какова цель Билля о правах?» Предлагались следующие варианты:
(a) Указать, сколько американцы должны платить налогов
(b) Защищать такие свободы, как свобода слова
(c) Описывать работу президента и Конгресса
(d) ) Сделать Вашингтон, округ Колумбия, столицей Соединенных Штатов
H-Bot не может понять принципы налогообложения, свободы или компетенции исполнительной и законодательной власти. Но ему не нужно понимать эти понятия, чтобы правильно реагировать. Вместо этого, чтобы выяснить значение Билля о правах, H-Bot обнаружил, что веб-страницы, на которых встречается фраза «Билль о правах» и слово «цель», содержат слова «свобода» и «выражение» чаще, чем слова например, «налоги», «президент» или «Вашингтон». (Чтобы быть более точным, алгоритмы H-Bot фактически сравнивали нормальную частоту этих слов в Интернете с частотой этих слов на соответствующих страницах.) Таким образом, H-Bot правильно предположил, что ответ был (б).
Мы дали H-Bot этот и десятки других общедоступных вопросов с несколькими вариантами ответов из экзамена NAEP по истории Америки для четвертого класса, на котором такие вопросы составляли около двух третей от общего числа. Он получил респектабельные 82 процента прав — намного лучше, чем средний студент. Более того, экспериментальный H-Bot — это лишь предварительная версия, запрограммированная скромным историком науки с помощью (очень умного) старшеклассника Саймона Корнблита. Представьте, как хорошо было бы с финансированием и легионами докторов математических наук решать проблемы от имени таких гигантов поисковых систем, как Google.
Прежде чем мы с пренебрежением отнесемся к мастерству H-Bot в сдаче тестов как к салонному трюку, мы должны помнить, что мы построили большую часть нашей образовательной системы вокруг таких тестов с множественным выбором. Они вездесущи даже в классах колледжей и часто упоминаются как свидетельство национального «невежества» в истории и других областях. Более того, наша привязанность к этим тестам (как хорошо знал Фредерик Келли) больше связана с экономикой и технологиями, чем с преподаванием и обучением. «Мы используем эти тесты, — пишет Сэм Уайнберг, когнитивный психолог, преподающий в педагогической школе Стэнфордского университета, в журнале 9.0028 The Journal of American History, «не потому, что они исторически обоснованы или предсказывают будущее участие в исторических исследованиях, а потому, что они могут быть прочитаны машинами, которые создают легко читаемые графики и гистограммы».
Кроме того, следует помнить о сопротивлении, которое сопровождало проникновение калькулятора в экзаменационную комнату. Скептики возмущались: «Разве американские студенты не оказались бы в невыгодном положении, если бы не могли умножать без машины? Разве способность выполнять такие процессы без посторонней помощи не ведет к более глубокому пониманию самой математики?» Но большинство людей быстро поняли, что предоставление калькуляторов студентам освобождает их для работы над более сложными и важными аспектами математики, вместо того чтобы беспокоиться о запоминании таблицы умножения.
Сочетание мобильного телефона и великолепного, хотя и несовершенного коллективного создания Интернета с относительно простыми математическими формулами дало нам бесплатную версию того, что наш проректор и историк Питер Стернс предложил нам пару лет назад — Cliolator, игра о музе истории и калькуляторе. Стернс заметил, что многие преподаватели будут сопротивляться принятию Cliolator, поскольку у них есть калькулятор. Но он также утверждал, и, на наш взгляд, справедливо, что это улучшит историческое образование, вытеснив фетишизацию фактического запоминания.
Более того, поскольку Сеть продолжает свой экспоненциальный рост, она будет (опять же, в целом) все более и более точной транскрипцией человеческого знания. Основной принцип теории информации заключается в том, что чем больше корпус, тем точнее он кодирует смысл и тем полезнее он для приложений интеллектуального анализа данных. И подумайте, что произойдет с качеством информации в Сети после завершения обширных инициатив Google и других по оцифровке высококлассной информации в книгах.
К тому времени, когда нынешние учащиеся начальной школы поступят в колледж, им, вероятно, покажется странным запрет на использование цифровых устройств, таких как мобильные телефоны, подключенных к Интернет-службе, такой как H-Bot, чтобы узнать, когда родился Нельсон Мандела. это означало бы сообщить студентам, что они не могут использовать калькулятор для выполнения рутинных арифметических действий в алгебраическом уравнении. Предоставляя гораздо больше, чем просто вопрос с открытым ответом, тесты с несколькими вариантами ответов дают учащимся — и, что, возможно, более важно в будущем, их цифровым помощникам — более чем достаточно информации для получения даже довольно сложного ответа из Интернета. Джин будет выпущен из бутылки, и нам придется начать думать о более осмысленных способах оценки исторических знаний или «невежества».
Примерно в то же время, когда Келли впервые применил тест с несколькими вариантами ответов на границе Канзаса, педагоги-психологи Дж. Карлтон Белл и Дэвид Ф. Макколлум, без сомнения, под влиянием той же мании к тестированию, которая охватила всю страну, начали исследование «достижений» студентов-историков в Техасе. Вначале они предполагали, что могли бы, например, оценить «способность студентов понимать события настоящего в свете прошлого» или их «умение просеивать и оценивать массу разнородных материалов» и «конструировать … прямой и вероятный отчет», или их способность давать «рефлексивные и проницательные ответы на «вопросы мысли» о данной исторической ситуации». Затем Белл и Макколлум отметили последнюю возможность того, что «исторические способности можно рассматривать как готовность, с которой ученики отвечают на вопросы, раскрывающие диапазон их исторической информации», хотя «это, возможно, самый узкий и… наименее важный тип исторических способностей». ». Но, продолжали они, «это тот, который легче всего проверить, и поэтому он был выбран для изучения в настоящем исследовании». Как отмечает Уайнбург, «хотя, возможно, это был первый случай, это был не последний случай, когда простота измерения, а не приоритет понимания предмета, определяла форму и контур исследовательской программы».
Конечно, Беллу и Макколлуму было бы еще легче, если бы они узнали об инновациях Келли в тестировании. Вместо этого они попросили студентов, например, записать «причину исторической важности каждой из 10 репрезентативных дат» (например, 1789 г.). Это потребовало от них, к их разочарованию, частичного признания ответов, в том числе некоторых «оцененных совершенно произвольно». Однако очень скоро их фактологический подход соединится с, казалось бы, объективным тестом с множественным выбором, и историческое понимание сведется к заполненному кружку в форме.
Теперь, когда новая технология угрожает скромной технологии экзамена с несколькими вариантами ответов, у нас есть возможность вернуться к некоторым более широким и глубоким измерениям понимания истории и других предметов, которые Белл и Макколлум хорошо знали до того, как они другие устремились по пути, который привел нас и наших учеников в чистилище Скантрона. Белл и Макколлум знали (как и студенты, которые жалуются на скантроны), требуется значительно больше времени и усилий, чтобы оценить вопросы эссе, которые, например, измеряют способность учащегося синтезировать исторические источники в сложное повествование. Но, как показывают вопросы, основанные на документах, широко используемые в тестах по истории Advanced Placement, такие экзамены не являются несовместимыми со стандартизированными национальными измерениями. Они просто требуют немного больше времени, чтобы оценить. Действительно, создатели первоначального экзамена по истории США NAEP беспокоились о том, что «одним из недостатков многих традиционных оценок является то, что они часто представляют фрагменты информации или проблемы, которые нужно решать изолированно». Тем не менее, их ответ — размещение связанных вопросов с несколькими вариантами ответов вместе в «тематических блоках» с добавлением нескольких коротких вопросов «сконструированного ответа» — лишь скромно решил эту проблему.
Хотя мы склонны считать, что «новые технологии» всегда экономят время и деньги, брак Интернета с мобильным телефоном предвещает закат недорогих технологий тестов с множественным выбором и оценочных машин. Но мы не будем среди провожающих на похоронах многовариантного теста.