23. Конструктная валидность. Конвергентная и дискриминантная валидности
Читайте также
21. Определения валидности. Важнейшие составляющие валидности
21. Определения валидности. Важнейшие составляющие валидности Валидность (англ. valid – «действительный, пригодный, имеющий силу») – комплексная характеристика методики (теста), включающая сведения об области исследуемых явлений и репрезентативности диагностической
22. Основные типы валидности. Понятие «комплекса валидности». Обоснование необходимости периодической валидизации психодиагностических методик
22. Основные типы валидности. Понятие «комплекса валидности». Обоснование необходимости периодической валидизации психодиагностических методик Классификация типов валидности в достаточной мере условна, так как нередко для различных критериев валидности применяются
24. Факторная валидность
24. Факторная валидность Факторная валидность. Прямое отношение к характеристике конструктной валидности имеет факторный анализ, позволяющий строго статистически проанализировать структуру связей показателей исследуемого теста с другими известными и латентными
25. Дифференциальная валидность. Валидность по возрастной дифференциации
25. Дифференциальная валидность. Валидность по возрастной дифференциации Дифференциальная валидность – вид конструктной валидности, рассматривающей внутренние взаимоотношения между психологическими факторами, диагностируемыми с помощью психодиагностической
26. Критериальная валидность
26. Критериальная валидность Критериальная валидность – комплекс характеристик, включающий текущую и прогностическую валидности методики и отражающий соответствие диагноза и прогноза определенному кругу критериев измеряемого явления. В качестве критерия
27. Синтетическая и инкрементная валидности
27. Синтетическая и инкрементная валидности Синтетическая валидность. Более эффективным с точки зрения практической направленности теста (его адекватности как средства диагноза и прогноза реальной деятельности) является соотнесение результатов с критериальными
28. Текущая и эмпирическая валидности
28. Текущая и эмпирическая валидности Текущая валидность (диагностическая, конкурентная) – характеристика теста, отражающая его способность различать испытуемых на основании диагностического признака, являющегося объектом исследования в данной методике. В более узком
29. Прогностическая валидность
29. Прогностическая валидность Прогностическая валидность – информация о том, с какой степенью точности и обоснованности методика (тест) позволяет судить о диагностируемом психологическом качестве спустя определенное время после измерения. Прогностическая валидность
32. Критерий валидности. Основное психометрическое неравенство. Типы критериев валидности
Глава 5. Оценка валидности утверждений
Глава 5. Оценка валидности утверждений Оценка валидности утверждений (иногда обозначаемая аббревиатурой ОВУ) на сегодняшний день является наиболее популярной методикой для оценки правдоподобности утверждений, представленных в устной форме. Эта методика была
Валидность
Валидность В каждом исследовании есть переменные и отношения между ними. Поэтому, когда мы хотим описать исследование, центральным является конструкт переменных: какого вида различия изучаются и какими способами? Если мы хотим выйти за рамки описания и перейти к оценке
Причины искажения валидности
Причины искажения валидности Как мы увидели, конечной целью планирования исследования всегда является достижение валидных выводов об изучаемом феномене. Неудачный исследовательский план ставит валидность под сомнение, не устраняя спорных моментов и ограничивая
Валидность
Валидность При оценке валидности теста ставится следующий вопрос: измеряет ли тест то, что, как предполагается, он должен измерять? Если это, к примеру, IQ-тест, действительно он измеряет различия в уровне интеллекта или различия показателей испытуемых обусловлены чем-то
Глава 5. Оценка валидности утверждений
Глава 5. Оценка валидности утверждений Оценка валидности утверждений (иногда обозначаемая аббревиатурой ОВУ) на сегодняшний день является наиболее популярной методикой для оценки правдоподобности утверждений, представ-, ленных в устной форме. Эта методика была
Валидность
Валидность Первую важную информацию такого рода, которая будет постоянно обсуждаться в данной книге, часто называют «критерием валидности». Вопрос здесь состоит в том, насколько результаты тестирования измеряют то, что они должны измерять в соответствии со своим
Валидность, Конвергентная И Дискриминантная — это, определение слова, понятие. Что такое Валидность, Конвергентная И Дискриминантная, значение, словарь, энциклопедия
Большой словарь эзотерических терминов — редакция д.м.н. Степанов А.М
(от англ. valid – пригодный), один из основных критериев качества опыта (например, в психологии для оценки доверия к тестам). Проблема валидности возникает в процессе разработки и практического применения теста, когда ставится задача установить соответствие между степенью…
Психологическая энциклопедияСм. валидность, черты.
Психологическая энциклопедия
— степень, в которой результаты исследования, системы измерений или статистики являются точными или представляют то, что были предназначены представлять.
Психологическая энциклопедия
(англ. valid — пригодный) — качество метода психологического исследования, выражающееся в его соответствии тому, для изучения и оценки чего он изначально был предназначен.
Психологическая энциклопедия
(Validity). Понятие, обозначающее, что тест измеряет то, для чего он предназначен.
Психологическая энциклопедия
Степень нашей уверенности в том, что тест, измерение или эксперимент действительно выполняет ту функцию, для которой они предназначены. Этот весьма общий термин по-разному используется в психологии. В процессе эксперимента мы можем оценить: 1. Внутреннюю валидность:…
Психологическая энциклопедия
Неформальная процедура, используемая для определения валидности теста посредством просмотра каждого пункта и оценки степени, в которой он выполняет предназначенную ему роль в тесте.
Психологическая энциклопедия
Своего рода предварительная, интуитивная оценка содержательной валидности теста. Степень, в которой пункты теста, как кажется, имеют интуитивную, априорную связь с моделями поведения, которые, как считается, они тестируют. Также называется валидное-тью здравого смысла.
Психологическая энциклопедия
Метод установления валидности нового теста посредством корреляции значений, полученных по нему, со значениями, полученными по другому тесту с установленной валидностью. Наиболее типичный случай — тесты интеллекта, когда вновь разработанные тесты сравниваются с известными тестами…
Психологическая энциклопедия
В принципевалидность теста, представленная тем фактом, что пункты, входящие в него, по определению, являются пунктами, отражающими измеряемые аспекты. В статье определение обратите внимание на то, что практически это понятие включает в себя нечто большее, чем кажется на первый…
первые итоги – тема научной статьи по психологическим наукам читайте бесплатно текст научно-исследовательской работы в электронной библиотеке КиберЛенинка
Национальный психологический журнал №2(18)/2015, 115-122 УДК: 159.9.072
Оригинальная статья
National Psychological Journal #2(18)/2015, 115-122 doi: 10.11621/npj.2015.0212
Original Article
Оценка конвергентной и дискриминантной валидности русскоязычной версии методики MMPI-2: первые итоги
Э.И. Мещерякова А.В. Ларионова, С.А. Богомаз Томский государственный университет, Томск, Россия
Поступила 18 апреля 2014/ Принята к публикации: 7 мая 2015
Evaluation of convergent and discriminant validity of the Russian version of MMPI-2: First results
Emma I. Mescheriakova, Anastasia V. Larionova, Sergey A. Bogomaz Tomsk State University, Tomsk, Russia
Received: 18 April, 2014 / Accepted for publication: May 7, 2015
«О статье представлены результаты проведения проверки конструктной валидности новой версии методики Миннесотского мультифакторного исследования В личности (MMPI-2), рестандартизация которой была начата в 1982 г. (J.N. Butcher, W.G. Dahlstrom, J.R. Graham, A. Tellegen, B. Kaemmer) и продолжается по настоящее время. Интерес профессионального сообщества к новой версии методики обусловлен ее преимуществом перед старой версией, заключающемся в реструктуризации и включении новых шкал, которые открывают дополнительные возможности психодиагностики личности. Проверка конструктной валидности проводилась с помощью трех современных методик: «Опросник качества жизни и удовлетворенности» (краткий вариант М. Рицнера и др. в адаптации Е.И. Рассказовой), «Шкала базисных убеждений личности» Р. Янофф-Бульман (перевод и адаптация О. Кравцовой) и «Оценка личных достоинств», разработанная Е.Н. Осиным на основе Values-In-Action К. Петерсона и М. Селигмана. Выбор психодиагностических методик осуществлялся в соответствии с тенденциями современной психологии к ориентации на позитивные феномены, расшифровки потенциалов субъектности как потребности и способности к самодетерминируемому, самоорганизуемому, саморегулируемому и самоконтролируемому поведению. Авторы провели процедуру конструктной валидности на респондентах группы «норма», выборку составили 205 человек (62% женщин, 38% мужчин). В процессе проведения процедуры конструктной валидности анализировались дополненные и расширенные проверочные шкалы (FI, BF, FP, S и К) и шесть из десяти основных шкал методики (D, Pd, Pa, Pt, Sc, Si) методики MMPI-2. Полученные результаты позволяют сделать выводы о конструктной валидности рассматриваемых шкал и о возможностях использования методики для системного изучения потенциала личности, что облегчит задачу исследователя, избавит его от применения батареи тестовых методик. Данная статья представляет собой первый этап проверки конструктной валидности, следующий этап предполагает рассмотрение факторной структуры проверяемых шкал. Ключевые слова: психодиагностика, тест MMPI-2, конструктная, конвергентная, дискриминантная валидность, психопатология, позитивная психология.
Ир’he paper presents the results of construct validity testing for a new version of the MMPI-2 (Minnesota Multiphasic Personality Inventory), which restandardization T started in 1982 (J.N. Butcher, W.G. Dahlstrom, J.R. Graham, A. Tellegen, B. Kaemmer) and is still going on. The professional community’s interest in this new version of the Inventory is determined by its advantage over the previous one in restructuring the inventory and adding new items which offer additional opportunities for psychodiagnostics and personality assessment. The construct validity testing was carried out using three up-to-date techniques, namely the Quality of Life and Satisfaction with Life questionnaire (a short version of Ritsner’s instrument adapted by E.I. Rasskazova), Janoff-Bulman’s World Assumptions Scale (adapted by O. Kravtsova), and the Character Strengths Assessment questionnaire developed by E. Osin based on Peterson and Seligman’s Values in Action Inventory of Strengths. These psychodiagnostic techniques were selected in line with the current trends in psychology, such as its orientation to positive phenomena as well as its interpretation of subjectivity potential as the need for self-determined, self-organized, self-realized and self-controlled behavior and the ability to accomplish it. The procedure of construct validity testing involved the «norm» group respondents, with the total sample including 205 people (62% were females, 32% were males). It was focused on the MMPI-2 additional and expanded scales (FI, BF, FP, S и К) and six of its ten basic ones (D, Pd, Pa, Pt, Sc, Si). The results obtained confirmed construct validity of the scales concerned, and this allows the MMPI-2 to be applied to examining one’s personal potential instead of a set of questionnaires, facilitating, in turn, the personality researchers’ objectives. The paper discusses the first stage of this construct validity testing, the further stage highlighting the factor structure of the scales mentioned. Keywords: psychodiagnostics, test MMPI-2, construct, convergent, discriminant validity, psychopathology, positive psychology.
нтенсивная динамика современной жизни обуславливает изме-■ нения общественных норм, правил, ценностей и идеалов, что влечет за собой необходимость поиска новых методов исследования, диагностики и оценки личности и общества. В связи с этим
ку личности в норме и патологии и положительно зарекомендовавшую себя в психодиагностической практике зарубежной и отечественной психологии. В России методика ММР1 известна в двух в двух модификациях: как Методика многостороннего исследования личности
Необходимость рестандартизации методики ММР1 и создания ее новой версии — ММР1-2 была обусловлена, во-первых, тенденцией современной постнеклассической психологии к использованию антропного принципа со смещением акцентов от патоцентрических, клинических феноменов к «проблеморазрешающим», саноцентрическим; во-вторых, появлением в психопатологии новых данных, «размывающих» границы нормы и патологии; в-третьих, разработкой новых теорий личности
разрабатывается множество новых тестовых методик, опросников, осуществляется адаптация зарубежных тестов, ведется их обновление, дополнение и модификация. Данная тенденция затронула одну из самых репрезентативных в психодиагностике методик — методику MMPI (Minnesot Multiphasic Personality Inventory), позволяющую осуществлять психодиагности-
ММИЛ (Березин, 1994) и как Стандартизованный многофакторный метод исследования личности СМИЛ (Собчик, 2007). В обоих вариантах авторами модификаций была проделана колоссальная работа, направленная не только на валидизацию методик, но и на разработку собственных инструментов диагностики. Так, СМИЛ, по сравнению
Эмма Ивановна Мещерякова — доктор психологических наук, профессор, зав. лабораторией психологической экспертизы, профессор кафедры организационной психологии факультета психологии Томского государственного университета. Имеет 103 публикации. E-mail: [email protected]
Анастасия Вячеславовна Ларионова — младший научный сотрудник лаборатории психологической экспертизы факультета психологии Томского государственного университета, общее количество публикаций — 34 публикации. E-mail: [email protected]
Сергей Александрович Богомаз — доктор психологических наук, профессор, заведующий кафедрой организационной психологии факультета психологии Томского государственного университета. Имеет 200 публикаций. E-mail: [email protected]
с MMPI, представляет собой новый, более дифференцированный подход, базирующийся на ином концептуальном и методологическом подходе (Собчик, 2007; Рассказова, 2013). В настоящее время группой ученых (Dzherelievskaya, Vizgina, Pantileev, Yashina, 2014) был проведен психометрический анализ ММИЛ с целью поддержания эффективности методики. Анализ позволил установить, что методика не отвечает психометрическим требованиям и нуждается в существенном пересмотре в соответствии с требованиями времени.
Необходимость рестандартизации методики MMPI и создания ее новой версии -MMPI-2 была обусловлена, во-первых, тенденцией современной постнеклас-сической психологии к использованию антропного принципа со смещением акцентов от патоцентрических, клинических феноменов к «проблеморазрешающим», саноцентрическим; во-вторых, появлением в психопатологии новых данных, «размывающих» границы нормы и патологии; в-третьих, разработкой новых теорий личности. Все это требовало современное обновления теоретического и эмпирического фундамента методики. Кроме того, некой сверхзадачей была необходимость «реабилитировать» методику MMPI как только клиническую, психопатологическую, «узурпированную» психиатрами и клиническими психологами, расшифровать в ней потенциал субъектности как потребности и способности к самодетерминируемому, самоорганизуемому, саморегулируемому и самоконтролируемому поведению. Подобные исследования картирования реструктурированных клинических шкал новой версии методики на нормативной выборке проводятся и на Западе (Sellbom, Ben-Porath, 2005; Sellbom, Ben-Porath, Graham, 2006; Forbey, Ben-Porath, 2008).
Рестандартизационный проект начался в 1982 г. и был опубликован J.N. Butcher, W. G. Dahlstrom, J. R. Graham A. Tellegen, B. Kaemmer под названием MMPI-2 в 1989 г. В Позднее, в начале 2000-х годов была предложена новая усовершенствованная версия методики — MMPI-2 (Butcher, Graham, Ben-Porath, Tellegen, Dahlstrom, Kaemmer, 2001; Tellegen, Ben-Porath, McNulty, Arbisi, Graham, Kaemmer, 2003). Создатели новой версии подчеркивают ее преимущества перед старой.
Несмотря на то, что исследования новой версии MMPI длятся более 20 лет, в научных кругах все еще идут споры о целесообразности рестандартизации методики. Опросник MMPI-2 разрабо-тывался с использованием строгих статистических методов, которые были недоступны при создании первой версии, добавлены новые индикаторы и шкалы, пересмотрен способ преобразования сырых оценок в стандартные показатели. Были устранены неоднозначные диагностические показатели, учтено влияние гендерных различий. Новая версия опросника содержит 567 вопросов, процедура ответов на вопросы осталась прежней. MMPI-2 включает 10 основных шкал и 3 проверочных, заимствованных из старой версии. Кроме того, авторы модификации разбили на три шкалы проверочную шкалу F, добавили проверочную шкалу S, 15 дополнительных и 15 содержательных шкал (Рассказова, 2013).
В России в 2012 г. группа ученых-психологов (Е.И. Рассказова, Д.А. Леонтьев, С.А. Богомаз, Л.Я. Дорфман, Ю.Ю. Нея-скина, О.В. Сулимина, Е.В. Четошнико-ва) осуществила первичную апробацию MMPI-2 в шести регионах России с центрами в Москве, Твери, Перми, Барнауле, Томске и Петропавловске-Камчатском. Выборку исследования составили 1237 человек. Полученные результаты позволили исследователям сделать вывод о функциональной, метрической эквивалентности русскоязычной версии MMPI-2 американскому оригиналу. В шкальной эквивалентности нормативных показателей российских испытуемых, по сравнению с американскими, были обнаружены различия, которые могут быть обусловлены влиянием культуры и принятых в ней представлений (Рассказова, 2013). Поэтому продолжаются исследования, направленные на адаптацию новой версии применительно к российской действительности, валидизацию методики и сопоставимость ее интерпретационных схем.
Тот факт, что в новой версии были реструктурированы клинические шкалы, модифицированы и заменены вопросы, содержательно определены единые конструкты, позволившие выявить специфические черты каждой нозологической единицы, обуславливает необходимость проведения процедуры конструктной ва-лидности шкал новой версии методики.
Эту необходимость усиливает изменение стандартных оценок, обусловивших различия в подъеме профиля по клиническим шкалам. Представляемая статья описывает результаты проведения процедуры конструктной валидности отдельных шкал ММР1-2.
Понятие «конструктная валидность» как «некий постулированный атрибут человека, предположительно отражаемый в выполнении теста», определили в первой версии MMPI L. Cronbach, P. Meehl при отборе критериев классификации психопатологии (Cronbach, Meehl, 1955). Конструктная валидность отражает степень репрезентации исследуемого психологического конструкта в результатах теста (Шмелев, 2013). D.T. Campbell, D.W. Fiske в 1959 году ввели понятие двух видов конструктной валидности: конвергентной и дискри-минантной. Конвергентная валидность определяет, в какой степени конструкты, которые должны быть взаимосвязаны, согласно теоретическим соображениям, действительно имеют прямую или обратную связь релевантных переменных c измеряемым конструктом. Дис-криминантная валидность, напротив, означает установление отсутствия связи иррелевантных показателей (Campbell, Fiske, 1959). Таким образом, процедура проверки конструктной валидности заключается в сопоставлении связей проверяемого теста как с близкородственными показателями (конвергентная валидность), так и с теми, где значимых связей наблюдаться не должно (дискри-минантная валидность).
Сложность проведения проверки конструктной валидности MMPI-2 обусловлена большим объемом переменных методики (количество выделяемых шкал), поэтому для реализации процедуры валидизации с соблюдением всех правил проведения необходимо было разбить процедуру на несколько этапов. На первом этапе исследования (описанном в данной статье) процедуре проверки конструктной валидности были подвергнуты: дополненные и расширенные
проверочные и основные шкалы. Это шкала F (аггравация), включающая три шкалы: FI (шкала редких ответов), BF (back F — шкала редких ответов на вторую половину методики), FP (она более чувствительна, чем FI к редким ответам на психопатологию и представляет
собой «чистую» аггравацию). А также
— шкала S (superlative self-presentation
— шкала приукрашающей самопрезентации), шкала К (коррекция), шесть из десяти основных (клинических) шкал: 2 (D), 4 (Pd), 6 (Pa), 7 (Pt), 8 (Sc), 0 (Si). Все они отражены в таблице 1.
Представим подробнее теоретические конструкты только новых шкал, поскольку конструкты основных шкал остались прежними и соответствуют психологическому содержанию релевантных им феноменов.
Шкала F (аггравации) — ключевой функцией шкалы является выявление субъективного преувеличения тяжести реально существующего заболевания или психологических проблем. Утверждения, включенные в шкалу F, касаются необычных мыслей, желаний и ощущений, существование которых в нормативной выборке не признается испытуемыми. В старой версии методики шкала F не позволяла исследователю сделать однозначное заключение о причинах повышения показателей — является ли повышение технической ошибкой (случайное заполнение, невнимательность испытуемого) или намеренным преувеличением выраженности симптомов. Разработчики новой версии попытались преодолеть эту неоднозначность интерпретации, разбив шкалу F на три: FI, BF и FP. Шкала редких ответов FI позволяет определить качество заполнения методики (случайный порядок, непонимание вопросов). Симуляция симптоматики или грубая патология сопровождается подъемом по шкале FP. BF (back F) — шкала редких ответов на вторую половину методики дает возможность оценить, как меняется стратегия испытуемого к концу теста. Причем, наблюдается следующая закономерность
— если повышение баллов по шкале BF
Сложность проведения проверки конструктной валидности ММР1-2 обусловлена большим объемом переменных методики (количество выделяемых шкал), поэтому для реализации процедуры валидизации с соблюдением всех правил проведения необходимо было разбить процедуру на несколько этапов
не сопровождается повышением по шкалам FI и FP, то это интерпретируется или как стратегия случайного заполнения, или как симуляция, проявившаяся во второй половине теста, или как грубая патология, выявившаяся на фоне истощения. Таким образом, шкала FP более чувствительна, чем FI к редким ответам о психопатологии и представляет собой «чистую» аггравацию.
Шкала S (superlative self-presentation -приукрашающей самопрезентации) оценивает выраженность попыток испытуемых создать лучшее впечатления о себе и их тенденцию давать социально желательные (приемлемые) ответы. Повышенные показатели по шкале S положительно коррелируют с теми признаками, которые в обществе принято расценивать как позитивные (социально желательные): положительная самооценка, общительность, активность, здоровье (физическое и психическое), оптимизм, доброта и т.д. (Butcher, Graham, Ben-Porath, Tellegen, Dahlstrom, Kaemmer, 2001).
Выборка и методы исследования
В исследовании конструктной валидности методики MMPI-2 приняли участие 205 человек. Возраст участников исследования от 18 до 66 лет (средний возраст 28,3 года). Группа участников в возрасте до 25 лет — 112 человек (54,3%), группа в возрасте 25-39 лет — 60 человек (29,3%), группа в возрасте 40 лет и старше — 30 человек (14,6%), не указали свой возраст -3 человека (1,5%). В выборке 78 представителей мужского пола и 127 -женского пола (38% и 62%, соответственно). Перевес женщин в выборке обусловлен тем, что мужчины значительно чаще, чем женщины отказывались от тестирования либо на предварительном этапе, либо по ходу тестирования Средний возраст мужчин составил 29,0±11,2 года, женщин — 27,9±10,0 лет. Среднее образование имели 18 человек (8,8%), среднее специальное — 47 человек (18,8%), неоконченное высшее — 84 человека (50,0%), высшее — 43 человека (21,0%), не указали свое образование 13 человек
(6,3%). Отбор респондентов для исследования был осуществлен с учетом результатов предварительного анкетирования, которое позволило отобрать группу испытуемых по заданным критериям (отсутствие психических и соматических заболеваний). Все испытуемые являются жителями Сибирского федерального округа.
Процедура проведения исследования. Тестирование в бланковом режиме проводилось в групповой и индивидуальной форме авторами статьи и специально подготовленными тестостировщиками (магистранты, обучающиеся по направлению «Психология»). У респондентов предварительно устно спрашивали о согласии участвовать в тестировании, информировали участников о том, что они могут завершить тестирование в любой момент, и просили сообщать о любом дискомфорте во время тестирования. Участникам исследования объяснялась процедура тестирования, кратко освещалась цель исследования и выдавался пакет психодиагностических методик. Время выполнения
тестовых методик не ограничивалось.
Выбор психодиагностических методик осуществлялся в соответствии с задачами исследования, теоретическими конструктами проверяемых шкал и современной тенденцией психологии к ориентации на позитивные феномены. Наибольший интерес в рамках нашего исследования представляет изучение позитивных черт в качестве психологической структуры, обеспечивающей человеку профилактическую, «буферную» функцию при воздействии на него неблагоприятных факторов, снижающей риск возникновения у него заболеваний, препятствующей развитию психической патологии и отклоняющегося поведения и повышающей его адаптивный потенциал (Ryff, Singer, 1998; Keyes, Schmotkin, Ryff, 2002; Seligman, Csikszentmihalyi, 2000; Seligman, 2002; Peterson, Seligman, 2004; Леонтьев, 2011).
Таким образом, отбор методик для проведения первого этапа провер-
ки конструктной валидности методики MMPI-2 базировался, во-первых, на одной из новейших тенденций психологии к смещению акцентов с клинических на позитивные, «проблемораз-решающие» феномены, во-вторых, на потребности расширения диагностического поля методики MMPI-2 в направлении раскрытия ее потенциала диагностики субъектности, способности к самодетерминируемому, самоорганизуемому, саморегулируемому и самоконтролируемому поведению. Возможность измеренияличностногопрофиляиспытуемого с помощью методики MMPI уже давно используется Л.Н. Собчик для психодиагностики нормы. Был осуществлен перевод названия шкал на язык нормы (например, «паранояльность» — «ригидность»). Поэтому вполне допустимо осуществлять валидизацию с использованием методик, направленных на диагностику тех нормативных показателей личности, которые находятся в современном психологическом тезаурусе. В связи с этим предполагаем, что методики, отобранные в нашем исследовании для проверки валидности MMPI-2, определяют взаимосвязи, большинство из которых должны иметь обратный характер.
Приводим краткое описание психодиагностических методик для определения конструктной валидности MMPI-2.
1. Опросник качества жизни и удовлетворенности (КЖУ) — краткий вариант М. Рицнера и др. (Ritsner, Kurs, Gibel, Ratner, Endicott, 2005) в адаптации Е.И. Рассказовой (Рассказова, 2012). Методика позволяет диагностировать и сопоставлять удовлетворенность и качество жизни в четырех сферах: физическое здоровье, эмоциональная сфера, социальная сфера и активность в свободное время. На основе вычисляемого суммарного индекса КЖУ, как среднеарифметического всех показателей методики, можно судить об итоговой субъективной оценке испытуемым качества своей жизни и удовлетворенности ею. Методика широко используется психологами во многих социальных и клинических практиках, поскольку позволяет оценивать различные аспекты жизни, как на нормативном, так и на психопатологическом уровне.
2. Шкала базисных убеждений личности, разработанная американским
Выбор психодиагностических методик осуществлялся в соответствии с задачами исследования, теоретическими конструктами проверяемых шкал и современной тенденцией психологии к ориентации на позитивные феномены. Наибольший интерес в рамках нашего исследования представляет изучение позитивных черт в качестве психологической структуры, обеспечивающей человеку профилактическую, «буферную» функцию при воздействии на него неблагоприятных факторов
психологом Р. Янофф-Бульман (перевод и адаптация О. Кравцовой), направлена на оценку психической стабильности и успешности в повседневной жизни, личностной безопасности человека. Методика позволяет оценить восемь базисных убеждений: благосклонность мира, доброта людей, справедливость мира, контролируемость мира, случайность как принцип распределения происходящих событий, ценность собственного Я, степень самоконтроля происходящих событий, степень удачи или везения. На их основе вычисляются три категории базисных убеждений (Сол-датова, Шайгерова, 2003). С.А. Богомаз и А. Гладких, исследовав различия в степени выраженности базисных убеждений жителей Сибири (выборка 1445 человек), предложили вычислять дополнительные индексы «Мир и Я» (позитивное убеждение относительно природы мира и себя в нем) и «Индекс психологической безопасности» (Богомаз, Гладких, 2009). Выделяемые категории и индексы позволяют соотнести убеждения испытуемого относительно окружающего мира, убеждения о себе самом и о том, в какой степени можно контролировать и влиять на какие-либо процессы и события в этом мире. 3. «Анкета 24 добродетели», разработанная Е.Н. Осиным (Буровихина, 2007; Кошелева, 2012) на основе опросника Values-In-Action К. Петерсона и М. Селигмана (Peterson, Seligman, 2004). Методика позволяет определить идеальные представления испытуемого о значимости для него 24-х достоинств и степень их выраженности у каждого (идеальное и реальное Я), а также самооценку испытуемого, которая проявляется в степени «разрыва» Я реального и Я идеального. С целью установления конвергентной и дискриминантной валидности с использованием программы STATISTICA 6.0. был проведен корреляционный анализ между шкалами FI, BF, FP, S, К, D, Pd, Pa, Pt, Sc, Si методики MMPI-2 со шкалами «Опросника качества жизни и удовлетворенности», субшкалами и категориями Шкалы базисных убеждений личности, переменными «Анкета 24 добродетели». Результаты корреляционного анализа предъявлены в таблице 1.
В таблице 1 представлены корреляционные связи, отражающие как конвергентную валидность (значимые корреляции) так и дивергентную (отсутствие корреляционных связей). Для оценки конвергентной валидности в процессе интерпретации учитывались наиболее значимые корреляционные связи (0,4 и выше) при уровне значимости р<0,01.
Шкалы F (аггравация) представлены следующими связями: шкала FI имеет отрицательную связь со шкалами методики «Опросник качества жизни и удовлетворенности» — «Эмоциональные переживания», индекс КЖУ, с субшкалами методики «Шкала базисных убеждений личности» -«Благосклонность мира», «Ценность собственного «Я», с категориями — «Благосклонность мира и окружающих людей», «Ценность «Я». Шкала BF имеет наиболее высокие отрицательные значения коэффициентов корреляции с субшкалами методики «Шкала базисных убеждений личности» — «Ценность собственного «Я», «Благосклонность мира», «Степень удачи или везения», «Доброта людей», с категориями — «Благосклонность мира и окружающих людей», «Ценность «Я», индекс психологической безопасности. Шкала FP имеет наиболее высокий отрицательный коэффициент корреляции с субшкалой методики «Шкала базисных убеждений личности» — «Благосклонность мира», с категорией «Мир и я».
Подобное различие полученных корреляционных связей по шкалам аггравации отражает стратегию испытуемых в процессе заполнения теста: повышение по шкалам FI и BF свидетельствует о тенденции испытуемых негативно оценивать себя и свои успехи, а также об их общей неудовлетворенностью жизнью. Напротив, относительное сходство полученных связей по шкалам FI и BF указывает на способность испытуемых нормативной выборки придерживаться единой линии ответов на протяжении всего заполнения теста. Отличительные особенности в корреляционных связях наблюдаются по шкале FP, которая особенно чувствительна к редким ответам на психопатологию, ее повышение свидетельствует о стремлении испытуемых более негативно оценивать окружающую действительность, нежели себя.
Шкала S (самопрезентация) положительно коррелирует с субшкалами методики «Шкала базисных убеждений лич-
ности» — «Доброта людей», «Ценность собственного «Я», с категориями «Благосклонность мира и окружающих людей», «Мир и «Я». Полученные корреляционные связи указывают на тенденцию испытуемых положительно оценивать себя, позитивно воспринимать окружающих с присущим им оптимизмом. В целом, полученные корреляционные связи сопоставимы с теоретическим конструктом шкалы. Как видно из табл. 1, полученные результаты в ходе проверки конструктной валидности основных шкал MMPI-2 свидетельствуют о репрезентативности психологических конструктов проверяемых шкал методики.
Методика «Анкета 24 добродетели» показала себя менее информативной при проверке валидности, чем ожидалось. Это может быть обусловлено либо неудачным выбором методики для проведения конструктной валидности, либо недостаточным объемом выборки при сильном разбросе полученных данных. Значимые корреляционные связи говорят лишь о слабых тенденциях, присущих проверяемым теоретическим конструктам шкал MMPI-2.
Полученные данные по методике MMPI-2 позволяют отчасти снять остроту так называемого межкорпоративного конфликта психиатров и психологов по проводу применения методики только в качестве клинического, а не психологического критерия. Вариант MMPI-2 движется к большей онтологичности, ориентированности на качество жизни, ресурсы и смыслы бытия человека. Применительно к психиатрии методика MMPI-2 позволит более целенаправленно апеллировать к сохранным зонам пациента, а в психологии — развивать компенсаторные возможности человека и его способности, обусловливающие личностный рост.
Таким образом, методика MMPI-2 может использоваться не только для выявления психопатологии, но и для системного изучения потенциала личности, что облегчит задачу исследователя и избавит от применения батареи тестовых методик. Использование новых методов, направленных на рассмотрение различных сторон личности, при проведения процедуры конструктной валидности методики закладывает основания для дальнейшего углубления и дополнения интерпретации теста в соответствии с современными тенденциями психологии.
Показатели FI BF FP K S D Pd Pa Pt Sc Si
«Опросник качества жизни и удовлетворенности», шкалы
Физическое здоровье -0,35** -0,35** -0,22* 0,41** 0,36** -0,38** -0,17 -0,39** -0,32** -0,36** -0,04
Эмоциональные переживания -0,42** -0,34** -0,2 0,25** 0,33** -0,37** -0,21* -0,27** -0,28** -0,32** -0,37**
Активность в свободное время -0,29** -0,29** -0,21* 0,31** 0,32** -0,22* -0,14 -0,26** -0,24* -0,25* -0,08
Сфера общения -0,27** -0,17 -0,09 0,12 0,12 -0,37** -0,15 -0,19 -0,23* -0,27** -0,31**
Индекс КЖУ -0,44** -0,38** -0,22* 0,34** 0,38** -0,48** -0,24* -0,37** -0,38** -0,42** -0,3**
«Шкала базисных убеждений личности», субшкалы
Благосклонность мира -0,4** -0,51** 0,4** 0,34** 0,37** -0,37** -0,36** -0,28** -0,24* -0,37** -0,19*
Доброта людей -0,34** 0,43** -0,32** 0,48** 0,48** -0,22* -0,23* -0,16 -0,12 -0,22* -0,13
Справедливость мира -0,09 -0,27** -0,23* 0,11 0,06 -0,17 0,01 -0,09 -0,09 -0,16 -0,1
Контролируемость мира -0,08 -0,26** 0,15 0,05 0,01 0,24* 0,11 -0,21* -0,18 -0,18 -0,13
Случайность как принцип распределения происходящих событий 0,12 0,14 0,05 -0,22 -0,19 0,01 0,06 0,1 0,01 0,02 0,04
Ценность собственного Я -0,56** -0,53** -0,33** 0,47** 0,49** -0,47** 0,34** -0,44** -0,49** -0,52** -0,14
Степень самоконтроля -0,13 -0,06 -0,01 -0,13 -0,22* -0,31** -0,15 -0,16 -0,1715 -0,17 -0,10
Степень удачи или везения -0,28** -0,45** -0,34** 0,27** 0,30** -0,45** -0,12 -0,24* -0,29** -0,23* -0,24*
«Шкала базисных убеждений личности», категории
Благосклонность мира и окружающих людей -0,4** -0,51** -0,39** 0,44** 0,46** -0,32** -0,32** -0,24* -0,2* -0,32** -0,18
Осмысленность жизни -0,18 -0,26* -0,15 0,23* 0,178 -0,15 0,00 -0,05 -0,03 -0,11 -0,08
Ценность «Я» -0,38** -0,48** -0,35** 0,28** 0,26** -0,5** -0,27** -0,3** -0,3** -0,33** -0,24*
Мир и Я -0,51** -0,62** -0,45** 0,5** 0,53** -0,48** -0,33** -0,36** -0,37** -0,43** -0,23
Индекс психологической безопасности -0,37** -0,5** -0,34** 0,36** 0,34** -0,4** -0,24* -0,31** -0,29** -0,33** -0,2*
«Анкета 24 добродетели»
Идеальные представления о значимости достоинств
Жизненная энергия -0,27** -0,2* -0,11 0,23** 0,16 -0,09 -0,1 -0,17 -0,11 -0,17 -0,26**
Любопытство -0,14 -0,05 -0,07 0,02 -0,02 -0,19* -0,15 -0,08 -0,21* -0,12 -0,18
Непредвзятость 0,11 0,06 0,02 -0,08 -0,05 0,02 0,08 0,19* 0,03 0,08 -0,12
Религиозность -0,11 -0,10 -0,17 0,23* 0,17 0,03 0,13 0,1 0,15 0,06 -0,06
Скромность 0,13 0,14 0,00 -0,1 -0,14 0,15 0,15 0,3** 0,2* 0,17 0,09
Социальный интеллект 0,08 0,11 0,11 0,02 0,05 -0,05 0,05 0,01 -0,03 0,12 -0,25**
Упорство -0,22* -0,02 0,05 0,19** 0,14 -0,09 -0,16 -0,17 -0,11 -0,16 -0,16
Суммарный индекс -0,1 0,03 -0,07 0,12 0,11 -0,08 -0,03 0,07 -0,02 -0,03 -0,2*
Реальная степень выраженности личностных достоинств
Благоразумие -0,26** -0,01 -0,01 0,1 0,11 -0,15 -0,24** -0,06 -0,2 -0,16 -0,07
Гибкость мышления -0,11 -0,03 0,08 0,11 0,1 -0,16 -0,16 -0,12 -0,23** -0,08 -0,08
Жизненная энергия -0,23** 0,03 0,02 0,11 0,08 -0,37** -0,08 -0,16 -0,25** -0,21* -0,3**
Искренность -0,08 0,00 0,01 0,00 0,04 -0,18* -0,08 0,07 -0,07 -0,01 -0,21*
Креативность -0,04 0,02 0,23** 0,06 0,01 -0,16 -0,08 0,07 -0,17 -0,03 -0,01
Лидерство -0,02 0,03 0,12 -0,09 -0,1 -0,3** -0,16 -0,07 -0,22* -0,12 -0,16
Мудрость -0,12 0,0 0,07 0,03 0,07 -0,23** -0,25** -0,13 -0,29** -0,16 -0,05
Непредвзятость -0,04 -0,06 -0,05 0,07 0,09 -0,07 -0,03 -0,01 -0,16 -0,08 -0,23**
Причастность общему делу -0,12 0,00 -0,02 0,14 0,13 -0,01 -0,04 -0,03 0,02 -0,03 -0,19*
Религиозность -0,17 -0,1 -0,12 0,24** 0,19* -0,03 0,04 0,15 0,17 0,1 -0,07
Самоконтроль -0,07 0,05 0,13 0,14 0,18 -0,11 -0,2* -0,02 -0,16 -0,03 -0,02
Скромность -0,09 0,03 -0,02 -0,11 -0,08 0,1 -0,21* 0,02 0,05 -0,1 0,15
Социальный интеллект 0,03 0,24** 0,13 0,00 -0,04 -0,01 -0,02 0,11 0,00 0,09 -0,16
Способность прощать -0,14 -0,07 -0,1 -0,03 -0,01 -0,09 -0,24** -0,12 -0,05 -0,13 0,01
Упорство -0,11 0,08 0,09 0,08 0,1 -0,21* -0,04 0,06 -0,12 -0,09 -0,21
Храбрость 0,1 0,11 0,19* 0,04 0,02 -0,21* -0,02 0,07 -0,19 -0,05 -0,09
Суммарный индекс -0,17 0,05 0,1 0,07 0,06 -0,29** -0,22* 0,01 -0,2 -0,11 -0,25**
Примечания. Уровень значимости различий: *p < 0,05, **p < 0,01.
Таблица 1. Корреляционные связи между шкалами ММР1-2, «Опросника качества жизни и удовлетворенности», «Шкалы базисных убеждений» и «Оценки личных достоинств».
Во второй части статьи будет рассмо- ММР1-2 со шкалами методик «Шкала бази- ман, «Опросник качества жизни и удовлет-трена факторная структура и модель связей сных убеждений личности» Р. Янофф-Буль- воренности» и «Анкета 24 добродетели».
Литература:
Березин Ф.Б. Методика многостороннего исследования личности (ММИЛ): структура, основы интерпретации, некоторые области применения / Ф.Б. Березин, М.П. Мирошников, Е.Д. Соколова. — Москва : Фолиум, 1994. — 175 с.
Богомаз С.А. Психологическая безопасность и ее измерение с помощью шкалы базисных убеждений / С.А. Богомаз, А.Г. Гладких // Вестник Томского государственного университета. — 2009. — № 318. — С. 191-194.
Буровихина И. Силы характера как ресурсы личности подростка: опыт применения опросника «Профиль личных достоинств» / И. Буровихина, Д.А. Леонтьев, Е.Н. Осин // Психологическая диагностика. — 2007. — № 1. — C. 107-127.
Кошелева Н.В. Имплицитные представления студентов об атеистах и верующих людях / Н.В. Кошелева, Е.Н. Осин // Психология. Журнал Высшей школы экономики. — 2012. — Т. 9. — № 1. — С. 135-143.
Леонтьев Д.А. Подход через позитивные черты личности: от психологического благополучия к добродетелям и силам характера // Личностный потенциал. Структура и диагностика: монография / под ред. Д.А. Леонтьева. — Москва : Смысл, 2011. — С. 76-92.
Практикум по психодиагностике и исследованию толерантности личности / под ред. Г.У. Солдатовой, Л.А. Шайгеровой. — Москва : МГУ им. М.В. Ломоносова, 2003. — 112 с.
Рассказова Е.И. Психометрические характеристики русскоязычной версии MMPI-2 / Е.И. Рассказова, С.А. Богомаз, Л.Я. Дорфман Л.Я. и др. // Психологические исследования: электронный научный журнал. — 2013. — Т. 6. — № 29. — [Электронный ресурс]. — Режим доступа : http:// psystudy.ru — (дата обращения: 20.12.2013).
Рассказова Е.И. Методика оценки качества жизни и удовлетворенности: психометрические характеристики русскоязычной версии / Е.И. Рассказова // Психология. Журнал Высшей школы экономики. — 2012. — Т. 9. — № 4. — С. 81-90.
Собчик Л.Н. Стандартизированный многофакторный метод исследования личности СМИЛ (MMPI) : практическое руководство / Л.И. Собчик. — Москва : Речь, 2007. — 224 с.
Шмелев А.Г. Практическая тестология: тестирование в образовании, прикладной психологии и управлении персоналом / А.Г. Шмелев. -Москва : Маска, 2013. — 688 с.
Butcher J.N., Graham J.R., Ben-Porath Y.S., Tellegen A., Dahlstrom W.G., Kaemmer B. MMPI-2 (Minnesota Multiphasic Personality Inventory-2): Manual for administration and scoring. — Minneapolis, MN: University of Minnesota Press, 2001.
Campbell D.T., Fiske D.W. Convergent and discriminant validation by the multitraitmultimethod matrix // Psychol. Bull. — 1959. — Vol. 56. — P. 81-105. Cronbach L., Meehl P. Construct validity in psychological tests. — Psychological Bulletin, 1955. — 302 p.
Dzherelievskaya M.A.,Vizgina A.V., Pantileev S.R., Yashina, L.L. A substantial psychometric analysis of the scales of the Minnesota Multiphasic Personality Inventory: F.B. Berezin’s version, the MMIL // Psychology in Russia: State of the Art. — 2014. — V. 7 (1). — P. 105-121. DOI: 10.11621/ pir.2014.0111
Forbey J.D., Ben-Porath Y.S. Empirical correlates of the MMPI-2 Restructured Clinical (RC) scales in a nonclinical setting // Journal of Personality Assessment. — 2008. — № 90. — P. 138-143.
Keyes C.L.M., Shmotkin D., Ryff C.D. Optimizing well-being the empirical encounter of two traditions // Journal of Personality and Social Psychology. -2002. — V. 82. — P. 1007-1022.
Peterson C., Seligman M.E.P. Character strengths and virtues: a handbook and classification. — N.Y.: Oxford University Press, 2004.
Ritsner M., Kurs R., Gibel A., Ratner Y., Endicott J. Validity of an abbreviated quality of life enjoyment and satisfaction questionnaire (q-les-q-18) for
schizophrenia, schizoaffective, and mood disorder patients // Quality of Life Research. — 2005. — № 14. — Р. 1693-1703.
Ryff C.D., Singer B. The contours of positive human health // Psychological Inquiry. — 1998. — V. 9. — P. 1-28.
Seligman M.E.P. Authentic happiness: using the new positive psychology to realize your potential for lasting fulfillment. — N.Y.: Free Press, 2002.
Seligman M.E.P, Csikszentmihalyi M. Positive psychology: an introduction // American Psychologist. — 2000. — V. 55. — № 1. — P. 5-14.
Sellbom M., Ben-Porath Y.S., Graham J.R. Correlates of the MMPI-2 restructured clinical (RC) scales in a college counseling setting // Journal of Personality Assessment. — 2006. — № 86 (1). — P. 89-99.
Sellbom M., Ben-Porath Y.S., Lilienfeld S.O., Patrick C. J., Graham J.R. Assessing psychopathic personality traits with the MMPI-2 // Journal of Personality Assessment. — 2005. — № 85. — P. 334-343.
Te llegen A., Ben-Porath Y.S., McNulty J.L., Arbisi P.A., Graham J.R., Kaemmer B. MMPI-2 Restructured Clinical (RC) scales: Development, validation, and interpretation. — Minneapolis: University of Minnesota Press, 2003.
References:
Berezin, F.B. (1994) Metodika mnogostoronnego issledovaniya lichnosti (MMIL): struktura, osnovy interpretatsii, nekotorye oblasti primenenija [Methods of multilateral study of personality (nm): structure, based on interpretation, some areas of application]. Berezin, F.B., Miroshnikov, M.P., & Sokolov, E.D. Moscow, Folium, 175.
Bogomaz, S.A. (2009) Psikhologicheskaya bezopasnost’ i ee izmerenie s pomoshch’yu shkaly bazisnykh ubezhdeniy [Psychological security and its measurement by the scale of basic beliefs]. Bogomaz, S.A., & Gladkikh, A.G. Vestnik Tomskogo gosudarstvennogo universiteta [Bulletin of Tomsk State University]. 318, 191-194.
Burovihina, I. (2007) Sily kharaktera kak resursy lichnosti podrostka: opyt primeneniya oprosnika «Profil’ lichnykh dostoinstv» [Strength of character as a resource of the adolescent personality: the experience of using questionnaire «Profile of merit»]. Burovihina, I. Leontiev, D.A., & Osin, E.N. [Psychological diagnostics]. 1, 107-127.
Butcher, J.N., Graham, J.R., Ben-Porath, Y.S., Tellegen, A., Dahlstrom, W.G., & Kaemmer, B. (2001) MMPI-2 (Minnesota Multiphasic Personality Inventory-2): Manual for administration and scoring. Minneapolis, MN, University of Minnesota Press.
Campbell, D.T., & Fiske, D.W. (1959) Convergent and discriminant validation by the multitraitmultimethod matrix. Psychol. Bull. Vol. 56, 81-105. Cronbach, L., & Meehl, P. (1955) Construct validity in psychological tests. Psychological Bulletin, 302.
Dzherelievskaya, M.A.,Vizgina, A.V., Pantileev, S.R., & Yashina, L.L. A substantial psychometric analysis of the scales of the Minnesota Multiphasic
№ 2 [18] 2015 ISSN 2079-6617 Print ISSN 2309-9828 Online 121 Национальный психологический журнал National psychological journal http://npsyj.ru
© Lomonosov Moscow State University, 2015
Personality Inventory: F.B. Berezin’s version, the MMIL. Psychology in Russia: State of the Art. — 2014. Vol. 7 (1), 105-121. DOI: 10.11621/pir.2014.0111 Forbey, J.D., & Ben-Porath, Y.S. (2008) Empirical correlates of the MMPI-2 Restructured Clinical (RC) scales in a nonclinical setting. Journal of Personality Assessment. 90, 138-143.
Keyes, C.L.M., Shmotkin, D., & Ryff, C.D. (2002) Optimizing well-being the empirical encounter of two traditions. Journal of Personality and Social Psychology. Vol. 82, 1007-1022.
Kosheleva, N.V. (2012) Implitsitnye predstavleniya studentov ob ateistakh i veruyushchikh lyudyakh [Implicit representations of students about atheists and believers men]. Kosheleva, N.V., & Osin, E.N. Psikhologiya. Zhurnal Vysshey shkoly ekonomiki [Psychology. Journal of Higher School of Economics]. Vol. 9, 1, 135-143.
Leontiev, D.A. (2011) Podkhod cherez pozitivnye cherty lichnosti: ot psikhologicheskogo blagopoluchiya k dobrodetelyam i silam kharaktera [The approach through positive personality traits: the psychological well-being of the virtues and the forces of nature]. Lichnostnyj potentsial. Struktura i diagnostika: monografiya [Personal potential. Structure and diagnostics: monograph]. Moscow, Smysl, 76-92.
Peterson, C., & Seligman, M.E.P. (2004) Character strengths and virtues: a handbook and classification. N.Y., Oxford University Press.
Ritsner, M., Kurs, R., Gibel, A., Ratner, Y., & Endicott, J. (2005) Validity of an abbreviated quality of life enjoyment and satisfaction questionnaire (q-les-q-18) for schizophrenia, schizoaffective, and mood disorder patients. Quality of Life Research. 14, 1693-1703.
Ryff, C.D., & Singer, B. (1998) The contours of positive human health. Psychological Inquiry. Vol. 9, 1-28.
Rasskazova, E.I. (2013) Psikhometricheskie kharakteristiki russkoyazychnoy versii MMPI-2 [Psychometric characteristics of the Russian version of the MMPI-2]. Rasskazova, E.I., Bogomaz, S.A., & Dorfman, L.Y. et al. [Psychological research: an electronic scientific journal]. Vol. 6. 29. — [Electronic resource]. — http://psystudy.ru — (date of reference: 12.20.2013).
Rasskazova, E.I. (2012) Metodika otsenki kachestva zhizni i udovletvorennosti: psikhometricheskie kharakteristiki russkoyazychnoy versii [Methods of assessing the quality of life and satisfaction: psychometric characteristics of the Russian-language version]. Psikhologiya. Zhurnal Vysshey shkoly ekonomiki [Psychology. Journal of Higher School of Economics]. Vol. 9. 4, 81-90.
Seligman, M.E.P. (2002) Authentic happiness: using the new positive psychology to realize your potential for lasting fulfillment. N.Y.,Free Press. Seligman, M.E.P, Csikszentmihalyi, M. (2000) Positive psychology: an introduction. American Psychologist. Vol. 55. 1, 5-14.
Sellbom, M., Ben-Porath, Y.S., & Graham, J.R. (2006) Correlates of the MMPI-2 restructured clinical (RC) scales in a college counseling setting. Journal of Personality Assessment. 86 (1), 89-99.
Sellbom, M., Ben-Porath, Y.S., Lilienfeld, S.O., Patrick, C. J., & Graham, J.R. (2005) Assessing psychopathic personality traits with the MMPI-2. Journal of Personality Assessment. 85, 334-343.
Shmelev, A.G. (2013) Prakticheskaya testologiya: testirovanie v obrazovanii, prikladnoy psikhologii i upravlenii personalom [Practical testers: testing in education, applied psychology and human resource]. Moscow, Maska, 688.
(Eds.) Soldatova, H.W., & Shaygerovoy, L.A. (2003) Praktikum po psihodiagnostike i issledovaniju tolerantnosti lichnosti [Practice file on psychological diagnostics and research of tolerance of the person]. Moscow, 112.
Sobchik, L.N. (2007) Standartizirovannyy mnogofaktornyy metod issledovaniya lichnosti SMIL (MMPI): prakticheskoe rukovodstvo [A standardized method of multivariate study of personality SMIL (MMPI): a practical guide / LI Sobchik. Moscow, Rech’, 224.
Te llegen, A., Ben-Porath, Y.S., McNulty, J.L., Arbisi, P.A., Graham, J.R., & Kaemmer, B. (2003) MMPI-2 Restructured Clinical (RC) scales: Development, validation, and interpretation. Minneapolis, University of Minnesota Press.
Конструктная валидность. Конвергентная и дискриминантная валидности
Конструктная валидность – один из основных типов валидности, отражающий степень репрезентации исследуемого психологического конструкта в результатах теста. В качестве конструкта могут выступать практический или вербальный интеллект, эмоциональная неустойчивость, интроверсия, понимание речи, переключаемость внимания и т. д. Конструктная валидность определяет область теоретической структуры психологических явлений, измеряемых тестом.
Среди конкретных методов характеристики конст-руктной валидности в первую очередь необходимо назвать сопоставление исследуемого на предмет конструктной валидности теста с другими методиками, конструктное содержание которых известно. Наличие корреляции между новым и аналогичным по конструкту тестом указывает на то, что разрабатываемый тест «измеряет» примерно ту же сферу поведения, способность, личностное качество, что и эталонная методика.
В отличие от критериальной валидизации при анализе конструктной валидности не требуется высокой степени связи результатов двух тестов. Если окажется, что новый и эталонный тесты практически идентичны по содержанию, результатам и разрабатываемая методика не обладает преимуществами краткости или легкости применения, это означает лишь дублирование теста, оправданное только с точки зрения создания параллельной формы теста.
Смысл процедуры конструктной валидности состоит в установлении одновременно как сходства, так и различия психологических феноменов, измеряемых новым тестом по сравнению с известным.
Конвергентная и дискриминантная валидности.При анализе конструктной валидности методики обычно формулируют ряд гипотез о том, как будет коррелировать разрабатываемый тест с другими тестами, направленными на конструкты, находящиеся в теоретически известной или предполагаемой связи с исследуемыми. При этом конструктная валидность характеризуется не только связями проверяемого теста с близкородственными показателями, но и с теми, где значимых связей наблюдаться не должно. Эти подходы определяются как конвергентная(проверка степени близости прямой или обратной связи) и дискриминантная(установление отсутствия связи) валидизации. Подтверждение совокупности теоретически ожидаемых связей составляет важный круг сведений конструктной валидности. В англоязычной психодиагностике такое операциональное определение конструктной валидности обозначается как «предполагаемая валидность» (assumed validity).
Конструктная валидность. Конвергентная и дискриминантная валидности
Конструктная валидность – один из основных типов валидности, отражающий степень репрезентации исследуемого психологического конструкта в результатах теста. В качестве конструкта могут выступать практический или вербальный интеллект, эмоциональная неустойчивость, интроверсия, понимание речи, переключаемость внимания и т. д. Конструктная валидность определяет область теоретической структуры психологических явлений, измеряемых тестом.
Среди конкретных методов характеристики конст-руктной валидности в первую очередь необходимо назвать сопоставление исследуемого на предмет конструктной валидности теста с другими методиками, конструктное содержание которых известно. Наличие корреляции между новым и аналогичным по конструкту тестом указывает на то, что разрабатываемый тест «измеряет» примерно ту же сферу поведения, способность, личностное качество, что и эталонная методика.
В отличие от критериальной валидизации при анализе конструктной валидности не требуется высокой степени связи результатов двух тестов. Если окажется, что новый и эталонный тесты практически идентичны по содержанию, результатам и разрабатываемая методика не обладает преимуществами краткости или легкости применения, это означает лишь дублирование теста, оправданное только с точки зрения создания параллельной формы теста.
Смысл процедуры конструктной валидности состоит в установлении одновременно как сходства, так и различия психологических феноменов, измеряемых новым тестом по сравнению с известным.
Конвергентная и дискриминантная валидности.При анализе конструктной валидности методики обычно формулируют ряд гипотез о том, как будет коррелировать разрабатываемый тест с другими тестами, направленными на конструкты, находящиеся в теоретически известной или предполагаемой связи с исследуемыми. При этом конструктная валидность характеризуется не только связями проверяемого теста с близкородственными показателями, но и с теми, где значимых связей наблюдаться не должно. Эти подходы определяются как конвергентная(проверка степени близости прямой или обратной связи) и дискриминантная(установление отсутствия связи) валидизации. Подтверждение совокупности теоретически ожидаемых связей составляет важный круг сведений конструктной валидности. В англоязычной психодиагностике такое операциональное определение конструктной валидности обозначается как «предполагаемая валидность» (assumed validity).
Факторная валидность
Факторная валидность.Прямое отношение к характеристике конструктной валидности имеет факторный анализ, позволяющий строго статистически проанализировать структуру связей показателей исследуемого теста с другими известными и латентными факторами, выявить общие и специфические для группы сопоставляемых тестов факторы, степень их представленности в результатах, т. е. определить факторный состав и факторные нагрузки результата теста. Исключительная важность такой процедуры является основанием для выделения ее в особый вид конструктной валидности – факторную валидность.
Важным аспектом конструктной валидности является внутренняя согласованность, отражающая то, насколько определенные пункты (задания, вопросы), составляющие материал теста, подчинены основному направлению теста как целого, ориентированы на изучение одних и тех же конструктов. Анализ внутренней согласованности осуществляется путем коррелирования ответов на каждое задание с общим результатом теста.
При определении конструктной валидности важное место принадлежит изучению динамики измеряемого конструкта. При этом мы можем опираться на гипотезы о его возрастном развитии, влиянии тренировок, обучения, освоения профессии и т. д. Одним из таких подходов является применение критерия возрастной дифференциации, что предусматривает согласование результатов теста с ожидаемыми изменениями, которые претерпевает изучаемое психическое свойство в возрастной динамике при переходе на новый этап развития. Этот метод конструктной валидности особенно важен для валидизации тестов интеллекта, достижений в обучении.
В комплекс сведений о конструктной валидности методики входят также данные, относящиеся к сфере критериальной и содержательной валидности. Так, критерии, используемые при валидизации, несут информацию, позволяющую раскрыть область поведения, качества, представленные в тесте в виде конструкта. Для характеристики конструктной валидно-сти необходимы связь с практическими формами деятельности, достоверность прогноза реального поведения. Однако конструктная валидность является качественно более высоким и комплексным уровнем описания теста, характеризуя область измеряемого поведения в широких психологических понятиях. Благодаря данным конструктной валидности мы можем с психологических позиций закономерно объяснить результаты теста и их дисперсию, обосновать диагноз, введя измеряемое свойство в систему психологических категорий, прогнозировать поведение в более широких пределах, чем это задается областью деятельности, для которой определялась содержательная валидность.
КОНВЕРГЕНТНЫЙ — Что такое КОНВЕРГЕНТНЫЙ?
Слово состоит из 13 букв: первая к, вторая о, третья н, четвёртая в, пятая е, шестая р, седьмая г, восьмая е, девятая н, десятая т, одиннадцатая н, двенадцатая ы, последняя й,
Слово конвергентный английскими буквами(транслитом) — konvergentnyi
Значения слова конвергентный. Что такое конвергентный?
Конвергенция
КОНВЕРГЕНЦИЯ КОНВЕРГЕНЦИЯ (от лат. convergo — приближаюсь, схожусь), независимое развитие сходных признаков у разных групп организмов к сходным условиям внеш. среды.разобщённых во времени и пространстве, могут конвергентно развиваться целые биоценозы, включающие ряды конвергентных видов. Так, в Австралии эволюция сумчатых млекопитающих привела к…
Биологический энциклопедический словарь. — 1986
Конвергенция. ]лат.[/p] convergo ‘приближаться, сходиться’) В исторической фонетике — совпадение первоначально разных фонем в одной фонеме (например, совпадение праслав. *ē и * oi в фонеме * ě; совпадение др.-русск. ě…Примером конвергентных процессов может быть образование языковых союзов…
Cправочник по этимологии и исторической лексикологии. — 1998
КОНВЕРГЕНЦИЯ (от лат. converge — приближаюсь, схожусь), независимое развитие сходных признаков у разных групп организмов к сходным условиям внеш. среды.местообитаниях, разобщённых во времени и пространстве, могут кон-вергентно развиваться целые биоценозы, включающие ряды конвергентных видов.
Биологический словарь
Конвергентная эволюция
Конвергентная эволюция (от лат. con — вместе и vergere — сближаться) — эволюционный процесс, при котором возникает сходство между организмами различных систематических групп, обитающих в сходных условиях…
ru.wikipedia.org
КОНВЕРГЕНТНАЯ ЭВОЛЮЦИЯ развитие признаков, несущих одинаковые функции, у неродственных организмов, обитающих в среде одинакового типа. Развитие или проявление сходных черт у животных или растений, принадлежащих к разным группам классификации…
Экологический словарь
КОНВЕРГЕНТНАЯ ЭВОЛЮЦИЯ возникновение у различных по происхождению видов и биотических сообществ сходных внешних признаков в результате аналогичного образа жизни и приспособления к близким условиям среды…
Экологический словарь
Конвергентное мышление
Конвергентное мышление (от лат. cоnvergere — сходиться) — форма мышления -. Основано на стратегии точного использования предварительно усвоенных алгоритмов решения определенной задачи…
Психологический словарь. — 2000
Конвергентное мышление Словообразование. Происходит от лат. cоnvergere — сходиться. Категория. Форма мышления. Специфика. Основано на стратегии точного использования предварительно усвоенных алгоритмов решения определенной задачи…
Психологический словарь. — 2000
Конвергентное мышление — форма мышления, основанная на стратегии точного использования предварительно усвоенных алгоритмов решения определенной задачи.
Карманов А. Психологический словарь
Конвергентная валидность
Конвергентная валидность — свойство нескольких показателей одного м того же понятия приводить к одному и тому же результату.
glossary.ru
Конвергентная валидность (Convergent validity). Величина корреляции показателей данного теста с показателями другого теста, который предположительно измеряет тот же самый конструкт.
Теории личности: Глоссарий к книге
Конвергентная валидность (обоснованность) — свойство нескольких показателей (мер) одного м того же понятия приводить к одному и тому же результату.
Социологический словарь. — 2003
КОНВЕРГЕНТНЫЕ СКРЕЩИВАНИЯ
КОНВЕРГЕНТНЫЕ СКРЕЩИВАНИЯ, разновидность возвратного (насыщающего) скрещивания, в к-ром гибриды 1-го поколения скрещиваются в двух направлениях: одни — с отцовской формой, другие — с материнской.
https
Конвергентная журналистика
Конверге́нтная журнали́стика (англ. Convergence journalism) — это процесс слияния, интеграции информационных и коммуникативных технологий в единый информационный ресурс.
ru.wikipedia.org
Мышление конвергентное
Мышление конвергентное (лат. convergere — приближаться, сходиться) — характеризуется сведением вместе всех сведений относительно имеющейся задаче, то есть синтезом информации о проблеме в поисках её решения.
vocabulary.ru
Мышление конвергентное — (лат. convergere — приближаться, сходиться) — характеризуется сведением вместе или с синтезом информации о проблеме в поисках её решения.
Жмуров В.А. Большой толковый словарь терминов по психиатрии
МЫШЛЕНИЕ, КОНВЕРГЕНТНОЕ Мышление, которое характеризуется сведением вместе или синтезом информации и знаний, сосредоточением на решении проблемы. Такое мышление часто связано с решением задач, особенно с проблемами…
Оксфордский словарь по психологии. — 2002
Валидность конвергентная и дискриминантная
Валидность конвергентная и дискриминантная (лат. convergens – приближаться, сходиться; discrivinans – различающий, разделяющий) – степень, в какой любой определённый инструмент тестирования обладает валидностью, если мера значения…
vocabulary.ru
ВАЛИДНОСТЬ, КОНВЕРГЕНТНАЯ и ДИСКРИМИНАНТНАЯ
ВАЛИДНОСТЬ, КОНВЕРГЕНТНАЯ и ДИСКРИМИНАНТНАЯ Степень, в которой любой определенный инструмент тестирования обладает валидностью, будет отражать, в какой мере значения, полученные по этому тесту (а) коррелируют с факторами…
Оксфордский словарь по психологии. — 2002
Русский язык
Кон/верг/е́нт/н/ый.
Морфемно-орфографический словарь. — 2002
- конвенционный
- конвенция
- конвергентность
- конвергентный
- конвергенты
- конвергент
- конвергенция
Валидность измерения исследования в клинической психологии
Валидность измерения (measurement validity) является ответом на вопрос, «измеряет ли измерение то, что оно должно измерить» (Barker C. [et al.], 2002). Например, измеряет ли шкала для оценки симптомов депрессии выраженность депрессии или же она измеряет что-то другое (самооценку, желание признать наличие проблемной ситуации и т. п.)? Сам по себе концепт «валидность измерения» более сложен для понимания и оценки, чем надежность. В настоящем разделе обсуждается именно валидность измерения, хотя постановка вопроса о валидности распространяется и на дизайн исследования, о чем говорилось в главе 2. Изучение качества методики измерения того или иного показателя предполагает, что на первом этапе требуется оценка надежности, а затем валидности. С одной стороны, надежность является необходимым, но не достаточным условием валидности. Для того чтобы быть валидным, измерение должно быть надежным, в противном случае оно будет преимущественно отражать влияние ошибки. Так, если два исследователя не могут прийти к единому суждению по поводу того, содержатся ли в тексте беседы пациента и психотерапевта признаки отказа пациента от лечения, нет возможности делать какие-то выводы о валидности категории отказа от лечения. С другой стороны, методика может быть очень надежной, но не валидной: например, измерение окружности головы для определения интеллекта. Оцениваются различные аспекты валидности методики, на которые нужно ориентироваться исследователю. К основным видам валидности следует отнести содержательную, внешнюю, критериальную и конструктную.
Содержательная валидность (content validity) — показатель того, насколько методика (а также каждый ее компонент или шкала) охватывает все аспекты того конструкта, который методика призвана измерить. Например, присутствуют ли в опроснике с целью выявить симптомы депрессии у пациента вопросы, затрагивающие сниженное настроение, снижение мотивации, нарушения сна и т. д. Оценка содержательной валидности носит качественный характер, и нет какого-то специального коэффициента содержательной валидности. Имеется три способа оценки содержательной валидности:
- анализ общепринятых подходов к изучению рассматриваемой проблемы на основании литературных данных;
- экспертная оценка содержания опросника специалистами;
- оценка содержания опросника самими больными.
Внешняя валидность (face validity) весьма близка к содержательной валидности. Оценка внешней валидности предполагает ответ на вопрос: лежит ли на поверхности то, что призвана измерить данная методика? Так, в опроснике, цель которого выявить симптомы депрессии, должны присутствовать вопросы, затрагивающие снижение настроения у пациента, а не его отношение к начальнику на работе. Внешняя валидность позволяет определить, охватывают ли вопросы опросника круг проблем, беспокоящих пациента. Внешняя валидность желательна, но не всегда обязательна. Так, в опроснике могут присутствовать «мелкие» на первый взгляд, не относящиеся к изучаемому конструкту вопросы, которые на самом деле позволяют снизить вероятность фальсификации данных. Внешняя валидность отчасти является своеобразным пиар-ходом, так как в результате шкала опросника выглядит правильной для потенциального респондента. Если у респондента не складывается такого впечатления, он может просто отказаться отвечать на поставленные вопросы. Как и содержательная валидность, внешняя валидность является качественной оценкой и не имеет какого-то измерения.
Критериальная валидность (criterion validity) устанавливает возможность точно оценить ту или иную переменную или тот или иной концептуальный показатель на основе сопоставления с «золотым стандартом» и возможность использования методики для замены такого «золотого стандарта». Оценка критериальной валидности методики предполагает использование и сравнение эффективности двух сопоставляемых методик (одновременное или попеременное в случайной последовательности), причем важно, чтобы разрабатываемая методика была проще в использовании и экономичнее, чем существующий метод оценки, рассматриваемый в качестве стандарта (Кельмансон И. А., 2004). Проблема критериальной валидности во многом является центральной в решении вопроса о валидности методики. Критериальная валидность позволяет оценить, насколько удовлетворительно измеренный показатель согласуется с другим показателем, принятым в качестве критерия, индикатора измеряемого конструкта. Такой принятый критерий часто именуется «золотым стандартом» диагностики. Существуют разновидности критериальной валидности:
- Конкурентная валидность: диагностика осуществляется на основе принятого критерия одновременно с анализируемой методикой. Результаты использования анализируемой методики сопоставляются с существующими критериями. Например, оценки по шкале симптомов депрессии могут быть сопоставлены с результатами обследования пациента врачом-психиатром.
- Предсказательная валидность: диагностика осуществляется в дальнейшем, когда оценивается реализация прогноза, предсказания, основанного на анализируемом методе. Оценка по шкале депрессии может быть рассмотрена в качестве прогностического фактора последующих суицидальных попыток.
В отличие от других видов валидности, критериальная имеет ряд количественных характеристик. Критериальная валидность диагностической методики прежде всего определяется тем, насколько эффективно она способна констатировать позитивные результаты теста у тех обследуемых, которые в действительности имеют распознаваемое заболевание или высокий риск его развития, и негативные — у лиц, не имеющих данного заболевания или характеризуемых низким риском его развития. В табл. 14 представлено возможное соотношение результатов диагностического теста и истинного наличия или отсутствия распознаваемого заболевания (состояния), верифицированного «золотым стандартом» диагностики. В этой таблице величине a соответствует число обследуемых, имеющих положительные результаты диагностического теста при истинном наличии заболевания (истинно положительные результаты), величине b — число обследуемых, имеющих положительные результаты теста при фактическом отсутствии заболевания (ложноположительные результаты), величине c — число обследуемых, имеющих отрицательные результаты диагностического теста при истинном наличии заболевания (ложноотрицательные результаты), величине d — число обследуемых, имеющих отрицательные результаты диагностического теста при отсутствии заболевания (истинно отрицательные результаты).
Двумя принципиальными операционными характеристиками теста, отражающими его критериальную валидность, являются чувствительность (sensitivity, Se) и специфичность (specificity, Sp) (Кельмансон И. А., 2002; Власов В. В., 2004; Кельмансон И. А., 2004; Покровский В. П., Брико Н. И., 2012; Barker C. [et al.], 2002; Rothman K. J. [et al.], 2008).
Чувствительность — вероятность того, что результаты диагностического теста окажутся положительными при истинном наличии заболевания. Показатель вычисляется следующим образом:
По мере увеличения чувствительности теста снижается число испытуемых, фактически имеющих заболевание и неверно классифицируемых как здоровые в результате диагностического теста (снижается число ложноотрицательных результатов). Иначе говоря, если тест имеет высокую чувствительность, его негативные результаты позволяют эффективно исключить наличие диагноза.
Для правильной интерпретации смысла показателя чувствительности предлагается мнемоническое правило: SnNout (если тест имеет высокую чувствительность (Sensitivity), его отрицательные (Negative) результаты позволяют отвергнуть (rule out) диагноз) (Кельмансон И. А., 2002, 2004; Straus S. E., 2011).
Специфичность — вероятность того, что результаты теста окажутся отрицательными при истинном отсутствии заболевания у обследуемого. Специфичность рассчитывается следующим образом:
Высокая специфичность теста означает низкую вероятность его положительных результатов у лиц с отсутствием заболевания (низкую вероятность ложноположительных результатов). Иначе говоря, если тест имеет высокую специфичность, его позитивный результат позволяет эффективно распознать диагностируемое заболевание. Правильно интерпретировать смысл показателя специфичности помогает мнемоническое правило: SpPin (если тест характеризуется высокой специфичностью (Specificity), его позитивные (Positive) результаты подтверждают (rule in) диагноз) (Кельмансон И. А., 2002, 2004; Straus S. E., 2011).
Пример
Рассмотрим данные валидизации Эдинбургской шкалы постнатальной депрессии (Choi S. K. [et al.], 2012). Было обследовано 250 женщин; в качестве порогового уровня диагностики высокого уровня депрессивной симптоматики авторы выбрали значение > 3 баллов по шкале (табл. 15).
Расчет показателей чувствительности и специфичности дает следующие результаты:
Sc = a/(a + с) = 35/38 = 0,92 (92 %),
Sp = d/(b + d) = 186/212 = 0,88 (88 %).
При выбранном пороговом уровне тест имеет высокую чувствительность, равную 92 %. Следовательно, лишь в 8 % случаев существует вероятность того, что женщины, фактически имеющие проявления депрессивной симптоматики, будут неверно классифицироваться как здоровые. Тест имеет и достаточно высокую специфичность: в 88 % случаев положительные результаты теста позволяют правильно диагностировать наличие депрессивной симптоматики.
Очевидно, было бы весьма желательно, чтобы тест одновременно характеризовался высокой чувствительностью и специфичностью, как в приведенном примере. Однако на практике такая ситуация встречается редко, и можно говорить о существовании конкурентных отношений: по мере увеличения чувствительности наблюдается снижение специфичности теста и наоборот. Такая взаимоисключающая связь показателей чувствительности и специфичности отчасти связана с тем, что диагностика заболевания предполагает наличие лиц с доказанным отсутствием этого заболевания, доказанным наличием, а также существование некой «серой зоны», в пределах которой констатация наличия или отсутствия заболевания зависит от строгости используемых критериев. В подобных случаях снижение порогового уровня (выбран для констатации заболевания), направленное на снижение риска просмотра заболевания (а значит, на повышение чувствительности теста), должно неизбежно приводить к увеличению доли тех лиц, у которых будет ошибочно диагностироваться заболевание, т. е. к снижению специфичности.
Пример
Предположим, имеется гипотетическая методика, направленная на выявление определенного диагноза. Получены результаты обследования 30 испытуемых по данной методике, выявлено наличие у них распознаваемого диагноза (табл. 16). Очевидно, на операционные характеристики данного диагностического теста будет влиять выбор того порогового уровня, после достижения которого можно констатировать наличие заболевания. Зависимость чувствительности и специфичности теста от порогового уровня суммы баллов представлена в табл. 17. Снижение порогового уровня диагностики приводит к возрастанию чувствительности теста, но создает высокую вероятность ложноположительных результатов за счет неизбежного снижения специфичности. Напротив, завышение порога суммы баллов, необходимой для констатации диагноза, приводит к возрастанию вероятности пропуска тех лиц, которые в действительности имеют диагноз; в то же время доля ложноположительных результатов снижается.
Решение о выборе порогового уровня показателей теста, необходимого для принятия решения, во многом зависит от конкретной ситуации, прежде всего от значимости риска недооценки, пропуска распознаваемого состояния. Так, вполне обоснованным можно считать повышение чувствительности теста за счет снижения его специфичности, если речь идет о диагностике тяжелого заболевания, которое нельзя просмотреть, а также в тех случаях, когда проведение теста не требует больших материальных затрат и технически легко реализуемо (например, измерение артериального давления). Увеличение специфичности обосновано в случаях дорогостоящих и труднореализуемых тестов. Таким образом, чувствительности и специфичности может придаваться разный вес в зависимости от конкретной задачи исследования. Если вес, придаваемый чувствительности методики , обозначить как w, то вес, придаваемый специфичности, составит 1 -w. В этом случае оптимальный пороговый уровень, когда характеристики теста будут максимально удовлетворять требованиям исследователя, определяется максимальным значением М (Woodward M., 2014):
Если цель состоит в том, чтобы добиться оптимальной классификации при равной весовой значимости чувствительности и специфичности , то w = 0,5. В этом случае уравнение имеет вид:
Для выявления оптимального порогового уровня диагностики можно использовать индекс Юдена (Youden’d index, J), который рассчитывается следующим образом (Власов В. В., 2004; Szklo M., Nieto F. J., 2007):
В рассматриваемом примере максимальные величины показателя М и индекса Юдена наблюдаются при диагностическом пороге 31 балл, который можно признать оптимальным для разделения испытуемых в зависимости от наличия/отсутствия распознаваемого заболевания, если предъявляются равные требования к специфичности и чувствительности теста (см. табл. 17).
Компромиссным решением может быть батарея тестов, когда на первом этапе применяются относительно доступные и достаточно чувствительные методики предварительной оценки вероятного риска распознаваемого состояния, а затем у лиц, характеризуемых повышенным риском, осуществляют более детальную диагностику, уже используя высокоспецифичные тесты. Иными словами, высокая чувствительность — это принцип скрининг-методик, а высокая специфичность — специальных диагностических методик.
Для интегральной оценки соотношения чувствительности и специфичности методики при различных пороговых уровнях диагностики часто используют так называемую характеристическую кривую (receiver operating characteristic curve, ROC-curve) (Armitage P. [et al.], 2001; Peat J. K., Barton B., 2014; Woodward M., 2014). Эта кривая отражает связь вероятностей ложноположительных (1-специфичность) и истинно положительных (чувствительность) результатов. На рис. 43 представлена кривая, основанная на операционных характеристиках рассматриваемого примера гипотетического диагностического теста. Чем меньше изгиб кривой, чем ближе она расположена к биссектрисе, проходящей через начало координат под углом 45°, тем менее эффективно диагностическое исследование, так как точки на такой диагонали соответствуют отсутствию диагностической валидности теста (перемещение диагностического порога не приводит к изменению пропорции ложноположительных и истинно положительных результатов ).
Площадь под кривой (area under the curve, AUC), ограниченная характеристической кривой и осью абсцисс, является хорошей интегральной характеристикой эффективности теста. Теоретически эта площадь может принимать значения от 0 до 1,0. Поскольку в валидных тестах характеристическая кривая проходит выше биссектрисы, то обычно заслуживает обсуждения лишь изменение площади в диапазоне от 0,5 до 1,0 (площадь под биссектрисой изначально равна 0,5 и свидетельствует об отсутствии валидности методики). Чем ближе значение площади к 1,0, тем более эффективен диагностический тест. Статистические расчеты направлены на выявление достоверности различий вычисленной площади и площади, равной 0,5, свидетельствующей об отсутствии эффективности методики . В рассматриваемом примере площадь под кривой равна 0,864; данное значение с 99,9 % вероятностью (Р = 0,001) отличается от неэффективного показателя, равного 0,5. Приведенные оценки свидетельствуют об эффективности методики . Отметим, что большинство прикладных статистических программ (SPSS, SAS, STATA) позволяют построить такие характеристические кривые и изучить их параметры.
Отношение правдоподобия при положительном результате теста говорит о том, во сколько раз вероятность положительного результата теста выше у пациента с действительным наличием заболевания по сравнению с пациентом, у которого заболевание отсутствует (Кельмансон И. А., 2002; Власов В. В., 2004; Armitage P. [et al.], 2001; Woodward M., 2014). Рассчитывается данный показатель следующим образом:
Отношение правдоподобия при отрицательном результате свидетельствует о том, во сколько раз вероятность отрицательного результата теста выше у пациента с наличием заболевания по сравнению с пациентом, у которого в действительности отсутствует заболевание (Кельмансон И. А., 2002; Власов В. В., 2004; Armitage P. [et al.], 2001; Woodward M., 2014). Данный показатель вычисляется следующим образом:
В приведенном примере диагностики симптомов постнатальной депрессии на основе показателей Эдинбургской шкалы (см. табл. 15) отношение правдоподобия составит:
Полученные цифры свидетельствуют о том, что при позитивных результатах теста вероятность наличия депрессии у женщины возрастает в 7,67 раза, при отрицательных результатах она возрастает в 0,09 раза (или уменьшается примерно в 11 раз).
Прогностичность (predictive value). Суждение о критериальной валидности диагностической методики во многом основывается на вероятности совпадения выявленных положительных результатов с истинным наличием заболевания и отрицательных результатов с его отсутствием. Для этих целей широко используются показатели про-гностичности (Кельмансон И. А., 2002; Власов В. В., 2004; Rothman K. J. [et al.], 2008; Woodward M., 2014).
Прогностигность положительного результата (predictive value positive, PV+) отражает вероятность того, что пациент, имеющий положительные результаты теста, в действительности страдает заболеванием. Расчет осуществляется по формуле:
Прогностигность отрицательного результата (predictive value negative, PV-) отражает вероятность того, что у обследуемого с отрицательными результатами диагностического метода в действительности заболевание отсутствует. Расчет осуществляется по формуле:
Высокие показатели прогностичности отрицательного результата являются непременным условием любого диагностического метода, направленного на выявление редкого заболевания (состояния), так как, по условию, большая часть обследуемых лиц не страдает данным заболеванием.
Показатели прогностичности теста отчасти зависят от его чувствительности и специфичности. Действительно, чем чувствительнее тест, тем меньше вероятность того, что пациент, имеющий отрицательные диагностические результаты, страдает заболеванием и, следовательно, тем выше прогностичность отрицательного результата. Аналогично, чем выше специфичность теста, тем меньше вероятность того, что у пациента с положительными диагностическими результатами отсутствует заболевание, т. е. тем выше прогностичность положительного результата. Однако нужно отметить, что при прочих равных условиях прогностичность диагностического исследования существенным образом зависит от преваленса (распространенности в популяции) распознаваемого заболевания (патологического состояния), что не учитывается при расчете показателей чувствительности и специфичности. Это положение особенно актуально в случаях диагностики относительно редких заболеваний, с чем сталкиваются исследователи при проведении скрининга. Преваленс заболевания (патологического состояния) в обследуемой популяции и операционные характеристики теста, взаимодействуя между собой, определяют, какова вероятность идентификации заболевания среди обследуемых лиц. Лучше всего указанная взаимосвязь выявляется, если вместо пре-валенса использовать производную от него величину — претестовые шансы заболевания (pretest odds) (Кельмансон И. А., 2002; Straus S. E., 2011). Эти показатели соотносятся следующим образом:
Претестовые шансы заболевания = преваленс / (1 — преваленс).
Тогда послетестовые шансы заболевания (post-test odds) будут вычисляться как произведение претестовых шансов и отношения правдоподобия при положительных результатах теста:
Послетестовые шансы = претестовые шансы х LR+.
Конструктная валидность (construct validity) оценивается с целью определить, насколько структура опросника позволяет достоверно измерить то, что он должен измерить. Строятся определенные гипотезы, в основе которых лежат различные факторы (например, психологические, социальные или клинические показатели). В процессе исследования эти теоретические предположения подтверждают или опровергают. Различают виды конструктной валидности:
- конвергентная (convergent validity). результаты двух способов измерения одной характеристики должны коррелировать между собой;
- дискриминантная (discriminant validity): результаты измерения различных характеристик не связаны между собой (Barker C. [et al.], 2002).
В обоих случаях конструктная валидность предполагает оценку взаимосвязи изучаемой шкалы с определенными характеристиками.
Факторный анализ по методу главных компонент (Howell D. C., 2013) — статистический прием, который обеспечивает проверку предполагаемой структуры опросника и призван выявить отдельные компоненты в пределах структуры опросника. Относится к общепринятым подходам к оценке конструктной валидности. В процессе проведения факторного анализа определяют то, как пункты опросника распределяются по отношению к своим шкалам. Кроме того, факторный анализ должен показывать, что пункты шкалы относятся к своему фактору и тесно с ним коррелируют, слабо коррелируя с другими факторами.
Пример
Опросник SF-36, предназначенный для оценки качества жизни, связанного со здоровьем, принципиально предполагает наличие двухкомпонентной структуры (физического и психологического компонентов здоровья). Пункты таких шкал «Физическое функционирование» и «Боль» имеют высокую «факторную нагрузку» на физический компонент здоровья и низкую — на психологический компонент (Новик А. А., Ионова Т. И., 2007).
Метод известных групп. Респондентов распределяют на группы в зависимости от наличия или отсутствия у них какого-либо фактора. Высказывается наиболее вероятное предположение в отношении распределения у них данного фактора, и проводится анализ взаимосвязей показателей в зависимости от изучаемого фактора.
Пример
Изучаются показатели качества жизни, связанного со здоровьем, в зависимости от возраста пациентов: высказывались предположения о различиях показателей физического здоровья в различных возрастных группах. Эти предположения были подтверждены: респонденты старших возрастных групп имели показатели качества жизни хуже, чем респонденты молодого возраста (Новик А. А., Ионова Т. И., 2007).
Еще одним способом оценки конструктной валидности является оценка корреляций с внешними критериями (шкалами другого опросника, симптомами, клиническими или лабораторными показателями и т. д.). В таком случае целесообразно использовать многочертную-многометодную матрицу (multitrait-multimethod matrix) (Barker C. [et al.], 2002). Данная методика была предложена исследователями Д. Кэмпблом и Д. Фиске (D. Campbell, D. Fiske). Матрица представляет собой таблицу, отражающую корреляции между различными методиками, измеряющими различные конструкты. Важно одновременно анализировать и соотносить друг с другом не только измеряемые черты (т. е. что измеряется), но и измерительные методы (т. е. как измеряется).
Пример
Исследуется конструкт «высокий уровень тревоги во время публичных выступлений». Можно изучить показатели тревоги при помощи, скажем, двух различных опросников, а также исследовать частоту сердечных сокращений, кожный гальванический рефлекс у испытуемых во время публичных выступлений. Кроме того, у испытуемых можно исследовать коэффициент интеллекта, выраженность экстраверсии, уровень самооценки.
Многочертно-многометодная матрица будет отражать взаимную корреляцию всех изученных показателей. В частности, матрица будет показывать выраженность положительных корреляций измерений, относящихся к изучаемому конструкту, с измерениями, относящимися к другим близким конструктам. Это будет конвергентная валидность. С другой стороны, матрица будет показывать слабость или отсутствие корреляций измерений, относящихся к изучаемому конструкту, с измерениями, относящимися к конструктам, которые не связанны с данным конструктом (дискриминантная валидность) . В приведенном примере все измерения, направленные на изучение тревоги во время публичных выступлений, должны хотя бы умеренно коррелировать друг с другом. Предположительно, они не должны достоверно коррелировать с возрастом и коэффициентом интеллекта испытуемых. Кроме того, они должны лишь незначительно коррелировать с показателем самооценки, однако гораздо сильнее коррелировать с выраженностью экстраверсии. Матрица также позволяет выявить степень вариабельности отдельных методик, тенденцию, с которой коррелируют между собой близкие методики. Например, различные опросники, основанные на самоотчетах, часто взаимно коррелируют, хотя и призваны оценивать различные конструкты. Вот почему важно использовать в ходе исследования различные методики, а не целиком полагаться на какой-то один тип измерения.
Конвергентная валидность и дискриминантная валидность: определение, примеры
План экспериментов > Конвергентная валидность и дискриминантная валидность
Возможно, вам будет полезно сначала прочитать эту статью: Что такое валидность конструкции?
Что такое конвергентная и дискриминантная валидность?
Конвергентная валидность — это подтип конструктной валидности. Валидность конструкции означает, что тест, предназначенный для измерения конкретной конструкции (например, интеллекта), фактически измеряет эту конструкцию.Конвергентная валидность использует две меры, которые должны измерять один и тот же конструкт, и показывает, что они связаны. И наоборот, дискриминантная валидность показывает, что две меры, которые не должны быть связаны, на самом деле не связаны. Оба типа валидности являются требованием для отличной конструктной валидности.
Пример
Допустим, вы изучали депрессию у студентов колледжа. Чтобы измерить депрессию (конструкт), вы используете два измерения: опрос и включенное наблюдение.Если оценки двух ваших измерений достаточно близки (т. е. сходятся), это свидетельствует о том, что они измеряют одну и ту же конструкцию. Если они не сходятся, это может означать, что они измеряют разные конструкты (например, гнев и депрессию или самооценку и депрессию).
Конкретный пример можно найти у Chou et al. (2005), который изучал китайскую версию гериатрической шкалы суицидальных мыслей. Выборка состояла из 154 пожилых людей. В резюме сделан вывод, что « С точки зрения конвергентной валидности, GSIS-C значимо и положительно коррелирует с депрессией (по оценке CES-D), одиночеством (по пересмотренной шкале одиночества Калифорнийского университета в Лос-Анджелесе) и безнадежностью (по оценке по шкале безнадежности Бека).
Конвергентная валидность, дискриминантная валидность и корреляция
Определение конструкций может быть проблемой. Следовательно, применение конвергентной валидности и дискриминантной валидности также может быть проблемой. Конвергентная валидность обычно достигается путем демонстрации корреляции между двумя показателями, хотя редко какие-либо два показателя будут идеально сходящимися. В случае дискриминантной валидности можно было бы показать, что корреляции вообще нет.
Корреляция измеряется коэффициентом корреляции r по шкале от -1 до 1, где r=-1 — полная отрицательная корреляция, r=1 — полная положительная корреляция, а r=0 — полное отсутствие корреляции.
Графики, показывающие корреляцию -1, 0 и +1
.Иногда заявляют о конвергентной валидности, если коэффициент корреляции выше 0,50, хотя обычно рекомендуется выше 0,70.
Ссылка:
Carlson & Herdman, 2012. Получено 3 февраля 2016 г. с: www.management.pamplin.vt.edu/directory/Articles/Carlson1.pdf.
Нужна помощь с домашним заданием или контрольным вопросом? С Chegg Study вы можете получить пошаговые ответы на свои вопросы от эксперта в данной области.Ваши первые 30 минут с репетитором Chegg бесплатны!
Комментарии? Нужно опубликовать исправление? Пожалуйста, оставьте комментарий на нашей странице в Facebook .
Конвергентная и дивергентная валидность | Лэрд Диссертация
Конвергентная и дивергентная валидность
Конвергентная валидность и дивергентная валидность — это способы оценки конструктивной валидности процедуры измерения (Campbell & Fiske, 1959). Если вы не уверены, что такое конструктная валидность, мы рекомендуем вам сначала прочитать: Конструктивная валидность.Конвергентная валидность помогает установить конструктную валидность, когда вы используете две разные процедуры измерения и методы исследования (например, включенное наблюдение и опрос) в своей диссертации для сбора данных о конструкции (например, гнев, депрессия, мотивация, выполнение задач). Дивергентная валидность помогает установить конструктную валидность, демонстрируя, что интересующий вас конструкт (например, гнев) отличается от других конструктов, которые могут присутствовать в вашем исследовании (например, гнев).г., депрессия). Чтобы оценить конструктную валидность в своей диссертации, вы должны сначала установить конвергентную валидность, прежде чем проверять дивергентную валидность. В этой статье мы объясним, что такое конвергентная и дивергентная валидность, приведя несколько примеров.
Что такое конвергентная валидность?
Конвергентная валидность помогает установить конструктную валидность, когда вы используете две разные процедуры измерения и методы исследования (например, включенное наблюдение и опрос) в своей диссертации для сбора данных о конструкции (например.г., гнев, депрессия, мотивация, выполнение задания). Степень, в которой была продемонстрирована конвергентная валидность, определяется силой связи между баллами , полученными из двух разных процедур измерения и методов исследования, которые вы использовали для сбора данных о конструкции, которую вы изучаете. Идея состоит в том, что если эти оценки сходятся , несмотря на то , что мы используем две разные процедуры измерения и методы исследования, мы должны измерять одну и ту же конструкцию .
Мы используем слова , несмотря на факт , потому что в исследованиях может быть достаточно сложно создать одно надежное операционное определение для конструкции; то есть единственный надежный способ измерения конкретной конструкции. Одно дело предложить измерить конструкт рост с помощью сантиметров или вес человека с помощью килограммов , но это операциональные определения конструктов, вполне очевидные, где легко придумать одиночное рабочее определение.Гораздо сложнее создать надежные операционные определения для таких конструктов, как гнев, депрессия, мотивация и выполнение задачи, не говоря уже о множественных операционных определениях [см. статью о конструктах в количественных исследованиях]. Однако, чтобы установить конвергентную валидность, мы должны прийти к двум операционным определениям интересующей нас конструкции. .г., с включенным наблюдением и опросом в качестве методов исследования). Каждая из этих процедур измерения потребует отдельного рабочего определения. Давайте рассмотрим пример:
Исследование №1
Конструкция № 1 = Качество сна
Представьте, что мы заинтересованы в изучении взаимосвязи между уровнем физической подготовки и качеством сна ; то есть влияние, которое физические упражнения оказывают на то, насколько хорошо люди спят. Для целей этого примера давайте сосредоточимся на баллов на зависимой переменной , которая представляет собой качество сна (т.т. е. качество сна представляет собой интересующий конструкт ). Когда участники исследования просыпаются утром, они регистрируют качество своего сна с помощью анкеты , заполняемой самостоятельно (т.е. они заполняют анкету). Это дает нам представление о том, насколько хорошо участники чувствовали, что они спали. Однако является ли это надежной процедурой измерения конструкции качества сна ? Давайте представим, что мы просто не уверены, потому что иногда самостоятельные процедуры измерения могут быть подвержены определенным предубеждениям .Таким образом, мы также наблюдаем за участниками, пока они спят, используя видеокамеру для наблюдения за режимом их сна. Проводя наблюдения, мы набрали баллов за качество сна участников. Мы надеемся, что, используя два разных метода исследования для оценки качества сна , мы получим более надежную процедуру измерения интересующей нас конструкции. две разные процедуры измерения , используемые в соответствии с двумя методами исследования (т.e., баллов из опроса и баллов из включенного наблюдения ). Мы начнем демонстрировать конвергентную валидность , если существует сильная связь между двумя оценками (т. Такая сильная взаимосвязь, которая помогает продемонстрировать конвергентную валидность, является важным шагом в оценке конструктной валидности ; то есть мы можем быть более уверены в том, что процедуры измерения, которые мы используем для измерения качества сна , являются допустимой мерой конструкции , качества сна.
Чтобы установить конвергентную валидность, оценивается сила взаимосвязи между показателями двух разных процедур измерения, двух разных методов. Обычно это достигается путем расчета корреляции между двумя оценками.
ПРИМЕЧАНИЕ. Конвергентная валидность — это не то же самое, что параллельная валидность , которую мы более подробно обсуждаем в статье: Параллельная валидность. Тем не менее, различие довольно простое. И конвергентная, и параллельная валидность являются способами оценки конструктивной валидности путем изучения силы взаимосвязи между оценками двух разных процедур измерения.Однако в то время как параллельная валидность сравнивалась с новой процедурой измерения с хорошо зарекомендовавшей себя процедурой измерения , обе процедуры измерения являются новыми при тестировании на конвергентную валидность. Таким образом, если одна из процедур измерения, которые вы используете для определения конструктивной валидности, является хорошо зарекомендовавшей себя , вам следует прочитать статью: Параллельная валидность.
Что такое конвергентная и дискриминантная валидность?
Мартин Шаттлворт | Основное различие между конвергентной и дискриминантной валидностью заключается в том, что конвергентная валидность проверяет, связаны ли конструкции, которые должны быть связаны.Дискриминантная валидность проверяет, являются ли предполагаемые несвязанные конструкты на самом деле несвязанными.
C Конвергентная валидность и дискриминантная валидность обычно рассматриваются как способы оценки конструктной валидности процедуры измерения (Campbell & Fiske, 1959). Конвергентные тесты валидности, которые предполагают, что конструкции, которые должны быть связаны, на самом деле связаны. Короче говоря, конвергентная валидность помогает установить конструктную валидность, когда вы используете две разные процедуры измерения и методы исследования (например,например, включенное наблюдение и опрос) при сборе данных о конструкте (например, гнев, депрессия, мотивация, выполнение задачи). Дискриминантная валидность (или дивергентная валидность) проверяет, что конструкции, которые не должны иметь никакой связи, на самом деле не имеют никакой связи. Дискриминантная валидность помогает установить конструктную валидность, демонстрируя, что интересующий вас конструкт (например, гнев) отличается от других конструктов, которые могут присутствовать в вашем исследовании (например, депрессия). Чтобы оценить конструктную валидность в вашем исследовании, вы должны сначала установить конвергентную валидность, прежде чем проверять дискриминантную валидность.
Если показано, что исследовательская программа обладает обоими этими типами валидности, ее также можно рассматривать как имеющую превосходную конструктную валидность.
Во многих областях исследований, в основном в социальных науках, психологии, образовании и медицине, исследователям необходимо анализировать неколичественные и абстрактные понятия, такие как уровень боли, тревоги или успеваемости.
Исследователь должен точно определить, какую черту он измеряет, если он хочет поддерживать хорошую достоверность построения.
Конструкты очень редко существуют независимо друг от друга, потому что человеческий мозг не является простой машиной и состоит из взаимосвязанной паутины эмоций, рассуждений и чувств. Любая исследовательская программа должна распутать эти сложные взаимодействия и установить, что вы только тестируете желаемую конструкцию.
Это практически невозможно доказать без сомнений, поэтому исследователи собирают достаточно доказательств, чтобы защитить свои выводы от критики.
Основное различие между конвергентной и дискриминантной валидностью заключается в том, что конвергентная валидность проверяет, связаны ли конструкты, которые должны быть связаны.Дискриминантная валидность проверяет, являются ли предполагаемые несвязанные конструкты на самом деле несвязанными.
Представьте, что исследователь хочет измерить самооценку, но он также знает, что остальные четыре конструкции связаны с самооценкой и в некоторой степени пересекаются. Конечная цель состоит в том, чтобы попытаться изолировать самооценку.
В этом примере конвергентная валидность будет проверять, что четыре других конструкта на самом деле связаны с самооценкой в исследовании. Исследователь также проверит, что самооценка и уверенность в себе, а также социальные навыки и самооценка также связаны между собой.
Дискриминантная валидность гарантирует, что в исследовании неперекрывающиеся факторы не перекрываются. Например, самооценка и интеллект не должны (слишком сильно) быть связаны в большинстве исследовательских проектов.
Как видите, отделить и изолировать конструкты сложно, и это один из факторов, чрезвычайно затрудняющих социальные науки.
Социальные науки редко производят исследования, которые дают ответ «да» или «нет», а процесс сбора знаний идет медленно и неуклонно, опираясь на то, что уже известно.
Библиография
Домино Г. и Домино М.Л. (2006). Психологическое тестирование: введение. (2-е изд.). Кембридж: Издательство Кембриджского университета.
Джон, О.П., и Бенет-Мартинес, В. (2000). Измерение: надежность, проверка конструкции и построение шкалы. Ин Рейс, Х.Т., и Джадд, К.М. (Ред.). Справочник по методам исследования в социальной психологии и психологии личности, стр. 339-370. Кембридж, Великобритания: Издательство Кембриджского университета.
Струвиг М., Струвиг Ф.В. и Стед, Г.Б. (2001). Планирование, отчетность и разработка исследований, Кейптаун, Южная Африка: Pearson Education.
Мартин Джеймс Шаттлворт (Martyn James Shuttleworth) — опытный внештатный писатель, специализирующийся на написании академических, технических, копировальных материалов и статей. Обладает широким спектром письменных навыков и специальных знаний в ряде областей, включая науку, историю, строительство и вопросы окружающей среды. Он хорошо разбирается в широком спектре форматов и стилей технического письма. Подключиться через Электронная почта: info@freelance-writereditor.ком
построение гипотез и интерпретация результатов
BMC Res Notes. 2016; 9: 226.
, , , , и и иЙернг Л. Абма
6
Maroeska Rovers
Отделение медицинской документации и операционных, Институт медицинских наук Радбуда, Медицинский центр Университета Радбуда, Неймеген, Нидерланды
Philip J.van der Wees
Институт медицинских наук Радбуда, Медицинский центр Университета Радбауд, IQ Health, а/я 9101, huispost 114, 6500 HB Неймеген, Нидерланды
Институт медицинских наук Радбуда, Медицинский центр Университета Радбауд, IQ здравоохранение, а/я 9101, huispost 114, 6500 HB Неймеген, Нидерланды
Департамент медицинских данных и операционных, Институт медицинских наук Радбуда, Медицинский центр Университета Радбауд, Неймеген, Нидерланды
Автор, ответственный за переписку.Поступила в редакцию 15 января 2016 г.; Принято 8 апреля 2016 г.
Открытый доступ Эта статья распространяется в соответствии с условиями международной лицензии Creative Commons Attribution 4.0 (http://creativecommons.org/licenses/by/4.0/), которая разрешает неограниченное использование, распространение и воспроизведение на любом носителе при условии вы должным образом указываете автора (авторов) и источник, предоставляете ссылку на лицензию Creative Commons и указываете, были ли внесены изменения. Отказ от права Creative Commons на общественное достояние (http://creativecommons.org/publicdomain/zero/1.0/) относится к данным, доступным в этой статье, если не указано иное. Эта статья цитировалась в других статьях в PMC.Abstract
Цель
Конвергентная валидность — это один из типов валидности, который обычно оценивают для показателей результатов, сообщаемых пациентами (PROM). Он оценивается с помощью «проверки гипотез»: определения того, коррелируют ли оценки изучаемого инструмента с другими инструментами ожидаемым образом. Авторы систематических обзоров измерительных свойств PROM могут столкнуться с проверочными статьями, в которых не формулируются гипотезы, с помощью которых можно проверить конвергентную валидность.Таким образом, информация в этих статьях не может быть легко использована для определения адекватности конвергентной валидности. Мы предлагаем, чтобы в этих случаях рецензенты строили свои собственные гипотезы. Однако строить гипотезы и интерпретировать результаты не всегда просто, и мы хотим помочь рецензентам, основываясь на нашем собственном недавнем опыте систематического обзора свойств измерений.
Рекомендации
У нас есть следующие рекомендации для авторов систематического обзора свойств измерений, которые хотят построить гипотезы для конвергентной валидности: принимать активное участие в оценке пригодности инструментов сравнения статей проверки; быть прозрачным в отношении того, какие гипотезы были построены, лежащие в их основе предположения, на которых они основаны, и были ли они построены авторами проверочной статьи или рецензентом; обсудить неудовлетворенные гипотезы, особенно если конвергентная валидность признана неадекватной; и при синтезе данных суммируйте результаты всех гипотез для одного инструмента, а не оценивайте конвергентную достоверность для каждого исследования.
Исходная информация
Анкеты о состоянии здоровья и функционировании пациентов, заполняемые пациентом, также известные как показатели результатов, сообщаемые пациентом (PROM), должны быть проверены, чтобы гарантировать, что они измеряют тему («конструкт»), которую они стремятся измерить. (действительность), и что они делают это надежным способом (надежность). Существует несколько различных аспектов достоверности и надежности, которые можно оценить для определения качества PROM. Международная группа Delphi по составлению основанных на Консенсусе стандартов для выбора инструментов измерения здоровья (COSMIN) достигла консенсуса в отношении всеобъемлющей терминологии этих измерительных свойств, а также в отношении содержания первого удобного для пользователя контрольного списка качества для валидационных исследований [1– 3].Часто используются контрольный список и рекомендации COSMIN: поиск COSMIN в PubMed показывает 50 систематических обзоров измерительных свойств с использованием контрольного списка COSMIN только за 2015 год.
Одним из аспектов валидности является конструктная валидность, то есть степень, в которой баллы PROM согласуются с гипотезами, основанными на предположении, что PROM достоверно измеряет измеряемый конструкт [4–7]. Конвергентная валидность, подтип конструктной валидности, проверяет, «имеют ли смысл» оценки изучаемого инструмента по отношению к оценкам других, родственных инструментов.Оценки должны коррелировать с оценками других инструментов в ожидаемой степени. Оценка конвергентной валидности представляет собой итеративный процесс: чем больше гипотез проверяется, тем сильнее доказательства в пользу достоверности инструмента. Конвергентная валидность обычно считается адекватной, если > 75 % гипотез верны или если корреляция с инструментом, измеряющим ту же конструкцию, составляет >0,50. Точные значения этих точек отсечки могут быть произвольными, но они служат ориентиром при оценке адекватности конвергентной валидности.Кроме того, корреляции с родственными конструктами должны быть выше, чем с неродственными [4, 8].
При систематическом обзоре свойств измерений оценка и обобщение данных для конвергентной валидности часто менее просты, чем для многих других свойств измерений. Авторы валидационных исследований не всегда строят гипотезы при изучении конвергентной валидности: во многих исследованиях представлены только размеры корреляции, без их интерпретации или использования для проверки ожиданий.Основываясь на руководящих принципах COSMIN, эти данные не могут быть легко использованы в систематическом обзоре. Поэтому авторы недавнего систематического обзора [9] решили построить свои собственные гипотезы конвергентной валидности. В нашем собственном недавнем систематическом обзоре измерительных свойств PROM для обструктивного апноэ сна (OSA) [10] мы последовали их примеру.
Мы считаем, что построение гипотез конвергентной валидности должно стать более распространенным в систематических обзорах свойств измерений, в которых включенные исследования не представляют своих собственных гипотез.Однако при таком подходе к проверке гипотез возникают определенные проблемы, в том числе: как поступать с неподходящими или низкокачественными инструментами сравнения; различные способы построения гипотез; интерпретация результатов и синтез доказательств, которые являются общими вопросами независимо от подхода. Эти вопросы еще не обсуждались в литературе. Цель этой статьи состоит в том, чтобы дать обзор этих вопросов, касающихся конвергентной валидности, и начать обсуждение того, как их лучше всего решить в будущих систематических обзорах.Кроме того, мы считаем, что соображения, изложенные в этой статье, помогут авторам будущих проверочных исследований, которые столкнутся со многими похожими проблемами.
Качество приборов сравнения
В идеале должно быть ясно, что приборы сравнения достоверно и надежно измеряют то, что они должны измерять. На практике, однако, инструменты сравнения часто не проходят всесторонней валидации или не валидируются в целевой популяции. Кроме того, неясно, когда именно прибор-компаратор является «действительным» — нет никаких правил или предложений о том, какие измерительные свойства должны быть достаточно качественными для приборов-компараторов (и из-за иногда ограниченной доступности подходящих приборов-компараторов это также может не сработать). быть желанным).Наиболее практичным подходом для рецензентов может быть исключение инструментов сравнения из-за недостаточного качества только в том случае, если вообще нет доступных статей для разработки или проверки.
Однако есть одна ситуация, в которой качество инструмента или шкалы может явно ограничивать их ценность в качестве инструмента сравнения для конвергентной валидности: когда не все вопросы шкалы связаны с одной и той же конструкцией. Иногда шкалы претендуют на измерение довольно «расплывчатой» темы, такой как социальное функционирование.На практике вопросы, составляющие одну шкалу «социального функционирования», часто сильно отличаются от пунктов других шкал с аналогичными названиями, и нельзя обязательно предполагать, что их оценки в значительной степени коррелируют, что проблематично при попытке определить достоверность инструмента. находится в стадии изучения (примеры этого явления см. в Kemmler 1999 [11] или Lacasse 2004 [12]). Может случиться так, что «социальное функционирование» просто не является правильным обозначением конструкта для (одной из) этих шкал, или недостаточно точным описанием конструкта, или шкалы имеют разные лежащие в основе теории о том, как измерять социальное функционирование.Другая возможность состоит в том, что они представляют собой набор вопросов с разными темами вокруг одной и той же общей темы, а не одну связную конструкцию. Если для шкалы сравнения был проведен факторный анализ и/или если была определена внутренняя согласованность шкалы, это может помочь определить шкалы, для которых это имеет место. Мы бы рекомендовали ознакомиться как с содержанием шкалы, так и с доступной информацией о свойствах измерения, прежде чем принимать решение о дисквалификации шкалы сравнения или инструмента из-за проблем с непротиворечивостью построения.
Во всех случаях мы рекомендуем (кратко) обсудить качество инструментов сравнения, так как это может помочь оценить результаты конвергентной валидности в перспективе.
Пригодность инструментов сравнения
Конструкция инструментов сравнения важна для конвергентной валидности: в идеале ее конструкция должна иметь четкую связь с изучаемой конструкцией. Эта четкая связь не всегда присутствует для инструментов сравнения, используемых в валидационных исследованиях.Следовательно, размеры корреляции трудно предсказать. Примером из нашего обзора является связь между субъективной сонливостью и объективной тяжестью апноэ во сне, которая не является однозначной [13–15]. Если результаты исследования опровергают какую-либо сконструированную гипотезу, это больше иллюстрирует путаницу в связи между этими двумя конструктами, чем дает информацию о достоверности инструмента. Мы рекомендуем исключить сравнения с этими «неподходящими» конструктами из доказательной базы.
Кроме того, иногда конструкты сравнения имеют лишь отдаленное отношение к изучаемому конструкту. Примером из нашего обзора является связь между сонливостью и качеством жизни. Эти конструкции, вероятно, в некоторой степени связаны с пациентами, страдающими апноэ во сне, состоянием, при котором сонливость часто является основной жалобой. Однако гипотезы о низкой корреляции для слабо связанных конструктов часто верны и снижают влияние гипотез для более сильно связанных конструктов, что особенно проблематично в случаях, когда первых больше, чем вторых, и нет четкого обоснования выбора конструктов. эти слабо связанные инструменты сравнения или домены.Мы рекомендуем использовать ожидаемые слабые корреляции только для требования, чтобы корреляции со связанными конструкциями были выше, чем с несвязанными конструкциями.
Иногда для проверки друг друга используются два инструмента. Это не идеально, так как неясно, какой инструмент «неисправен», если гипотеза не выполняется. Однако, поскольку может быть довольно сложно интерпретировать результаты в любом случае (см. раздел «Интерпретация результатов»), рецензенты могут принять решение о включении этих исследований и обсуждении нереализованных гипотез в контексте рассматриваемого валидационного исследования.
Построение гипотез
COSMIN рекомендует строить гипотезы для величин относительной корреляции различных инструментов сравнения. т.е. ожидается, что корреляция интересующего инструмента с инструментом А будет выше, чем его корреляция с инструментом В. Однако конструкции инструментов сравнения не всегда могут быть подходящими для выдвижения значимых относительных гипотез. Чтобы иметь возможность делать гипотезы для каждого инструмента сравнения, может быть желательно также построить гипотезы для абсолютной величины корреляций.В нашем обзоре мы относим каждый инструмент сравнения к одной из следующих категорий: слабый (<0,3), слабый или умеренный (>0,2 <0,4), средний (>0,3 <0,7), средний или высокий (>0,6 <0,8). или высокая корреляция (>0,7). Перекрытие между этими категориями было преднамеренным, чтобы обеспечить большую гибкость в гипотезах. Для каждой корреляции мы также отмечали ожидаемое направление корреляции — положительное или отрицательное. Обратите внимание, что мы не сосредоточились на общем требовании, согласно которому конвергентная валидность является адекватной, если инструмент, измеряющий ту же конструкцию, >0.50. Мы подробно изучили инструменты, а не полагались только на описание инструментов сравнения, и когда два инструмента действительно измеряли одну и ту же конструкцию, мы считали более сложную гипотезу (корреляция выше >0,70) более адекватной.
Если во включенном проверочном исследовании используются гипотезы для оценки конвергентной валидности, эти гипотезы могут быть объединены с гипотезами рецензентов. Если первоначальные гипотезы более строгие, чем те, что были построены рецензентами, их можно скорректировать.Например, в нашем обзоре мы скорректировали прогноз ровно 0,3, чтобы он соответствовал нашей категории «от слабой до умеренной» (> 0,2 <0,4).
Интерпретация результатов
Когда гипотеза верна, это способствует подтверждению того, что исследуемый инструмент измеряет то, что он должен измерять. Однако, когда гипотеза неверна, это может иметь несколько причин: (1) прибор не измеряет то, что он должен измерять, (2) прибор сравнения не измеряет то, что он должен измерять, или (3) теория или предположения, лежащие в основе гипотезы, неверны [5].Не всегда ясно, какая из этих возможностей верна в той или иной ситуации, хотя у авторов могут быть свои представления о наиболее вероятной причине. В идеале авторы обсуждают возможные причины, по которым гипотеза не оправдалась.
Гипотезы о корреляциях, особенно когда они измеряют разные, но связанные конструкты, в некоторой степени являются наиболее обоснованными предположениями. Другая команда авторов или рецензентов, скорее всего, выдвинет (немного) другие гипотезы, что, возможно, приведет к другим выводам.Поэтому мы предлагаем подробное описание проверяемых гипотез.
Синтез доказательств
Во многих систематических обзорах свойств измерений сообщаются результаты путем синтеза доказательств. Чтобы определить силу доказательств для каждого свойства измерения, часто принимается во внимание количество валидационных исследований, изучающих это свойство измерения, а также качество исследований [8, 16, 17]. Качество самих измерительных свойств может быть положительным, отрицательным, неопределенным (когда доступны только исследования низкого качества) или противоречивыми (когда результаты валидационных исследований неоднозначны).Хотя этот подход имеет смысл для некоторых свойств измерения, для проверки гипотез количество исследований может быть менее релевантным, чем количество проверенных гипотез. Например: если есть два исследования, измеряющие конвергентную валидность, и в одном исследовании есть только одна гипотеза, которая оказалась неточной (отрицательное свидетельство), а в другом есть три разные гипотезы, которые являются точными (положительные доказательства), метод оценки приведет к с «противоречивым» общим баллом. Однако в целом 75 % гипотез верны.Таким образом, суммирование гипотез различных исследований привело бы к более разумной оценке конвергентной валидности инструмента. Чтобы включить в оценку методологическое качество различных исследований, можно было бы придать больший вес гипотезам о лучших исследованиях или просто решить, что все исследования должны быть как минимум приемлемого качества.
Обсуждение
Построение гипотез конвергентной валидности в систематическом обзоре требует усилий, но это единственный способ оценить это свойство измерения, если ранее не было построено никаких гипотез.В этой статье представлен обзор вопросов, которые могут возникнуть в систематических обзорах, оценивающих измерительные свойства PROM. Наши рекомендации кратко изложены во вставке 1. Они могут быть полезны будущим рецензентам и авторам статей по валидации в отношении конвергентной валидности, а также других свойств измерения, которые определяются с помощью проверки гипотез, таких как валидность по известным группам и дискриминантная валидность. (оба также подтипы конструктной валидности) и отзывчивость.
Важность проверки гипотез заключается в ее способности помочь понять структуру показателей PROM. ППЗУ, помеченное неточной конструкцией, представляет собой проблему, которая в противном случае может остаться нераспознанной, поскольку она не обязательно влияет на другие свойства измерения. Неадекватная конструктивная валидность приводит к вопросу о том, какой конструкт действительно измеряет PROM, и придется еще раз взглянуть на содержание вопросника и поместить его в контекст его инструментов сравнения.В зависимости от ситуации, либо элементы PROM могут быть адаптированы, либо может быть решено перемаркировать конструкцию, которую PROM стремится измерить.
Установление конвергентной валидности сопряжено с несколькими проблемами: его результаты в значительной степени зависят от выбора инструментов сравнения и от того, какие и сколько гипотез построены. Однако, поскольку 75 % гипотез должны быть точными, а не все из них, один неадекватный инструмент сравнения или гипотеза не будут немедленно препятствовать положительному суждению о конвергентной достоверности.Кроме того, если результаты интерпретировать критически, мы убеждены, что возможно точное суждение о конвергентной достоверности.
Box1
Вклад авторов
IA внесла свой вклад в концепцию этой рукописи и подготовила ее. PW и MR внесли свой вклад в концепцию этой рукописи и критически переработали ее. Все авторы прочитали и одобрили окончательный вариант рукописи.
Конкурирующие интересы
Авторы заявляют об отсутствии конкурирующих интересов.
сокращения
COSMIN | COSMIN | COSSENSUS на основе стандартов измерения состояния здоровья |
OSA | Обструктивный сон APNEA | |
PROM | Pature Categle Revices |
Ссылки
1. Mokkink LB, Terwee CB, Patrick DL, Alonso J, Stratford PW, Knol DL, Bouter LM, de Vet HC. В исследовании COSMIN был достигнут международный консенсус в отношении таксономии, терминологии и определений характеристик измерения результатов, о которых сообщают пациенты, связанных со здоровьем.Дж. Клин Эпидемиол. 2010;63:737–745. doi: 10.1016/j.jclinepi.2010.02.006. [PubMed] [CrossRef] [Google Scholar]2. Моккинк Л.Б., Терви К.Б., Патрик Д.Л., Алонсо Дж., Стратфорд П.В., Кнол Д.Л., Баутер Л.М., де Вет Х.К. Контрольный список COSMIN для оценки методологического качества исследований измерительных свойств приборов для измерения состояния здоровья: международное исследование Delphi. Качество жизни Res. 2010; 19: 539–549. doi: 10.1007/s11136-010-9606-8. [Бесплатная статья PMC] [PubMed] [CrossRef] [Google Scholar]3. Terwee CB, Mokkink LB, Knol DL, Ostelo RW, Bouter LM, de Vet HC.Оценка методологического качества в систематических обзорах исследований свойств измерений: система баллов для контрольного списка COSMIN. Качество жизни Res. 2012;21:651–657. doi: 10.1007/s11136-011-9960-1. [Бесплатная статья PMC] [PubMed] [CrossRef] [Google Scholar]4. Terwee CB, Bot SD, de Boer MR, van der Windt DA, Knol DL, Dekker J, Bouter LM, de Vet HC. Предложены критерии качества измерения свойств опросников о состоянии здоровья. Дж. Клин Эпидемиол. 2007; 60:34–42. doi: 10.1016/j.jclinepi.2006.03.012. [PubMed] [CrossRef] [Google Scholar]5. Штрайнер Д., Норман Г. Шкалы измерения здоровья: практическое руководство по их разработке и использованию. 4. Оксфорд: издательство Оксфордского университета; 1995. [Google Scholar]6. Де Вет Х.К., Терви К.Б., Моккинк Л.Б., Кнол Д.Л. Измерение в медицине. Кембридж: Издательство Кембриджского университета; 2011. [Google Академия]7. Fayers PM, Machin D. Качество жизни: оценка, анализ и интерпретация. 2. Чичестер: Уайли; 2000. [Google Scholar]8. Шеллингерхаут Дж.М., Верхаген А.П., Хейманс М.В., Коэс Б.В., де Вет Х.К., Терви К.Б.Измерительные свойства опросников по конкретным заболеваниям у пациентов с болью в шее: систематический обзор. Качество жизни Res. 2012;21:659–670. doi: 10.1007/s11136-011-9965-9. [Бесплатная статья PMC] [PubMed] [CrossRef] [Google Scholar]9. Кендзерска Т.Б., Смит П.М., Бриньярделло-Петерсен Р., Леунг Р.С., Томлинсон Г.А. Оценка измерительных свойств шкалы сонливости Эпворта: систематический обзор. Sleep Med Rev. 2014; 18:321–331. doi: 10.1016/j.smrv.2013.08.002. [PubMed] [CrossRef] [Google Scholar] 10.Абма И.Л., ван дер Вис П.Дж., Вир В., Вестерт Г.П., Роверс М. Измерительные свойства показателей результатов, сообщаемых пациентами (PROM) у взрослых с обструктивным апноэ во сне (СОАС): систематический обзор. Sleep Med Rev. 2015; 28:14–27. doi: 10.1016/j.smrv.2015.07.006. [PubMed] [CrossRef] [Google Scholar] 11. Кеммлер Г., Хольцнер Б., Копп М., Дансер М., Маргрейтер Р., Грейл Р., Спернер-Унтервегер Б. Сравнение двух инструментов оценки качества жизни онкологических больных: общая функциональная оценка терапии рака и Европейская организация исследований и Лечение рака Опросник качества жизни-C30.Дж. Клин Онкол. 1999;17:2932–2940. [PubMed] [Google Scholar] 12. Lacasse Y, Bureau MP, Series F. Новый стандартизированный и самоуправляемый вопросник качества жизни, специфичный для обструктивного апноэ сна. грудная клетка. 2004; 59: 494–499. doi: 10.1136/thx.2003.011205. [Бесплатная статья PMC] [PubMed] [CrossRef] [Google Scholar]13. Мейси П.М., Ву М.А., Кумар Р., Кросс Р.Л., Харпер Р.М. Взаимосвязь между тяжестью обструктивного апноэ сна и симптомами сна, депрессии и тревоги у впервые диагностированных пациентов. ПЛОС ОДИН.2010;5:e10211. doi: 10.1371/journal.pone.0010211. [Бесплатная статья PMC] [PubMed] [CrossRef] [Google Scholar]14. Там С., Вудсон Б.Т., Ротенберг Б. Измерения результатов при обструктивном апноэ во сне: помимо индекса апноэ-гипопноэ. Ларингоскоп. 2014; 124:337–343. doi: 10.1002/lary.24275. [PubMed] [CrossRef] [Google Scholar] 15. Weaver EM, Kapur V, Yueh B. Полисомнография в сравнении с самооценкой пациентов с апноэ во сне. Arch Otolaryngol Head Neck Surg. 2004; 130:453–458. doi: 10.1001/архотол.130.4.453.[PubMed] [CrossRef] [Google Scholar] 16. Нобен С.Ю., Эверс С.М., Нейхуис Ф.Дж., де Рийк А.Е. Оценка качества общих инструментов самооценки, измеряющих изменения производительности, связанные со здоровьем: систематический обзор. Общественное здравоохранение BMC. 2014;14:115. дои: 10.1186/1471-2458-14-115. [Бесплатная статья PMC] [PubMed] [CrossRef] [Google Scholar]17. Wigham S, McConachie H. Систематический обзор свойств инструментов, используемых для измерения результатов в исследованиях вмешательства при тревоге у детей с расстройствами аутистического спектра. ПЛОС ОДИН.2014;9:e85268. doi: 10.1371/journal.pone.0085268. [Бесплатная статья PMC] [PubMed] [CrossRef] [Google Scholar]Конвергентная валидность | Чегг пишет
Опубликовано 27 ноября 2021 г. Обновлено 14 декабря 2021 г.
Предположим, что психологическое исследование самооценки студентов собрало ответы как в форме анкеты, так и в ходе личного опроса той же группы студентов. В этом случае их ответы должны быть схожими.Высокая корреляция между ответами, полученными обоими методами, обеспечит высокую конвергентную достоверность.
Конвергентная валидность также полезна в исследованиях, в которых присутствует несколько коррелирующих переменных. Многие области науки о поведении изучают переменные, которые взаимосвязаны с несколькими другими факторами. В таких случаях важно установить конвергентную достоверность между переменными, которые считаются связанными.
Дискриминантная валидность
Дискриминантная валидность измеряет, являются ли понятия, не связанные в теории, не связанными в исследовании.Он измеряет степень, в которой различные переменные не связаны друг с другом. Это полезно в социальных науках, поскольку помогает исключить факторы, не связанные с изучаемой переменной. Например,
В области психологии принято считать, что самооценка человека не связана с его интеллектом. Поэтому при проведении исследования, затрагивающего самооценку человека, исследователь должен проверить, не связаны ли эти две отдельные переменные друг с другом в исследовании.Низкая корреляция между переменными обеспечит их высокую дискриминантную валидность.
Дискриминантная валидность полезна в социальных науках и других науках о поведении, где необходимо исключить множество несвязанных факторов при изучении переменной, чтобы исследование имело высокую конструктную валидность.
Ключевые блюда на вынос
- Конвергентная и дискриминантная валидность помогают установить конструктную валидность исследования. Другой способ заявить об этом состоит в том, что они устанавливают степень законности тестов, проведенных в исследовании.
- Конвергентная валидность измеряет, связаны ли переменные, которые предположительно связаны, в исследовании, в то время как дискриминантная валидность изучает, действительно ли переменные, которые считаются несвязанными, не связаны в исследовании.
- Они используются в основном в поведенческих науках, где требуется индивидуальное изучение множества взаимосвязанных переменных.
- В большинстве случаев полной конвергенции или различения достичь не удается, поэтому исследователи полагаются на меру степени конвергентной или дискриминантной валидности для оценки конструктной валидности исследования.
Сбор и анализ данных
Для получения более подробной информации посетите эти дополнительные руководства по исследованиям.
Отбор проб
Надежность и валидность
Что входит в подписку Chegg Writing
- Неограниченное количество сканов бумаги
- Обнаружение плагиата: проверка по миллиардам источников
- Экспертная вычитка статей по любой тематике
- Проверка грамматики на наличие более 200 типов распространенных ошибок
- Автоматически создавайте и сохраняйте цитаты в более чем 7000 стилей
- Отменить подписку в любое время, без обязательств
Конвергентная и дискриминантная валидность — Bio-101
Конвергентную и дискриминантную валидность инструмента оценивали с помощью подхода Форнелла и Ларкера с использованием извлеченной средней дисперсии (AVE), максимальной общей квадратичной дисперсии (MSV) и CR.Конвергентная валидность подтверждается, если пункты предполагаемой шкалы показывают сильные корреляции.
Кроме того, дискриминантная валидность поддерживается, когда извлеченные факторы отличаются друг от друга [32]. Для подтверждения конвергентной валидности AVE должен быть больше 0,5, а CR должен быть больше AVE. Однако дискриминантная валидность сохраняется, если AVE больше, чем MSV [33].
Информация об авторских правах и лицензии: Автор(ы) © 2021Открытый доступЭта статья находится под лицензией Creative Commons Attribution 4.0 Международная лицензия, которая разрешает использование, совместное использование, адаптацию, распространение и воспроизведение на любом носителе или в любом формате при условии, что вы укажете автора(ов) оригинала и источник, предоставите ссылку на лицензию Creative Commons и укажете если были внесены изменения. Изображения или другие сторонние материалы в этой статье включены в лицензию Creative Commons на статью, если иное не указано в кредитной строке материала. Если материал не включен в лицензию Creative Commons статьи, а ваше предполагаемое использование не разрешено законом или выходит за рамки разрешенного использования, вам необходимо получить разрешение непосредственно от правообладателя.Чтобы просмотреть копию этой лицензии, посетите http://creativecommons.org/licenses/by/4.0/. Отказ от права Creative Commons на общественное достояние (http://creativecommons.org/publicdomain/zero/1.0/) применяется к данным, представленным в этой статье, если иное не указано в кредитной линии данных.
Примечание. Содержимое выше было извлечено из исследовательской статьи, поэтому оно может отображаться некорректно.
Что означает конвергентная валидность? – СидмартинБио
В чем смысл конвергентной валидности?
Конвергентная валидность относится к тому, насколько тесно новая шкала связана с другими переменными и другими показателями той же конструкции.Конструкт должен не только коррелировать со связанными переменными, но и не должен коррелировать с непохожими, несвязанными.
Что такое пример конвергентной достоверности?
Например, чтобы проверить конвергентную валидность меры самооценки, исследователь может захотеть показать, что меры подобных конструктов, таких как самооценка, уверенность, социальные навыки и самооценка, также связаны с самооценку, тогда как непересекающиеся факторы, такие как интеллект, не должны …
Что такое конвергентная достоверность в статистике?
Конвергентная валидность использует две меры, которые должны измерять один и тот же конструкт, и показывает, что они связаны.И наоборот, дискриминантная валидность показывает, что две меры, которые не должны быть связаны, на самом деле не связаны. Оба типа валидности являются требованием для отличной конструктной валидности.
В чем разница между конвергентной и дивергентной валидностью?
Конвергентные тесты на валидность, которые предполагают, что конструкции, которые должны быть связаны, на самом деле связаны. Дискриминантная валидность (или дивергентная валидность) проверяет, что конструкции, которые не должны иметь никакой связи, на самом деле не имеют никакой связи.
Что такое конвергентная валидность в SEM?
Оценка конвергентной валидности является требованием для эмпирической оценки формирующих моделей измерения в PLS-SEM. Конвергентная валидность — это степень, в которой показатель соотносится с другими показателями того же явления (Hair et al., 2017a, глава 5).
Что такое конвергентная валидность и когда она имеет значение?
Конвергентная валидность утверждает, что тесты, имеющие одинаковые или похожие конструкции, должны быть сильно коррелированы.Для проверки конвергентной валидности часто применяются два метода. Один из них заключается в сопоставлении оценок между двумя инструментами оценки или подобластями инструментов, которые, как считается, измеряют одну и ту же конструкцию.
Что такое тест на конвергентную валидность?
Степень корреляции меры с родственным поведением. конвергентная валидность. степень, в которой показатель коррелирует с показателями тех же концептуальных переменных/конструкций. дискриминантная валидность. степень, в которой показатель не коррелирует с показателями различных концептуальных переменных/конструкций.
Что такое расходящаяся валидность и приведите пример?
Если обнаруживается, что тест слишком сильно коррелирует (или слишком похож) с другим тестом, это означает, что тесты измеряют одно и то же и слишком похожи, чтобы считаться разными. Примером может служить тест, используемый компанией для целей найма, который измеряет, насколько хорошо кто-то владеет определенным навыком.
Почему важна конвергентная валидность?
Что такое конвергентная валидность? Конвергентная валидность помогает установить конструктную валидность, когда вы используете две разные процедуры измерения и методы исследования (например,например, включенное наблюдение и опрос) в своей диссертации для сбора данных о конструкте (например, гнев, депрессия, мотивация, выполнение задания).
Что такое исследование достоверности?
Валидность определяется как степень точности измерения концепции в количественном исследовании. Например, опрос, предназначенный для изучения депрессии, но фактически измеряющий тревогу, не будет считаться достоверным.
Что такое конвергентная валидность в SEM?
Что такое викторина конвергентной валидности?
Что такое конвергентная и дивергентная валидность?
Конвергентные тесты на валидность, которые предполагают, что конструкции, которые должны быть связаны, на самом деле связаны.Дискриминантная валидность (или дивергентная валидность) проверяет, что конструкции, которые не должны иметь никакой связи, на самом деле не имеют никакой связи.
Какие существуют 4 типа валидности?
В этом уроке мы рассмотрим, что такое валидность, почему она важна, а также четыре основных типа валидности: лицевая, конструктная, содержательная и прогностическая валидность.
Что такое тестирование конвергентной и дивергентной валидности?
Еще один способ узнать, дает ли опрос нужные вам результаты, — это проверить конвергентную и дивергентную валидность.Их можно определить следующим образом: Конвергентная валидность – когда два одинаковых вопроса дают один и тот же результат. Расходящаяся валидность — когда два противоположных вопроса дают противоположные результаты. Тестирование на этот тип валидности требует, чтобы вы, по сути, задавали своим образцам похожие вопросы, которые разработаны, чтобы дать вам ожидаемые ответы.
Какие существуют типы доказательств достоверности?
Существует как минимум три типа свидетельств валидности: конструктивная валидность, валидность критерия и содержательная валидность.Для исследователя, пытающегося собрать доказательства валидности инструмента, для инструмента должны быть установлены все три типа валидности. Каждый тип доказательства достоверности будет описан по очереди.
.