Валидность теста это в психологии: Надежность и валидность психологических тестов

Содержание

Валидность (психология) | это… Что такое Валидность (психология)?

Вали́дность (англ. validity) — мера соответствия того, насколько методика и результаты исследования соответствуют поставленным задачам. В частности, валидность считается фундаментальным понятием экспериментальной психологии и психодиагностики.

Как в экспериментальной психологии, так и в статистике валидное измерение — такое измерение, которое измеряет то, что оно должно измерять. То есть, к примеру, при валидном измерении интеллекта измеряется именно интеллект, а не что-то другое. Безупречный эксперимент (возможный лишь в теории) будет обладать безупречной валидностью: он будет точно показывать, что экспериментальный эффект был вызван изменением независимой переменной, он будет полностью соответствовать реальности, его результаты можно обобщить без ограничений.

Когда говорят о степени валидности, рассматривается то, насколько результаты исследования соответствуют поставленным задачам (однако при этом валидность не измеряется в каких-либо условных единицах).

Содержание

  • 1 Способы установления валидности теста
  • 2 Требования к идеальному тесту
  • 3 Виды валидности
  • 4 См. также
  • 5 Ссылки

Способы установления валидности теста

Существуют четыре основных способа установления валидности теста.

I. Оценка очевидной валидности.

Очевидная валидность – валидность, при которой оценивается общее соответствие теста его назначению.

II. Оценка содержательной валидности.

Содержательная валидность предполагает, что тест обнаруживает в себе полный набор заданий для измерения определенной черты.

III. Оценка конструктной валидности.

Этот способ проверки заключается в проведении продуманных экспериментов. Подход первый — «конвергентная валидизация» — это проверка ожидаемой связи тестовых оценок с другими показателями. Например, если для измерения какой-либо черты существует несколько методик, целесообразным было бы провести эксперименты по хотя бы двум, и тогда при обнаружении высокой положительной корреляции их результатов между собой можно говорить о валидности.

Основной целью конвергентной валидизации является определение того, будут ли оценки теста варьироваться в соответствии с ожиданиями. Подход второй — «дивергентная валидизация» (англ.). Проверка валидности здесь заключается в том, что тест не должен измерять никакой черты, с которой он теоретически и не должен быть связан.

IV. Оценка прогностической валидности.

Прогностическая валидность заключается в том, что психологический тест часто используется для прогноза поведения. Соответственно, если прогноз оправдывается с течением времени, это говорит о том, что тест был валидным. Но для характеристики многих видов деятельности этого метода не достаточно.

Требования к идеальному тесту

  1. Минимальное количество заданий. Однако чем больше личностных факторов хочет измерить тестирующий, тем большее количество вопросов целесообразнее задать тестируемому.
  2. Тест должен соответствовать целевой группе, на которую он направлен. Верно то утверждение, что тест, направленный на одну группу, в результате тестирования которой были получены достоверные результаты, может быть невалидным в отношении другого целевого сегмента.
  3. Адаптация теста. Применяется в случае проведения теста в иноязычной стране.

Виды валидности

  • Внешняя валидность
    • Операциональная валидность
    • Конструктная валидность
  • Внутренняя валидность
  • Экологическая валидность
  • Дифференциальная валидность
  • Иллюзорная валидность
  • Инкрементная валидность
  • Консенсусная валидность
  • Критериальная валидность
  • Очевидная валидность
  • Валидность по возрастной дифференциации
  • Прогностическая валидность
  • Содержательная валидность
  • Текущая валидность
  • Эмпирическая валидность

См. также

  • Психологический эксперимент
  • Безупречный эксперимент в психологии
  • Эксперимент в науке
  • Психометрия и психофизика
  • Психодиагностика
  • Экспериментальная психология

Ссылки

  • А.Я. Психология: Виды валидности
  • Валидность теста — Психологический словарь

Валидность теста

15. 06.2020

Существует достаточно много разных способов доказательства валидности теста. О них и пойдет речь далее.

Тест называется валидным, если он измеряет то, для измерения чего предназначен.

Очевидная валидность — описывает представление о тесте, сложившееся у испытуемого. Тест должен восприниматься обследуемым как серьезный инструмент познания его личности, чем-то схожий с вызывающим уважение и в какой-то мере трепет медицинским диагностическим инструментарием. Очевидная валидность приобретает особое значение в современных условиях, когда представление о тестах в общественном сознании формируется многочисленными публикациями в популярных газетах и журналах того, что можно назвать квазитестами, с помощью которых читателю предлагается определить все, что угодно: от интеллекта до совместимости с будущим супругом.

Конкурентная валидность оценивается по корреляции разработанного теста с другими, валидность которых относительно измеряемого параметра установлена. П. Клайн отмечает, что данные о конкурентной валидности полезны тогда, когда есть неудовлетворительно работающие тесты для измерения некоторых переменных, а новые создаются для того, чтобы улучшить качество измерения. В самом деле, если уже существует эффективный тест, то для чего нужен такой же новый?

Прогностическая валидность устанавливается с помощью корреляции между показателями теста и некоторым критерием, характеризующим измеряемое свойство, но в более позднее время. Например, прогностическая валидность какого-либо теста интеллекта может быть показана корреляцией его показателей, полученных у испытуемого в возрасте 10 лет, с академической успеваемостью в период окончания средней школы. Л. Кронбах считает прогностическую валидность наиболее убедительным доказательством того, что тест измеряет именно то, для чего он был предназначен. Основная проблема, с которой сталкивается исследователь, пытающийся установить прогностическую валидность своего теста, состоит в выборе внешнего критерия.

В особенной степени чаще всего это касается измерения личностных переменных, где подбор внешнего критерия — чрезвычайно сложная задача, решение которой требует немалой изобретательности. Несколько проще обстоит дело при определении внешнего критерия для когнитивных тестов, однако и в этом случае исследователю приходится «закрывать глаза» на многие проблемы. Так, академическая успеваемость традиционно используется в качестве внешнего критерия при валидизации тестов интеллекта, но в то же время хорошо известно, что успехи в обучении далеко не единственное свидетельство высокого интеллекта.

Инкрементная валидность имеет ограниченное значение и относится к случаю, когда один тест из батареи тестов может иметь низкую корреляцию с критерием, но не перекрываться другими тестами из этой батареи. В этом случае данный тест обладает инкрементной валидностью. Это может быть полезно при проведении профотбора с помощью психологических тестов.

Дифференциальная валидность может быть проиллюстрирована на примере тестов интересов. Тесты интересов обычно коррелируют с академической успеваемостью, но по-разному для разных дисциплин. Значение дифференциальной валидности, так же как и инкрементной, ограничено.

Содержательная валидность определяется через подтверждение того, что задания теста отражают все аспекты изучаемой области поведения. Обычно она определяется у тестов достижений (смысл измеряемого параметра полностью ясен!), которые, как уже указывалось, тестами собственно психологическими не являются. На практике для определения содержательной валидности подбираются эксперты, которые указывают, какая область (области) поведения наиболее важна, например, для музыкальных способностей, а затем, исходя из этого, генерируются задания теста, которые вновь оценивают эксперты.

Конструктная валидность теста демонстрируется полным, насколько это возможно, описанием переменной, для измерения которой предназначается тест. По сути дела, конструктная валидность включает в себя все подходы к определению валидности, которые были перечислены выше. Кронбах и Мил (Cronbach & Meehl, 1955), которые ввели в психодиагностику понятие конструктной валидности, пытались решить проблему отбора критериев при валидизации теста. Они подчеркивали, что во многих случаях ни один отдельно взятый критерий не может служить для валидизации отдельного теста. Можно считать, что решение вопроса о конструктной валидности теста представляет собой поиск ответа на два вопроса:

  1. существует ли реально некоторое свойство;
  2. надежно ли измеряет данный тест индивидуальные различия по этому свойству.

Вполне понятно, что с конструктной валидностью связана проблема объективности в интерпретации результатов по изучению конструктной валидности, однако эта проблема общепсихологическая и выходит за рамки валидности.

Из вышесказанного следует, что не существует какого-либо единичного показателя, с помощью которого устанавливается валидность психологического теста. В отличие от показателей надежности и дискриминативности, нельзя осуществить точные статистические расчеты, подтверждающие валидность методики. Тем не менее разработчик должен представить весомые доказательства в пользу валидности теста, что потребует от него психологических знаний и интуиции.

Ключевые слова: Тесты

Источник: Бурлачук Л. Ф. Психодиагностика: Учебник для вузов. — СПб.: Питер, 2006. — 351 с: ил

Материалы по теме

Методология тестирования

Добреньков В.И., Методы социологического исследования

Проективные методики или «объективные тесты»?

Бурлачук Л. Ф. Психодиагностика: Учебник для вузов. — СПб.: Питер, 2006. — 351 с: ил

Классификация тестов в управлении персоналом

Добреньков В.И., Методы социологического исследования

Шкала в психологии. Виды шкал и их характеристика

Экспериментальная психология: Курс лекций. Авторы-составители О.В. Боголюбова, Е.В. Дьяченко…

Тест-опросник Леонгарда-Шмишека

Петруня О.Э., Юридическая психология

Современные психологические тесты онлайн – возможность протестировать себя прямо сейчас

Самостоятельный тест уровня интеллекта

Возникновение тестирования

типов действия | Психо-йог

Типы достоверности

Достоверность

Во-первых, что такое достоверность?

Валидность относится к степени, в которой результаты или выводы исследования действительно измеряют то, что, как они утверждают, измеряют.

Например: предположим, мы хотим измерить длину стола. Итак, берем рулетку и далее приступаем к измерению высоты ножек стола.

Что не так?

Ну длину стола мы не мерили. Мы измерили вместо высоты таблицы. Итак, наше измерение длины стола неверно. Однако если бы мы намеревались измерить высоту стола, то наше измерение было бы верным, потому что мы измерили высоту стола.

Внутренняя валидность

Внутренняя валидность — это мера измерения экспериментатором зависимой переменной.

Например: предположим, что экспериментатор хочет измерить время реакции человека и для этого использует человека с секундомером.

Видите ли вы проблему с этим измерением?

Проблема в том, что человек с секундомером тоже должен реагировать. Таким образом, мы ожидаем, что это измерение недействительно.

Лучшим способом измерения этой зависимой переменной было бы использование видеокамеры. Таким образом, экспериментатору не нужно полагаться на время реакции другого человека для измерения зависимой переменной. Таким образом, делая его более действительным.

Внешняя действительность

Внешняя действительность делится на два типа. Экологическая валидность и популяционная валидность.

Внешняя валидность относится к степени, в которой результаты исследования могут быть обобщены. Важно иметь высокие уровни внешней валидности, потому что это напрямую влияет на полезность результатов и выводов исследования.

Экологическая валидность

Экологическая валидность относится к степени, в которой результаты и выводы применимы к реальной жизни.

Экологическая достоверность в основном зависит от задачи, которую должны выполнить участники. Многие говорят, что именно методология, например, лабораторных экспериментов, влияет на экологическую достоверность, но это не обязательно так. Можно провести лабораторный эксперимент с высокой экологической достоверностью, потому что задача, которую должны выполнить участники, соответствует реальной жизни.

Давайте рассмотрим пример. Представьте, что вы экспериментатор и изучаете психологию взаимодействия в магазине с продавцами.

Вы решили использовать лабораторный эксперимент, потому что он дает вам лучший контроль над посторонними переменными.

Вы создали поддельный магазин, который точно такой же, как и в реальной жизни. Затем вы предлагаете участникам пойти в магазин и купить некоторые предметы, которые они обычно покупают. Это, хотя и лабораторный эксперимент, имеет высокую экологическую достоверность, потому что задача, которую должны выполнить участники, соответствует реальной жизни.

Валидность популяции


Валидность популяции относится к степени, в которой выборка может быть обобщена на аналогичные и более широкие популяции.

Этот тип валидности важен, потому что без него полезность исследования снижается.

Давайте рассмотрим пример.

Предположим, мы изучаем влияние прослушивания Моцарта на IQ (эффект Моцарта).

Итак, мы решаем, что будем использовать выборку людей с высоким IQ, и используем случайную выборку. Эта выборка будет иметь высокую валидность для людей с высоким IQ, но главным образом потому, что мы использовали случайную выборку. Однако эта выборка будет иметь низкую валидность для всех остальных, потому что выборка чрезвычайно ограничена.

Временная валидность

Временная валидность относится к степени достоверности результатов и выводов исследования, когда мы рассматриваем различия и изменения, возникающие со временем.

Исследования, которые являются достоверными во времени, будут либо недавними исследованиями, либо будут исследованиями, в которых рассматривается что-то, что не изменилось с момента завершения исследования, например, проведенное 50 лет назад исследование представлений людей о росте может иметь высокую временную достоверность, поскольку общество не изменил своего взгляда на высоту. Тем не менее, исследование телевизионной рекламы в семидесятых и восьмидесятых годах может быть неактуальным сегодня из-за того, что в настоящее время доступно множество телевизионных каналов по сравнению с несколькими каналами, которые были доступны в то время. (Взгляните на это исследование для примера, который можно считать низким по временной достоверности: Cowpe 1989)

Лицевая валидность

Лицевая валидность относится к степени, в которой исследование  появляется  для измерения того, что оно претендует на измерение.

Это тип валидности, на который следует ссылаться меньше всего, потому что это не очень хорошая точка оценки, лучше использовать внутреннюю валидность. Лицевая валидность может быть вам полезна, потому что вы можете легко использовать ее в качестве оценочного балла на экзамене по психологии OCR A2, если у вас ничего не получится и вы не сможете придумать другой оценочный балл.

Исследование с высокой внешней валидностью может выглядеть так, как будто оно измеряет то, что намеревается измерить исследователь, но это не обязательно означает, что исследование — это измерение того, на что оно претендует.

Давайте рассмотрим пример.

Предположим, мы пытаемся измерить влияние просмотра фильма ужасов на уровень стресса участников.

Мы показываем нашим участникам фильм ужасов и измеряем их уровень кортизола до и после.

Кортизол вырабатывается в ответ на стресс, , что означает, что на первый взгляд это исследование выглядит так, как будто оно измеряет влияние фильма ужасов на уровень стресса участников. Поэтому он имеет высокую лицевую валидность.

Однако мы не учитывали влияние того, что участники не ели во время просмотра фильма.

Мы понимаем, что отказ от еды понизил уровень глюкозы в крови наших участников, что также вызывает выработку кортизола. Это означает, что наше исследование, хотя имеет высокую внешнюю валидность, имеет низкую внутреннюю валидность.

Проверка достоверности

Проверка достоверности состоит из нескольких составных частей.

Под валидностью теста понимается степень значимости результатов исследования или теста.

Давайте рассмотрим пример.

Предположим, мы измеряем интеллект людей. Мы могли бы использовать тест IQ. Мы могли бы возразить, что тест IQ имеет высокий уровень валидности, потому что мы видим, что это хорошо зарекомендовавший себя тест.

Действительность конструкции

Конструктивная валидность относится к степени, в которой исследование или тест измеряют концепцию, на которую они претендуют.

Существует два типа конструктной валидности: конвергентная валидность и дискриминантная валидность.

Давайте рассмотрим пример.

Предположим, мы изучаем «Модель убеждений о здоровье» Беккера (1978)

. Мы обнаруживаем, что существует несколько когнитивных эвристик, которые люди используют, когда рассматривают возможность принятия здорового образа жизни. Все они присутствуют в модели убеждений о здоровье. Таким образом, мы можем утверждать, что наше исследование имеет высокую конструктную валидность.

Конвергентная валидность

Конвергентная валидность относится к степени, в которой тестируемые конструкции соотносятся друг с другом.

Различающая валидность

Различающая валидность относится к степени, в которой протестированные конструкции, не имеющие взаимосвязи, действительно не имеют взаимосвязи друг с другом.

Валидность содержания

Валидность содержания хорошо вытекает из валидности конструкции, поскольку валидность содержания относится к степени, в которой исследование или тест измеряет все элементы конструкции.

Например, предположим, что мы рассматриваем влияние стресса на производительность труда.

Мы предлагаем нашим участникам ответить на вопросники, насколько, по их мнению, на них влияет стресс на рабочем месте и насколько он влияет на их производительность.

Мы можем возразить, что содержание этого исследования недостаточно достоверно, потому что оно фактически не проверяло влияние стресса на производительность труда.

Обоснованность критерия

Обоснованность критерия относится к степени достоверности результатов и выводов по сравнению с другими показателями.

Валидность критерия делится на два типа валидности: прогностическая валидность и параллельная валидность.

Прогностическая валидность

Прогностическая валидность относится к степени, в которой результаты и выводы могут быть использованы для прогнозирования применения исследования в реальной жизни.

Давайте рассмотрим пример.

Предположим, мы изучаем влияние мыслей о том, что за вами наблюдают, на поведение.

Наше исследование является повторением нескольких или других исследований, которые были проведены ранее.

Мы даем нашим участникам задание для выполнения. Во время выполнения задачи они столкнутся с несколькими признаками того, что за ними наблюдают, например, «за вами наблюдают операторы видеонаблюдения».

Это исследование может иметь прогностическую ценность для подобных ситуаций.

Как правило, прогностическая достоверность определяется повторяющимися результатами с течением времени.

Параллельная валидность

Параллельная валидность относится к степени, в которой результаты и выводы согласуются с другими исследованиями и доказательствами.

Давайте рассмотрим пример.

Милграм (1963) изучал последствия послушания авторитету. Результаты Милгрэма совпали со многими повторениями исследования. Поэтому исследование Милгрэма имело высокую параллельную валидность.

Достоверность статистического заключения

Достоверность статистического заключения относится к той степени, в которой мы можем, чтобы результаты были статистически значимыми, то есть мы можем установить причину и следствие выше случайности.

Обычно в психологических исследованиях вероятность устанавливается на уровне 5% или >0,05 вероятности. Это означает, что если результаты превышают 5%, мы примем нашу альтернативную гипотезу и отклоним нашу нулевую гипотезу. Это предполагает причину и следствие между переменными. Если результаты ниже 5%, мы примем нашу нулевую гипотезу. Результат менее 5% вероятности означает, что мы не можем установить причину и следствие, потому что результаты произошли случайно.

Репрезентативная валидность

Репрезентативная валидность, известная также как трансляционная валидность, относится к степени, в которой изучаемый конструкт или концепция могут быть перенесены в реальную жизнь.

Диагностическая валидность

Диагностическая валидность мало используется в спецификации психологии OCR A2. Чаще всего используется в клинических условиях. Диагностическая валидность относится к степени точности диагноза, поставленного относительно состояния.

Инструментальная валидность

Инструментальная валидность относится к степени, в которой инструменты, используемые для измерения зависимых переменных, верны для данного измерения.

Например, вернемся к нашему исследованию таблицы ранее. Допустим, сейчас мы правильно измеряем длину стола, но потом понимаем, что наша рулетка неточна. Поэтому наше исследование имело низкую инструментальную валидность.

Дополнительная литература

Десять лучших советов по пересмотру психологии от Psych Yogi для отличников

Резюме

Валидность в исследованиях и психологии: типы и примеры

Что такое валидность в психологии, исследованиях и статистике?

Валидность в исследованиях, статистике, психологии и тестировании оценивает, насколько хорошо результаты тестов отражают то, что они должны измерять. Измеряет ли прибор то, что заявлено для измерения? Отражают ли измерения лежащую в основе реальность? Или они измеряют что-то другое?

Будьте уверены, что ваши измерения отражают то, что они должны измерять!

Например, оценивает ли тест интеллекта интеллект или другую характеристику, такую ​​как образование или способность вспоминать факты?

Исследователям необходимо подумать, измеряют ли они то, что, по их мнению, измеряют. Валидность относится к уместности данных, а не к воспроизводимости измерений (надежность). Однако, чтобы тест был действительным, он должен сначала быть надежным (непротиворечивым).

Оценка достоверности имеет решающее значение, поскольку она помогает определить, какие тесты следует использовать, а каких следует избегать. Если исследователи используют неправильные инструменты, их результаты могут быть бессмысленными!

Достоверность обычно менее важна для материальных измерений, таких как рост и вес. У вас могут быть дешевые напольные весы, которые показывают слишком высокие или слишком низкие показания, но они все равно измеряют вес. Для этих типов измерений вас больше интересует точность и прецизионность. Однако другие типы измерений не так просты.

Валидность часто является более серьезной проблемой в психологии и социальных науках, где вы измеряете нематериальные конструкты, такие как самооценка и позитивное мировоззрение. Если вы оцениваете психологический конструкт добросовестности, вам нужно убедиться, что инструмент измерения задает вопросы, которые оценивают эту характеристику, а не, скажем, послушание.

Психологические оценки ненаблюдаемых латентных конструктов (например, интеллекта, черт характера, способностей, наклонностей и т. д.) имеют особое применение, известное как валидность теста, т. е. степень, в которой теория и данные подтверждают интерпретацию результатов теста. Следовательно, это критическая проблема, поскольку она связана с пониманием результатов испытаний.

Связанный пост : Надежность и валидность

Оценка валидности

Исследователи проверяют тесты, используя различные доказательства. Инструмент может быть сильным для одного типа валидности, но слабым для другого. Следовательно, это не черный или белый вопрос — у него могут быть степени.

В этом ключе существует множество различных типов достоверности и способов ее осмысления. Рассмотрим несколько наиболее распространенных типов. Каждый вид представляет собой ряд доказательств, которые могут помочь подтвердить или опровергнуть общую валидность теста. В этом посте вы узнаете о лицах, содержании, критериях, дискриминанте, параллельной, прогностической и конструктной валидности.

Если вы хотите узнать об экспериментальной валидности, прочитайте мой пост о внутренней и внешней валидности. Эти типы относятся к плану эксперимента и методам.

Типы валидности

В этом посте я расскажу о следующих семи типах валидности:

  • Лицевая валидность : На первый взгляд, измеряет ли прибор предполагаемую характеристику?
  • Валидность содержания : Адекватно ли тестовые задания оценивают целевую тему?
  • Критерий достоверности : Коррелируют ли показатели с другими показателями в соответствии с теорией?
  • Дискриминантная достоверность : Нет ли корреляции между показателями, которые не должны иметь отношения?
  • Параллельная валидность : Коррелируют ли одновременные измерения одной и той же конструкции?
  • Прогностическая достоверность : Точно ли показатель предсказывает результаты?
  • Конструктивная достоверность : Измеряет ли прибор правильный атрибут?

Давайте рассмотрим эти виды валидности подробнее!

Face Validity

Face Validity — самый простой и слабый тип. Выглядит ли измерительный прибор «лицом к лицу» для измерения предполагаемой конструкции? Для опроса, который оценивает поведение, связанное с поиском острых ощущений, вы ожидаете, что он будет включать вопросы о поиске острых ощущений, быстрой скуке и рискованном поведении. Если опрос содержит эти вопросы, то «на первый взгляд» кажется, что инструмент измеряет конструкцию, которую намереваются исследовать исследователи.

Несмотря на то, что это низкая планка, важно учитывать ее. Никогда не упускайте из виду очевидное. Убедитесь, что вы понимаете природу инструмента и то, как он оценивает конструкцию. Посмотрите на вопросы. В конце концов, если тест не может выполнить это фундаментальное требование, другие типы валидности — спорный вопрос. Однако, когда мера удовлетворяет кажущейся достоверности, поймите, что это интуиция или предчувствие, что она кажется правильной. Это не статистическая оценка. Если ваш инструмент проходит эту низкую планку, вам предстоит еще много работы по проверке.

Контентная достоверность

Контентная действительность аналогична внешней достоверности, но имеет более строгую форму. Этот процесс часто включает в себя оценку отдельных вопросов теста и опрос экспертов, оценивает ли каждый пункт характеристики, для охвата которых предназначен инструмент. Этот процесс сравнивает тест с целями исследователя и теоретическими свойствами конструкции. Исследователи систематически определяют, вносит ли вклад каждый вопрос и не упускается ли из виду ни один аспект.

Например, если исследователи разрабатывают опрос для измерения отношения и деятельности любителей острых ощущений, им необходимо определить, достаточно ли вопросы охватывают оба этих аспекта.

Узнайте больше о достоверности содержимого.

Проверка достоверности критерия

Проверка достоверности критерия относится к отношениям между переменными в вашем наборе данных. Если ваши данные достоверны, вы ожидаете увидеть определенную закономерность корреляции между переменными. Исследователи обычно оценивают достоверность критерия, сопоставляя различные типы данных. Что бы вы ни измеряли, вы ожидаете, что оно будет иметь определенные отношения с другими переменными.

Например, показатели тревожности должны положительно коррелировать с количеством негативных мыслей. Показатели тревожности также могут положительно коррелировать с депрессией и расстройствами пищевого поведения. Если мы видим этот образец отношений, он поддерживает достоверность критерия. Наш показатель тревожности коррелирует с другими переменными, как и ожидалось.

Этот тип также известен как конвергентная валидность, потому что оценки для различных мер сходятся или соответствуют, как предполагает теория. Вы должны наблюдать высокие корреляции (как положительные, так и отрицательные).

Связанный пост : Интерпретация корреляции

Дискриминантная валидность

Этот тип противоположен валидности критерия. Если у вас есть достоверные данные, вы ожидаете, что определенные пары переменных будут коррелировать положительно или отрицательно. Однако для других пар переменных вы не ожидаете никакой связи.

Например, если самооценка и локус контроля в действительности не связаны, их показатели не должны коррелировать. Вы должны наблюдать низкую корреляцию между оценками.

Он также известен как расходящаяся валидность, потому что он связан с тем, как различаются разные конструкции. Низкие корреляции (близкие к нулю) указывают на то, что значения одной переменной не связаны со значениями других переменных — меры различают разные конструкции.

Параллельная валидность

Параллельная валидность оценивает степень, в которой мера конструкции коррелирует с другими одновременными мерами этой конструкции. Например, если вы проводите два разных теста интеллекта для одной и той же группы, должна быть сильная положительная корреляция между их результатами.

Прогностическая валидность

Прогностическая валидность оценивает, насколько хорошо конструкция предсказывает результат. Например, стандартизированные тесты, такие как SAT и ACT, предназначены для прогнозирования успеваемости старшеклассников в колледже. Если эти тесты обладают высокой прогностической способностью, результаты тестов будут иметь сильную положительную корреляцию с успеваемостью в колледже. Проверка этого типа валидности требует проведения оценки, а затем измерения фактических результатов.

Конструктивная валидность

Тест с высокой конструктивной валидностью правильно вписывается в общую картину с другими конструкциями. Следовательно, этот тип включает в себя аспекты критериальной, дискриминантной, параллельной и прогностической достоверности. Конструкт должен положительно и отрицательно коррелировать с теоретически приемлемыми конструктами, не иметь корреляции с правильными конструктами, коррелировать с другими показателями того же конструкта и т. д. выровнять. Он оценивает весь спектр характеристик измеряемой вами конструкции и определяет, все ли они правильно коррелируют с другими конструкциями, поведением и событиями.

Как видите, достоверность — сложный вопрос, особенно когда вы измеряете абстрактные характеристики.

About the Author

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Related Posts