Конструктная валидность: ВАЛИДНОСТЬ ИССЛЕДОВАНИЯ это

Содержание

Конструктная валидность — Психологос

01 октября 2022 г., 21:34

Констру́ктная вали́дность (концептуальная, понятийная валидность) — частный случай операциональной валидности, степень адекватности метода интерпретации экспериментальных данных теории, которая определяется правильностью употребления терминов той или иной теории.

Конструктная валидность имеет отношение к попыткам обозначения любых аспектов эксперимента. Опасности нарушения конструктной валидности заключаются в неправильном обозначении причины и эффекта с помощью абстрактных терминов, терминов, взятых из обыденного языка или формальной теории.

Экспериментальная психология

Комментарии (0):

Материалы по теме:

01 окт. 2022 г.

Экспериментальная психология

Экспериментальная психология — область психологии, структурирующая знания, касающиеся проблем исследований (в различных психологических направлениях) и способы их решения. Экспериментальную психологию называют научной дисциплиной о методах психологических исследований.

0Подробнее

01 окт. 2022 г.

Операциональная валидность

0Подробнее

01 февр. 2014 г.

Психологический эксперимент

Психологический эксперимент — проводимый в специальных условиях опыт для получения новых научных знаний посредством целенаправленного вмешательства исследователя в жизнедеятельность испытуемого. Это упорядоченное исследование, в ходе которого исследователь непосредственно изменяет некий фактор (или факторы), поддерживает остальные неизменными и наблюдает результаты систематических изменений.

1Подробнее

01 окт. 2022 г.

Валидность

Валидность – уверенность в том, что эксперимент измерил именно то, что исследователи хотели измерить.

3Подробнее

01 окт. 2022 г.

Внешняя валидность

0Подробнее

01 окт. 2022 г.

Внутренняя валидность психологического исследования

Внутренняя валидность – вид валидности, степень влияния независимой переменной на зависимую переменную.

0Подробнее

Содержание

Нет событий

Новые статьи:

Чья кукла?
Пороть родителей, которые порют детей!
Песнь о мудрой жене
Кого будешь спасать при пожаре: ребенка или мужа?
Читаем стихи, тренируем интонации: Иван Бунин. Сонет

Валидность конструктная | Psylist.net

Словари ↓

А Б В Г Д Е Ж З И К Л М Н О П Р С Т У Ф Х Ц Ч Ш Э Ю Я

Валидность конструктная — один из основных типов валидности, отражающий степень репрезентации исследуемого психологического конструкта в результатах теста. В качестве конструкта могут выступать практический или вербальный интеллект, эмоциональная неустойчивость, интроверсия, понимание речи, переключаемость внимания и т. д. Иначе говоря, В. к. определяет область теоретической структуры психологических явлений, измеряемых тестом.

Поскольку проявления таких конструктов, как, напр., интеллект в деятельности человека многообразны и неоднозначны с т. з. их выделения, процедура установления В. к. по сравнению с валидностью критериальной или валидностью содержательной сложна.

При объяснении связи полученных тестовых результатов с теоретическим конструктом необходимо постепенное накопление разнообразной информации о динамике развития измеряемого свойства, а также о его взаимодействии с другими психическими явлениями.

Среди конкретных методов характеристики В. к. в первую очередь необходимо назвать сопоставление исследуемого на предмет В. к. теста с другими методиками, конструктное содержание которых известно. Наличие корреляции между новым и аналогичным по конструкту тестом указывает на то, что разрабатываемый тест «измеряет примерно ту же сферу поведения, способность, личностное качество, что и эталонная методика. Такая процедура валидизации напоминает определение критериальной валидности в том смысле, что эталонный тест, валидность которого определена, выступает в качестве независимого критерия.

Следует, однако, заметить, что, в отличие от критериальной валидизации, при анализе В. к. не требуется высокой степени связи результатов двух тестов. Если окажется, что новый и эталонный тесты практически идентичны по содержанию и результатам и разрабатываемая методика не обладает преимуществами краткости или легкости применения, это означает лишь дублирование теста, оправданное только с т. з. создания параллельной формы теста. Смысл процедуры В. к. состоит в установлении одновременно как сходства, так и различия психологических феноменов, измеряемых новым тестом по сравнению с известным.

При анализе В. к. методики обычно формулируют ряд гипотез о том, как будет коррелировать разрабатываемый тест с широким кругом других тестов, направленных на конструкты, находящиеся в теоретически известной или предполагаемой связи с исследуемыми. При этом В. к. характеризуется не только связями проверяемого теста с близкородственными показателями, но и с теми, где, исходя из гипотезы, значимых связей наблюдаться не должно. Эти подходы определяются как конвергентная (проверка степени близости прямой или обратной связи) и дискриминантная (установление отсутствия связи) валидизации. Подтверждение совокупности теоретически ожидаемых связей составляет важный круг сведений В. к. В англоязычной психодиагностике такое операциональное определение В. к. обозначается как «предполагаемая валидность» (assumed validity).

Прямое отношение к характеристике В. к. имеет факторный анализ, позволяющий строго статистически проанализировать структуру связей показателей исследуемого теста с другими известными и латентными факторами, выявить общие и специфические для группы сопоставляемых тестов факторы, степень их представленное™ в результатах, т. е. определить факторный состав и факторные нагрузки результата теста. Исключительная важность такой процедуры является основанием для выделения ее в особый вид В.

к. — факторную валидность.

Важным аспектом В. к. является внутренняя согласованность, отражающая то, насколько определенные пункты (задания, вопросы), составляющие материал теста, подчинены основному направлению теста как целого, ориентированы на изучение одних и тех же конструктов. Анализ внутренней согласованности осуществляется путем коррелирования ответов на каждое задание с общим результатом теста. Следует отметить, что критерий внутренней согласованности указывает лишь на меру связи всего содержания теста с измеряемым конструктом, давая лишь косвенную информацию о природе измеряемого свойства.

При определении В. к. важное место принадлежит изучению динамики измеряемого конструкта. При этом мы можем опираться на гипотезы о его возрастном развитии, влиянии тренировок, обучения, освоения профессии и т. д. Одним из таких подходов является применение критерия возрастной дифференциации (см. Валидность по возрастной дифференциации), что предусматривает согласование результатов теста с ожидаемыми изменениями, которые претерпевает изучаемое психическое свойство в возрастной динамике при переходе на новый этап развития.

Этот метод В. к. особенно важен для валидизации тестов интеллекта, достижений в обучении.

В комплекс сведений о В. к. методики входят также данные, относящиеся к сфере критериальной и содержательной валидности. Так, критерии, используемые при валидизации, несут информацию, позволяющую раскрыть область поведения, качества, представленные в тесте в виде конструкта. Для характеристики В. к. необходимы связь с практическими формами деятельности, достоверность прогноза реального поведения. Однако В. к. является качественно более высоким и комплексным уровнем описания теста, характеризуя область измеряемого поведения в широких психологических понятиях. Благодаря данным В. к. мы можем с психологических позиций закономерно объяснить результаты теста и их дисперсию, обосновать диагноз, введя измеряемое свойство в систему психологических категорий, прогнозировать поведение в более широких пределах, чем это задается областью деятельности, для которой определялась содержательная валидность.

В качестве примера, иллюстрирующего необходимость глубокого анализа теоретического конструкта, лежащего в основе конкретной методики, для правильного применения теста и интерпретации его результатов, можно привести сопоставление двух популярных опросников личностных «Проявления тревожности» шкалы (MAS) и варианта Айзенка личностных опросников EPI. Корреляционные исследования показывают, что шкала «тревожности» MAS положительно коррелирует со шкалой «нейротизма» и отрицательно — со шкалой «экстраверсии» EPI. С т. з. концепции Айзенка, эти данные можно рассматривать как свидетельство низкой валидности шкалы MAS: «тревожность» коррелирует не только с релевантным фактором «нейротизм», но и с иррелевантным фактором «интроверсия». С этой т. з. MAS оказывается просто нечувствительным к особой разновидности «нейротизма» — нейротизму (тревожности) экстравертов: из перечня пунктов MAS исключены высказывания, в которых могла бы проявиться тревожность экстраверта. Однако с теоретических позиций К. Спенса и Дж. Тейлор, эта ситуация вполне закономерна, желательна и никак не является артефактом — следствием дефекта данного диагностического средства. Согласно К. Спенсу, пытавшемуся переносить на человеческое поведение теорию научения Халла, MAS измеряет общий уровень драйва — неспециализированного побуждения, которое как раз достигает максимума при сочетании нейротизма (специфическая активация, по Айзенку) и интроверсии (неспецифическая активация) (Практикум по психодиагностике, 1984).

Таким образом, названия тестов не всегда однозначно выражают понятия об измеряемом свойстве. В данном примере особенно подчеркивается роль психологической теории, лежащей в основе методики для раскрытия содержания показателей, получаемых с ее помощью.

Конструктивная валидность | Определение, типы и примеры

Опубликован в 17 февраля 2022 г. к Прита Бхандари. Отредактировано 22 июня 2023 г.

Конструктивная валидность показывает, насколько хорошо тест измеряет концепцию, для оценки которой он был разработан.

Крайне важно установить общую валидность метода.

Оценка достоверности конструкции особенно важна, когда вы исследуете что-то, что нельзя измерить или наблюдать напрямую, например интеллект, уверенность в себе или счастье. Вам нужно несколько наблюдаемых или измеримых показателей для измерения этих конструкций, иначе вы рискуете привнести исследовательскую предвзятость в свою работу.

Типы валидности измерения Конструктивная валидность является одним из четырех типов валидности измерения. Остальные три:

Валидность содержания: Является ли тест полностью репрезентативным для измерения?
Внешний вид: Соответствует ли содержание теста его целям?
Критерий достоверности: Точно ли результаты измеряют конкретный результат, для измерения которого они предназначены?

Содержание

Что такое конструкция?
Что такое конструктная валидность?
Типы конструктивной валидности
Как вы измеряете конструктивную валидность?
Угрозы конструктной валидности
Другие интересные статьи
Часто задаваемые вопросы о конструктной валидности

Что такое конструкция?

Конструкт — это теоретическая концепция, тема или идея, основанная на эмпирических наблюдениях. Это переменная, которую обычно нельзя измерить напрямую.

Пример: Конструкты Психологи разрабатывают и исследуют конструкты, чтобы понять индивидуальные и групповые различия.

Некоторые распространенные конструкции включают:

Самоуважение
Логические рассуждения
Академическая мотивация

Социальная тревожность

Вы не можете напрямую наблюдать или измерять эти конструкции. Вам необходимо исследовать набор индикаторов, чтобы проверить гипотезы о конструкциях.

Конструкции могут варьироваться от простых до сложных. Например, такое понятие, как предпочтение руки, легко оценить:

Простой вопрос: Спросите участников, какая рука у них доминирует.
Наблюдения: Попросите участников выполнить простые задания, например, поднять предмет или нарисовать кошку, и понаблюдайте, какой рукой они пользуются для выполнения заданий.

Более сложная концепция, такая как социальная тревожность, требует более тонких измерений, таких как психометрические опросники и клинические интервью.

Простые конструкции, как правило, имеют узкое определение, в то время как сложные конструкции шире и состоят из измерений. Измерения — это различные части конструкции, которые связаны друг с другом, образуя единое целое.

Пример: параметры конструкта Социальная тревожность — это сильный страх перед социальными ситуациями, влияющий на повседневную жизнь.

Как конструкт, социальная тревожность состоит из нескольких измерений.

Психологический аспект: Сильный страх и тревога
Физиологическое измерение: Показатели физического напряжения
Поведенческий аспект: Избегание социальных сетей

Что такое конструктная валидность?

Конструктивная валидность касается степени, в которой ваш тест или мера точно оценивают то, что должны.

В исследованиях важно преобразовать конструкции в конкретные и измеримые характеристики, основанные на вашем представлении о конструкции и ее размерах.

Перед сбором или анализом данных четко определите, как вы определяете свою конструкцию и как измерения соотносятся друг с другом. Это поможет вам убедиться, что любой метод измерения, который вы используете, точно оценивает конкретную конструкцию, которую вы исследуете, в целом, и помогает избежать систематических ошибок и ошибок, таких как систематическая ошибка пропущенной переменной или информационная систематическая ошибка.

Пример. Создайте показатель. Вы разрабатываете простую анкету для оценки социальной тревожности у студентов колледжа. Вы создаете вопросы, чтобы измерить свой конструкт социальной тревожности:

Как часто вы избегаете заходить в комнату, когда все уже сидят?
Другие люди склонны описывать вас как тихого?
Как часто, разговаривая с новыми знакомыми, вы боитесь сказать что-нибудь глупое?
Насколько вы боитесь выступать перед аудиторией?
Как часто вы избегаете зрительного контакта с другими людьми?
Вы предпочитаете иметь небольшое количество близких друзей большой компании друзей?

При разработке или оценке меры важно учитывать, действительно ли она нацелена на интересующую конструкцию или оценивает отдельные, но связанные конструкции.

Крайне важно отличать вашу конструкцию от родственных конструкций и убедиться, что каждая часть вашей методики измерения ориентирована исключительно на вашу конкретную конструкцию.

Пример: оценка вашего показателя. Вы просматриваете анкету, имея в виду несколько вопросов:

Ваша анкета измеряет исключительно социальную тревожность?
Все ли аспекты социальной тревожности охвачены вопросами?
Избегают ли ваши вопросы измерения других релевантных конструктов, таких как застенчивость или интроверсия?

Некоторые из ваших вопросов касаются застенчивости и замкнутости, а также социальной тревожности. Это означает, что ваша анкета слишком широка и нуждается в дальнейшем сужении, чтобы сосредоточиться исключительно на социальной тревожности.

Предотвращение плагиата. Запустите бесплатную проверку.

Попробуй бесплатно

Типы допустимости конструкции

Существует два основных типа конструктной валидности.

Конвергентная валидность: Степень соответствия вашей меры мерам родственных конструкций
Дискриминантная валидность: Степень, в которой ваша мера не связана или отрицательно связана с мерами различных конструкций

Конвергентная действительность

Конвергентная валидность – это степень, в которой измерения одних и тех же или подобных конструктов фактически соответствуют друг другу.

В научных исследованиях вы ожидаете, что измерения связанных конструктов будут коррелировать друг с другом. Если у вас есть две связанные шкалы, люди, получившие высокие баллы по одной шкале, как правило, получают высокие баллы и по другой.

Пример: конвергентная валидность. После пересмотра вашей анкеты вы раздаете ее выборке студентов колледжа вместе с парой оценочных шкал. Одна из этих шкал является существующей, широко используемой мерой социальной тревожности для взрослых.

Вы проверяете, имеет ли ваш новый вопросник конвергентную валидность, проверяя, коррелируют ли ответы на него с ответами на существующую шкалу.

Дискриминантная валидность

И наоборот, дискриминантная валидность означает, что две меры несвязанных конструктов, которые должны быть несвязанными, очень слабо связанными или отрицательно связанными, на самом деле имеют место на практике.

Вы проверяете дискриминантную валидность так же, как и конвергентную валидность: сравнивая результаты для разных показателей и оценивая, коррелируют ли они и каким образом.

Как выбрать несвязанные конструкции? Хорошо выбирать конструкции, которые теоретически являются различными или противоположными концепциями в рамках одной категории.

Например, если интересующая вас конструкция представляет собой черту личности (например, интроверсию), уместно выбрать полностью противоположную черту личности (например, экстраверсию). Вы можете ожидать, что результаты вашего теста на интроверсию будут отрицательно коррелировать с результатами измерения экстраверсии.

В качестве альтернативы можно выбрать непротиворечивые несвязанные понятия и проверить отсутствие корреляций (или слабых корреляций) между мерами.

Пример: Дискриминантная валидность. Вы проверяете, имеет ли ваш опросник по социальной тревожности дискриминантную валидность по сравнению с опросником по расстройствам аутистического спектра в той же выборке. Аутизм и социальная тревожность теоретически существенно различаются, поэтому вы ожидаете лишь слабую связь между показателями.

Вы раздаете обе анкеты большой выборке и оцениваете достоверность. Основываясь на очень слабой корреляции между результатами, вы можете подтвердить, что ваша анкета имеет дискриминантную валидность.

Как вы измеряете валидность конструкции?

Вы часто сосредотачиваетесь на оценке достоверности конструкции после разработки новой меры. Лучше всего проверить новую меру с помощью пилотного исследования, но есть и другие варианты.

Пилотное исследование — это пробный запуск вашего исследования. Вы проверяете свою меру на небольшой выборке, чтобы проверить ее выполнимость, надежность и достоверность. Это поможет вам понять, нужно ли вам настроить или пересмотреть свою меру, чтобы убедиться, что вы точно тестируете свою конструкцию.

Статистический анализ часто применяется для проверки достоверности данных ваших мер. Вы проверяете конвергентную и дискриминантную валидность с помощью корреляций, чтобы увидеть, положительно или отрицательно связаны результаты вашего теста с результатами других установленных тестов.

Вы также можете использовать регрессионный анализ , чтобы оценить, действительно ли ваша мера предсказывает результаты, которые вы ожидаете теоретически предсказать. Регрессионный анализ, подтверждающий ваши ожидания, укрепляет ваше утверждение о достоверности конструкции.

Угрозы построить достоверность

Важно распознавать угрозы и противостоять им, чтобы обеспечить достоверность надежного плана исследования. Наиболее распространенные угрозы:

Плохая операционализация
Ожидания экспериментатора
Предвзятость субъекта

Плохая эксплуатация

Большая угроза достоверности конструкции плохая операционализация конструкции.

Хорошее рабочее определение конструкции поможет вам точно и точно измерить ее каждый раз. Ваш протокол измерений ясен и конкретен, и его могут использовать другие люди в различных условиях.

Без хорошего рабочего определения у вас может быть случайная или систематическая ошибка, которая ставит под угрозу ваши результаты и может привести к искажению информации. Ваша мера может быть не в состоянии точно оценить вашу конструкцию.

Ожидания экспериментатора

Ожидания экспериментатора об исследовании могут повлиять на ваши результаты. Лучше всего знать об этой предвзятости в исследованиях и предпринимать шаги, чтобы ее избежать.

Для борьбы с этой угрозой используйте триангуляцию исследователей и привлекайте людей, не знакомых с гипотезой, к проведению измерений в вашем исследовании. Поскольку у них нет сильных ожиданий, они вряд ли исказят результаты.

Предвзятость субъекта

Когда участники возлагают большие надежды на исследование, их поведение и ответы иногда зависят от их собственных предубеждений. Это может поставить под угрозу достоверность вашего построения, поскольку вы не сможете точно измерить то, что вас интересует.

Вы можете смягчить предметную предвзятость , используя маскировку (ослепление), чтобы скрыть истинную цель исследования от участников. Предоставляя им прикрытие для вашего исследования, вы можете снизить влияние предвзятости субъекта на ваши результаты, а также помешать им угадать суть вашего исследования, что может привести к характеристикам спроса, предвзятости социальной желательности и эффекту Хоторна.

Другие интересные статьи

Если вы хотите узнать больше о статистике, методологии или предвзятости исследований, обязательно ознакомьтесь с другими нашими статьями с пояснениями и примерами.

Часто задаваемые вопросы о достоверности конструкции

Почему конструктивная валидность имеет значение?

При разработке или оценке меры конструктивная валидность помогает вам убедиться, что вы действительно измеряете интересующую вас конструкцию. Если у вас нет конструктивной валидности, вы можете непреднамеренно измерить несвязанные или отдельные конструкции и потерять точность в своем исследовании.

Конструктивная валидность часто считается всеобъемлющим типом валидности измерения, поскольку она охватывает все остальные типы. Для достижения конструктивной валидности вам необходимо иметь лицевую валидность, содержательную валидность и валидность критерия.

Как измерить конструктивную валидность?

org/Answer»>

Статистический анализ часто применяется для проверки достоверности данных ваших мер. Вы проверяете конвергентную валидность и дискриминантную валидность с корреляциями, чтобы увидеть, положительно или отрицательно связаны результаты вашего теста с результатами других установленных тестов.

Вы также можете использовать регрессионный анализ, чтобы оценить, действительно ли ваша мера предсказывает результаты, которые вы ожидаете теоретически предсказать. Регрессионный анализ, подтверждающий ваши ожидания, укрепляет ваше утверждение о достоверности конструкции.

Процитировать эту статью Scribbr

Если вы хотите процитировать этот источник, вы можете скопировать и вставить цитату или нажать кнопку «Цитировать эту статью Scribbr», чтобы автоматически добавить цитату в наш бесплатный генератор цитирования.

Бхандари, П. (2023, 22 июня). Конструктивная валидность | Определение, типы и примеры. Скриббр. Проверено 20 июля 2023 г., с https://www.scribbr.com/methodology/construct-validity/

Процитировать эту статью

Полезна ли эта статья?

Вы уже проголосовали. Спасибо 🙂 Ваш голос сохранен 🙂 Обработка вашего голоса…

Прита имеет академическое образование в области английского языка, психологии и когнитивной нейробиологии. Как междисциплинарный исследователь, она любит писать статьи, объясняющие сложные исследовательские концепции для студентов и ученых.

Что такое критерий достоверности? | Определение и примеры

Опубликован в 2 сентября 2022 г. к Кассиани Николопулу. Отредактировано 22 июня 2023 г.

Валидность критерия (или валидность, связанная с критерием ) оценивает, насколько точно тест измеряет результат, для измерения которого он был разработан. Результатом может быть болезнь, поведение или производительность. Параллельная валидность измеряет тесты и переменные критериев в настоящем, а прогностическая валидность измеряет те, которые будут в будущем.

Чтобы установить достоверность критерия, вам необходимо сравнить результаты теста с переменными критерия . Критериальные переменные часто называют «золотым стандартом». Они включают в себя другие тесты, которые широко признаны в качестве достоверных показателей конструкции .

Пример: валидность критерия. Исследователь хочет знать, может ли вступительный экзамен в колледж предсказать будущую успеваемость. Средний балл за первый семестр может служить критериальной переменной, поскольку он является общепринятым показателем академической успеваемости.
Затем исследователь может сравнить результаты вступительных экзаменов в колледж 100 студентов с их средним баллом после одного семестра в колледже. Если результаты двух тестов близки, то вступительный экзамен в колледж имеет критерий достоверности.
Когда ваш тест согласуется с переменной критерия, он имеет высокую достоверность критерия. Однако может быть трудно найти переменные критерия.
Содержание
Что такое достоверность критерия?
Типы критерия достоверности
Пример валидности критерия
Как измерить валидность критерия
Другие интересные статьи
Часто задаваемые вопросы о валидности критерия
Что такое достоверность критерия?
Валидность критерия показывает, насколько хорошо тест коррелирует с установленным стандартом сравнения, называемым критерием.
Инструмент измерения, такой как вопросник, имеет критерий достоверности, если его результаты сходятся с результатами какого-либо другого общепринятого инструмента, обычно называемого «золотым стандартом».
Золотой стандарт (или переменная критерия) измеряет:
Та же конструкция
Концептуально релевантные конструкции
Концептуально релевантное поведение или производительность
При наличии золотого стандарта оценка достоверности критерия является простым процессом. Например, вы можете сравнить новую анкету с установленной. В медицинских исследованиях вы можете сравнивать результаты тестов с клиническими оценками.
Однако во многих случаях золотого стандарта не существует. Например, если вы хотите измерить боль, для этого не существует объективного стандарта. Вы должны полагаться на то, что говорят вам респонденты. В таких случаях вы не можете добиться достоверности критерия.
Важно иметь в виду, что достоверность критерия зависит от достоверности золотого стандарта или эталонного показателя. Если эталонная мера страдает от какой-либо исследовательской погрешности, она может повлиять на валидную в остальном меру. Другими словами, действительная мера, проверенная на основе предвзятого золотого стандарта, может не соответствовать критерию валидности.
Точно так же два необъективных измерения будут подтверждать друг друга. Таким образом, валидность критерия не является гарантией того, что мера действительно действительна. Его лучше всего использовать в тандеме с другими типами валидности.
Типы достоверности критерия
Существует два типа достоверности критерия. Какой тип вы используете, зависит от времени, в которое получены две меры (критерий и ваш тест).
Параллельная валидность используется, когда результаты теста и переменные критерия получаются в одновременно .
Прогностическая валидность используется, когда переменные критерия измеряются после баллов теста.
Одновременное действие
Параллельная валидность демонстрируется, когда новый тест коррелирует с другим тестом, который уже считается действительным, называемым критериальным тестом. Высокая корреляция между новым тестом и критерием указывает на параллельную валидность.
Установление одновременной валидности особенно важно, когда создается новая мера, которая претендует на то, чтобы быть в чем-то лучше, чем ее предшественники: объективнее, быстрее, дешевле и т. д.
Пример: Параллельная валидность Психолог хочет оценить тест самоотчета о неудовлетворенности образом тела. Параллельную валидность теста можно оценить, сравнив баллы теста с клиническим диагнозом, поставленным в то же время.
Помните, что эту форму достоверности можно использовать только в том случае, если уже существует другой критерий или проверенный инструмент.
Прогностическая достоверность
Прогностическая достоверность демонстрируется, когда тест может предсказать будущую производительность. Другими словами, тест должен коррелировать с переменной, которую можно будет оценить только в какой-то момент в будущем, после того, как тест будет проведен.
Для валидности прогностического критерия исследователи часто изучают, как результаты теста предсказывают соответствующий будущий результат. Например, результаты теста IQ можно использовать для прогнозирования будущих успехов в учебе. Результат по замыслу оценивается в какой-то момент в будущем.
Пример: прогностическая валидность Предположим, вы хотите выяснить, может ли вступительный тест по математике в колледж предсказать будущую успеваемость учащегося по программе инженерного обучения.
Средний балл учащегося является общепринятым показателем академической успеваемости и может использоваться в качестве переменной критерия. Чтобы оценить прогностическую достоверность теста по математике, вы сравниваете баллы, набранные учащимися в этом тесте, с их средним баллом после первого семестра инженерной программы. Если бы высокие результаты тестов были связаны с людьми, которые впоследствии хорошо показали себя в учебе и достигли высокого среднего балла, то тест по математике имел бы сильную прогностическую достоверность.
Высокая корреляция свидетельствует о прогностической достоверности. Это указывает на то, что тест может правильно предсказать то, что, как вы предполагаете, он должен делать.
Получение отзывов о языке, структуре и форматировании
Профессиональные редакторы вычитывают и редактируют вашу статью, уделяя особое внимание:
Академический стиль
Расплывчатые предложения
Грамматика
Согласованность стиля
См. пример
Пример достоверности критерия
Критерий валидности часто используется, когда исследователь хочет заменить установленный тест другой версией того же теста, особенно более объективной, более короткой или более дешевой.
Пример: валидность критерия. Школьный психолог создает сокращенную форму существующего опроса для оценки прокрастинации среди учащихся.
Несмотря на то, что первоначальный тест широко используется в качестве надежного средства измерения прокрастинации, он очень длинный и требует много времени для его выполнения. В результате многие учащиеся заполняют его без тщательного обдумывания своих ответов.
Чтобы оценить, насколько хорошо новый, более короткий тест оценивает прокрастинацию, психолог просит одну и ту же группу студентов пройти как новый, так и первоначальный тест. Если результаты двух тестов схожи, новый тест имеет высокую достоверность критерия. Психолог может быть уверен, что новый тест будет измерять прокрастинацию так же точно, как и первоначальный.
Как измерить достоверность критерия
Валидность критерия оценивается двумя способами:
Путем статистического тестирования нового метода измерения в сравнении с независимым критерием или стандартом для установления одновременной достоверности
Путем статистического тестирования будущей производительности для установления прогностической достоверности
Мера, подлежащая валидации, например тест, должна быть соотнесена с мерой, которая считается хорошо установленным показателем исследуемой конструкции. Это ваша критериальная переменная.
Корреляции между результатами теста и переменной критерия рассчитываются с использованием коэффициента корреляции, такого как r Пирсона. Коэффициент корреляции выражает силу связи между двумя переменными в одном значении от -1 до +1.
Значения коэффициента корреляции можно интерпретировать следующим образом:
r = 1: Существует совершенная положительная корреляция
r = 0: корреляции нет вообще.
r = −1: существует совершенная отрицательная корреляция
Вы можете автоматически рассчитать Pearson r в Excel, R, SPSS или других статистических программах.
Положительная корреляция между тестом и переменной критерия показывает, что тест действителен. Отсутствие корреляции или отрицательная корреляция указывает на то, что переменная теста и критерия не измеряют одно и то же понятие.
Пример: Измерение достоверности критерия Предположим, вы заинтересованы в разработке собственной шкалы измерения самооценки. Чтобы установить достоверность критерия, вам необходимо сравнить его с переменной критерия.
Вы даете две шкалы одной и той же выборке респондентов. Степень совпадения результатов двух шкал выражается через коэффициент корреляции.
Вы вычисляете коэффициент корреляции между результатами двух тестов и обнаруживаете, что ваша шкала коррелирует с имеющейся шкалой ( r = 0,80). Это значение показывает, что существует сильная положительная корреляция между двумя шкалами.
Другими словами, ваши весы точно измеряют ту же конструкцию, что и проверенные весы.
Другие интересные статьи
Если вы хотите узнать больше о статистике, методологии или предвзятости исследований, обязательно ознакомьтесь с другими нашими статьями с пояснениями и примерами.
Часто задаваемые вопросы о достоверности критерия
org/FAQPage»>
В чем разница между валидностью критерия и конструктивной валидностью?
Валидность критерия и достоверность конструкции являются типами достоверности измерения. Другими словами, они оба показывают, насколько точно метод что-то измеряет.
В то время как конструктивная валидность — это степень, в которой тест или другой метод измерения измеряет то, что он должен измерять, валидность критерия — это степень, в которой тест может прогнозировать (в будущем) или одновременно (в настоящем) измерять что-либо.
Конструктивная валидность часто считается всеобъемлющим типом метрической валидности. Вы должны иметь лицевую валидность, содержательную валидность и валидность критерия, чтобы достичь конструктной валидности.
Почему конструктивная валидность имеет значение?
При разработке или оценке меры конструктивная валидность помогает вам убедиться, что вы действительно измеряете интересующую вас конструкцию. Если у вас нет конструктивной валидности, вы можете непреднамеренно измерить несвязанные или отдельные конструкции и потерять точность в своем исследовании.
Конструктивная валидность часто считается всеобъемлющим типом валидности измерения, поскольку она охватывает все остальные типы. Для достижения конструктивной валидности вам необходимо иметь лицевую валидность, содержательную валидность и валидность критерия.
Почему валидность лица важна?
org/Answer»>
Лицевая валидность важна, потому что это простой первый шаг к измерению общей валидности теста или методики. Это относительно интуитивно понятный, быстрый и простой способ начать проверять, кажется ли новая мера полезной на первый взгляд.
Внешняя достоверность означает, что любой, кто просматривает вашу меру, говорит, что она измеряет то, что должна. Из-за плохой внешней достоверности кто-то, просматривающий вашу меру, может быть озадачен тем, что вы измеряете и почему вы используете этот метод.
Процитировать эту статью Scribbr
Если вы хотите процитировать этот источник, вы можете скопировать и вставить цитату или нажать кнопку «Цитировать эту статью Scribbr», чтобы автоматически добавить цитату в наш бесплатный генератор цитирования.
Николопулу, К. (2023, 22 июня). Что такое валидность критерия? | Определение и примеры. Скриббр.