Валидность — Блог Викиум
Илья Павлов
Автор Викиум
Валидность — важнейший аспект экспериментальной психологии. Это свидетельство того, что, применяя определённую методику, специалист измерил именно то, что планировал.
Валидной считается методика, результаты которой соответствуют задачам, поставленным перед исследованием. Например, методика, разработанная для того, чтобы определить темперамент человека, должна измерять именно его, а не иные психические свойства.
Принципиальную важность валидности невозможно переоценить. Ведь именно от неё зависит достоверность проводимых тестов. Совершенный эксперимент невозможен, если методика не обладает идеальной валидностью.
Как проверить валидность?
Существует три способа, позволяющих определить, насколько методика валидна:
- Содержательная сторона
Проверка выявляет, насколько методика соответствует действительности, в которой реализуется изучаемое свойство.
- Конструктная валидность
Если методика валидна, она будет проверять научно обоснованные конструкты. Здесь же можно пойти по двум направлениям. Конвергентная валидность требует сопоставления нескольких методик, проверяющих идентичные показатели. Если между результатами будет наблюдаться корреляция, методику можно считать валидной.
При дискриминантном подходе проверяют, диагностирует ли методика только заданные характеристики и не затрагивает ли те, с которыми нет зависимости у исходных параметров.
- Критериальная проверка
Здесь используются статистические методы. Чтобы протестировать валидность, проверяют, соответствуют ли результаты испытания заранее заданным критериям.
Рассматривая критериальную валидность, также говорят о прогностической составляющей.
Такие методики применяют, когда хотят предсказать поведение. Если прогноз, сделанный с помощью методики, со временем оправдывается, экспериментальный комплекс получает статус прогностически валидного.Надёжность и валидность
Критерии надёжности рассматриваются с формальной точки зрения, тогда как содержательная сторона не учитывается.
Валидность, наоборот, обращает внимание на содержательные результаты теста. Оценивается их соответствие существующим феноменам психологии.
Надёжная методика не тождественна валидной. Например, тест, оценивающий инициативность, может продемонстрировать высокие показатели надёжности и ретестовости элементов. Однако фактически результаты будут свидетельствовать о значительной силе воли, но с точки зрения содержания инициативности не подтвердят.
Таким образом, надёжность теста является высокой, а валидность — низкой.
Внутренняя валидность и пример её нарушения
Внутренняя валидность — одна из разновидностей данного феномена. Чтобы понять её принцип, стоит рассмотреть пример, который отразит её нарушение.
Допустим, лаборатория хочет протестировать лекарство, способствующее росту. Для этого экспериментаторы отбирают несколько подростков тринадцати лет, измеряют параметры роста и дают детям лекарство.
Спустя два года снова производятся замеры, которые отражают увеличение показателей. Однако на основании изменившихся данных нельзя сделать вывод о том, что причиной перемен оказалось именно лекарство.
Нарушение внутренней валидности заключается в неучтенных факторах, которые влияют на результат исследования. В данном случае речь идёт о естественных процессах взросления. Корректный эксперимент должен был предусмотреть и их.
Методика определения определения поведения людей в различных ситуациях тоже может быть валидной или нет. Курс Викиум «Профайлинг» научит «читать людей» по невербальным признакам, выявлять скрытые намерения собеседника и прогнозировать действия оппонента.
Валидность в психологии.
Определение. ПодробнееВалидность служит основным целям любой науки – познание и власть.
Сегодня часто утверждают, что концепция валидности уникальна. Но критерий оценки или процедура оценки действительна или недействительна, и не более того. Разнообразны и многочисленны методы проверки, одни из которых теоретические или конструктивные, а другие — прагматические или просто эмпирические.
Техники валидации очень распространены, и их количество быстро растет. Но, существует только два фундаментальных типа валидности, которые в остальном взаимозависимы: теоретическая и практическая. Они соответствуют двум фундаментальным целям науки: познанию и власти. С одной стороны, чтобы познать реальность, объяснить и понять ее, то есть чтобы учесть один аспект реальности (объяснить его) в связи с другими аспектами (понять их).
С другой стороны, чтобы иметь возможность вмешиваться в реальность, чтобы до некоторой степени доминировать над ней, лучше приспособиться к ней или модифицировать ее так, чтобы она лучше соответствовала нашим целям. Это две разные цели, но не независимые.
В психометрии валидность понимается как степень, в которой инструмент или процедура измеряет то, что они предназначены для измерения. Другими словами, метод измерения будет действителен до тех пор, пока он эффективно отражает психологическую переменную, на которую он направлен. Переменная эта оценивается по ее взаимосвязи с определенным критерием, например, результатами в других переменных или связанных задачах. В этом смысле можно рассматривать различные типы достоверности: прогнозирующая валидность, конвергентная валидность, конструктивная валидность и т.д.
Валидность — это суждение или оценка того, насколько хорошо тест измеряет (оценивает) то, что он предназначен для измерения в данном контексте. В частности, это вынесение основанного на фактах суждения о целесообразности различий, сделанных на основе результатов тестов.
Валидность гарантирует, что измеряется то, что предлагается, а не что-то иное. Тест считается валидным, если он соответствует нашим целям.
Валидация — это процесс, который позволяет все больше и больше уточнять, ограничивать и улучшать измерительный «инструмент». Таким образом, тест по теории измерений будет действительным, если он действительно дает возможность измерить, например, знания, которые студенты имеют по этому предмету, а не (возможно, непреднамеренно) что-либо иное.
Наконец, срок действия валидности относится к степени, в которой тест измеряет то, что он намеревается измерить. В этом смысле тест будет пригоден для измерения пространственного мышления, например, если он измеряет этот тип рассуждения, а не что-то еще.
Валидность в психологииВалидация — это процесс сбора и оценки достоверности доказательств. И создатель теста, и пользователь теста могут сыграть роль в валидации теста для конкретной цели.
Один из способов, которым специалисты по измерениям традиционно концептуализируют валидность, состоит в трех категориях:
- Валидность содержания. Валидность контента определяет, является ли тест репрезентативным для всех аспектов конструкции. Полностью ли тест отражает то, что он нацелен на измерение.
- Валидность (текущая или прогностическая), связанная с критерием оценивает, насколько близко результаты теста соответствуют результатам другого теста одного и того же предмета.
- Валидность конструкции — это гарантия того, что метод измерения соответствует конструкции, которую вы хотите измерить.
Валидность можно разделить на два основных типа:
- Внутренняя валидностьозначает степень уверенности в том, что тестируемая причинно-следственная связь заслуживает доверия и не зависит от других факторов или переменных.
Один из ключей к пониманию внутренней валидности — это признание того, что, когда она связана с экспериментальным исследованием, она относится как к тому, насколько хорошо было проведено исследование (план исследования, используемые рабочие определения, как измерялись переменные, что измерялось/не измерялось и т.
д.), так и насколько уверенно можно сделать вывод, что изменение зависимой переменной было произведено исключительно независимой переменной, а не посторонними.В своей классической книге по экспериментальным исследованиям Кэмпбелл и Стэнли (1966) идентифицируют и обсуждают 8 типов посторонних переменных, которые, если их не контролировать, могут поставить под угрозу внутреннюю валидность эксперимента.
- История
Это уникальный опыт, полученный испытуемыми между различными измерениями, выполненными в эксперименте. Этот опыт действует как дополнительные и незапланированные независимые переменные. Исследования, в которых с течением времени проводятся повторяющиеся измерения субъектов, с большей вероятностью будут подвержены влиянию исторических переменных, чем те, которые собирают данные в более короткие периоды времени или не используют повторные измерения.
- Созревание
Это естественные (а не навязанные экспериментатором) изменения, которые происходят в результате нормального течения времени. Например, чем больше времени проходит в исследовании, тем больше вероятность того, что испытуемые устают и скучают, более или менее мотивированы в зависимости от голода или жажды и т. д.
- Тестирование
Во многих экспериментах проводится предварительное тестирование субъектов, чтобы установить, что все субъекты начинают исследование примерно на одном и том же уровне и т. д. Это может повлиять на результативность субъектов в более поздних.
- Инструменты
Изменение методов измерения (или их применения) во время исследования влияет на то, что измеряется.
- Статистическая регрессия
Это когда субъекты исследования выбираются в качестве участников из-за того, что они набрали чрезвычайно высокие или чрезвычайно низкие баллы по некоторому показателю эффективности. Повторное тестирование субъектов почти всегда приводит к другому распределению баллов. и среднее значение для этого нового распределения будет ближе к среднему значению.
- Отбор
Субъекты в группах сравнения (например, контрольная и экспериментальная) должны быть функционально эквивалентны в начале исследования. Если группы сравнения отличаются друг от друга в начале исследования, результаты исследования являются необъективными.
- Экспериментальная смертность
Испытуемые выбывают из исследований. Если одна группа сравнения испытывает более высокий уровень исключения/смертности субъектов, чем другие группы, то наблюдаемые различия между группами становятся сомнительными.
- Взаимодействие при выборе
В некоторых исследованиях метод выбора взаимодействует с одной или несколькими другими угрозами (описанными выше), искажая результаты исследования.
- Внешняя валидность относится к степени, в которой результаты исследования могут быть применены (обобщены) к другим ситуациям, группам или событиям.
Достоверность исследования во многом определяется планом эксперимента. Чтобы убедиться в достоверности используемых вами инструментов или тестов, вы также должны учитывать достоверность измерений.
Степень, в которой результаты исследования (независимо от того, является ли исследование описательным или экспериментальным) могут быть обобщены/применены к другим людям или условиям, отражает его внешнюю валидность. Как правило, групповые исследования, использующие рандомизацию, изначально будут обладать более высокой внешней валидностью, чем исследования (например, тематические исследования и экспериментальные исследования с одним субъектом), в которых не используется случайный выбор/назначение. Кэмпбелл и Стэнли определили 4 фактора, которые отрицательно влияют на внешнюю валидность исследования:
- Взаимодействие
Взаимодействие между тем, как были выбраны субъекты и лечение может произойти. Если субъекты не выбираются случайным образом из популяции, то их конкретные демографические/организменные характеристики могут влиять на их работу, и результаты исследования могут быть неприменимы к популяции или к другой группе, которая более точно представляет характеристики популяции.
- Предварительное тестирование
Это может вызвать более/менее сильную реакцию, например, на лечение, чем если бы они не прошли предварительное тестирование. Иными словами, чтобы обобщить результаты исследования, исследователь должен будет указать, что также должен проводиться определенный тип предварительного тестирования, поскольку предварительное тестирование может служить дополнительной непреднамеренной независимой переменной.
- Эффективность субъектов
Эффективность субъектов в некоторых исследованиях больше является продуктом или реакцией на экспериментальные условия (например, ситуацию, в которой проводится исследование), чем на независимую переменную.
Исследования, в которых используется несколько методов вмешательств, могут иметь ограниченную обобщаемость, поскольку ранние методы исследования могут иметь кумулятивный эффект на показатели субъектов.
Существует разница между внутренней и внешней валидностью.
Внутренняя валидность является степень уверенности, что причинно-следственная связь тестируется не зависит от других факторов или переменных.
Внешняя валидность — это степень, в которой ваши результаты могут быть обобщены на другие контексты.
- Повышение внутренней и внешней валидности
В групповых исследованиях основными методами, используемыми для достижения внутренней и внешней валидности, являются рандомизация, использование плана исследования и статистического анализа, соответствующих типам собранных данных, а также вопросам, которые исследователь(и) пытается решить, найти ответ. Экспериментальные исследования с одним субъектом почти всегда имеют высокую внутреннюю валидность, поскольку субъекты служат в качестве их собственных контролей, но они чрезвычайно низки в отношении внешней валидности. Однопредметные исследования приобретают внешнюю валидность в процессе репликации и расширения, т.
Что такое валидность психологического эксперимента?
Несмотря на свою важность, концепция экспериментальной валидности с момента своего появления получила мало развития. По этой причине цель состоит в том, чтобы обеспечить критический анализ с помощью метода философского анализа по трем осям:
- различие между альтернативными гипотезами и экспериментальными артефактами;
- списки угроз экспериментальной валидности;
- предполагаемое противоречие между внутренней и внешней валидностью.
Если разработка концепции экспериментальной валидности была недостаточной, то всему виной ограниченное рассмотрение как причинных допущений, так и неопределенности в экспериментальном контексте.
Надежность психологического эксперимента измеряет согласованность, проверяемость или повторяемость исследования. Если исследование может быть повторено и по-прежнему дает те же результаты (либо в другой группе участников, либо в течение другого периода времени), то оно считается надежным.
Со своей стороны, валидность в психологии (и не только), измеряет относительную точность или точность выводов, сделанных в результате исследования. Это относительная точность и правильность психологических исследований. Чтобы определить достоверность меры количественно, ее необходимо сравнить с критерием.
Выделяются различные типы валидности психологического эксперимента:
Валидность теста
Валидность теста — это показатель количества смысла, который можно приписать набору результатов теста. В психологических и образовательных тестах, где важность и точность тестов имеют первостепенное значение, очень важна валидность теста.
Валидность теста включает в себя ряд видов действия, в том числе критерия достоверности, обоснованности содержания и валидности. Если исследовательский проект имеет высокие баллы в этих областях, общая валидность теста высока.
- Критерий валидности
Валидность критерия устанавливает, соответствует ли тест определенному набору навыков:
- Параллельная достоверность измеряет тест против эталонного теста, а высокая корреляция указывает на то, что тест имеет сильную достоверность критерия.
- Прогностическая достоверность является мерой того, насколько хорошо тест предсказывает навыки, такие как измерение того, дает ли, например, хороший средний балл в средней школе хорошие результаты в колледже или университете.
- Валидность содержания
Валидность содержания определяет , как хорошо тест по сравнению с реальным миром. Например, тест на школьные способности должен отражать то, что на самом деле преподается в классе.
- Валидность конструкции
Валидность конструкции является мерой того, насколько хорошо тест выполняет свои требования. Тест, предназначенный для измерения депрессии, должен измерять только этот конкретный конструкт, а не тесно связанные идеалы, такие как тревога или стресс.
Валидность методики
Валидность вместе с надежностью, составляют фундаментальные свойства психометрических методов и, в более общем плане, процедур наблюдения и записи психологических переменных. В этом смысле это также применимо к экспериментальным процедурам, в которых проводится различие между внутренней и внешней валидностью.
Валидация метода относится к процессу экспериментирования и оценки для определения рабочих характеристик метода. Метод считается валидированным, когда «испытатель» подтвердил посредством объективных свидетельств и оценки этих экспериментов, что метод соответствует его предполагаемому использованию (соответствует цели).
Два из этих параметров — точность и аккуратность.
Результатом валидации является решение относительно средств управления, которые необходимо ввести, чтобы гарантировать, что метод остается действительным.
Существуют различные методологии, позволяющие определить валидность содержания теста или инструмента. Некоторые авторы заявляют, что в них входят результаты тестирования, мнение специалистов, когнитивные интервью и оценка экспертов. Других выполняют статистический анализ с различными «формулами. Качественные данные получаются благодаря таким методам как:
- Экспертная комиссия
Это методология, которая позволяет определить валидность инструмента с помощью группы экспертов для каждой из областей науки, которые должны быть рассмотрены в инструменте оценки, которые должны проанализировать, как минимум, согласованность пунктов с цели курсов, сложность заданий и оцениваемые когнитивные способности. Эта методология наиболее часто используется для проверки содержимого.
- Когнитивное интервью
Это метод, требующий от участников мысли вслух при выполнении требуемой деятельности. Полученный рассказ записывается для последующей расшифровки и анализа.
Для лучшего результата в отношении валидности содержания предлагается использовать более одной методологии, чтобы дополнять их, тем самым повышая строгость процесса.
Способы установления валидности методики
Когда валидность обсуждается в контексте определенных тестов, экспериментов или методик, может быть поставлен вопрос и о валидности метода, тестирования или иного определенного метода в целом, особенно тогда инструментом исследования определяют мета-анализ.
Для установления валидности методики используют 3 основных способа:
Методику можно считать прогностически валидной, если прогноз подтверждается с течением времени.
Все создатели своих методик должны неустанно обосновывать все виды валидности и собирать свидетельства в пользу валидности выбранных инструментов.
Часто валидность считают синонимом точности. Но нет, валидность — это не синоним точности. Таким образом, валидность результата эксперимента означает, что результату можно доверять, и люди могут принимать осмысленные решения, основываясь на качестве результатов. Это потому что тестирование проводилось с использованием проверенного метода (метод был проверен для достижения характеристик, необходимых для соответствия цели испытания, включая точность), и метод контролировался и оценивался посредством внутренних и внешних проверок (включая точность).
Срок действия | Психология | Tutor2u
Exam Support: Используйте наши онлайн-курсы Grade Booster 2023 для подготовки к предстоящим экзаменам. Записаться здесь →
Изучение психологии
Учебные заметки
- Уровень:
- AS, A-уровень
- Плата:
- AQA, Edexcel, OCR, IB
Последнее обновление 22 марта 2021 г.
Поделиться :
Валидность относится к тому, действительно ли мера измеряет то, что, по ее утверждению, измеряет . Некоторые ключевые типы валидности рассматриваются ниже.
Лицевая достоверность
Лицевая достоверность является мерой того, выглядит ли субъективно многообещающе то, что инструмент измеряет то, что он должен измерять
- например. Можно заметить, что люди с более высокими баллами на экзаменах получают более высокие баллы по опроснику IQ; вы не можете быть уверены, что они напрямую связаны, но на первый взгляд кажется, что результаты экзаменов являются разумным показателем показателей IQ, поэтому ваша мера показывает хорошую внешнюю достоверность.
Внутренняя действительность
Внутренняя валидность является мерой того, зависят ли полученные результаты исключительно от изменений в переменной, с которой манипулируют (т. е. независимой переменной) в причинно-следственной связи. Два ключевых типа внутренней валидности:
- Конструктивная валидность – спрашивает, успешно ли мера измеряет концепцию , для которой она предназначена (например, измеряет ли опрос IQ или что-то родственное, но принципиально отличное?).
- Параллельная валидность — спрашивает, согласуется ли мера с ранее существовавшими мерами, которые проверены для проверки той же [или очень похожей] концепции (оценивается путем сопоставления мер друг с другом).
Внутреннюю валидность можно оценить на основе того, успешно ли контролируются или исключаются посторонние (т. е. нежелательные) переменные, которые также могут повлиять на результаты; чем больше контроль над такими переменными, тем больше уверенность в том, что можно найти причину и следствие, относящиеся к исследуемому конструкту.
Внешняя валидность
Внешняя валидность — это мера того, могут ли данные быть обобщены на другие ситуации за пределами исследовательской среды, в которой они были первоначально собраны. Два основных типа внешней валидности:
- Временная валидность — это высокая когда результаты исследований успешно применяются в течение времени (некоторые переменные в прошлом могут больше не иметь значения сейчас или в будущем).
- напр. Изменения в отношении к гендерным ролям с течением времени могут снизить временную достоверность данных прошлых экспериментов применительно к современным исследованиям.
- Экологическая достоверность – можно ли обобщить данные на реальный мир , исходя из условий, в которых проводится исследование, и используемых процедур.
- напр. Лабораторные исследования могут обеспечить высокую степень контроля над посторонними переменными, которые в противном случае варьировались бы в естественной среде, поэтому результаты могут считаться слишком «искусственными» и, следовательно, иметь низкую экологическую достоверность.
- Однако мыши, например, могут вести себя одинаково в лаборатории и в дикой природе, так что лабораторные эксперименты, возможно, сохранят здесь высокую экологическую достоверность.
- напр. Лабораторные исследования могут обеспечить высокую степень контроля над посторонними переменными, которые в противном случае варьировались бы в естественной среде, поэтому результаты могут считаться слишком «искусственными» и, следовательно, иметь низкую экологическую достоверность.
Внешняя валидность эксперимента может быть оценена и улучшена путем повторения исследования в разное время и в разных местах и получения аналогичных результатов. Например, уверенность в обобщаемости [и, в свою очередь, внешней валидности] результатов повышается, когда исследования успешно воспроизводятся в разных культурах.
Поделиться :
Вам также может понравиться
Наши предметы
Исследовать
Контакты
© 2002-2023 Tutor2u Limited. Регистрационный номер компании: 04489574. Регистрационный номер НДС 816865400.
НаверхЧто такое психологическое тестирование прогнозной валидности?
Прогностическая валидность в психологии относится к способности теста или оценки измерять то, для измерения чего они предназначены. Понимание определение психологии прогностической достоверности может помочь учащемуся преуспеть в своих классах или профессионалу овладеть важным навыком для своей работы.
Что включает в себя исследование прогностической достоверностиНовый человек в науке о данных или статистике может задаться вопросом: » Что такое прогностическая достоверность ?» Прогностическая валидация исследования могут проводиться как способ определения достоверности какого-либо другого теста. Эти исследования достоверности широко используются во многих областях исследований и экспертизы.
Исследование прогностической достоверности предполагает определение того, насколько хорошо определенная мера, метрика или статистика могут предсказать будущее поведение. Это тип критериального исследования. Это исследование того, как одна переменная может предсказать результат на основе информации, предоставленной другими переменными. Важно, чтобы вся информация собиралась объективно и с использованием одних и тех же стандартов измерения. Предубеждения или различия в инструментах измерения могут повлиять на прогностическое исследование валидности.
Цель прогнозного исследованияЧто такое прогнозное исследование ? Цель прогностического исследования достоверности состоит в том, чтобы выяснить, является ли какое-либо другое измерение хорошим для прогнозирования результата. Если окажется, что этот другой тест или измерение бесполезны для прогнозирования результата, то организация, агентство или компания могут захотеть найти другую метрику или статистику, которая имеет высокую прогностическую достоверность .
Поскольку у исследователей ограниченное количество времени и других ресурсов, они должны использовать их с умом. Исследование прогностической валидности может дать им доказательства того, стоило ли время, потраченное на измерение определенных критериев.
Как используется прогностическое исследование валидностиПрогностическое исследование валидности используется для прогнозирования поведения в будущем, объясняет Статистическое руководство. Они могут быть применены к реальным или смоделированным ситуациям. В лучшем случае они делаются на перспективу. Это означает, что они занимают много времени, чтобы завершить.
Исследования прогностической достоверности также требуют большого размера выборки. В некоторых случаях может быть трудно получить большой размер выборки, что является одной из причин, по которой завершение исследования прогностической достоверности может занять много времени.
Примеры исследований прогностической валидностиКогда исследование прогностической валидности проводится в реальном мире, оно проводится с определенной целью. Один пример прогностической достоверности может быть в приемных комиссиях колледжей. Сотрудник приемной комиссии будет смотреть на оценки учащегося в средней школе и средний балл, чтобы предсказать успех учащегося в колледже. По окончании колледжа приемная комиссия могла просмотреть все данные и выяснить, вовремя ли закончили колледж люди с хорошими оценками в средней школе и получили ли они высокие средние баллы во время учебы в колледже. Члены приемной комиссии также могут проводить этот тип исследования с помощью таких тестов, как Scholastic Aptitude Test (SAT).
В этом примере исследование занимает много времени. Данные должны быть собраны от старшеклассников. Когда-нибудь в будущем (четыре или более года) необходимо будет снова собрать данные об успеваемости в колледже.
Необходимо провести анализ, чтобы определить, существует ли положительная или отрицательная корреляция между успеваемостью в средней школе, включая результаты тестов и средний балл, и успеваемостью в колледже. Этот анализ может быть завершен с использованием коэффициента корреляции Пирсона. Эта статистическая формула измеряет линейную связь между двумя переменными. К счастью, есть программное обеспечение, которое может вычислить эту формулу. Коэффициент корреляции Пирсона может указать нам тип линейной зависимости (положительная, отрицательная или отсутствие эффекта) и силу этой связи.
Сотрудники отдела кадров и рекрутеры также используют прогностическую проверку при приеме на работу новых сотрудников. Потенциальных сотрудников могут попросить пройти когнитивный тест, который показал способность предсказывать будущие результаты работы на определенной должности. Если бы корреляция между результатами теста и производительностью труда была статистически значимой, тест имел бы прогностическую ценность.
Другие типы валидационных исследованийВ психологических исследованиях существует семь распространенных типов валидации. Кратко остановимся на важных особенностях каждого из них.
Лицевая валидностьЭто наименее научный тип валидности в исследованиях. Это очень поверхностный анализ. Исследователь может спросить группу случайных людей, считают ли они, что оценка имеет смысл для того, что они пытаются измерить. Лицевая валидность — хорошая отправная точка, но ее никогда не следует использовать в качестве единственного метода валидности.
Конструктивная валидностьКонструктивная валидность показывает, насколько хорошо тест или эксперимент измеряет то, что заявлено для измерения. Возможно, вы захотите определить, действительно ли художественная программа в начальной школе повысила художественные способности учащихся. Художественные способности — относительно абстрактное понятие. Исследователю потребуется работа, чтобы определить конструкцию, которую он пытается оценить, и определить, точно ли его инструмент оценки измеряет художественные способности.
Существует несколько психологических тестов с высокой конструкционной достоверностью. IQ-тест — один из самых известных тестов с высокой конструкционной валидностью.
Валидность содержанияВалидность содержания фокусируется на том, охватывает ли инструмент оценки или измерения все содержимое измеряемой конструкции или поведения. Если бы кто-то хотел измерить экстраверсию, ему нужно было бы определить, какие черты охватывают эту конструкцию. Если говорят, что оценка имеет высокую содержательную валидность, это означает, что тест измеряет все атрибуты экстраверсии.
Внутренняя достоверностьВнутренняя достоверность относится к степени, в которой вы можете быть уверены, что ваша независимая переменная производит наблюдаемый эффект. Исследование будет иметь внутреннюю валидность, если оно может показать заслуживающую доверия причинно-следственную связь. Исследователю может быть интересно узнать, может ли мотивационное приложение уменьшить негативное мышление. Если бы исследование показало, что негативное мышление уменьшилось после взаимодействия с мотивационным приложением и не было задействовано никаких других переменных, это было бы хорошей внутренней валидностью.
Внешняя валидностьВнешняя валидность — это способность исследования получать те же результаты за пределами контролируемой среды (например, в лаборатории) в реальном мире.
Параллельная валидностьПараллельная валидность используется для оценки степени согласия между двумя оценками, сделанными одновременно. Если учащийся получил одинаковый балл как по бумажной, так и по электронной версии теста, тест будет иметь сильную параллельную валидность.
Валидность критерияВалидность критерия относится к тому, насколько точно тест или оценка измеряет результат, для измерения которого они были созданы.