Валидность это в психологии определение: Валидность — Психологос

Содержание

Валидность это в психологии, виды валидности, понятие

Валидность – это один из базовых критериев в психодиагностике тестов, методик, определяющий их качество, близкое к понятию достоверности. Применяется, когда нужно узнать насколько хорошо методика измеряет именно то, на что она ориентирована, соответственно то, насколько лучше отображается исследуемое качество, тем большая валидность данной методики.

Вопрос о валидности возникает сперва в процессе разработки материала, потом после применения теста или методики, если необходимо узнать, соответствует ли степень выраженности определяемой характеристики личности и методом измерения этого свойства.

Понятие валидности выражается корреляцией результатов, которые получились в результате применения теста или методики с другими характеристиками, которые также исследуются, и ее можно также аргументировать комплексно, с помощью разных приемов и критериев. Используются разные виды валидности: концептуальная, конструктивная, критериальная, содержательная валидности, со свойственными методами установления их степени достоверности. Иногда критерий достоверности является обязательным требованием к проверке психодиагностических методов, если они вызывают сомнения.

Чтобы психологическое исследование имело реальную ценность, оно должно быть не только валидным, а еще и надежным одновременно. Надежность позволяет экспериментатору быть уверенным в том, что исследуемое значение очень близко к истинному показателю. А валидный критерий важен тем, что он указывает, что изучается именно то, что экспериментатор предполагает. Важно обратить внимание на тот факт, что данный критерий может предположить надежность, но надежность предположить валидность не может. Надежные значения могут быть не валидными, но валидные обязаны быть надежными, в этом вся суть успешного исследования, тестирования.

Валидность это в психологии

В психологии понятие валидности обозначает уверенность экспериментатора в том, что он измерял именно то, что хотел с помощью определенной методики, показывает меру соответствия результатов и самой методики относительно поставленных задач. Валидное измерение – это то значение, которое измеряет именно то, для чего было создано. Например, методика, направлена на определение темперамента, должна измерять именно темперамент, а не нечто другое.

Валидность в экспериментальной психологии очень важный аспект, является важным показателем, который обеспечивает достоверность результатов, и с ним иногда больше всего возникает проблем. Совершенный эксперимент должен обладать безупречной валидностью, то есть он должен демонстрировать, что экспериментальный эффект вызван модификациями независимой переменной и полностью соответствовать действительности. Полученные результаты без ограничений можно обобщать. Если речь идет о степени данного критерия, то предполагается, что результаты будут соответствовать поставленным задачам.

Проверка на валидность осуществляется тремя способами.

Оценивание содержательной валидности, проводится, чтобы узнать уровень соответствия использованной методики и реальной действительности, в которой выражается исследуемое свойство в методике. Существует здесь также такой компонент, как очевидная, еще ее называют лицевая валидность, она характеризует степень соответствия теста к ожиданиям оцениваемых. В большинстве методик считается очень важным, чтобы участник оценки видел очевидную связь содержания процедуры оценки и действительности того объекта оценки.

Оценивание конструктной валидности исполняется для получения степени обоснованности, что тест реально вычисляет те конструкты, которые заданные и научно обоснованные.

В конструктной валидности имеются два направления. Первый называется конвергентной валидизацией, с его помощью проверяется ожидаемая связь результатов методики с характеристиками из других методик, которые измеряют исходные свойства. Если для измерения какой-то характеристики необходимо несколько методик, то рациональным решением было бы проведение экспериментов минимум двух методик, чтобы при сопоставлении результатов обнаружив высокую положительную корреляцию, можно было утверждать о валидном критерии.

Конвергентная валидизация определяет вероятность вариации оценки теста с ожиданиями. Второй подход, называется дискриминантная валидизация, в ней заключается, что методика не должна измерять никаких характеристик, с которой теоретически не должно быть корреляции.

Проверка на валидность, также бывает критериальной, она, руководствуясь статистическими методами, определяет степень соответствия результатов к заранее определенным внешним критериям. Такими критериями могут быть: непосредственные меры, независимые от результатов методики или значение социально-организационных значимых показателей деятельности. В критериальной валидности также выделяют прогностическую, она применяется при потребности прогнозирования поведения. И если получается, что этот прогноз осуществляется со временем, значит методика прогностически валидна.

Валидность теста это

Тест – это стандартизованное задание в результате применения, которого получаются данные о психофизиологическом состоянии человека и его личностные свойства, его знания, способности и навыки.

Валидность и надежность тестов – это два показателя, которые определяют их качество.

Валидность теста определяет степень соответствия исследуемого качества, характеристики, психологического свойства к тесту, с помощью которого они определяются.

Валидность теста является показателем его эффективности и применяемости к измерению необходимой характеристики. Самые качественные тесты имеют 80% валидности. При валидизации следует учитывать, что от контингента испытуемых и их характеристик, будет зависеть качество результатов. Получается, что один тест может быть как высоко достоверным, так и совсем невалидным.

Существует несколько подходов к определению валидности теста.

При измерении сложного психологического явления, которое имеет иерархическую структуру и его невозможно исследовать, применяя всего один тест, применяют конструктивную валидность. Она определяет точность исследования сложных, структурированных психологических явлений, качеств личности, измеряемых с помощью тестирования.

Валидность за критерием – это такой критерий теста, за которым определяется исследуемое психологическое явление в настоящий момент и прогнозирование особенностей этого явления в будущем. Для этого результаты, полученные при тестировании соотносятся со степенью развития измеряемого качества на практике, оценка специфических способностей в определенной деятельности. Если валидность теста имеет значение минимум 0,2 то применение такого теста является оправданным.

Содержательная валидность – это критерий теста, который применяется для определения соответствия области его измеряемых психологических конструктов, демонстрирует все полноту множества измеряемых показателей.

Прогностическая валидность – критерий, за которым можно предсказать характер развития исследуемого качества в будущем. Такой критерий качества теста очень ценный, если смотреть с практической стороны, но могут быть сложности, поскольку исключается неравномерность развития данного качества в разных людей.

Надежность теста – это критерий теста, который измеряет уровень стабильности результатов, полученных после тестирования, при повторном исследовании. Определяется путем вторичного тестирования спустя определенное количество времени и расчета корреляционного коэффициента результатов, полученных после первого и после второго тестирования. Также важно, учитывать особенности самой процедуры проведения тестов и социально-психологической структуры выборки. Один и тот же тест может иметь разную надежность, зависимо от пола, возраста, социального статуса исследуемых. Поэтому надежность может иногда иметь неточности, ошибки, которые истекают из самого процесса исследования, поэтому ищутся пути, как уменьшить влияние определенных факторов на тестирование. Можно утверждать о надежности теста, если она составляет значение 0,8-0,9.

Валидность и надежность тестов очень важны, потому что определяют тест, как измерительный инструмент. Когда надежность и валидность неизвестны, тест считается неприменяемым для применения.

В измерении надежности и валидность имеет место также этический контекст. Это особенно важно, когда результаты тестирования имеют значимость в использовании их для принятия жизненно важных решений людей. Одних людей принимают на работу, других отсеивают, одни студенты проходят в учебные заведения, а другие должны еще доучиться сначала, кому-то определяется психиатрический диагноз и лечение, а кто-то здоров – это все говорит о том, что подобные решения принимаются на основании изучения оценки поведения или специальных способностей. Например, человек ищущий работу, должен пройти тестирование, и его оценки есть решающими показателями при приеме на работу, узнает, что тест был не в меру валидным и надежным, он очень разочаруется.

Валидность методики это

Валидность методики определяет соответствие того, что изучается данной методикой, тому для изучения чего именно она предназначена.

Например, если психологическая методика, которая основана на осведомленном самоотчете, назначена для исследования некого качества личности, такого качества, которое не может быть верно, оцененным самим человеком, то такая методика не будет валидной.

В большинстве случаев ответы, которые дает испытуемый на вопросы о наличии или отсутствии развитости в нем этого качества, может выражать то, как сам испытуемый воспринимает себя, или каким бы ему хотелось быть в глазах других людей.

Валидность также является основным требованием к психологической методике изучения психологических конструктов. Существует масса разных видов данного критерия, и нет пока единственного мнения о том, как правильно назвать эти виды и неизвестно каким именно видам методика обязана соответствовать. Если же методика оказывается невалидной внешне или внутренне, не рекомендуется ее использовать. Существуют два подхода к валидизации методики.

Теоретический подход выявляется в том, чтобы показать насколько действительно методика измеряет именно то качество, которое, как придумал исследователь, и обязана измерять. Это доказывается через составление с родственными показателями и теми, где связей не могло бы быть. Поэтому для подтверждения теоретического валидного критерия нужно определить степень связей с родственной методикой, имеется в виду конвергентный критерий и отсутствие такой связи с методиками, которые имеют иную теоретическую базу (дискриминантная валидность).

Оценивание валидности методики может быть количественной или качественной. За прагматическим подходом оценивается эффективность и практическая значимость методики, и для ее проведения используется независимый критерий извне, как показатель встречаемости данного качества в повседневной жизни. Таким критерием, например, может быть успеваемость (для методик на достижения, тестов на интеллект), субъективные оценки (для личностных методик), специфические способности, рисование, моделирование (для методик специальных особенностей).

Для доказательства валидности внешних критериев, выделяется четыре типа: критерии исполнения – это критерии такие, как количество выполненных заданий, время, потраченное на обучение; субъективные критерии получают вместе с опросниками, интервью или анкетами; физиологические – частота пульса, давление, физические симптомы; критерии случайности – используются, когда к цели имеет касательство или влияние определенного случая или обстоятельств.

При выборе методики исследования имеет теоретическое и практическое значение определение охвата изучаемых характеристик, как важной составляющей валидности. Информация, которая содержится в названии методики практически всегда не является достаточной для суждения об области ее применения. Это просто имя методики, но под ним всегда кроется еще много чего. Хорошим примером будет методика корректурной пробы. Здесь в сферу изучаемых свойств включаются концентрация внимания, устойчивость и психомоторная скорость процессов. Такая методика дает оценку выраженности этих качеств в личности, хорошо соотноситься со значениями, полученными из других методов и обладает хорошей валидностью. Вместе с тем полученные в результате проведения корректурной пробы значения подвержены большему влиянию других факторов, относительно которых методика будет неспецифичной. Если применить корректурную пробу, чтобы измерить их, то валидность будет невысокая. Выходит,что определяя область применения методики, валидный критерий отображает уровень обоснованности результатов исследования. При небольшом количестве сопровождающих факторов, которые имеют влияние на результаты, достоверность оценок, полученных в методике будет выше. Еще достоверность результатов определяется с помощью набора измеряемых свойств, их важностью при осуществлении диагностики сложной деятельности, существенностью отображения в материале методики предмета измерения. Например, для удовлетворения требований достоверности и надежности, методика, назначенная на профотбор, должна иметь анализ большого круга различных показателей, которые наиболее важные при достижении успеха в профессии.

Виды валидности

Валидный критерий бывает нескольких видов, в зависимости на что именно он направлен.

Внутренняя валидность определяет насколько определенное экспериментально воздействие стало причиной изменений в данном эксперименте.

Внутренняя валидность определяется отношениями между независимыми и зависимыми переменными, и проходит через особенные процедуры, в результате которых определяется достоверность выводов в данном исследовании. О внутреннем критерии говорится, когда достоверно известно о зависимости причинно-следственного типа между независимыми и зависимыми переменными.

Валидность исследования определяется влиянием неконтролируемых ситуативных факторов на изучаемое явление, если оно высокое, то данный критерий будет низким. Высокая внутренняя валидность исследования является признаком качественного исследования.

Внешняя валидность обобщает вывод популяции, ситуации и других независимых переменных. От того, насколько высокая и хорошая внешняя валидность зависит возможность переноса результатов, полученных в исследовании на реальную жизнь.

Очень часто внешняя и внутренняя валидизации противоречат друг другу, потому что если увеличивается одна валидность, то это значение может повлиять на показатели другой. Самым лучшим вариантом считается выбор экспериментальных планов, которые обеспечивали бы два вида данного критерия. Особенно это важно в случае исследований, в которых важным есть распространение результатов в определенных практических ситуациях.

Содержательная валидность применима к тем тестам, в которых полностью моделируется определенная деятельность, в первую очередь, аспекте связанным с предметом. Выходит, что в самом содержании методики отражаются основные стороны психологического конструкта. Если эта характеристика имеет сложную структуру, то в самой методике должны присутствовать все входящие в него элементы. Определяется такой валидный критерий с помощью систематического контроля за содержанием, должен показывать полноту охвата всей выборки за измеряемыми параметрами. Исходя из этого должна быть проведена эмпирическая проверка методики в соответствии с ее гипотезами. Каждое задание или вопрос в назначенной области, должен иметь равные шансы на включение его к заданиям теста.

Эмпирическая валидность определяется через статистическую корреляцию, то есть считается корреляция баллов по тесту и показателей внешнего параметра, избранного как критерий валидности.

Конструктная валидность относится к теоретическому конструкту, как отдельному и включается к поиску факторов, которые объясняют поведение человека при выполнении теста или методики.

Прогностический тип валидности определяется за счет наличия очень надежного внешнего критерия, хотя информация о нем собирается через определенное время после окончания испытания. Таким внешним критерием может быть способность личности к определенному виду деятельности, для которой он был отобран за результатами психодиагностических измерений. Точность прогнозирования в этом валидном критерии находится в противоположной зависимости от времени, которое давалось для прогнозирования. И чем больше времени проходит после исследования, тем еще больше факторов будут учитываться для оценивания прогностической значимости теста. Хотя учесть абсолютно все имеющиеся факторы практически невозможно.

Ретроспективная валидность определяется за критерием, который отражает события или сстояние свойства в прошлом времени. Она может использоваться для получений знаний о предсказательных аспектах методики. Очень часто в таких тестах сопоставляют оценки развития способности в их прошлом значении и на данный момент, вычесляется насколько эффективнее стали результаты.

Экологическая валидность показывает, что некий организм в силу наследственных, генетически обусловленных или приобретенных особенностей является подготовленным к демонстрированию разнообразных форм поведения во всевозможных контекстах или в разных средах обитания. Действия организма могут быть успешными в одном времени и месте, но не настолько успешными или совсем не иметь успеха в другое время, и другом месте.

Экологическая валидность подтверждается, если результаты исследования имеют место подтверждения или должного применения их в полевых исследованиях. Проблемой лабораторных исследований есть адекватная переносимость полученных результатов на условия реальной жизни, на повседневную деятельность индивида, которая длится естественным путем. Но это тоже не является конечным подтверждением результатов, как экологически валидных, потому что предполагает генерализацию также на другие условия и обстоятельства. Часто исследования обвиняются в невысоком, экологическом валидном критерии, но вся причина бывает заключается в невозможности повторить исследование в реальной жизни.

Автор: Практический психолог Ведмеш Н.А.

Спикер Медико-психологического центра «ПсихоМед»

Валидность в психологии. Что это, определение простыми словами, виды, пример


Валидность в дословном переводе с английского языка означает «устойчивый, пригодный, соответствующий». В научных кругах данный термин используется, как показатель, который оценивает пригодность той или иной методики исследования в конкретной ситуации, условиях.

Нередко валидность ставят на одну ступень вместе с таким понятием как «надежность». Данный критерий определяет уместность и эффективность, надежность выбранных методов исследования: что и как они измеряют и характеризуют, какую картину отражают, для чего производится оценка.

Чем ближе исследователь подбирается к главному признаку проблемы, который позволяет оценить ее характер и влияние с помощью определенной методики, тем выше ее валидность. Сам процесс проверки действенности (качества) и эффективности, применимости методов исследования называется валидизацией.

Что такое валидность в психологии

Валидность – важная характеристика психологических тестов и методик. Она должна проверяться экспериментаторами наравне с надежностью методики. Критерий валидности чаще всего используется в психодиагностике. В нем раскрывается проблема соответствия полученных в ходе исследования данных «идеальным». То есть тем, которые не искажены какими-либо внутренними или внешними факторами.

В психологии ярко выражена проблема субъективности. Какими бы точными, по мнению экспериментатора, не были полученные данные – они искажены. Для проверки уровня достоверности полученного знания используется критерий валидности. Валидность не используется в точных науках: физике, химии, математике.

Это уникальный критерий психологии, позволяющий сгладить трудности получения объективных знаний. Первой причиной появления этого инструмента служит проблема точного определения изучаемой характеристики или свойства. Так, исследуя тревожность, невозможно однозначно установить диагностируемое явление. Тревожность – это и страх, и беспокойство, и волнение.

Второй причиной является субъективность исследуемого параметра психодиагностической методикой. Разработчик вкладывает в формулировки собственное значение и смысл, но это не значит, что испытуемый думает по такому же шаблону. Интерпретации одних и тех же вопросов или утверждений могут сильно отличаться.

В точных науках нет проблемы определения исследуемого объекта. Трудность составляют способы изучения. Например, ученый-физик, исследующий параметры железного шара, точно видит и осязает его. Он поставил себе цель: изучить радиус шара. Параметр объективен и находится с помощью измерения и формул.

[Править]Альфа Кронбаха

В этом методе, предложенном Ли Кронбахом, сравнивается разброс каждого элемента с общим разбросом всей шкалы. Если разброс результатов теста меньше, чем разброс результатов для каждого отдельного вопроса, следовательно, каждый отдельный вопрос направлен на исследование одного и того же общего основания. Они вырабатывают значение, которое можно считать истинным. Если такое значение выработать нельзя, то есть получается случайный разброс при ответе на вопросы, тест не надежен и коэффициент альфа Кронбаха будет равен 0. Если же все вопросы измеряют один и тот же признак, то тест надежен и коэффициент альфа Кронбаха в этом случае будет равен 1.

Что такое валидность методики

Методика, в отличие от метода – это набор определенных действий специалиста, направленных на соответствующий результат. Метод исследования может включать в себя несколько методик. Например, метод анкетирования по классификации Б. Г. Ананьева может осуществляться с помощью разных тест-опросников.

Валидность в психологии — это соответствие целостности психодиагностической методики и отдельных её частей исследуемой психической характеристике.

ПДМ может включать несколько шкал. Например, тест-опросник, определяющий уровень невротизации-психопатизации, состоит из следующих шкал: психопатизация, невротизация и шкала «лжи». Третья измерительная шкала используется для проверки искренности испытуемого. Самая распространенная причина лжи – мотивация одобрения. Этот фактор сильно искажает статистические и индивидуальные данные.

Валидная ПДМ – это методика, диагностирующая только заданный экспериментатором узкий спектр характеристик. Она пользуется большим доверием специалистов и применяется в научных исследованиях. Чем выше коэффициент валидности, тем достовернее полученные в ходе эксперимента данные.

[Править]Надёжность как устойчивость

Устойчивость результатов теста или ретестовая надежность (англ — test-retest reliability) – возможность получения одинаковых результатов у испытуемых в различных случаях.

Устойчивость определяется с помощью повторного тестирования (ретеста):

В данном методе предлагается провести несколько замеров с некоторым промежутком времени (от недели до года) одним и тем же тестом. Если корреляция между результатами различных замеров будет высокой, следовательно, тест достаточно надежный. Наименьшим удовлетворительным значением для ретестовой надежности является 0,5. Однако надежность не всех тестов можно проверять этим методом, так как оцениваемое качество, явление или эффект могут быть сами по себе нестабильны (например, наше настроение, которое может меняться от одного замера к следующему).

Еще один недостаток повторного тестирования – это эффект привыкания. Испытуемые уже знакомы с этим тестом, а может быть, даже помнят большую часть своих ответов после предыдущего заполнения.

В связи с выше сказанным применяется исследование надежности психодиагностических методик с использованием параллельных форм, при которых конструируются эквивалентные или параллельные наборы заданий. При этом испытуемые выполняют совершенно другой тест при аналогичных условиях. Однако имеются трудности в доказательстве того, что обе формы являются действительно эквивалентными. Несмотря на это, на практике параллельные формы тестов оказываются полезными в установлении надежности тестов.

Что такое валидность теста

Психологический тест – разновидность психодиагностических методик. Тест пользуется наибольшей популярностью среди экспериментаторов из-за простоты применения. В комплектацию исследователя входит стимульный материал, бланки ответов и инструкции.

Тест-опросники могут исследовать такие психические характеристики испытуемого, как стрессоустойчивость, интеллект, мотивация и толерантность. Вопросы формулируются с учетом специфики целевых выборок и цели исследования.

Они могут быть закрытыми – испытуемому предлагается выбрать одно из утверждений; открытыми – испытуемый должен сам ответить на вопрос или прокомментировать утверждение; косвенными – являющимися общеизвестными фактами или мнением; прямыми – которые непосредственно оппонируют мнению индивида.

Валидность теста обеспечивает достоверность полученных с его помощью данных о психических явлениях. Без экспериментально доказанной высокой валидности тест нельзя считать эффективным. Если выполнение отдельного задания или самого теста фиксирует измеряемое психическое явление, то валидность принимает высокие значение.

Это значит, что тест валиден и надежен, так как исключены воздействия на испытуемого. Валидность теста можно подтвердить, не обладая глубочайшими познаниями в психологии.

Например, студенты 1 курса могут проверить тест с помощью испытуемых. Экспертам предлагается оценить понятность формулировок вопросов или утверждений, исходя из личного жизненного опыта. На основе полученных данных можно говорить о валидности опросника.

[Править]Надёжность как внутренняя согласованность

Внутренняя согласованность(англ. — internal consistency) определяется связью каждого конкретного элемента теста с общим результатом, тем, насколько каждый элемент входит в противоречие с остальными, насколько каждый отдельный вопрос измеряет признак, на который направлен весь тест. Чаще всего тесты, разрабатываются таким образом, чтобы у них была высокая степень внутренней согласованности, а связи с тем, что если одна переменная измеряется частью теста, то тогда в других частях, если они не согласованы с первой, эта же переменная измеряться не может. Таким образом, чтобы тест был валидным, необходимо, чтобы он был согласован.

Однако существует и противоположная точка зрения. Кэттелл говорит о том, что высокая внутренняя согласованность на самом деле является противоположностью валидности: каждый вопрос должен затрагивать меньшую область или иметь более узкое значение, чем критерий, подвергающийся измерению. Если все вопросы являются согласованными в высокой степени, они сильно коррелируют, и, следовательно, надежный тест будет измерять только лишь сравнительно «узкую» переменную с малыми отклонениями. По рассуждениям Кэттелла, максимум валидности существует, когда все задания теста не коррелируют друг с другом, а каждое из них имеет положительную корреляцию с критерием. Однако, такой тест будет характеризоваться низкой надежностью по внутренней согласованности.

Для проверки внутренней согласованности применяются:

  1. Метод расщепления или метод автономных частей
  2. Метод эквивалентных бланков
  3. Альфа Кронбаха

Психометрические свойства методик психодиагностики

Психометрической основой любой методики являются шкалы. Понятие «шкала» трактуется в широком и узком значении: в первом случае шкала – это конкретная методика, во втором случае – это измерительная шкала, фиксирующая исследуемые признаки. Каждому элементу методики соответствует определенный балл или индекс, который формирует выраженность того или иного психического явления.

Измерительные шкалы разделяют на:

  • Метрические: интервальные, шкалы отношений.

  • Неметрические: номинативные, порядковые.
Название шкалыПояснение, примеры
Номинативная (шкала наименований)На основе общего свойства или символа относит наблюдаемое явление к соответствующему классу.
Шкала наименований самая распространенная в исследовательских психодиагностических методиках.

Эта шкала используется, например, в тест-опросниках. Отрицание или утверждение испытуемого сравнивается с ответами в ключе. Также номинативная шкала может предполагать выбор одного или нескольких признаков из предложенных.

ПорядковаяРазделяет сумму признаков на элементы, исходя из принципа «больше – меньше». Таким образом, она расставляет результаты в порядке возрастания или убывания.
Порядковая шкала используется в тесте цветового выбора. Испытуемому предлагается выбрать один из квадратов на белом фоне, после чего выбранная фигура откладывается в сторону, и процедура повторяется. Результат: расставленные по степени привлекательности для испытуемого цвета. Каждой фигуре присваивается свой порядковый номер.
ИнтервальнаяЭлементы упорядочены не только по принципу выраженности измеряемого признака, но и на основе распределения признаков по размеру, что выражается интервалами между числами, приписываемыми степени выраженности измеряемого признака.
Интервальные шкалы часто используются при стандартизации первичных тестовых показателей.
ОтношенийУпорядочивает элементы по числовому значению, соблюдая между ними пропорциональность. Объекты разделены согласно измеряемому свойству. Числа, которые приравниваются к классам объектов, пропорциональны степени выраженности исследуемых свойств.
Используется, например, при определении порогов чувствительности анализаторов. Часто применяется в психофизике.

После определения используемой шкалы для формирования теста, нужно определить коэффициент психометрических свойств методики.

К ним относятся:

  • Репрезентативность.
  • Стандартность.
  • Надежность.
  • Валидность.

Репрезентативность – это свойство, которое распространяется на выборку испытуемых. Оно может характеризовать как популяцию, так и генеральную совокупность. Репрезентативность имеет два параметра: качественный и количественный. Качественный параметр характеризует выбор испытуемых и способы построения выборки.

Количественный параметр – это объем выборки, выраженный в числах.

В психологических исследованиях это свойство определяет, насколько возможно обобщение результатов. Например, изучаются отношения мужчин и женщин. Если взять испытуемых разного возраста (школьников, студентов, взрослых, пенсионеров), то репрезентативность такой выборки будет низкой.

Однако, если испытуемые будут примерно одного возраста и сферы деятельности (только школьники, студенты, взрослые, пенсионеры обоих полов), то репрезентативность будет высокой. В психодиагностике репрезентативность используется для того, чтобы обозначить возможность применения методики на всю генеральную совокупность.

Стандартность – это упрощение методики, приведение частей ПДМ и процедуры применения к единым нормам. ПДМ должны быть универсальны и применимы разными специалистами в различных ситуациях. При отклонении структуры ПДМ от стандартов, её результаты будет невозможно сравнить с результатами других исследований. Нестандартизованные методики используются в основном для научных исследований.

С их помощью изучаются новые психические явления. Но такой методикой нельзя пользоваться в психодиагностических целях. Ещё один важный параметр ПДМ – надежность. Она характеризует точность, устойчивость и стабильность результатов, полученных с помощью конкретной методики.

Высокая надежность методики исключает действие посторонних факторов и существенно приближает эксперимент к «чистому». Критерий надежности и валидности – это разные понятия. Причем надежность трактуется шире, чем валидность: надежность > валидность.

Например, в выходной день человек получает возможность провести время либо на рыбалке, либо на охоте. Если он решает идти на охоту, но берёт с собой удочку, то его выбор не будет валиден. Однако, если человек пошел на охоту с ружьем, и оно дало осечку, значит, выбранный метод ненадежен.

[Править]Вычисление Кронбаха

Кронбаха определяется как

,

где — число элементов в шкале, — дисперсия общего тестового балла, и — дисперсия элемента .

Альтернативный способ вычисления выглядит следующим способом:

где N — число элементов в шкале, — средняя дисперсия для выборки, — среднее значение для всех ковариаций между компонентами выборки.

В настоящее время Кронбаха считают при помощи SPSS, STATISTICA и других современных статистических пакетов, возможно и при помощи Microsoft Excel

Виды валидности

Существует много видов валидности.


Валидность в психологии делится на несколько видов.

Перечень:

  • Внутренняя валидность. Характеризует соответствие полученных результатов стимульному материалу психодиагностической методики. Она определяет, действительно ли реакции испытуемых обусловлены только заданиями и фиксируют изучаемые психические свойства.
  • Внешняя валидность. Высокая внешняя валидность определяет репрезентативность выборки. То есть соответствие методики выбранным категориям населения и условиям, в которых применяется.
  • Концептуальная валидность. Валидность в психологии – это логичность построенной экспериментатором теории. Определяется на этапе разработки концепции изучаемого психического свойства. В проверке концептуальной валидности участвует группа экспертов-психологов, которые контролируют создание концепции и методики.
  • Очевидная валидность. Высокая очевидная валидность означает применимость тестовых заданий целевой выборке. Так, если экспериментатор хочет исследовать определенные качества школьников, то и задания в методике должны быть сформулированы в расчете на уровень знаний среднестистического школьника. Помимо этого, очевидная валидность фиксирует понятность формулировок, исходя из социально-демографических характеристик, представлений и жизненного опыта испытуемых. Утверждения в опросниках бывают неоднозначны. Например, утверждение «я завожусь с пол-оборота» можно интерпретировать по-разному. Есть утверждения и вопросы, которые не соответствуют жизненному опыту испытуемых. Вопрос о какой-либо ситуации во время вождения автомобиля будет неизвестен людям, которые не умеют водить.
  • Конструктная валидность. Характеризует соответствие используемых формулировок методики фиксируемым явлениям. Высокая конструктная валидность означает, что выбранные для методики понятия (например, вопросы или утверждения в тесте) фиксируют те свойства, которые хочет исследовать экспериментатор.

  • Прогностическая валидность. Обозначает достоверность прогноза, сделанного на основе результатов исследования с помощью ПДМ. Этот вид валидности важен для профотбора и постановки диагноза в психиатрических клиниках. Высокая прогностическая валидность позволяет эксперту быть уверенным в назначенном курсе лечения или выборе кандидата на должность. Измеряет задатки и предпосылки испытуемого к тем или иным качествам, свойствам. Например, если сформулировать прогностическую валидность в виде вопроса, то он может прозвучать так: «Сможет ли Иванов стать квалифицированным эндокринологом?».
  • Текущая валидность. Фиксирует текущее положение дел. Определяет те свойства и качества, которые есть у испытуемого на данный момент. Если сформулировать текущую валидность в виде вопроса, как в примере выше, то он будет звучать так: «Иванов – квалифицированный эндокринолог?» Часто в тестах используется прогностическая валидность. Текущая используется как замена.
  • Конвергентная валидность. Определяет силу связи между частями одной ПДМ или методиками, фиксируемыми одно и то же свойства. Если конвергентная валидность двух методик высока, то, вероятно, они диагностируют общее качество. Сильная связь должна устанавливаться между утверждениями или вопросами в психодиагностической методике, которые относятся к одной шкале и фиксируют одну характеристику.
  • Содержательная валидность. Валидность в психологии – это соответствие тестовых заданий диагностируемому психическому качеству. Тест не должен содержать пункты, относящиеся к диагностике других свойств. Однако, он может включать в себя шкалы «лжи» для высокой достоверности результатов.

  • Дискрименантная валидность. Высокая дискрименантная валидность выявляет отсутствие связи между заданиями одной психодиагностической методики или разными ПДМ. Используется для проверки вопросов и утверждений, методик, которые должны изучать не связанные психические свойства.

[Править]См. Также Дискриминативность

Дискриминативность задач определяется как способность отделять испытуемых с высоким общим баллом по тесту от тех, кто получил низкий балл, или испытуемых с высокой продуктивностью учебной деятельности от испытуемых с низкой продуктивностью.

Другими словами, дискриминативность — способность заданий теста дифференцировать студентов относительно «максимального» или «минимального» результата теста. Определение дискриминативности тестового задания необходимо для того, чтобы поставить заслон некачественным заданиям.

Для вычисления дискриминативности будет применяться метод крайних групп: при расчете дискриминативности тестового задания учитываются результаты наиболее и наименее успешных студентов — это самый простой и наглядный метод вычисления дискриминативности.

Доля членов крайних групп может изменяться в широких пределах в зависимости от величины выборки. Чем больше выборка, тем меньшей долей испытуемых можно ограничиться при выделении групп с высоким и низким результатами. Нижняя граница «отсечения групп» составляет 10% от общего числа испытуемых в выборке, верхняя — 33%. В данном случае будет использоваться 27% группа, так как при таком процентном соотношении достигается максимальная точность определения дискриминативности. Индекс дискриминации вычисляется как разность между долей лиц, правильно решивших задачу, из «высокопродуктивной» и «низкопродуктивной» групп.

Психометрический парадокс — явление, возникающее при использовании опросников личностных; его сущность состоит в том, что вопросы (утверждения), имеющие высокий показатель дискриминативности (см. Дискриминативность заданий теста), являются неустойчивыми по отношению к повторяемости результата, и, наоборот, стабильность ответа часто отмечается у тех вопросов, которые обладают низкой дискриминативностью.

П. Айзенбергом (1941) было показано, что вопросы, которые позволяют отличать больных неврозом от других больных или здоровых, являются ненадежными; иначе говоря, мала вероятность получения того же самого ответа при повторном обследовании. В то же время с помощью вопросов, определяемых как надежные, различение изучаемых групп не достигалось или было неудовлетворительным. Позднее изучению этого явления, получившего название П. п., были посвящены работы Л. Голдберга (1963) и М. Новаковской (1975).

П. п. не может быть объяснен без психологического анализа процесса формирования ответов на вопросы личностных опросников. Согласно М. Новаковской, вопросы, оставаясь формально неизменными, подвержены семантическим (психологическим) преобразованиям как в плане интериндивидуальном, так и интра-индивидуальном. Интериндивидуальная изменчивость обусловлена двумя причинами: различия в выраженности измеряемой черты (свойства) у разных обследуемых и различия в понимании значения вопросов. Интраиндивидуальная изменчивость обусловлена вариабельностью значения, трудностью принятия решения об ответе и флуктуацией выраженности черты (последний источник изменчивости можно не учитывать, если интервал между повторными исследованиями невелик).

Для психологической интерпретации П. п. М. Новаковская предлагает различать три детерминанты ответов: выраженность черты у обследуемого; значение, придаваемое вопросу; степень легкости принятия решения об ответе. Она подчеркивает также необходимость отличать вопросы однозначные от многозначных, которые в известном смысле могут быть Уподоблены проективным стимулам.

М. Новаковская предлагает различать два вида П. п. — типа Л и типа В — и исходить из следующих гипотез их возникновения. Парадокс типа Л возникает при вопросах, поддающихся различному истолкованию (многозначных), а также в том случае, когда трудно принять решение об ответе. Такие вопросы имеют высокий показатель дискриминативности при значительной вариабельности ответа. Парадокс типа В возникает при однозначных вопросах, для которых легко подобрать ответ. Сюда же должны быть отнесены т. н. односторонние диагностические вопросы или те вопросы, для которых только один тип ответа является диагностически значимым. Подобные вопросы характеризуются слабой дискриминативностью и незначительно выраженной вариабельностью.

Необходимо учитывать П. п. при конструировании (адаптации) личностных опросников.

Примеры похожих учебных работ

18.Характеристика малоформализованных методов: наблюдение, беседа, интервью, анализ …

… по методу обозначающему: числовой метод графический метод шкала прилагательных графический метод дополняет числовой метод: чертят … Определена жестко заданная тактика проведения интервью, вопросы задаются в строго определенной последовательности. …

12.Понятие валидности, надежности, достоверности в психодиагностике

… тест признавался валидным. Таким образом, эмпирические методы обоснования валидности … значения. Это значение колеблется в определённых границах. Колебание данного значения … последовательность теста внутри себя, меру адекватности подбора вопросов. …

Критерии валидности, применяемые к качественным исследованиям.

… вопрос о валидности до последнего времени представляется одним из самых сложных. Наиболее укоренившимся определением этого понятия является то, которое приведено в книге А. Анастази: «Валидность теста … пор придают меньшее значение гуманитарному знанию …

Психодиагностические методы в психологии

… вариант дифференциации методов: Организационные методы (в эту группу входят метод наблюдения и метод эксперимента) Вспомогательные методы (сюда относят метод экспертных оценок, различные методы опроса, метод самонаблюдения, метод тестов, анализ …

Угрожающие факторы

Валидность в психологии – это свойство качественной методики, но могут возникнуть факторы, искажающие теоретически правильно построенную ПДМ. Побочные факторы сильнее проявляются в работе с плохо организованными стимулами или новыми, неясными ранее для испытуемого задачами.

Трудность составляет изучение неуравновешенных и неуверенных в себе индивидов. Главными угрозами высокой валидности являются особые характеристики тестируемого и ситуационные явления.

Достоверность результатов снижают:

  • ошибки испытуемого;
  • ошибки специалиста;
  • ошибки, вызванные условиями или неправильного проведения диагностики.

Если диагностика не предполагает обязательного нахождения специалиста в помещении, то его присутствие может исказить результаты исследования. Комментарии и интерпретация тестовых задания тоже снижают достоверность полученных данных.

Испытуемый, заинтересованный в намеренных погрешностях тестирования или представлении себя в выгодном свете перед руководством, искажает результаты диагностики. Не меньшую опасность представляет психофизиологическое состояние тестируемого. Например, индивид сильно голоден, утомлен или страдает от мигрени.

Посторонний шум, голос, возможность обсуждать тестовые задания с другими испытуемыми, снижают точность результатов. Это относится к ошибкам условий и процедуры диагностики.

[Править]Теоретическое основание Кронбаха

Альфа Кронбаха может быть рассмотрено как расширение Кьюдера-Ричардсона-20 , которая является эквивалентом для работы с дихотомиями или переменными, принимающих только два значения (например, ответы истинно/ложно).

Α Кронбаха теоретически связана с формулой прогнозирования Спирмана-Брауна. И обе эти формулы вытекают из классической теорией теста, заключающийся в том, что достоверность результатов тестирования может быть выражена как отношение дисперсий истинной и общей оценок (ошибки и истинной оценки).

Специфика и задачи психологического эксперимента

Эксперимент направлен на доказательство или опровержение гипотезы, всегда проводится в особых экспериментальных условиях, искусственно созданных исследователем. Специфика психологического эксперимента заключается в некоторой его субъективности. Психология сталкивается с проблемами субъективности в теории и на практике.

Все знания, полученные в ходе психологических исследований, в той или иной мере субъективны, искажены сознанием испытуемого и экспериментатора. Поэтому получить полностью достоверные знания – это крайне сложная задача. Эксперимент должен соответствовать цели, задачам, исключать внешние воздействия и искажения результатов исследователем.

Задача психологического эксперимента – сделать доступными для наблюдения исследуемые психологические явления, свойства, состояния испытуемого. Для этого используется построение условий, в которых окажется тестируемый. Эти условия должны раскрывать исследуемое психическое свойство и исключать проявление других.

Психологический эксперимент отличается зависимостью от условий и уровня развития исследуемых явлений, требует строгого контроля, постоянства процесса, изоляции ненужных аспектов психики от изучаемых.

Высокая валидность применяемой методики позволяет снизить погрешность полученных результатов. Это важный фактор в психологических исследованиях, поскольку недостоверные результаты не несут никакой практической пользы.

Валидность — это … Что такое валидность: типы и способы установления

Добавлено в закладки: 0

Что такое валидность? Описание и определение понятия.

Валидность – это

1) мера соответствия, которая показывает насколько соответствуют поставленным задачам полученные результаты и разработанная методика исследования;

2) фундаментальное понятие в экспериментальной психологии и психодиагностике. Различают такие типы валидности: валидность по содержанию, конструктивная валидность, прогностическая валидность, валидность по критерию. Безупречную валидность имеет только теоретический безупречный эксперимент: эксперимент,  при котором получаемый эффект вызывает независимую переменную, соответствует полностью реальности, а его итоги поддаются без дополнительных ограничений обобщению.

Вали́дность (англ. validity, от лат. validus — «сильный, здоровый, достойный») — пригодность и обоснованность использования результатов и методик исследования в конкретных условиях. Более прикладное определение понятия “валидность” – мера соответствия результатов и методик исследования поставленным задачам. Валидность является фундаментальным понятием психодиагностики, организационной психологии, экспериментальной психологии.

Как в статистике, так и в психологии, валидное измерение — такое измерение, которое измеряет то, что оно обязано измерять (эта узкая трактовка “валидности” – наиболее популярная, она по факту соответствует понятию “конструктная валидность”). То есть, например, при валидном измерении интеллекта измеряют именно интеллект, а не что-то другое. Безупречный эксперимент (возможный только в теории) будет иметь безупречную валидность: он точно будет показывать, что экспериментальный эффект вызван изменением независимой переменной, он будет соответствовать полностью реальности, его итоги можно без ограничений обобщить.

Когда говорят о степени валидности, рассматривают то, насколько итоги исследования соответствуют поставленным задачам (но при этом валидность не измеряется в каких-нибудь условных единицах).

Важная особенность валидности – её невозможно единожды установить и использовать это доказательство в качестве финального аргумента “за” качество определенной методики или эксперимента. Валидность нужно постоянно обосновывать новыми данными, в независимых исследованиях перепроверять.

Способы установления валидности методики

Зачастую понятие “валидность” обсуждают в контексте конкретных экспериментов или методик. Может быть при этом поставлен вопрос и о валидности в целом определенного метода (к примеру, ассессмент центра или метода тестирования). Подобные исследования проводят при помощи мета-анализа.

Существуют три главных метода установления валидности методики.

I. Оценка содержательной валидности

Содержательная валидность – степень соответствия содержания заданий методики реальной деятельности, в которой проявляют свойство, измеряемое в методике. Частным случаем содержательной валидности является так называемая очевидная (фейс или лицевая) валидность – степень соответствия методики ожиданиям оцениваемых. Для большей части методик считают важным, чтобы для участника оценки очевидна связь меж содержанием процедуры оценки и реальной деятельностью, которая является объектом оценки (семейная, профессиональная, учебная и так далее.).

II. Оценка конструктной валидности

Конструктная валидность – степень обоснованности того, что методика измеряет действительно заданные и при этом обоснованные научно конструкты. Есть, как минимум, две стратегии установления конструктной валидности.

Подход первый — «конвергентная валидизация» — проверка ожидаемой связи итогов конкретной методики с показателями прочих методик, которые измеряют сходные характеристики. К примеру, если для измерения какой-нибудь черты есть несколько методик, было бы целесообразным провести эксперименты по хотя бы двум, и тогда при выявлении высокой позитивной корреляции их итогов меж собой можно говорить о валидности. Главная цель конвергентной валидизации — определение того, будут ли оценки теста варьироваться соответственно с ожиданиями.

Подход второй — «дивергентная валидизация». Проверка валидности тут заключается в том, что тест не может измерять никакой черты, с которой он и не должен быть связан теоретически.

III. Оценка критериальной валидности

Критериальная валидность – степень соответствия внешних критериев, определенных заранее, и результатов методики, определенная статистическими методами. Подобными критериями могут быть:

  • непосредственные меры исследуемого качества (такие как выраженность определенного свойства личности, степень развития способности, уровень достижения в какой-нибудь деятельности и так далее), независимые от результатов методики,
  • показатели оргазизационно или социально-значимых результатов деятельности (ключевые показатели эффективности (KPI или КПЭ), устойчивость семейных отношений, успеваемость и так далее)

Одним из типов критериальной валидности является так называемая “прогностическая” валидность. Этот тип валидности применяется, когда методика призывается давать определенный прогноз поведения человека. Соответственно, когда прогноз с течением времени оправдывается, это говорит о том, что методика является валидной прогностически.

Профессиональные разработчики методик должны обосновывать все перечисленные типы валидности и проводить постоянный сбор свидетельств в пользу валидности их инструментов.

Типы валидности

В разных источниках упоминают различные названия, что может создать определенную путаницу. В экспериментальной психологии ключевые понятия:

  • Внешняя валидность
    • Конструктная валидность
    • Операциональная валидность
  • Дифференциальная валидность
  • Внутренняя валидность
  • Экологическая валидность
  • Инкрементная валидность

Для организационной психологии и психодиагностики более традиционной является классификация из трех главных типов валидности:

  • Конструктная валидность
    • Дивергентная валидность
    • Конвергентная валидность
  • Эмпирическая валидность (Критериальная валидность)
      • Прогностическая валидность
    • Ретроспективная валидность
    • Текущая валидность
  • Содержательная валидность
    • Очевидная валидность

Мы коротко рассмотрели валидность: типы и способы установления. Оставляйте свои комментарии или дополнения к материалу.

Валидность в психологии. Что это, определение простыми словами, виды, пример

Валидностью в психологии называется соответствием используемой методики тому психическому явлению, которое изучается. Иными словами, это характеристика эффективности методики. Любой психологический тест должен сначала пройти экспертизу валидности и надежности.

Что такое валидность в психологии

Валидность – важная характеристика психологических тестов и методик. Она должна проверяться экспериментаторами наравне с надежностью методики. Критерий валидности чаще всего используется в психодиагностике. В нем раскрывается проблема соответствия полученных в ходе исследования данных «идеальным». То есть тем, которые не искажены какими-либо внутренними или внешними факторами.

В психологии ярко выражена проблема субъективности. Какими бы точными, по мнению экспериментатора, не были полученные данные – они искажены. Для проверки уровня достоверности полученного знания используется критерий валидности. Валидность не используется в точных науках: физике, химии, математике.

Это уникальный критерий психологии, позволяющий сгладить трудности получения объективных знаний. Первой причиной появления этого инструмента служит проблема точного определения изучаемой характеристики или свойства. Так, исследуя тревожность, невозможно однозначно установить диагностируемое явление. Тревожность – это и страх, и беспокойство, и волнение.

Второй причиной является субъективность исследуемого параметра психодиагностической методикой. Разработчик вкладывает в формулировки собственное значение и смысл, но это не значит, что испытуемый думает по такому же шаблону. Интерпретации одних и тех же вопросов или утверждений могут сильно отличаться.

В точных науках нет проблемы определения исследуемого объекта. Трудность составляют способы изучения. Например, ученый-физик, исследующий параметры железного шара, точно видит и осязает его. Он поставил себе цель: изучить радиус шара. Параметр объективен и находится с помощью измерения и формул.

Что такое валидность методики

Методика, в отличие от метода – это набор определенных действий специалиста, направленных на соответствующий результат. Метод исследования может включать в себя несколько методик. Например, метод анкетирования по классификации Б. Г. Ананьева может осуществляться с помощью разных тест-опросников.

Валидность в психологии — это соответствие целостности психодиагностической методики и отдельных её частей исследуемой психической характеристике.

ПДМ может включать несколько шкал. Например, тест-опросник, определяющий уровень невротизации-психопатизации, состоит из следующих шкал: психопатизация, невротизация и шкала «лжи». Третья измерительная шкала используется для проверки искренности испытуемого. Самая распространенная причина лжи – мотивация одобрения. Этот фактор сильно искажает статистические и индивидуальные данные.

Валидная ПДМ – это методика, диагностирующая только заданный экспериментатором узкий спектр характеристик. Она пользуется большим доверием специалистов и применяется в научных исследованиях. Чем выше коэффициент валидности, тем достовернее полученные в ходе эксперимента данные.

Что такое валидность теста

Психологический тест – разновидность психодиагностических методик. Тест пользуется наибольшей популярностью среди экспериментаторов из-за простоты применения. В комплектацию исследователя входит стимульный материал, бланки ответов и инструкции.

Тест-опросники могут исследовать такие психические характеристики испытуемого, как стрессоустойчивость, интеллект, мотивация и толерантность. Вопросы формулируются с учетом специфики целевых выборок и цели исследования.

Они могут быть закрытыми – испытуемому предлагается выбрать одно из утверждений; открытыми – испытуемый должен сам ответить на вопрос или прокомментировать утверждение; косвенными – являющимися общеизвестными фактами или мнением; прямыми – которые непосредственно оппонируют мнению индивида.

Валидность теста обеспечивает достоверность полученных с его помощью данных о психических явлениях. Без экспериментально доказанной высокой валидности тест нельзя считать эффективным. Если выполнение отдельного задания или самого теста фиксирует измеряемое психическое явление, то валидность принимает высокие значение.

Это значит, что тест валиден и надежен, так как исключены воздействия на испытуемого. Валидность теста можно подтвердить, не обладая глубочайшими познаниями в психологии.

Например, студенты 1 курса могут проверить тест с помощью испытуемых. Экспертам предлагается оценить понятность формулировок вопросов или утверждений, исходя из личного жизненного опыта. На основе полученных данных можно говорить о валидности опросника.

Психометрические свойства методик психодиагностики

Психометрической основой любой методики являются шкалы. Понятие «шкала» трактуется в широком и узком значении: в первом случае шкала – это конкретная методика, во втором случае – это измерительная шкала, фиксирующая исследуемые признаки. Каждому элементу методики соответствует определенный балл или индекс, который формирует выраженность того или иного психического явления.

Измерительные шкалы разделяют на:

  • Метрические: интервальные, шкалы отношений.
  • Неметрические: номинативные, порядковые.
Название шкалыПояснение, примеры
Номинативная (шкала наименований)На основе общего свойства или символа относит наблюдаемое явление к соответствующему классу.

Шкала наименований самая распространенная в исследовательских психодиагностических методиках.

Эта шкала используется, например, в тест-опросниках. Отрицание или утверждение испытуемого сравнивается с ответами в ключе. Также номинативная шкала может предполагать выбор одного или нескольких признаков из предложенных.

ПорядковаяРазделяет сумму признаков на элементы, исходя из принципа «больше – меньше». Таким образом, она расставляет результаты в порядке возрастания или убывания.

Порядковая шкала используется в тесте цветового выбора. Испытуемому предлагается выбрать один из квадратов на белом фоне, после чего выбранная фигура откладывается в сторону, и процедура повторяется. Результат: расставленные по степени привлекательности для испытуемого цвета. Каждой фигуре присваивается свой порядковый номер.

ИнтервальнаяЭлементы упорядочены не только по принципу выраженности измеряемого признака, но и на основе распределения признаков по размеру, что выражается интервалами между числами, приписываемыми степени выраженности измеряемого признака.

Интервальные шкалы часто используются при стандартизации первичных тестовых показателей.

ОтношенийУпорядочивает элементы по числовому значению, соблюдая между ними пропорциональность. Объекты разделены согласно измеряемому свойству. Числа, которые приравниваются к классам объектов, пропорциональны степени выраженности исследуемых свойств.

Используется, например, при определении порогов чувствительности анализаторов. Часто применяется в психофизике.

После определения используемой шкалы для формирования теста, нужно определить коэффициент психометрических свойств методики.

К ним относятся:

  • Репрезентативность.
  • Стандартность.
  • Надежность.
  • Валидность.

Репрезентативность – это свойство, которое распространяется на выборку испытуемых. Оно может характеризовать как популяцию, так и генеральную совокупность. Репрезентативность имеет два параметра: качественный и количественный. Качественный параметр характеризует выбор испытуемых и способы построения выборки.

Количественный параметр – это объем выборки, выраженный в числах.

В психологических исследованиях это свойство определяет, насколько возможно обобщение результатов. Например, изучаются отношения мужчин и женщин. Если взять испытуемых разного возраста (школьников, студентов, взрослых, пенсионеров), то репрезентативность такой выборки будет низкой.

Однако, если испытуемые будут примерно одного возраста и сферы деятельности (только школьники, студенты, взрослые, пенсионеры обоих полов), то репрезентативность будет высокой. В психодиагностике репрезентативность используется для того, чтобы обозначить возможность применения методики на всю генеральную совокупность.

Стандартность – это упрощение методики, приведение частей ПДМ и процедуры применения к единым нормам. ПДМ должны быть универсальны и применимы разными специалистами в различных ситуациях. При отклонении структуры ПДМ от стандартов, её результаты будет невозможно сравнить с результатами других исследований. Нестандартизованные методики используются в основном для научных исследований.

С их помощью изучаются новые психические явления. Но такой методикой нельзя пользоваться в психодиагностических целях. Ещё один важный параметр ПДМ – надежность. Она характеризует точность, устойчивость и стабильность результатов, полученных с помощью конкретной методики.

Высокая надежность методики исключает действие посторонних факторов и существенно приближает эксперимент к «чистому». Критерий надежности и валидности – это разные понятия. Причем надежность трактуется шире, чем валидность: надежность > валидность.

Например, в выходной день человек получает возможность провести время либо на рыбалке, либо на охоте. Если он решает идти на охоту, но берёт с собой удочку, то его выбор не будет валиден. Однако, если человек пошел на охоту с ружьем, и оно дало осечку, значит, выбранный метод ненадежен.

Какие значения может принимать валидность, примеры

Валидность может принимать значение от -1 до 1. Высокий коэффициент валидности позволяет сделать вывод, что полученные результаты достоверны. Если же валидность равна 0, то данные содержат ошибки. Коэффициент, равный -1, означает недостоверность результатов. Чаще всего оценка будет противоположной, отрицательной.

Виды валидности

Существует много видов валидности.

Валидность в психологии делится на несколько видов.

Перечень:

  • Внутренняя валидность. Характеризует соответствие полученных результатов стимульному материалу психодиагностической методики. Она определяет, действительно ли реакции испытуемых обусловлены только заданиями и фиксируют изучаемые психические свойства.
  • Внешняя валидность. Высокая внешняя валидность определяет репрезентативность выборки. То есть соответствие методики выбранным категориям населения и условиям, в которых применяется.
  • Концептуальная валидность. Валидность в психологии – это логичность построенной экспериментатором теории. Определяется на этапе разработки концепции изучаемого психического свойства. В проверке концептуальной валидности участвует группа экспертов-психологов, которые контролируют создание концепции и методики.
  • Очевидная валидность. Высокая очевидная валидность означает применимость тестовых заданий целевой выборке. Так, если экспериментатор хочет исследовать определенные качества школьников, то и задания в методике должны быть сформулированы в расчете на уровень знаний среднестистического школьника. Помимо этого, очевидная валидность фиксирует понятность формулировок, исходя из социально-демографических характеристик, представлений и жизненного опыта испытуемых. Утверждения в опросниках бывают неоднозначны. Например, утверждение «я завожусь с пол-оборота» можно интерпретировать по-разному. Есть утверждения и вопросы, которые не соответствуют жизненному опыту испытуемых. Вопрос о какой-либо ситуации во время вождения автомобиля будет неизвестен людям, которые не умеют водить.
  • Конструктная валидность. Характеризует соответствие используемых формулировок методики фиксируемым явлениям. Высокая конструктная валидность означает, что выбранные для методики понятия (например, вопросы или утверждения в тесте) фиксируют те свойства, которые хочет исследовать экспериментатор.
  • Прогностическая валидность. Обозначает достоверность прогноза, сделанного на основе результатов исследования с помощью ПДМ. Этот вид валидности важен для профотбора и постановки диагноза в психиатрических клиниках. Высокая прогностическая валидность позволяет эксперту быть уверенным в назначенном курсе лечения или выборе кандидата на должность. Измеряет задатки и предпосылки испытуемого к тем или иным качествам, свойствам. Например, если сформулировать прогностическую валидность в виде вопроса, то он может прозвучать так: «Сможет ли Иванов стать квалифицированным эндокринологом?».
  • Текущая валидность. Фиксирует текущее положение дел. Определяет те свойства и качества, которые есть у испытуемого на данный момент. Если сформулировать текущую валидность в виде вопроса, как в примере выше, то он будет звучать так: «Иванов – квалифицированный эндокринолог?» Часто в тестах используется прогностическая валидность. Текущая используется как замена.
  • Конвергентная валидность. Определяет силу связи между частями одной ПДМ или методиками, фиксируемыми одно и то же свойства. Если конвергентная валидность двух методик высока, то, вероятно, они диагностируют общее качество. Сильная связь должна устанавливаться между утверждениями или вопросами в психодиагностической методике, которые относятся к одной шкале и фиксируют одну характеристику.
  • Содержательная валидность. Валидность в психологии – это соответствие тестовых заданий диагностируемому психическому качеству. Тест не должен содержать пункты, относящиеся к диагностике других свойств. Однако, он может включать в себя шкалы «лжи» для высокой достоверности результатов.
  • Дискрименантная валидность. Высокая дискрименантная валидность выявляет отсутствие связи между заданиями одной психодиагностической методики или разными ПДМ. Используется для проверки вопросов и утверждений, методик, которые должны изучать не связанные психические свойства.

Угрожающие факторы

Валидность в психологии – это свойство качественной методики, но могут возникнуть факторы, искажающие теоретически правильно построенную ПДМ. Побочные факторы сильнее проявляются в работе с плохо организованными стимулами или новыми, неясными ранее для испытуемого задачами.

Трудность составляет изучение неуравновешенных и неуверенных в себе индивидов. Главными угрозами высокой валидности являются особые характеристики тестируемого и ситуационные явления.

Достоверность результатов снижают:

  • ошибки испытуемого;
  • ошибки специалиста;
  • ошибки, вызванные условиями или неправильного проведения диагностики.

Если диагностика не предполагает обязательного нахождения специалиста в помещении, то его присутствие может исказить результаты исследования. Комментарии и интерпретация тестовых задания тоже снижают достоверность полученных данных.

Испытуемый, заинтересованный в намеренных погрешностях тестирования или представлении себя в выгодном свете перед руководством, искажает результаты диагностики. Не меньшую опасность представляет психофизиологическое состояние тестируемого. Например, индивид сильно голоден, утомлен или страдает от мигрени.

Посторонний шум, голос, возможность обсуждать тестовые задания с другими испытуемыми, снижают точность результатов. Это относится к ошибкам условий и процедуры диагностики.

Специфика и задачи психологического эксперимента

Эксперимент направлен на доказательство или опровержение гипотезы, всегда проводится в особых экспериментальных условиях, искусственно созданных исследователем. Специфика психологического эксперимента заключается в некоторой его субъективности. Психология сталкивается с проблемами субъективности в теории и на практике.

Все знания, полученные в ходе психологических исследований, в той или иной мере субъективны, искажены сознанием испытуемого и экспериментатора. Поэтому получить полностью достоверные знания – это крайне сложная задача. Эксперимент должен соответствовать цели, задачам, исключать внешние воздействия и искажения результатов исследователем.

Задача психологического эксперимента – сделать доступными для наблюдения исследуемые психологические явления, свойства, состояния испытуемого. Для этого используется построение условий, в которых окажется тестируемый. Эти условия должны раскрывать исследуемое психическое свойство и исключать проявление других.

Психологический эксперимент отличается зависимостью от условий и уровня развития исследуемых явлений, требует строгого контроля, постоянства процесса, изоляции ненужных аспектов психики от изучаемых.

Высокая валидность применяемой методики позволяет снизить погрешность полученных результатов. Это важный фактор в психологических исследованиях, поскольку недостоверные результаты не несут никакой практической пользы.

Видео о валидности в психологии

Психологические методики — валидность:

Понятие «валидность тестов»

Краткая характеристика валидности тестов

Валидность результата теста является соответствием измеряемому признаку.

Валидность теста не применяется в статистических процедурах. Их (процедуры) можно использовать для доказательства, что разрабатываемая процедура психологических измерений имеет достаточную валидность. Они оценивают эмпирическую валидность.

Взаимосвязь между эмпирической и содержательной валидностью схожа с взаимосвязью статистической и экспериментальной гипотезами. Так как первые описывают причинно-следственные связи между фактом и явлением в эксперименте, а вторые – вероятную оценку результата, которая является базой для решения реальности. То содержательная валидность устанавливает связь между результатом теста и реальностью, а статистическая – содержит оценку валидизации эксперимента, которая считается инструментом для принятия решения.

Отсюда следует, что содержательная сторона валидизации отличается от понятия надежность, а эмпирическая сторона совпадает. Но сама по себе валидизация тестирования предполагает надежность психодиагностических методов. Высокая степень надежности не гарантия такой же валидизации. Но при этом снижение надежности тестирование ведет к снижению валидизации.

Характерные особенности эмпирической валидности

Она устанавливается внешним критерием, определяющий предметную область. Например, интеллектуальная шкала Д. Векслера WAIS, или тест Векслера включает в себя шесть заданий на вербальный интеллект, 5 – на невербальный, сенсомоторный интеллект. Задания называются субтестами, на базе результатов которых анализируют показатели интеллекта. Для оценивания шкалы вербального интеллекта используют уровень академической успеваемости, для невербальной – успешность канцелярской работы. Валидизация оценивается, с точки зрения соотношения между результатами тестирования и успеха в определенных видах деятельности. Такая валидность называется прагматической.

Определение прагматической валидизации

Считает, что валидность теста дает прогноз:

  • личностных свойств человека;
  • влияния на поведение индивида.

Она может не предполагать организацию соотношения. Оценивание валидизации тестирования основывается на:

  • принципах квазиэксперимент;
  • выделение контрастных групп.

Нужна помощь преподавателя?

Опиши задание — и наши эксперты тебе помогут!

Описать задание Замечание 1

Разработка теста по оцениванию мотивации достижения школьников. Для этого есть все необходимые документы по успеваемости учеников. Класс делят на две группы:

  • с низким уровнем успеваемости;
  • с высоким уровнем успеваемости.

Самый грубый метод разделения – деление по медиане, надежный – исследования каждого ребенка и правильное соотнесение в ту или иную группу.

Например, для валидизации теста применяют только результаты успеваемости учеников, входящие в первый и четвертый квартили. В конечном итоге появляется квазиэкспериментальный план. Тогда значениями ковариаты будут результаты теста.

Данный ход в вылидной прагматике определяют ретроспективным.

Понятие проспективной, конструктивной и истинной валидности теста

Первый метод используют, когда только предполагается получить критерий валидности. Здесь испытуемые выбираются по принципу вероятностного прогноза проявления измеряемого признака в популяции. Это дает больше возможности оценить причинно-следственные связи между измеряемыми свойствами и формами поведения человека.

Замечание 2

Конструктивная валидность используется, когда нет сомнений в валидизации тестирования.

Один из способов получения валидности является применение экспертных оценок. Их получает во время наблюдения за тестированием. Полученные результаты вносятся в таблицу, где в столбцах указывают оценки экспертов (k ), а в строках – оценки испытуемых (п). Главный фактор – согласованность полученных оценок, которую определяют при помощи критерия Кронбаха (α) или формулы Спирменаа-Брауна.

Истинная валидность тестирования определяется формулой:

где ryy – соотношение с «истинным критерием», rхх – эмпирическое соотношение с критерием, αс – надежность критерия, найденная по формуле Кронбаха.

Автор: Анна Коврова

Преподаватель факультета психологии кафедры общей психологии. Кандидат психологических наук

Валидность, Содержательная — это, определение слова, понятие. Что такое Валидность, Содержательная, значение, словарь, энциклопедия

Оценка валидности инструмента тестирования, основанная на детальном исследовании содержания пунктов теста. Под содержанием здесь понимается фактический материал, входящий в пункты тестов; оценка их осуществляется посредством просмотра каждого пункта с тем, чтобы определить, соответствует ли он тесту в целом, и посредством оценки общей согласованности нескольких пунктов. Например, чтобы тест математических способностей имел достаточный уровень содержательной валидности, его пункты не должны иметь таких формулировок, при которых для человека, выполняющего тест, решающими оказываются вербальные способности, необходимые для того, чтобы понять, о чем спрашивается в этом пункте. Далее, содержание должно быть уравновешено таким образом, чтобы все тестируемые аспекты были представлены соответственно; тест не должен быть перегружен, скажем, пунктами на умножение в ущерб пунктам на сложение. Установление содержательной валидности – в значительной степени субъективная операция, основанная на мнениях «экспертов» относительно уместности используемых материалов. А также оно является ситуационно-специфическим, и оценки, сделанные в одних обстоятельствах, нельзя переносить на другие. Например, тест арифметических навыков, разработанный и содержательно валидизированный для традиционной школы, может иметь очень низкую содержательную валидность, когда он применяется в школе, использующей так называемую «новую математику».

Большой словарь эзотерических терминов — редакция д.м.н. Степанов А.М

(от англ. valid – пригодный), один из основных критериев качества опыта (например, в психологии для оценки доверия к тестам). Проблема валидности возникает в процессе разработки и практического применения теста, когда ставится задача установить соответствие между степенью…

Психологическая энциклопедия

См. валидность, черты.

Психологическая энциклопедия

— степень, в которой результаты исследования, системы измерений или статистики являются точными или представляют то, что были предназначены представлять.

Психологическая энциклопедия

(англ. valid — пригодный) — качество метода психологического исследования, выражающееся в его соответствии тому, для изучения и оценки чего он изначально был предназначен.

Психологическая энциклопедия

(Validity). Понятие, обозначающее, что тест измеряет то, для чего он предназначен.

Психологическая энциклопедия

Степень нашей уверенности в том, что тест, измерение или эксперимент действительно выполняет ту функцию, для которой они предназначены. Этот весьма общий термин по-разному используется в психологии. В процессе эксперимента мы можем оценить: 1. Внутреннюю валидность:…

Психологическая энциклопедия

Неформальная процедура, используемая для определения валидности теста посредством просмотра каждого пункта и оценки степени, в которой он выполняет предназначенную ему роль в тесте.

Психологическая энциклопедия

Своего рода предварительная, интуитивная оценка содержательной валидности теста. Степень, в которой пункты теста, как кажется, имеют интуитивную, априорную связь с моделями поведения, которые, как считается, они тестируют. Также называется валидное-тью здравого смысла.

Психологическая энциклопедия

Степень, в которой любой определенный инструмент тестирования обладает валидностью, будет отражать, в какой мере значения, полученные по этому тесту (а) коррелируют с факторами, с которыми в принципе они должны коррелировать на высоком уровне значимости, и (б) коррелируют с…

Психологическая энциклопедия

Метод установления валидности нового теста посредством корреляции значений, полученных по нему, со значениями, полученными по другому тесту с установленной валидностью. Наиболее типичный случай — тесты интеллекта, когда вновь разработанные тесты сравниваются с известными тестами…


Поделиться:

Валидность психологических тестов. Виды валидности.

К основным психометрическим характеристикам тестов относятся, в первую очередь, валидность и надежность.

Валидность – это свойство теста измерять именно то, для чего он предназначен.

Например, мы можем определить что «знание математики» соответствует высоким баллам, полученным по математическим тестам. Но если все задания состоят из простых арифметических задач, то тест будет определять, насколько человек быстро считает. Таким образом, важно понимание того насколько рабочее определение измеряемой величины соответствует концептуальному определению. Достичь абсолютной валидности нельзя. Можно лишь пытаться максимально улучшить валидность в каждом конкретном случае, исходя из критериев, значимых для этого случая.

Существуют разные типы и виды валидности:

Практическая валидность характеризует тест не столько со стороны его психологического содержания, сколько с точки зрения его ценности в отношении достижения определенной практической цели (прогнозирования, диагностики). Выделяют подтипы практической валидности: прогностическая и совпадающая. Тест с высокой прогностической валидностью позволяет сделать прогноз, насколько успешно испытуемый будет выполнять определенную деятельность впоследствии. Тест с высокой совпадающей валидностью позволяет ответить на вопрос: «Какова вероятность того, что индивид Х обладает свойством У в настоящий момент времени?»  Валидность по объему отражает степень, в какой объем теста выборочно репрезентирует тот класс ситуаций или учебного материала, относительно которого должны быть сделаны выводы и показывает, в каком объеме, в какой мере знание чего-либо отражено в методике.  Оценочная валидность выражает степень корреляции (соответствия) между показателями, полученными испытуемыми по данному методу, и оценками измерительного свойства со стороны экспертов. Например, при валидизации (проверке теста на валидность) тестов оценки знаний школьников в качестве экспертов обычно выступают учителя.  Внешняя валидность означает, что впечатление, которое создается при знакомстве с сугубо внешней стороной тестирования, соответствует заявленному содержанию метода. Это наименее важный аспект валидности, так как требует дополнительной проверки валидности другими методами. В некоторых случаях исследователи специально ухудшают внешнюю валидность, например, для измерения социально нежелательных характеристик (таких как расизм). Внутренняя валидность – это необходимое условие возможности интерпретации результатов теста, она спрашивает: «Не изменились ли условия эксперимента в данном случае?» Факторы ухудшающие внутреннюю валидность: 1. История: некое событие произошло между первым и вторым измерением в дополнение к экспериментальным переменным. 2.  Развитие: процесс внутри испытуемых, как функция от времени (не специфический к частным событиям), например, взросление, усиление чувства голода, усталость и т.д. 3. Тестирование: эффект первого тестирования влияет на баллы второго. 4.  Инструменты: изменение в наблюдателях или способах получения баллов могут влиять на наблюдаемые величины.5.  Статистическая регрессия: в случае, если работа идет с группами, отобранными на основе экстремальных значений балов.6.  Выбор: смещение, возникающее в результате дифференцированного выбора респондентов в пары для сравнения.7.   Выбывание: дифференциальная потеря респондентов из сравниваемых групп.Валидность генерализации (репрезентативность), задает вопрос о том, на кого мы можем распространить результаты эксперимента. Факторы ухудшающие репрезентативную валидность: 1. Реагирующий или взаимодействующий эффект тестирования: значения первого теста могут возрасти.2.  Эффект взаимодействия смещения выбора и экспериментальных переменных.3.  Эффект экспериментальной подготовки, который будет препятствовать распространению результата на людей, которые тестируются в не-экспериментальном окружении.4. Эффект многократной обработки, когда эффект предыдущих тестов не стирается. Валидность критерия состоит из двух частей:Совместная валидность: «Есть ли какая-либо связь между мерой и другими проявлениями свойства, которого этот тест должен измерить?».Предиктивная валидность: «Предсказывает ли тест уровень развития данной конкретной способности?»

 Относительная валидность: важно знать насколько результаты данного теста соответствуют результатам аналогичных тестов, которые измеряют то же или близкое свойство. Дискриминантная валидность: важно показать, что мера не измерят то, что не предполагалось измерять, то есть дискриминантна. Например, можно говорить о дискриминантной валидности, если есть низкая корреляция между результатами теста на скорость чтения и теста на определяющие факторы мотивации, так как способность к чтению не имеет отношения к мотивации.

 Источники плохой валидности:1. Плохая надежность теста2. Ответы на вопросы = психологическая ориентация или предубеждения против данного ответа:2.1. Уступчивость: тенденция соглашаться, то есть говорить «Да». Следует составлять вопросы.2.2.Социальная желательность: тенденция показывать себя в лучшем свете. Следует составлять тесты, где социальная желательность не очень заметна.2.3. Ухудшение: намеренно говорить «Нет», если это принесет какую-нибудь «награду» (например, внимание, компенсацию, социальную помощь и т.д.).3. Смещение:1.1 Культурное смещение: имеет ли данное свойство одинаковое значение в разных культурах? Как различные вопросы интерпретируются людьми разных культур? Содержание теста (внешняя валидность) может быть разной для людей разных культур.1.2 Смещение по половому признаку также может быть возможным.1.3 Тестовое смещение:1.3.1  Смещение в измерениях возникает, если тест делает систематическую ошибку в измерении данного свойства. Например, считается, что многие тесты IQ хороши для основной средней массы населения, но не для представителей национальных меньшинств, ведущих отличный образ жизни. Если тест проводится методом интервью, то возникает смещение в направлении хорошо выглядящих экзаменуемых.1.3.2Смещение в предпосылках возникает, когда тест делает систематическую ошибку в предсказании некоторого значения или критерия. Также тест может быть хорош только для некоторых групп людей. Например, тест, составленный мужчинами, может не очень хорошо оценивать значение данной характеристики у женщин.

Поможем написать любую работу на аналогичную тему

Получить выполненную работу или консультацию специалиста по вашему учебному проекту

Узнать стоимость

Валидность в психологии: типы и определение — видео и расшифровка урока

Construct Validity

Вероятно, вы уже знакомы с определением конструкции. Конструкт — это атрибут, навык или способность, основанные на устоявшихся теориях и существующие в человеческом мозгу. Интеллект, тревога и депрессия — все это примеры конструктов. Валидность конструкции — это степень, в которой тест измеряет конструкцию, которую он должен измерять.Другими словами, насколько хорошо BAI измеряет теоретическую концепцию тревоги? Установление валидности конструкции включает в себя рассмотрение многочисленных исследований, в которых используется BAI. Есть два необходимых компонента конструктной валидности: конвергентная и дискриминантная валидность.

Предположим, что при чтении руководства вы обнаружили, что BAI сильно коррелирует с рейтинговой шкалой Гамильтона (HRS) и опросником состояния тревоги (STAI), которые являются двумя ранее подтвержденными показателями тревоги.Это устанавливает конвергентную действительность . Конвергентная валидность — это степень, в которой измерение согласуется с другими измерениями, оценивающими ту же конструкцию.

Вы также обнаружили, что BAI имеет низкую корреляцию с опросником депрессии Бека, который предназначен для измерения депрессии. Это устанавливает дискриминантную валидность . Дискриминантная валидность — это степень, в которой измерение , а не коррелирует с другими измерениями, которые оценивают различных понятий, так что оно различает две конструкции.

Содержание Валидность

Вы также прочитали в руководстве, что пункты BAI были выбраны на основе их сходства с критериями тревожных расстройств, приведенными в Диагностическом и статистическом руководстве по психическим расстройствам. Кроме того, предметы охватывают весь спектр тревожных симптомов, в том числе при панических и генерализованных тревожных расстройствах. Это устанавливает действительность содержания BAI. Измерение имеет содержательную достоверность , когда его элементы охватывают все аспекты измеряемой конструкции.Другими словами, содержательная валидность позволяет нам узнать, адекватно ли пункты BAI охватывают все области беспокойства.

Валидность, связанная с критерием относится к степени, в которой измерение может точно предсказать конкретные переменные критерия. Параллельная валидность и прогностическая валидность — это два типа валидности, связанной с критериями. Параллельная достоверность включает измерения, которые администрируются одновременно, в то время как прогностическая достоверность включает одно измерение, предсказывающее будущие характеристики другого.

Допустим, вы обнаружили значительную корреляцию между показателями BAI и показателями HRS и STAI. Вы установили параллельную валидность, то есть степень, в которой баллы по измерению соответствуют другим измерениям, которые уже были признаны действительными.

Если баллы по BAI значительно коррелируют с людьми, у которых в будущем будет диагностировано тревожное расстройство, BAI имеет прогностическую ценность. Прогностическая валидность — это степень, в которой баллы по оцениваемому измерению соответствуют другому критериальному измерению, полученному в будущем.В нашем примере диагноз тревожности (измерение критерия) ставится после введения BAI (оцениваемого теста).

Почему важна достоверность?

Предположим, через несколько недель после того, как вы применили BAI к своему клиенту, вы узнали, что BAI не измеряет тревогу, как предполагалось. Что это значит для вашего клиента? Это означает, что интерпретация результатов BAI, сделанная вами в связи с уровнем беспокойства вашего клиента, недействительна. В результате любые выводы, сделанные вами на основе теста, не будут точными.Например, если вы диагностировали у своего клиента тревожность на основании результатов BAI, ваш диагноз будет ошибочным, поскольку тест не измерял тревожность.

Лечебные вмешательства, которые вы применили, вероятно, будут неэффективными, поскольку у вашего клиента на самом деле нет беспокойства. Если вы решили помочь своему клиенту получить успокаивающие препараты, вы обнаружите, что лекарства не помогают и не ухудшают состояние вашего клиента. Здесь вы можете увидеть, почему валидность важна в психологии. Без достоверности результаты вашей оценки совершенно бесполезны, и ваши попытки помочь клиенту, используя информацию из оценки, могут в конечном итоге навредить вашему клиенту.

Итоги урока

Давайте повторим. Валидность относится к степени, в которой тест измеряет то, что он должен измерять. Существует три типа валидности. Конструктивная валидность , то есть степень, в которой тест измеряет конструкцию, которую он должен измерять. Двумя необходимыми компонентами конструктной валидности являются конвергентная и дискриминантная валидность . Валидность содержания относится к тому, представляют ли элементы измерения все аспекты измеряемой конструкции.

Валидность, связанная с критерием относится к степени, в которой измерение может точно предсказать конкретные переменные критерия. Параллельная валидность и прогностическая валидность — это два типа валидности, связанной с критерием. Чтобы тест был валидным, он должен иметь конструктивную валидность, содержательную валидность и валидность, связанную с критериями. Итак, в следующий раз, когда кто-то придет к вам в офис для оценки, не забудьте вытащить руководство по тестированию и поискать доказательства его достоверности.

Результаты обучения

Посмотрев этот урок и расширив свои знания о валидности в психологии, вы впоследствии сможете перейти к:

  • Описать валидность в отношении тестирования и психологии
  • Контрастная действительность конструкции и достоверность содержания
  • Определить, к какому критерию относится валидность
  • Понять важность достоверности

типов действия | Psych Yogi

Типы валидности




Существует много типов валидности, и знание их чрезвычайно полезно для получения максимально возможных оценок на экзамене OCR A2 по психологии.

Срок действия

Во-первых, что такое срок действия?

Валидность относится к степени, в которой результаты или выводы исследования действительно измеряют то, что, как они утверждают, измеряют.

Например: предположим, мы хотим измерить длину стола. Итак, берем рулетку и далее приступаем к измерению высоты ножек стола.

Что не так?

Ну длину стола мы не мерили. Вместо этого мы измерили высоту стола.Итак, наше измерение длины стола неверно. Однако если бы мы намеревались измерить высоту стола, то наше измерение было бы верным, потому что мы измерили высоту стола.

Внутренняя валидность

Внутренняя валидность — это мера измерения экспериментатором зависимой переменной.

Например: предположим, что экспериментатор хочет измерить время реакции человека и для этого использует человека с секундомером.

Вы видите проблему с этим измерением?

Проблема в том, что человек с секундомером тоже должен реагировать. Таким образом, мы ожидаем, что это измерение недействительно.

Лучшим способом измерения этой зависимой переменной было бы использование видеокамеры. Таким образом, экспериментатору не нужно полагаться на время реакции другого человека для измерения зависимой переменной. Таким образом, делая его более действительным.

Внешняя действительность

Внешняя действительность делится на два типа.Экологическая валидность и популяционная валидность.

Внешняя валидность относится к степени, в которой результаты исследования могут быть обобщены. Важно иметь высокие уровни внешней валидности, потому что это напрямую влияет на полезность результатов и выводов исследования.

Экологическая валидность

Экологическая валидность относится к степени, в которой результаты и выводы применимы к реальной жизни.

На экологическую достоверность в основном влияет задача, которую должны выполнить участники.Многие говорят, что именно методология, например, лабораторных экспериментов, влияет на экологическую достоверность, но это не обязательно так. Можно провести лабораторный эксперимент с высокой экологической достоверностью, потому что задача, которую должны выполнить участники, соответствует реальной жизни.

Давайте рассмотрим пример. Представьте, что вы экспериментатор и изучаете психологию взаимодействия в магазине с продавцами.

Вы решили использовать лабораторный эксперимент, потому что он дает вам лучший контроль над посторонними переменными.

Вы создали поддельный магазин, который точно такой же, как и в реальной жизни. Затем вы предлагаете участникам пойти в магазин и купить некоторые предметы, которые они обычно покупают. Это, хотя и лабораторный эксперимент, имеет высокую экологическую достоверность, потому что задача, которую должны выполнить участники, соответствует реальной жизни.

Валидность популяции


Валидность популяции относится к степени, в которой выборка может быть обобщена на аналогичные и более широкие популяции.

Этот тип валидности важен, потому что без него полезность исследования снижается.

Давайте рассмотрим пример.

Предположим, мы изучаем влияние прослушивания Моцарта на IQ (эффект Моцарта).

Итак, мы решаем, что будем использовать выборку людей с высоким IQ, и используем случайную выборку. Эта выборка будет иметь высокую валидность для людей с высоким IQ, но главным образом потому, что мы использовали случайную выборку. Однако эта выборка будет иметь низкую валидность для всех остальных, потому что выборка чрезвычайно ограничена.

Временная валидность

Временная валидность относится к степени достоверности результатов и выводов исследования, когда мы рассматриваем различия и изменения, возникающие со временем.

Исследования, которые являются достоверными во времени, будут либо недавними исследованиями, либо будут исследованиями, в которых рассматривается что-то, что не изменилось с момента завершения исследования, например, проведенное 50 лет назад исследование представлений людей о росте может иметь высокую временную достоверность, поскольку общество не изменил своего взгляда на высоту. Тем не менее, исследование телевизионной рекламы в семидесятых и восьмидесятых годах может быть неактуальным сегодня из-за того, что в настоящее время доступно множество телевизионных каналов по сравнению с несколькими каналами, которые были доступны в то время.(Взгляните на это исследование в качестве примера, который можно считать низким по временной валидности: Cowpe 1989)

Лицевая валидность

Лицевая валидность относится к степени, в которой исследование  появляется  для измерения того, что оно претендует на измерение.

Это тип валидности, на который следует ссылаться меньше всего, потому что это не очень хорошая точка оценки, лучше использовать внутреннюю валидность. Лицевая валидность может быть вам полезна, потому что вы можете легко использовать ее в качестве оценочного балла на экзамене по психологии OCR A2, если у вас ничего не получится и вы не сможете придумать другой оценочный балл.

Исследование с высокой внешней валидностью может выглядеть так, как будто оно измеряет то, что намеревается измерить исследователь, но это не обязательно означает, что исследование является измерением того, на что оно претендует.

Давайте рассмотрим пример.

Предположим, мы пытаемся измерить влияние просмотра фильма ужасов на уровень стресса участников.

Мы показываем нашим участникам фильм ужасов и измеряем их уровень кортизола до и после.

Кортизол вырабатывается в ответ на стресс, что означает, что на первый взгляд это исследование выглядит так, как будто оно измеряет влияние фильма ужасов на уровень стресса участников.Поэтому он имеет высокую лицевую валидность.

Однако мы не учитывали влияние того, что участники не ели во время просмотра фильма.

Мы понимаем, что отказ от еды снижает уровень глюкозы в крови наших участников, что также вызывает выработку кортизола. Это означает, что наше исследование, хотя имеет высокую внешнюю валидность, имеет низкую внутреннюю валидность.

Проверка достоверности

Проверка достоверности состоит из нескольких составных частей.

Под валидностью теста понимается степень значимости результатов исследования или теста.

Давайте рассмотрим пример.

Предположим, мы измеряем интеллект людей. Мы могли бы использовать тест IQ. Мы могли бы возразить, что тест IQ имеет высокий уровень валидности, потому что мы видим, что это хорошо зарекомендовавший себя тест.

Конструктивная валидность

Конструктивная валидность относится к степени, в которой исследование или тест измеряют концепцию, на которую они претендуют.

Существует два типа конструктной валидности: конвергентная валидность и дискриминантная валидность.

Давайте рассмотрим пример.

Предположим, мы изучаем «Модель убеждений о здоровье» Беккера (1978)

. Мы обнаруживаем, что существует несколько когнитивных эвристик, которые люди используют, когда рассматривают возможность принятия здорового образа жизни. Все они присутствуют в модели убеждений о здоровье. Таким образом, мы можем утверждать, что наше исследование имеет высокую конструктную валидность.

Конвергентная валидность

Конвергентная валидность относится к степени, в которой тестируемые конструкции соотносятся друг с другом.

Различающая валидность

Различающая валидность относится к степени, в которой протестированные конструкции, не имеющие взаимосвязи, действительно не имеют взаимосвязи друг с другом.

Валидность содержания

Валидность содержания хорошо вытекает из валидности конструкции, поскольку валидность содержания относится к степени, в которой исследование или тест измеряет все элементы конструкции.

Например, предположим, что мы рассматриваем влияние стресса на производительность труда.

Мы предлагаем нашим участникам ответить на вопросники, насколько, по их мнению, на них влияет стресс на рабочем месте и насколько он влияет на их производительность.

Мы можем возразить, что содержание этого теста недостаточно достоверно, потому что оно фактически не проверяло влияние стресса на производительность труда.

Обоснованность критерия

Обоснованность критерия относится к степени достоверности результатов и выводов по сравнению с другими показателями.

Валидность критерия делится на два типа валидности: прогностическая валидность и параллельная валидность.

Прогностическая валидность

Прогностическая валидность относится к степени, в которой результаты и выводы могут быть использованы для прогнозирования применения исследования в реальной жизни.

Давайте рассмотрим пример.

Предположим, мы изучаем влияние мыслей о том, что за вами наблюдают, на поведение.

Наше исследование является повторением нескольких или других исследований, которые были проведены ранее.

Мы даем нашим участникам задание для выполнения. Во время выполнения задания они столкнутся с несколькими признаками того, что за ними ведется наблюдение, например, «за вами наблюдают операторы видеонаблюдения».’

Это исследование может иметь прогностическую ценность для подобных ситуаций.

Обычно прогностическая валидность устанавливается на основе повторяющихся результатов с течением времени.

Параллельная валидность

Параллельная валидность относится к степени, в которой результаты и выводы согласуются с другими исследованиями и доказательствами.

Давайте рассмотрим пример.

Милграм (1963) изучал последствия послушания авторитету. Результаты Милгрэма совпали со многими повторениями исследования.Поэтому исследование Милгрэма имело высокую параллельную валидность.

Достоверность статистического заключения

Достоверность статистического заключения относится к той степени, в которой мы можем, чтобы результаты были статистически значимыми, то есть мы можем установить причину и следствие выше случайности.

Обычно в психологических исследованиях вероятность устанавливается на уровне 5% или >0,05 вероятности. Это означает, что если результаты превышают 5%, мы примем нашу альтернативную гипотезу и отклоним нашу нулевую гипотезу.Это предполагает причину и следствие между переменными. Если результаты ниже 5%, мы примем нашу нулевую гипотезу. Наличие результата ниже 5% вероятности означает, что мы не можем установить причину и следствие, потому что результаты произошли случайно.

Репрезентативная валидность 

Репрезентативная валидность, известная также как трансляционная валидность, относится к степени, в которой изучаемый конструкт или концепция могут быть перенесены в реальную жизнь.

Диагностическая валидность

Диагностическая валидность мало используется в спецификации психологии OCR A2.Чаще всего используется в клинических условиях. Диагностическая валидность относится к степени точности диагноза, поставленного относительно состояния.

Инструментальная валидность

Инструментальная валидность относится к степени, в которой инструменты, используемые для измерения зависимых переменных, верны для данного измерения.

Например, вернемся к нашему исследованию таблицы ранее. Допустим, сейчас мы правильно измеряем длину стола, но потом понимаем, что наша рулетка неточна.Поэтому наше исследование имело низкую инструментальную валидность.

Дополнительная литература

Десять лучших советов по пересмотру психологии от Psych Yogi для студентов A*

Резюме

Название статьи

Типы действия

Описание

90 чрезвычайно полезно для получения максимально возможных оценок в вашем OCR A2

Автор

Психо-йог

Что такое валидность и ее определение, история, типы?

Надежность_и_валидность по Careershodh

Надежность_и_валидность 2 по Careershodh

Значение валидности

Валидность относится к вопросу: « Измеряет ли тест »

Слово «действительный» происходит от латинского «validus», что означает «сильный».Валидность – это точность теста или эксперимента.

  • Концепция валидности, данная Келли ( 1927) и определяющая валидность как «тест действителен, если он измеряет то, что, по его утверждению, измеряет».
  • Логически обоснованность есть свойство аргумента, основанного на факте: «истинность посылок гарантирует истинность вывода».
  • Проверка достоверности относится к значению и полезности результатов проверки.
  • Валидность оценки – это степень, в которой она измеряет то, что она должна измерять.
  • Более конкретно, валидность относится к степени приемлемости определенного вывода или интерпретации, основанной на тесте.
  • Валидность теста означает, что измеряет тест и насколько хорошо он работает?
  • Экс – Сознание.
  • Актуальная концепция ?
  • Аспекты концепции ?

Определение валидности

«Валидность — это степень, в которой фактические данные и теория поддерживают интерпретацию результатов теста, связанную с использованием теста.

«Показатель валидности показывает степень, в которой тест измеряет то, что следует измерять по сравнению с принятым критерием» – Фримен

История валидности или развитие концепций валидности

1 ст стадия развития of Validity
  • Самое раннее использование тестов было для оценки того, чему человек научился. Сейчас конечно конец.
  • Пример. Экзамены в конце семестра.
  • Для теста достижения – сравнение его содержимого с
  • Домен контента, предназначенный для оценки.
  • Все еще актуально/ применимо.

2-й этап развития достоверности
  • Переход к предсказанию.
  • Как люди поведут себя в данной ситуации — сейчас и в будущем?
  • Здесь валидность теста означает коэффициент корреляции между результатами теста и прямыми и независимыми измерениями этого критерия
  • Полезно при отборе и трудоустройстве — образовании, работе, лечении и т. д.

3-й Текущая стадия развития валидности
  • – 2 основные тенденции
  • Усиление теоретической ориентации.
  • Тесная связь между психологической теорией и проверкой посредством эмпирической и экспериментальной проверки гипотез
  • Эти тенденции признали ценность конструкции.
  • Конструкция

    • Широкая категория
    • Получено из общего признака, присущего непосредственно наблюдаемому поведению.
    • Теоретические объекты, непосредственно не наблюдаемые

    Это приводит к введению конструктной валидности как фундаментальной и всеобъемлющей

    Коэффициент валидности
    • Это отношение между тестом и критерием обычно выражается как корреляция.
    • Этот коэффициент говорит о том, насколько тест действителен для утверждения критерия.
    • Коэффициенты достоверности в диапазоне от 0,30 до 0,40 обычно считаются высокими.
    • Коэффициент достоверности статистически значим или не значим не имеет значения.
    • Вопросы, вызывающие озабоченность при интерпретации коэффициентов достоверности.
      • Ищите изменения в причине отношений.
      • Логика проверки критерия предполагает, что причины взаимосвязи между тестом и критерием все еще будут существовать во время использования теста.
      • Что означает критерий? Исследования валидности, связанные с критериями, вообще ничего не значат, если критерий не является валидным и надежным.

    Типы достоверности по Careershodh

    Проверка достоверности

    Проверка достоверности — это показатель того, насколько много значения можно придать набору результатов проверки.

    Виды тестовой справедливости

    Есть три типа доказательств:

    (1)

    (1) Конструкция срок действия -Construct связанный

    (2) Критерий Срок действия Связанные с критериями

    (3) Валидность содержания – Связанные с содержанием

    Лицевая валидность (не чистый тип валидности)

    Лицевая валидность8 самая простая форма1

    Внешняя валидность — это просто видимость того, что мера имеет юридическую силу.

    Элементы, утверждения или вопросы должны быть разумно связаны с предполагаемой целью теста.

    Лицевая достоверность будет использоваться для тестов способностей и тестов достижений.

    Например, любой школьный/колледжский тест будет иметь эту юридическую силу.

    Например – Если шкала для измерения тревожности

    Пункты, утверждения или вопросы для проверки достоверности теста на тревожность будут –

    • «Мой желудок расстраивается, когда я думаю о сдаче анализов»
    • «Мое сердце начинает колотиться быстро, когда я думаю о результатах.”
    • Если они ответят «да» на оба вопроса, можем ли мы заключить, что человек встревожен?
    • Нет! – Валидность требует доказательств для обоснования выводов.
    • Лицевая валидность вовсе не является валидностью, потому что она не дает доказательств в поддержку выводов, сделанных на основе результатов тестов.
    • Внешняя валидность — это когда тест измеряет определенный критерий; это не гарантирует, что тест действительно измеряет явления в этом факторе.
    • Но очень важно быть честным; для теста, который «выглядит» как действительный.
    • Эти образы могут помочь мотивировать тестируемых, демонстрируя актуальность.

    1. Содержание Валидность или описание процедур проверки
    • Он оценивает, насколько мера представляет каждый отдельный элемент конструкции или указанной концепции.
    • Это систематическое изучение содержимого теста для определения того, охватывает ли оно репрезентативную выборку всех измерений/областей, подлежащих измерению.
    • Эта процедура оценивания используется при разработке тестов для измерения того, насколько хорошо человек овладел навыком.
    • Домены, разделы, типы и т.д. должны быть полностью описаны заранее.
    • Содержание должно быть определено широко, чтобы включать основные цели: применение принципов, интерпретацию данных, фактическое знание и т. д.
    • Валидность зависит от реакции человека на тест в рассматриваемой области поведения, а не от внешнего вида содержания элемента.
    Специфическая процедура для разработки Content Validity
      1. Выбор подходящих пунктов/утверждений/вопросов
      2. Систематическое изучение учебных программ, учебника
      3. Консультация экспертов по предмету (SMEs)
      4. ,цели/процесс обучения, важные отдельные темы, количество пунктов
    • Обсуждение проверки содержания должно быть в руководстве по тестированию.
    • Эмпирическая процедура определения валидности содержимого должна охватывать общие баллы и баллы по элементам.
    • Дополнительная процедура для определения достоверности содержания должна выполнять анализ типов ошибок.
    • При установлении достоверности содержимого следует учитывать адекватность представления концептуальной области, для охвата которой предназначен тест.
    • Традиционно доказательство валидности содержания вызывало наибольшую озабоченность при образовательном тестировании.
    • Уникальная особенность достоверности содержания заключается в том, что она является логической, а не статистической.Как лицо достоверности.
    • Для установления достоверности содержания требуется хорошая логика, интуитивные навыки и настойчивость.

    Два новых понятия в развитии достоверности содержания-

    1. Недопредставленность конструкции

    Недопредставленность конструкции описывает неспособность зафиксировать важные компоненты конструкции.

    Например, если тест на математические знания включает алгебру, но не геометрию, достоверность теста будет поставлена ​​под угрозу из-за недопредставленности конструкции.

    2. Нерелевантная для конструкции дисперсия
    • Нерелевантная для конструкции дисперсия возникает, когда на баллы влияют факторы, нерелевантные для конструкции.
    • Например, на тест интеллекта может повлиять понимание прочитанного, тревога при тестировании или болезнь.

    Применение проверки достоверности содержания

    • Проверка достоверности содержания может подходить для образовательного теста, теста достижений, отбора сотрудников и классификации сотрудников.
    • Содержимое Валидность не подходит для проверки способностей и личности.

    9

    Ограничения содержания Срок действия

    Например, многие студенты делают плохо на тесты из-за проблем с тревогой или чтения

    2. Критерий Очевидность или критерий, связанные с ними доказательства для достоверности
    • свидетельство валидности говорит нам, насколько хорошо тест соответствует конкретному критерию.
    • Критерий — это стандарт, с которым сравнивается тест.
    • Например, с помощью теста можно предсказать, какие помолвленные пары вступят в успешный брак, а какие разведутся.

    Критерии будут — радут успех

    Тип критерия. свидетельства достоверности критерия, известного как свидетельство прогностической достоверности.

    SAT/GRE , включая его количественные и вербальные подтесты, является переменной-предиктором, а средний балл колледжа (GPA) является критерием.

    Тесты на пригодность , принимаемые работодателями, компаниями, являются еще одним примером прогностической достоверности.

    Цель теста — предсказать вероятность успешного выполнения критерия, т. е. достижения высокого среднего балла в колледже.

    2. Параллельная валидность Доказательства валидности, связанные с одновременной валидностью

    Параллельная валидность имеет место, когда меры критерия получены одновременно с результатами теста.

    Когда мера сравнивается с другой мерой того же типа, они будут связаны.

    Показывает, насколько точно результаты теста оценивают текущее состояние человека по данному критерию.

    Параллельная валидность исходит из оценки одновременной связи между тестом и критерием, например, между тестом на неспособность к обучению и успеваемостью в школе.

    Параллельное свидетельство валидности применяется, когда тест и критерий могут быть измерены одновременно.

    Например, в тесте на депрессию тест должен иметь параллельную валидность, если он измеряет текущие уровни депрессии, испытываемые человеком, прошедшим тест.

    Применение параллельной валидности

    Большинство психологических тестов используют эту валидность.

    Параллельное действие в основном используется в промышленном секторе .

    3. Конструктивная валидность

    Конструктивная валидность определяет, насколько тест или эксперимент соответствует заявленным.

    Тест, созданный для измерения депрессии, он должен измерять только этот конкретный конструкт, а не тесно связанные идеалы, такие как стресс или тревога.

    Конструктивная валидность означает, что тест демонстрирует связь между баллами и предсказанием теоретического признака, понятия, атрибута и т. д.

    и психологические характеристики, которые они хотели измерить.

    Например, меры интеллекта, любви, любопытства или психического здоровья.

    Все эти тесты должны иметь конструктную валидность.

    Не было критерия интеллекта, потому что это гипотетическая конструкция .

    Конструкт определяется как нечто, построенное путем ментального синтеза.

    Интеллект как конструкт не существует как отдельная вещь, которую мы можем потрогать или ощутить, поэтому его нельзя использовать в качестве объективного критерия.

    Валидность конструкции может быть установлена ​​с помощью ряда действий, в которых исследователь одновременно определяет некоторую конструкцию и разрабатывает инструменты для ее измерения.

    1. Т. Кэмпбелл и Фиске (1959) представили важный набор логических соображений для установления доказательств конструктной валидности. Они различали два типа доказательств, необходимых для осмысленного теста: конвергентные и дивергентные/дискриминантные.

    Два типа конструктивной валидности по Кэмпбеллу и Фиске (1959)

    Когда мера хорошо коррелирует с другими тестами, которые, как предполагается, измеряют ту же конструкцию, получают конвергентные доказательства валидности.

    В каждом случае баллы за тест связаны с баллами по какому-либо другому показателю.

    Однако не существует критерия для определения того, что мы пытаемся измерить.

    Конвергентная валидность достигается одним из двух способов .-

    1. Мы показываем, что тест измеряет те же вещи, что и другие тесты, используемые для той же цели.
    2. Мы демонстрируем определенные взаимосвязи, которых можно ожидать, если тест действительно выполняет свою работу.

    2 . Дивергентная или дискриминантная валидность  

    Тесты на то, что конструкции не должны иметь никакой связи, на самом деле не имеют никакой связи.

    Он показывает, что мера не включает лишних элементов и что тест измеряет что-то отличное от других тестов.

    Экспериментальная валидность

    Валидность дизайна экспериментальных исследований является центральной частью научного метода и предметом исследовательской этики.Без достоверного дизайна невозможно сделать достоверные научные выводы.

    Типы экспериментальной валидности

    1. Внутренняя валидность

    Внутренняя валидность — это мера, которая подтверждает, что исследовательский план эксперимента тщательно следует принципу причины и следствия.

    Индуктивная оценка степени, в которой можно сделать выводы о причинно-следственных связях (например, о причине и следствии), на основе используемых показателей, условий исследования и всего плана исследования.

    Другими словами, существует причинно-следственная связь между независимой и зависимой переменной.

    Внутреннюю валидность можно улучшить, регулируя внешние переменные, используя стандартизированные инструкции, уравновешивая и устраняя характеристики спроса и эффекты исследователя.

    2. Внешняя валидность

    Внешняя валидность связана с обобщением: в какой степени эффект в исследовании может быть обобщен на популяции, условия, переменные лечения и переменные измерения?

    Внешняя валидность касается степени, в которой (внутренне значимые) результаты исследования могут считаться верными для других случаев, например, для разных людей, мест или времени.

    Внешнюю валидность можно повысить, поставив эксперименты в более естественной обстановке и используя случайную выборку для выбора участников.

    Внешняя валидность обычно подразделяется на два различных типа:

    1. Популяционная валидность — другие люди
    2. Историческая валидность — с течением времени
    3. Экологическая валидность — степень применимости результатов исследования к реальным жизненным обстоятельствам вне наборов исследований

    Оба основных элемента при оценке прочности экспериментального дизайна.

     

    Справочники по действительности и типам действительности

    Анастаси , А., и Урбина, С. (1997). Психологическое тестирование  (7-е изд.). Прентис Холл/Пирсон Образование.

    https://www.simplypsychology.org/validity.html#ext

    https://en.wikipedia.org/wiki/Validity_(statistics)

    по психологии

    Цели обучения

    1. Определение надежности, включая различные типы и способы их оценки.
    2. Определите достоверность, включая различные типы и способы их оценки.
    3. Опишите виды доказательств, которые могут иметь отношение к оценке надежности и обоснованности конкретной меры.

    Опять же, измерение включает в себя присвоение баллов отдельным лицам, чтобы они представляли некоторую характеристику людей. Но откуда исследователи узнают, что баллы на самом деле отражают характеристику, особенно когда речь идет о таком конструкте, как интеллект, самооценка, депрессия или объем рабочей памяти? Ответ заключается в том, что они проводят исследование с использованием меры, чтобы подтвердить, что оценки имеют смысл, исходя из их понимания измеряемой конструкции.Это чрезвычайно важный момент. Психологи не просто предполагают , что их меры работают. Вместо этого они собирают данные, чтобы продемонстрировать , что они работают. Если их исследование не показывает, что мера работает, они перестают ее использовать.

    В качестве неформального примера представьте, что вы уже месяц сидите на диете. Ваша одежда кажется более свободной, и несколько друзей спрашивали, похудели ли вы. Если бы в этот момент ваши весы в ванной показывали, что вы потеряли 10 фунтов, это имело бы смысл, и вы продолжали бы пользоваться весами.Но если бы оно указывало на то, что вы набрали 10 фунтов, вы бы правильно заключили, что оно сломано, и либо починили бы его, либо избавились от него. При оценке метода измерения психологи учитывают два основных аспекта: надежность и валидность.

    Надежность

    Надежность  относится к согласованности меры. Психологи рассматривают три типа согласованности: во времени (надежность повторного тестирования), между элементами (внутренняя согласованность) и между разными исследователями (межэкспертная надежность).

    Тест-ретест Надежность

    Когда исследователи измеряют конструкцию, которая, по их мнению, неизменна во времени, полученные ими баллы также должны быть постоянными во времени. Надежность при повторном тестировании  – это степень, в которой это действительно так. Например, обычно считается, что интеллект неизменен во времени. Человек, который очень умен сегодня, будет очень умным на следующей неделе. Это означает, что любая хорошая мера интеллекта должна дать этому человеку примерно такие же оценки на следующей неделе, как и сегодня.Ясно, что мера, которая дает крайне противоречивые оценки во времени, не может быть очень хорошей мерой конструкции, которая должна быть последовательной.

    Оценка надежности повторного тестирования требует одновременного использования показателя для группы людей, повторного использования его для той же группы людей в более позднее время, а затем изучения корреляции между двумя наборами показателей баллы. Обычно это делается путем графического отображения данных на диаграмме рассеяния и вычисления коэффициента корреляции.На рис. 4.2 показана корреляция между двумя наборами оценок нескольких студентов университета по шкале самооценки Розенберга, проведенных два раза с интервалом в неделю. Коэффициент корреляции для этих данных составляет +,95. В целом считается, что корреляция между тестом и повторным тестом +,80 или выше указывает на хорошую надежность.

    Рисунок 4.2. Корреляция тестов и повторных тестов между двумя наборами баллов нескольких студентов колледжа по шкале самооценки Розенберга, полученных два раза в неделю с интервалом

    Опять же, высокая корреляция между тестом и повторным тестом имеет смысл, когда предполагается, что измеряемый конструкт неизменен во времени, как в случае с интеллектом, самооценкой и личностными параметрами Большой пятерки.Но другие конструкции не считаются стабильными во времени. Например, сама природа настроения такова, что оно меняется. Таким образом, мера настроения, которая показала низкую корреляцию между тестами и повторными тестами в течение месяца, не должна вызывать беспокойства.

    Внутренняя согласованность

    Другим видом надежности является внутренняя согласованность , которая представляет собой согласованность ответов людей по пунктам измерения, состоящего из нескольких пунктов. В целом предполагается, что все пункты таких показателей отражают одну и ту же базовую конструкцию, поэтому баллы людей по этим пунктам должны коррелировать друг с другом.Согласно шкале самооценки Розенберга, люди, согласные с тем, что они достойные люди, должны, как правило, соглашаться с тем, что они обладают рядом хороших качеств. Если ответы людей на разные элементы не коррелируют друг с другом, то больше не имеет смысла утверждать, что все они измеряют одну и ту же лежащую в основе конструкцию. Это верно как для поведенческих и физиологических показателей, так и для показателей самоотчетов. Например, люди могут сделать серию ставок в смоделированной игре в рулетку, чтобы измерить уровень своего стремления к риску.Этот показатель будет внутренне непротиворечивым в той мере, в какой ставки отдельных участников были неизменно высокими или низкими в ходе испытаний.

    Как и надежность повторных испытаний, внутреннюю согласованность можно оценить только путем сбора и анализа данных. Один из подходов заключается в рассмотрении корреляции с разделением пополам . Это включает в себя разделение элементов на два набора, таких как первая и вторая половины элементов или элементы с четными и нечетными номерами. Затем для каждого набора элементов вычисляется оценка, и проверяется взаимосвязь между двумя наборами оценок.Например, на рис. 4.3 показана корреляция пополам между баллами нескольких студентов университетов по четным пунктам и их баллами по нечетным пунктам шкалы самооценки Розенберга. Коэффициент корреляции для этих данных составляет +,88. Половинная корреляция +,80 или выше обычно считается хорошей внутренней согласованностью.

    Рис. 4.3 Корреляция с разделением пополам между баллами нескольких студентов колледжа по четным пунктам и их баллами по нечетным пунктам шкалы самооценки Розенберга

    Возможно, наиболее распространенной мерой внутренней согласованности, используемой исследователями в области психологии, является статистика, называемая α Кронбаха  (греческая буква альфа).Концептуально α является средним значением всех возможных корреляций разделения пополам для набора элементов. Например, существует 252 способа разделить набор из 10 предметов на два набора по пять. α Кронбаха будет средним из 252 разделенных пополам корреляций. Обратите внимание, что это не то, как на самом деле вычисляется α, но это правильный способ интерпретации значения этой статистики. Опять же, значение +,80 или выше обычно считается показателем хорошей внутренней согласованности.

    Надежность между экспертами

    Многие поведенческие показатели требуют значительных суждений со стороны наблюдателя или оценщика. Межэкспертная надежность  – это степень, в которой разные наблюдатели последовательны в своих суждениях. Например, если вы заинтересованы в измерении социальных навыков студентов университета, вы можете сделать видеозаписи их общения с другим студентом, которого они встречают впервые. Затем вы можете попросить двух или более наблюдателей посмотреть видео и оценить уровень социальных навыков каждого учащегося. В той мере, в какой каждый участник на самом деле обладает определенным уровнем социальных навыков, который может быть обнаружен внимательным наблюдателем, оценки разных наблюдателей должны сильно коррелировать друг с другом.Межэкспертная надежность также могла быть измерена в исследовании Бандуры с куклой Бобо. В этом случае оценки наблюдателями того, сколько актов агрессии совершил конкретный ребенок во время игры с куклой Бобо, должны были иметь высокую положительную корреляцию. Надежность между экспертами часто оценивается с использованием коэффициента Кронбаха, когда суждения количественные, или аналогичного статистического показателя, называемого коэновским κ (греческая буква каппа), когда они категоричны.

    Срок действия

    Валидность  – это степень, в которой оценки меры представляют переменную, для которой они предназначены.Но как исследователи делают это суждение? Мы уже рассмотрели один фактор, который они учитывают, — надежность. Когда мера имеет хорошую надежность повторного тестирования и внутреннюю согласованность, исследователи должны быть более уверены в том, что оценки представляют то, что они должны представлять. Однако это должно быть нечто большее, потому что мера может быть чрезвычайно надежной, но не иметь никакой достоверности. В качестве абсурдного примера представьте себе человека, который считает, что длина указательного пальца человека отражает его самооценку, и поэтому пытается измерить самооценку, поднося линейку к указательным пальцам людей.Хотя эта мера будет иметь чрезвычайно хорошую надежность при повторном тестировании, она будет абсолютно недействительной. Тот факт, что указательный палец одного человека на сантиметр длиннее, чем у другого, ничего не говорит о том, у кого из них выше самооценка.

    Обсуждения валидности обычно делят ее на несколько различных «типов». Но хороший способ интерпретировать эти типы состоит в том, что они представляют собой другие виды доказательств — в дополнение к надежности — которые следует принимать во внимание при оценке достоверности меры.Здесь мы рассматриваем три основных вида: валидность лица, валидность содержания и валидность критерия.

    Проверка подлинности

    Лицевая валидность  – это степень, в которой метод измерения выглядит «на лицо» для измерения интересующей конструкции. Большинство людей ожидает, что анкета самооценки будет включать вопросы о том, считают ли они себя достойным человеком и считают ли они себя хорошими качествами. Таким образом, анкета, включающая такие пункты, будет иметь хорошую внешнюю валидность.С другой стороны, метод измерения самооценки по длине пальца, по-видимому, не имеет ничего общего с самооценкой и, следовательно, имеет низкую кажущуюся валидность. Хотя кажущаяся валидность может быть оценена количественно — например, когда большая выборка людей оценивает меру с точки зрения того, измеряет ли она то, для чего предназначена, — ее обычно оценивают неформально.

    Лицевая валидность — это в лучшем случае очень слабое доказательство того, что метод измерения измеряет то, что он должен измерять.Одна из причин заключается в том, что он основан на интуитивных представлениях людей о человеческом поведении, которые часто ошибочны. Также верно и то, что многие общепризнанные меры в психологии работают достаточно хорошо, несмотря на то, что им не хватает внешней достоверности. Миннесотский многофазный личностный опросник-2 (MMPI-2) измеряет многие личностные характеристики и расстройства, предлагая людям решить, применимо ли к ним каждое из более чем 567 различных утверждений, причем многие утверждения не имеют никакого очевидного отношения к конструкту, который они измеряют. .Например, пункты «Мне нравятся детективы или детективы» и «Вид крови меня не пугает и не вызывает тошноты» измеряют подавление агрессии. В данном случае интерес представляют не буквальные ответы участников на эти вопросы, а то, соответствует ли шаблон ответов участников на ряд вопросов ответам людей, склонных подавлять свою агрессию.

    Срок действия содержания

    Валидность содержания  – это степень, в которой мера «покрывает» интересующую конструкцию.Например, если исследователь концептуально определяет тестовую тревожность как активацию симпатической нервной системы (ведущую к нервным переживаниям) и негативные мысли, то его мера тестовой тревожности должна включать пункты, касающиеся как нервных переживаний, так и негативных мыслей. Или учтите, что отношения обычно определяются как включающие мысли, чувства и действия по отношению к чему-либо. Согласно этому концептуальному определению, человек позитивно относится к физическим упражнениям в той мере, в какой он или она позитивно относится к упражнениям, чувствует себя хорошо во время упражнений и действительно занимается ими.Таким образом, чтобы иметь хорошую содержательную валидность, мера отношения людей к физическим упражнениям должна отражать все три аспекта. Как и внешняя валидность, содержательная валидность обычно не оценивается количественно. Вместо этого он оценивается путем тщательной проверки метода измерения на соответствие концептуальному определению конструкции.

    Критерий достоверности

    Валидность критерия — это степень, в которой оценки людей по какому-либо показателю коррелируют с другими переменными (известными как критерии ), с которыми можно было бы ожидать их корреляции.Например, результаты людей по новому показателю тестовой тревожности должны иметь отрицательную корреляцию с их успеваемостью на важном школьном экзамене. Если бы было обнаружено, что баллы людей на самом деле отрицательно коррелируют с их успеваемостью на экзамене, то это было бы доказательством того, что эти баллы действительно отражают тревожность людей перед экзаменами. Но если бы было обнаружено, что люди получают одинаковые результаты на экзамене независимо от их оценки тревожности во время теста, это поставило бы под сомнение достоверность измерения.

    Критерием может быть любая переменная, которая, как есть основания полагать, должна быть коррелирована с измеряемым конструктом, и обычно их будет много. Например, можно было бы ожидать, что показатели тревожности при тестировании будут отрицательно коррелировать с успеваемостью на экзамене и оценками за курс и положительно коррелировать с общей тревожностью и кровяным давлением во время экзамена. Или представьте, что исследователь разрабатывает новую меру физического риска. Баллы людей по этому показателю должны коррелировать с их участием в «экстремальных» видах деятельности, таких как катание на сноуборде и скалолазание, количеством полученных ими штрафов за превышение скорости и даже количеством переломов костей, которые они получили за эти годы.Когда критерий измеряется одновременно с построением, валидность критерия упоминается как параллельная валидность ; однако, когда критерий измеряется в какой-то момент в будущем (после того, как конструкт был измерен), он упоминается как прогностическая достоверность (поскольку баллы по показателю «предсказывали» будущий результат).

    Критерии могут также включать другие меры той же конструкции. Например, можно было бы ожидать, что новые показатели тестовой тревожности или готовности к физическому риску будут положительно коррелировать с существующими установленными показателями тех же конструктов.Это известно как конвергентная действительность .

    Для оценки конвергентной валидности требуется сбор данных с использованием показателя. Исследователи Джон Качиоппо и Ричард Петти сделали это, когда создали свою шкалу самооценки потребности в познании, чтобы измерить, насколько люди ценят мышление и вовлечены в него (Cacioppo & Petty, 1982). В серии исследований они показали, что баллы людей положительно коррелируют с их баллами по стандартизированному тесту успеваемости и что их баллы отрицательно коррелируют с их баллами по показателю догматизма (что представляет собой тенденцию к послушанию).За годы, прошедшие с момента ее создания, шкала потребности в познании использовалась буквально в сотнях исследований, и было показано, что она коррелирует с широким спектром других переменных, включая эффективность рекламы, интерес к политике и решения присяжных. (Петти, Бриньоль, Лёрш и Маккаслин, 2009 г.).

    Дискриминантная достоверность

    Дискриминантная валидность , с другой стороны, представляет собой степень, в которой баллы меры , а не коррелируют с мерами переменных, которые концептуально различны.Например, самооценка — это общее отношение к себе, которое довольно стабильно во времени. Это не то же самое, что настроение, то есть то, насколько хорошо или плохо человек себя чувствует в данный момент. Таким образом, оценки людей по новому показателю самооценки не должны сильно коррелировать с их настроением. Если бы новая мера самооценки была сильно коррелирована с мерой настроения, можно было бы утверждать, что новая мера на самом деле не измеряет самооценку; вместо этого он измеряет настроение.

    Создавая Шкалу потребности в познании, Качиоппо и Петти также представили доказательства дискриминантной валидности, показав, что баллы людей не коррелируют с некоторыми другими переменными.Например, они обнаружили лишь слабую корреляцию между потребностью людей в познании и мерой их когнитивного стиля — степенью, в которой они склонны мыслить аналитически, разбивая идеи на более мелкие части или целостно с точки зрения «большой картины». Они также не обнаружили корреляции между потребностью людей в познании и показателями их тестовой тревожности и их тенденцией реагировать социально желательными способами. Все эти низкие корреляции свидетельствуют о том, что показатель отражает концептуально отличный конструкт.

    Ключевые выводы

    • Исследователи-психологи не просто предполагают, что их измерения работают. Вместо этого они проводят исследования, чтобы показать, что они работают. Если они не могут показать, что они работают, они перестают их использовать.
    • Существует два различных критерия, по которым исследователи оценивают свои измерения: надежность и достоверность. Надежность — это согласованность во времени (надежность при повторном тестировании), между элементами (внутренняя согласованность) и между исследователями (надежность между разными группами).Валидность — это степень, в которой оценки действительно представляют переменную, для которой они предназначены.
    • Обоснованность — это суждение, основанное на различных видах доказательств. Соответствующее свидетельство включает в себя надежность показателя, охватывает ли он интересующий конструкт и коррелируют ли полученные с его помощью оценки с другими переменными, с которыми они, как ожидается, будут коррелировать, и не коррелируют с переменными, которые концептуально различны.
    • Надежность и валидность меры определяется не каким-либо одним исследованием, а последовательностью результатов нескольких исследований.Оценка надежности и валидности является непрерывным процессом.

    Упражнения

    1. Практика: попросите нескольких друзей заполнить шкалу самооценки Розенберга. Затем оцените его внутреннюю согласованность, построив диаграмму рассеяния, чтобы показать корреляцию разделения пополам (четные и нечетные элементы). Вычислите также коэффициент корреляции   , если знаете как.
    2. Обсуждение: Вспомните последний экзамен в колледже, который вы сдавали, и подумайте об экзамене как о психологической мере.Как вы думаете, для измерения какой конструкции он предназначался? Прокомментируйте его внешний вид и действительность содержания. Какие данные вы могли бы собрать, чтобы оценить их надежность и валидность критериев?

    Срок действия | Tutor2u

    Валидность относится к тому, действительно ли мера измеряет то, что, по ее утверждению, измеряет . Некоторые ключевые типы валидности рассматриваются ниже.

    Лицевая достоверность

    Лицевая достоверность является мерой того, выглядит ли субъективно многообещающе то, что инструмент измеряет то, что он должен измерять

    • e.г. Можно заметить, что люди с более высокими баллами на экзаменах получают более высокие баллы по опроснику IQ; вы не можете быть уверены, что они напрямую связаны, но на первый взгляд кажется, что результаты экзаменов являются разумным показателем показателей IQ, поэтому ваша мера показывает хорошую внешнюю достоверность.

    Внутренняя валидность

    Внутренняя валидность является мерой того, зависят ли полученные результаты исключительно от изменений в переменной, с которой манипулируют (т. е. независимой переменной) в причинно-следственной связи.Два ключевых типа внутренней валидности:

    • Конструктивная валидность – спрашивает, успешно ли мера измеряет концепцию , для которой она предназначена (например, измеряет ли опрос IQ или что-то родственное, но принципиально отличное?).
    • Параллельная валидность – спрашивает, согласуется ли мера с ранее существовавшими мерами, которые проверены для проверки той же [или очень похожей] концепции (оценивается путем сопоставления мер друг с другом).

    Внутреннюю валидность можно оценить на основе того, успешно ли контролируются или исключаются посторонние (т. е. нежелательные) переменные, которые также могут повлиять на результаты; чем больше контроль над такими переменными, тем больше уверенность в том, что можно найти причину и следствие, относящиеся к исследуемому конструкту.

    Внешняя валидность

    Внешняя валидность — это мера того, могут ли данные быть обобщены на другие ситуации за пределами исследовательской среды, в которой они были первоначально собраны.Два ключевых типа внешней валидности:

    • Временная валидность – она высока, когда результаты исследования успешно применяются в течение времени (некоторые переменные в прошлом могут больше не иметь значения сейчас или в будущем).
      • напр. Изменения в отношении к гендерным ролям с течением времени могут снизить временную достоверность данных прошлых экспериментов применительно к современным исследованиям.
    • Экологическая достоверность – можно ли обобщить данные на реальный мир на основе условий, в которых проводится исследование, и используемых процедур.
      • напр. Лабораторные исследования могут обеспечить высокую степень контроля над посторонними переменными, которые в противном случае варьировались бы в естественной среде, поэтому результаты могут считаться слишком «искусственными» и, следовательно, иметь низкую экологическую достоверность.
        • Однако мыши, например, могут вести себя одинаково в лаборатории и в дикой природе, поэтому лабораторные эксперименты, возможно, по-прежнему сохраняют здесь высокую экологическую достоверность.

    Внешняя валидность эксперимента может быть оценена и улучшена путем повторения исследования в разное время и в разных местах и ​​получения аналогичных результатов.Например, уверенность в обобщаемости [и, в свою очередь, внешней валидности] результатов повышается, когда исследования успешно воспроизводятся в разных культурах.

    Типы действительности — определения и примеры — Voxco

    Необходимые файлы cookie помогают сделать веб-сайт удобным для использования, обеспечивая основные функции, такие как навигация по страницам и доступ к безопасным областям веб-сайта. Веб-сайт не может функционировать должным образом без этих файлов cookie.

    Имя Домен Назначение Срок действия Тип
    ступица вокско.ком Функциональный файл cookie HubSpot. 1 год HTTP
    lhc_dir_locale amplifyreach.com 52 года
    лхк_диркласском 52 года

    Маркетинговые файлы cookie используются для отслеживания посетителей на веб-сайтах. Цель состоит в том, чтобы показывать релевантную и привлекательную рекламу для отдельного пользователя и, следовательно, более ценную для издателей и сторонних рекламодателей.

    Имя Домен Назначение Срок действия Тип
    _fbp вокско.ком Основной файл cookie для рекламы Facebook Pixel 3 месяца HTTP
    __hstc voxco.com Файл cookie маркетинговой платформы Hubspot. 1 год HTTP
    __hssrc вокско.ком Файл cookie маркетинговой платформы Hubspot. 52 года HTTP
    __hssc voxco.com Файл cookie маркетинговой платформы Hubspot. Сессия HTTP

    Аналитические файлы cookie помогают владельцам веб-сайтов понять, как посетители взаимодействуют с веб-сайтами, собирая и сообщая информацию анонимно.

    Имя Домен Назначение Срок действия Тип
    _гид вокско.ком Кратковременный уникальный идентификатор отслеживания пользователей Google Universal Analytics. 1 день HTTP
    МУИД bing.com Файл cookie для отслеживания идентификатора пользователя Microsoft, используемый Bing Ads. 1 год HTTP
    МР bat.bing.com Файл cookie для отслеживания идентификатора пользователя Microsoft, используемый Bing Ads. 7 дней HTTP
    ИДЕ двойной щелчок.сеть Рекламный файл cookie Google, используемый для отслеживания пользователей и таргетинга рекламы. 2 года HTTP
    _vwo_uuid_v2 voxco.com Файл cookie для отслеживания пользователей Generic Visual Website Optimizer (VWO). 1 год HTTP
    _vis_opt_s voxco.com Файл cookie для отслеживания пользователей Generic Visual Website Optimizer (VWO), который определяет, является ли пользователь новым или возвращается в определенную кампанию. 3 месяца HTTP
    _vis_opt_test_cookie вокско.ком Сеансовый (временный) файл cookie, используемый Generic Visual Website Optimizer (VWO) для определения того, включены ли файлы cookie в браузере пользователя или нет. 52 года HTTP
    _ga voxco.com Долговременный уникальный идентификатор отслеживания пользователей Google Universal Analytics. 2 года HTTP
    _uetsid voxco.com Файл cookie для отслеживания универсального отслеживания событий Microsoft Bing Ads (UET). 1 день HTTP
    жидкость видео.ком Файл cookie отслеживания Vimeo 2 года HTTP

    Файлы cookie предпочтений позволяют веб-сайту запоминать информацию, которая меняет поведение или внешний вид веб-сайта, например предпочитаемый вами язык или регион, в котором вы находитесь.

    Имя Домен Назначение Срок действия Тип
    __cf_bm узловая точка.ком Общий функциональный файл cookie CloudFlare. Сессия HTTP

    Неклассифицированные файлы cookie — это файлы cookie, которые мы классифицируем вместе с поставщиками отдельных файлов cookie.

    Имя Домен Назначение Срок действия Тип
    _gcl_au вокско.ком 3 месяца
    _gat_gtag_UA_3262734_1 voxco.com Сессия
    _clck вокско.ком 1 год
    _ga_HNFQQ528PZ voxco.com 2 года
    _клск вокско.ком 1 день
    посетитель_id18452 pardot.com 10 лет
    посетитель_id18452-хэш пардо.ком 10 лет
    лпв18452 pi.pardot.com Сессия
    lhc_per вокско.ком 6 месяцев
    _uetvid voxco.com 1 год

    Объяснение достоверности измерения простым языком

    В моем предыдущем сообщении в блоге я отметил, что надежность и достоверность являются двумя важными свойствами психологических измерений.Показатели интеллекта, личности, профессиональных интересов и т. д., которым не хватает надежности и обоснованности, хуже, чем бесполезны. Когда мы принимаем важные решения для себя или других, основываясь на психологических показателях, которым не хватает надежности или обоснованности, эти решения, скорее всего, будут неправильными и вредными. Поэтому я считаю важным, чтобы каждый, кто подвергается психологическому тестированию, понимал надежность и валидность и понимал, когда психологическому показателю могут не хватать этих жизненно важных характеристик.

    Как я указал в своем предыдущем посте, если тест личности надежен, вы будете получать почти одинаковые баллы каждый раз, когда проходите тест. Допустим, вы проходите тест, который должен измерить уровень вашей застенчивости. В первый раз, когда вы проходите тест, вы набираете 90 баллов из 100 возможных. Через две недели вы проходите тест во второй раз и снова получаете 90 баллов. И, допустим, то же самое верно для тысячи других людей; их оценки при первом тестировании идентичны или почти идентичны их оценкам через две недели.Люди с низкими показателями застенчивости, в диапазоне от 0 до 34, также получили низкие баллы во второй раз. Люди с средними баллами, скажем, от 35 до 65, в первый раз также получили средние баллы за застенчивость во второй раз. А люди с высокими баллами застенчивости, 66 лет и старше, в первый раз также получили высокие баллы во второй раз. У нас есть то, что кажется надежным тестом для измерения застенчивости.

    Но подождите — этот надежный тест, который каждый раз дает практически одинаковые баллы, измеряет какую-то стабильную характеристику, но откуда мы знаем, что этот набор вопросов на самом деле измеряет застенчивость, а не какую-то другую устойчивую черту?» Это вопрос валидности теста. .Действительный тест измеряет то, что утверждает автор теста, а не какую-либо другую характеристику. Знание того, что тест действителен, требует большего, чем просто видимость валидности. На первый взгляд тест на застенчивость может показаться верным, потому что он содержит такие пункты, как «Я склонен избегать общественных собраний», и согласие с такими утверждениями дает вам баллы за застенчивость. Личностные тесты, содержащие пункты, содержание которых явно связано с тем, что должен измерять тест, обладают тем, что иногда называют «лицевой валидностью».Но этого недостаточно, чтобы сделать вывод о том, что эти вопросы действительно измеряют застенчивость. Если люди не могут или не хотят отвечать на эти вопросы надлежащим образом в соответствии с их фактическим уровнем застенчивости, личностный тест, который выглядит достоверным, на самом деле может быть недействительным. Вопрос остается открытым. , откуда мы знаем, что личностный тест действительно измеряет личностную черту, которую, как утверждает автор теста, он измеряет?

    Источник: лицензия CC0

    Оказывается, это очень сложный вопрос.Литература по валидности обширна и сложна. Опубликованы десятки статей на эту тему. Психологи писали о различных видах валидности, таких как критериальная валидность, прогностическая валидность, параллельная валидность и инкрементная валидность. В этой записи блога я стремлюсь преодолеть сложности и объяснить валидность на обычном языке, который не слишком упрощает чрезвычайно важную концепцию валидности измерений.

    Несмотря на различные «виды» валидности, о которых было написано, психологи согласны с тем, что все они зависят от основного, центрального понятия, называемого конструктивной валидностью , обсуждаемого в классической монографии Кронбаха и Мила (1955).(Пол Мил был назван самым умным психологом нашего времени.) Психологические конструкции, такие как застенчивость, социальный интеллект, депрессия, добросовестность и т. д., являются теоретическими идеями, которые нельзя легко свести к одному простому поведению. Застенчивость — это не просто избегание людей, хотя в повседневной жизни непсихологи могут использовать это поведение, чтобы отличить застенчивых людей от незастенчивых. Для психологов-исследователей застенчивость как теоретическая конструкция лежит в основе и объясняет широкий спектр мыслей, чувств, физических состояний и поведения.Тест на застенчивость с продемонстрированной конструкционной валидностью подтверждается доказательствами того, что он действительно измеряет различия в этой теоретической конструкции, застенчивости. Чтобы увидеть, как устанавливаются доказательства валидности конструкции, давайте посмотрим, что говорят исследователи о застенчивости.

    Источник: лицензия CC0

    Джонатан Чик, эксперт по застенчивости, предположил, что застенчивость лежит в основе внутренних состояний, таких как самокритичные и застенчивые мысли, беспокойство по поводу оценки другими, страх быть отвергнутым и чувство напряженности, расстройства и неловкости в социальных условиях. .Это также лежит в основе физических симптомов, таких как потливость, дрожь и покраснение в присутствии других, а также четко видимых форм поведения, таких как молчание, не смотреть людям в глаза, неловко спотыкаться в разговорах и вообще избегать социальных ситуаций.

    Так что же это за теоретическая конструкция, застенчивость, которая приводит к такому широкому диапазону последовательных мыслей, чувств и поведения? Ну, исследователи точно не знают. Конструкция застенчивости похожа на конструкцию гравитона в теоретической физике, которая, как предполагается, играет роль в силе гравитации.Предположительно, индивидуальные различия в застенчивости, в конечном счете, соответствуют некоторым пока еще ненаблюдаемым закономерностям в функционировании мозга. Есть что-то в мозгу застенчивых людей, отличающееся от мозга незастенчивых людей. Но точно так же, как у физиков нет способа обнаружить отдельные гравитоны, психологи пока не могут обнаружить все различия в функционировании мозга, которые соответствуют индивидуальным различиям в застенчивости (хотя теории были предложены). Таким образом, застенчивость остается теоретической конструкцией.

    Теории в науке делают предсказания о том, что будет наблюдаться при определенных обстоятельствах. Теории застенчивости предсказывают, что мы будем наблюдать, когда человека помещают в различные социальные ситуации (или просят представить, что он находится в определенных социальных ситуациях). В зависимости от теории застенчивости мы можем предсказать, что застенчивые люди проявляют больше физических признаков беспокойства (мышечное напряжение, дрожь, потливость) в группе людей, вовлеченных в соревновательную игру, чем в группе людей, которые все смотрят видео.Проверка такого прогноза требует, чтобы мы каким-то образом измеряли застенчивость — будь то с помощью опросника застенчивости, простой самооценки застенчивости, суждений о застенчивости от знающих знакомых или какой-либо другой меры застенчивости. Каждый раз, когда мы проводим исследование, чтобы проверить предсказание относительно конструкта застенчивости, мы одновременно проверяем достоверность конструкта метода, который мы используем для измерения застенчивости.

    По словам Хогана и Николсона (1988), «проверка конструкции — это не что иное, как проверка гипотезы» (стр.622).

    Допустим, мы действительно проводим исследование, описанное выше. Мы просим всех участников исследования заполнить Пересмотренную шкалу застенчивости щек и Басса (RCBS) из 20 пунктов. Мы прикрепляем ненавязчивые датчики для измерения мышечного напряжения, дрожи и потоотделения ко всем участникам исследования и случайным образом распределяем их по группам. Некоторым группам дается соревновательная игра, а другим предлагается посмотреть видео. После того, как все данные собраны, мы сравниваем психофизиологические записи с баллами по RCBS.Мы обнаружили, что участники с высокими баллами по RCBS демонстрировали немного большее мышечное напряжение, дрожь и потоотделение, чем участники с низкими баллами по RCBS, когда участники смотрели видео. Но при участии в соревновательной игре люди с высокими баллами по RCBS демонстрировали значительно большее мышечное напряжение, дрожь и потливость, чем люди с низкими баллами. Наш прогноз подтвердился.

    Это конец? Можем ли мы теперь сказать, что RCBS обладает конструктной валидностью, что он действительно измеряет застенчивость?

    Одним словом, нет.Подтверждение одного предсказания — это всего лишь доказательство, подтверждающее достоверность конструкции RCBS. Ни одна из теорий застенчивости не утверждает, что застенчивость — это не что иное, как переживание мышечного напряжения, дрожи и потливости во время соревновательной деятельности. Застенчивость — это гораздо больше, и мощная теория застенчивости может генерировать достаточно проверяемых прогнозов, чтобы занять исследователей на всю жизнь. Каждый раз, когда подтверждается новое предсказание, об этом одновременно свидетельствует конструктная валидность меры застенчивости, а также валидность теории, породившей проверяемую нами гипотезу.

    Но допустим, что наш прогноз не подтвердился. Предположим, что люди с высокими показателями RCBS демонстрировали гораздо большее мышечное напряжение, дрожь и потливость в обоих условиях — при просмотре видео и при участии в соревновательной игре. Означает ли это, что RCBS имеет нулевую конструктную валидность и должна быть отменена из-за новой меры застенчивости? Не обязательно. Когда прогнозы не подтверждаются, это может означать, что мере не хватает конструктной валидности. Но это также может означать, что в лежащей в основе теории была ошибка.Возможно, застенчивые люди испытывают физические симптомы беспокойства практически в любой групповой обстановке, а не только в соревновательных ситуациях, когда они беспокоятся о том, что их оценивают. Или, может быть, была методологическая проблема. Возможно, видео, выбранное для исследования, изображало социальные ситуации, которые заставляли застенчивых участников стесняться себя. Возможно, видео о животных дало бы предсказанные результаты.

    Точно так же, как одно подтвержденное предсказание не дает нам абсолютной уверенности в теории и достоверности конструкции теста, одно неудачное предсказание не обязательно означает отказ от теории или теста.Внимательное изучение результатов может привести к отказу от теории и/или измерения. Но более вероятно, что исследователи внесут небольшие изменения в теорию, методы или измерят и попытаются снова. Как я указывал ранее, проверка конструкции и проверка теории — бесконечные процессы, занимающие исследователей на протяжении всей их карьеры.

    Естественно, академические психологи, как и все остальные, хотят сделать успешную карьеру, и одним из требований к успешной карьере в области психологических измерений является разработка нового показателя, который исследовательское сообщество считает надежным и обоснованным.К сожалению, желание доказать свой успех иногда приводит исследователей к преждевременным заявлениям о конструктной валидности их измерений. Я не знаю, сколько раз я рецензировал рукопись, представленную для публикации, или даже видел опубликованную статью, в которой авторы утверждали, что «установили» конструктную валидность своей новой меры в одном наборе исследований. Иногда заявление делается на основе одного факторного анализа набора данных! Cronbach и Meehl (1955) упоминают факторный анализ как одну из статистических процедур исследования валидности конструкции.Похоже, что некоторые исследователи, спешащие продвинуться по карьерной лестнице, сосредоточились на этой части монографии Кронбаха и Миля и проигнорировали то, что они говорили о проверке конструкции как бесконечном процессе.

    Итак, не верьте психологам, которые говорят, что продемонстрировали конструктную валидность меры в одной статье. Ни одно неудачное предсказание не должно убедить вас в том, что теория неверна или шкала недействительна. Научное знание не похоже на башню из кирпичей, где выбивание одного кирпича разрушило бы башню.Научное знание больше похоже на паутину, которую Кронбах и Мил назвали «номологической сетью». Если вы перережете одну нить паутины, вся паутина не порвется. Достоверные научные знания не выдерживают и не падают в одном исследовании. Если наша паутина или сеть взаимосвязанных идей велика и хорошо зарекомендовала себя, она устоит, даже если одно исследование потерпит неудачу.

    Недавно я слышал, как Эл Гор говорил об этом на конференции по климату. Отрицатели изменения климата ошибаются, выделяя несколько исследований, в которых не удалось найти доказательств того, что изменение климата в первую очередь вызвано деятельностью человека, тогда как сеть научных открытий подавляющим большинством поддерживает теорию антропогенного изменения климата.Подумайте вот о чем: вы когда-нибудь проводили эксперимент на школьном курсе физики или химии и не получали ожидаемых результатов? Как бы часто это ни происходило в средних школах по всему миру, это не означает, что законы физики и химии нужно пересматривать.

    В конечном счете, попытки установить достоверность конструкции — это поиск истины. Поиск истины всегда был трудным. С самого начала цивилизации философы задавались вопросом: «Что мы знаем и откуда мы знаем, что знаем это?» Даже совершенно беспристрастный человек затрудняется ответить на этот вопрос.Наука, как групповое упражнение по установлению знаний, имеет большой опыт установления знаний, о чем свидетельствуют все ее достижения. Но отдельные ученые могут иметь предубеждения. К сожалению, иногда ученые планируют свои исследования так, чтобы получить результаты, которые нравятся корпорациям, которые их финансируют. Иногда ученые настолько привязываются к своим теориям, что отстаивают их однобоко, как юристы, а не беспристрастно.

    Одна из форм предвзятости, которую я наблюдал при валидации конструкции, заключается в том, что в нее включаются элементы, которые не описывают определяющие характеристики конструкции, а вместо этого предсказывают результаты, которые исследователь хочет связать с конструктом.На самом деле, на написание этого поста в блоге о валидности меня побудила история, которую я прочитал о попытках измерить духовность и продемонстрировать результаты духовной жизни. Позволь мне объяснить.

    Увидев, насколько сложным может быть определение конструкта застенчивости, вы, вероятно, сможете представить сложность и двусмысленность определения духовности. В статье, которую я читал о попытках измерения духовности, отмечалось, что трудно дать четкие определения духовности, хотя в психологической литературе можно найти более трех десятков показателей духовности.

    Источник: лицензия CC0

    В некоторых исследованиях утверждается, что духовность связана с позитивными социальными отношениями и хорошим здоровьем. Тем не менее, показатели духовности иногда содержат пункты о положительных социальных отношениях, такие как «у меня есть общее чувство принадлежности» и «я чувствую родство с другими людьми». Поскольку другие исследования уже продемонстрировали, что хорошие результаты для здоровья связаны с положительными социальными отношениями, отмечает Дэвид Спид (2017), утверждение, что духовность ведет к хорошему здоровью с помощью таких мер, равносильно включению пункта о «не курении» в шкалу духовности, а затем утверждая, что духовность защищает людей от рака.

    Урок для исследователей состоит в том, что им необходимо тщательно определять конструкты, которые они измеряют, и избегать включения элементов, представляющих прогнозируемые результаты, а не элементов, определяющих конструкты. Урок для потребителей состоит в том, что когда вы читаете, что личностная черта X предсказывает жизненный результат Y, вы можете захотеть проверить, содержит ли мера личностной черты X элементы, касающиеся Y. Даже один элемент Y будет выглядеть так, как будто X предсказывает Y, когда на самом деле это один элемент Y, который предсказывает Y.Пусть покупатель будет бдителен.

    .

    About the Author

    Добавить комментарий

    Ваш адрес email не будет опубликован. Обязательные поля помечены *

    Related Posts