Внутренняя валидность это: Внутренняя валидность психологического исследования — Психологос

Содержание

Внутренняя и внешняя валидность

Внешняя и внутренняя валидность.

Боровкова Виктория И-01

ВАЛИДНОСТЬ (validity)—достоверность (или степень достоверности) вывода, которую обеспечивают результаты реального эксперимента по сравнению с результатами безупречного эксперимента. “В.”—центральное понятие словаря экспериментатора: оно объединяет основные цели исследования с идеальными эталонами их достижения и реальными процедурами проведения экспериментах

Глобальной целью любого экспериментального исследования является обобщение полученных результатов и вывода об экспериментальной гипотезе. Однако полное достижение этой цели возможно лишь в мысленном, безупречном эксперименте, невыполнимом на практике. Реальный эксперимент в той или иной мере репрезентирует (представляет) безупречный, и чем лучше эта репрезентативность, тем выше В. эксперимента. Таким образом, повышение В., т. е. планирование проведения эксперимента в соответствии с его безупречным образцом, является конкретной задачей исследователя, успешность решения которой зависит, во-первых, от характера, реальных условий и, во-вторых, от адекватности выбора средств. Так, источники нарушения В., (прежде всего, ненадежность и смешение) отдаляют реальный эксперимент от безупречного, а способы их контроля, позволяют приблизиться к нему, т. е. обеспечить высокую В. для обобщения экспериментальных результатов. В. полученных данных можно оценить статистически: например, В. теста (в корреляционном исследовании) определяется степенью корреляции результатов его .выполнения с изучаемым видом деятельности испытуемых.

В соответствии с различными типами безупречного эксперимента различают внутреннюю и внешнюю В.:

внутренняя В. — достоверность выводов, которую обеспечивают результаты реального эксперимента по сравнению с результатами идеального бесконечного экспериментов. Повышение внутренней В. связано с устранением результатов действия побочных переменных и с усреднением их изменчивости и нестабильности. Внутренняя В. — первое и необходимое требование к экспериментальным выводам: эксперимент, не обладающий внутренней В., названы автором просто неудачным.

При обладающем внутренней валидностью исследовании исследователь уверен, что результаты, полученные измерением зависимой переменой, непосредственно связаны с независимой переменной, а не с каким-нибудь другим неконтролируемым фактором[2].

Однако, фактически, в науке (особенно в психологии) невозможно со стопроцентной уверенностью утверждать, что внутренняя валидность соблюдена. Например, невозможно изучить какой-то психический процесс отдельно от психики в целом. Поэтому всегда при любом психологическом эксперименте учёный может лишь максимально (но не абсолютно) удалить или минимизировать разнообразные факторы, угрожающие внутренней валидности.

Пример нарушения внутренней валидности

Допустим, мы хотим проверить лекарство, от которого люди будут становиться выше. Допустим, для своих исследований мы отбираем в качестве испытуемых 13-летних подростков, измеряем их рост, и даём им лекарство. Два года спустя мы возвращаемся к теперь уже 15-летним детям и фиксируем их текущий рост. Несомненно то, что они стали выше, но без сомнения и то, что мы не можем сделать из этого вывод, что эффект роста был вызван лекарством, так как мы не учли в своём теоретическом эксперименте естественных процессов взросления. Здесь внутренняя валидность нарушена следующим образом: мы не учли побочного для нашего исследования влияния других (в данном случае — очевидных) факторов, тогда как надо было их учитывать.

внешняя В. — достоверность выводов, которую обеспечивают результаты реального эксперимента по сравнению с результатами эксперимента полного соответствия. Повышение внешней В. обеспечивается достижением соответствия уровней дополнительных переменных в эксперименте уровням этих переменных в изучаемой реальности. Эксперимент, не обладающий внешней В., является неверным, не соответствующим поставленной гипотезе (но, быть может, пригодным для проверки, другой гипотезы).

Внешняя валидность определяет то, в какой мере результаты, полученные в эксперименте, могут соответствовать тому типу жизненной ситуации, которая была исследована, и то, насколько возможно обобщить эти результаты на все подобные жизненные ситуации[1]. Например, критику психологов-экспериментаторов в том, что о студентах-второкурсниках и белых крысах они знают очень много, а обо всём остальном — очень мало, можно рассматривать как критику внешней валидности.

Как и в отношении любой другой валидности, о внешней валидности в исследовании, вероятно, невозможно сказать, что она абсолютно соблюдена, можно указать только на её нарушение. Абсолютным соблюдение внешней валидности считалось бы тогда, когда результаты исследования можно обобщить на любые популяции при любых условиях и в любое время, поэтому учёные говорят не о соблюдении либо несоблюдении внешней валидности, а о степени её соблюдения.

Критерии внешней валидности

Чтобы исследование обладало наивысшей степенью валидности, должна существовать возможность генерализации его результатов на:

-другие популяции,

-другие условия,

-другое время.

Пример нарушения внешней валидности

Исследование Лоренса Колберга, посвящённое изучению нравственного развития детей, было подвергнуто критике за низкую степень внешней валидности. В 1963 году Колберг предложил мальчикам-подросткам разрешить различные коротко сформулированные дилеммы. На основании полученных ответов он разработал теорию о шести стадиях морального развития.

Критика внешней валидности этого исследования в частности состояла в том, что учёный не учитывал половых различий в особенностях мышления способах принятия моральных решений и, следовательно, неправомерно обобщил свою модель на представителей обоих полов.

Колберг также исходил из предпосылки о том, что существуют некие «универсальные принципы справедливости и соблюдения прав личности», однако он не учёл межкультурных различий, следовательно, выводы, которые он сделал, не могут восприниматься как универсальные.

Соблюдение внешней валидности

Чтобы увеличить степень внешней валидности, в исследованиях могут не ограничиваться лишь экспериментальным методом, но также использовать и другие — например, наблюдение, межкультурные исследования и т. д.

При современном научном подходе в психологии соблюдение внешней валидности в исследованиях играет ведущую роль, так как наиболее ценным считается создание общих теорий, моделей и алгоритмов, применимых к психике в целом, независимо от контекста, — то есть моделей, обладающих крайне широкими предсказательными возможностями; поэтому исследования, результаты, которых можно применить только к какой-то определённой ограниченной ситуации, обладают нисходящей ценностью.

Следует отметить, что любую переменную (фактор), отличную от независимой, также оказывающую влияние на зависимую переменную, автор называет просто “ other ” — другая. При переводе для обозначения таких переменных используются два разных термина: “побочная” — применительно к переменной, нарушающей внутреннюю В., и “дополнительная” — переменная, уровень которой входит в экспериментальную гипотезу и должен быть адекватно представлен с целью достижения внешней В. Иногда одни и те же факторы могут выступать в эксперименте и как побочные (нарушающие внутреннюю В.), и как дополнительные (влияющие на внешнюю В.). Устранение и унификация побочных факторов, повышающая внутреннюю В., может приводить к несоответствию уровней дополнительных переменных, что снижает внешнюю В. (см. Соответствие).

-операциональная В.—разновидность внешней В. для лабораторного эксперимента; соответствие (или степень соответствия) применяемых методических процедур тем теоретическим понятиям, которые входят в экспериментальную гипотезу.

Угрозы внутренней валидности

«Угрозы внутренней валидности» — выражение, относящееся к плану исслед., к-рое интерпретаторы данных используют для описания ряда вопросов, возникающих в связи с возможными неточностями при интерпретации причинно-следственных связей между изучаемыми переменными. Некоторые из этих угроз уже упоминались, в частности, при описании квазиэкспериментов. Выражение регрессия к среднему показателю используется для описания эффекта неточного измерения текущего и будущих наблюдений, и она представляет собой серьезную угрозу для внутренней валидности плана психол. исслед.

Другой угрозой является естественное развитие, поскольку испытуемые подвержены естественным процессам созревания и развития с течением времени независимо от манипуляций, которые совершает над ними исследователь. Эта последняя гипотеза, в частности, объясняет необходимость использования в исслед. контрольных групп, позволяющих осуществлять сравнения с естественно развивающимися испытуемыми.

Еще одной угрозой является отсев. Систематическое сокращение количественного состава групп вследствие выбывания, неявок, переезда людей в другой город, незаполненных критериальных опросников, и т. д. может делать менее заметной в результатах исслед. роль тех оставшихся участников, к-рые оказываются в меньшей степени подвержены эксперим. воздействию. А ведь чем более заметны улучшения по критерию, тем лучше выглядит эффективность самого изучаемого воздействия.

Угроза отбора возникает на этапе формирования исслед. состава групп участников. Систематический отбор или пассивный отбор (собственное желание) участников для изучаемого воздействия или условия может приводить к возникновению различий среди некоторых групп перед началом исслед. Эти группы будут по-прежнему отличаться от других и после реализации воздействия — даже когда они сами не подвергались воздействию. Поэтому, для достижения высокой внутренней валидности (причинно-следственных) утверждений в отношении взаимосвязей переменных, необходима формулировка и проверка альтернативной гипотезы о том, какими могли бы быть эти эффекты в отсутствие такого воздействия или условия.

Фон относится к тем изменениям контекста проводящегося исслед., которые могут смешиваться с самими изучаемыми воздействиями. Подобное смешение делает невозможным отнесение изменений в испытуемых на счет исследуемого воздействия или внешних изменений.

Инструментальная погрешность являются угрозой внутренней валидности, почти исключительно присущей психологии, поскольку она возникает в результате происходящих со временем изменений стандартов наблюдателя или условий наблюдения. Эти изменения вызывают различия в оценках. Проблема состоит в том, что подобные расхождения в стандартах измерения могут приводить к ошибочным оценкам тех изменений, которые являются следствием изучаемых воздействий.

Эффект тестирования являются примером другой, почти исключительно присущей психологии, угрозы внутренней валидности. Она связана с эффектом улучшения показателей испытуемых просто в результате предыдущего прохождения теста.

Нестабильность, как было указано выше, вытекает из попыток интерпретировать происходящие непосредственно после эксперимента воздействия или спустя к.-л. время естественные изменения испытуемых и измерений.

Существуют также четыре аффективных угрозы внутренней валидности: подражание, компенсаторное соперничество, компенсаторное уравнивание, и деморализация. Они также присущи исключительно психол. науке, поскольку возникают в результате эмоциональных изменений у испытуемых и проводящего измерения персонала как формы адаптации к тому факту, что они не попали в число «избранных» участников исследования, получающих и осуществляющих эксперимент

Внешняя валидность и метаанализ

Наконец, существует понятие внешней валидности — суммы характеристик исследований, к-рая позволяет осуществлять обобщение или распространение получаемых в исследованиях (как результат высокой внутренней валидности) причинно-следственных утверждений на сходные категории людей, воздействий и критериев за пределами данного исследования.

Метаанализ. Внешняя валидность результатов исследования, существенно усиливается, когда объединяется и обобщается целый ряд исследований одной и той же воздействующей переменной. Такая процедура называется метаанализом. В метаанализе определяются величина эффекта, оказываемого эксперимента, воздействием и основными условиями исследования на критериальные переменные. Последние выбираются в зависимости от теоретических интересов проводящего метаанализ исследователя. Т. о., если основной анализ предполагает сравнение связей всех пар переменных, то набор интересующих метааналитика связей является набором из переменных-условий и критериальных переменных, который позволяет судить о величине эффекта изучаемого воздействия на эти критериальные переменные. Величина эффекта для каждого исследования определяется простым делением разности между средними показателями по критериальной переменной в эксперименты группах и контрольной группе на меру изменчивости индивидуальных показателей в этих группах. В результате такого анализа можно продемонстрировать, что целый ряд изучавшихся переменных условий не оказывают влияния на набор критериев, что позволяет исследователям обобщать результаты своих исследований, не оглядываясь на эти, как было установлено в ходе метаанализа, посторонние условия.

Наконец, можно определить степень влияния каждой переменной-воздействия и их различных сочетаний на критерии. Это представляет особый интерес для прикладных областей, где важно знать не только о том, что одна переменная влияет на другую, но и насколько велико такое влияние.

Персональный сайт — Виды валидности применительно к психологическому исследованию.

Виды валидности применительно к психологическому исследованию.

Валидность исследования – оценка проведенного эмпирического исследования с точки зрения «правильности» его организации, возможности считать полученные рез-ты и сделанные выводы достоверными. Валидность при использовании методов наблюдения или эксперимента включает оценку репрезентативности исследования как степени его приближения к возможным безупречным мысленным образцам.

Валидность эксперимента – это степень соответствия его предполагаемым мысленным образцам. Различают 5 основных видов валидности: внутренняя, внешняя, операциональная, конструктная, популяционная.

Мысленные образцы эксперимента – это критерии, в отношении к которым обсуждаются разные аспекты валидности реально проводимых исследований.

Оценка психологических гипотез включает знание правил статистического вывода и оценки валидности эксперимента (внутренней и операциональной).

Оценка внутренней и операциональной валидностей позволяет оценить возможность артефактных выводов.  Они обеспечивают достоверность вывода о зависимости.

Внутренняя и операциональная оцениваются в любом эксперименте,  внешняя – в естественном; конструктная – при проверке теоретических гипотез; популяционная – при оценке репрезентативности выборки с точки зрения возможности переносить обобщения на популяции.

1. Внутренняя валидность – критерий оценки планирования и проведения исследования, позволяющий считать достоверными выводы относительно именно той зависимости, которая сформулирована в ЭГ, как об отношении между НП и ЗП с точки зрения приближения эксперимента к идеальному и бесконечному.

Ее оценка входит в формальное планирование.  Анализ эквивалентности групп – внутренняя валидность. Угрозы исходят от систематических и несистематических смешений с ПП. Основной источник угроз в межгрупповых схемах – межиндивидуальные различия. Обеспечивает достоверность вывода о зависимости и позволяет оценить возможность артефактных выводов.

2. Внешняя валидность – критерий оценки исследования с т.зр. решения проблем соответствия сформулированных в ЭГ переменных и реализованных методически условий тем, на которые осуществляется обобщение полученных рез-тов (приближение к эксперименту полного соответствия). соответствие реального исследования изучаемой объективной реальности.

Ее оценка входит в содержательное планирование. Позволяет делать обобщение за пределы ситуации. Аспект репрезентативности испытуемых – внешняя валидность. Обеспечивает надежность как устойчивость и воспроизводимость результатов.

3. Операциональная валидность – оценка эксперимента с т. зр. степени соответствия эмпирически нагруженным понятиям НП, ЗП и ДП тех методик задания и измерения переменных, которые используются в исследовании.

Ее оценка входит содержательное и формальное планирование. В лабораторном эксперименте может совпадать с оценкой конструктной валидности. Надежность методик – аспект операциональной валидности. Оценка операциональной валидности связана с тем, насколько удачно совершен переход от формулирования гипотез к выбору методик.

4. Конструктная валидность – аналог внешней валидности; это оценка соответствия представленных в ЭГ переменных теоретическим конструктам и ТГ.

Ее оценка входит в содержательное планирование. От нее зависит оценка возможности обобщения.

5. Популяционная валидность – это оценка того, насколько правомерно распространять обобщения, полученные на ограниченной выборке, на более широкие выборки и популяции.

Оценка этого вида валидности зависит от качества отбора испытуемых из популяции и от стратегий контроля индивидуальных различий. Ее оценка влияет на возможность обобщение за пределы исследования. Репрезентативность выборки – основной аспект оценки популяционной валидности. Выборка испытуемых из популяции не может представлять ее безупречно, но высокая репрезентативность м.б. достигнута при правильных стратегиях отбора испытуемых

Операциональная валидность. Операционализация переменных, операциональная и конструктная валидность

Валидность — соответствие конкретного исследования принятым стандартам (безупреч­ному эксперименту).

Валидность внешняя — соответствие конкретного исследования природной реальности и/или другим подобным исследованиям. Определяет возможность переноса и / или обоб­щения результатов на другие объекты и условия исследования. Зависит от репрезента­тивности выборки и соответствия контролируемых в исследовании дополнительных пе­ременных, их вариативности в других условиях. Частной формой внешней валидности является экологическая валидность, определяющая возможность распространить выво­ды конкретного исследования на реальные условия, а не на иные лабораторные условия.

Валидность внутренняя — соответствие конкретного исследования идеальному; оцени­вает изменение зависимой переменной, определяется влиянием независимой перемен­ной, а не другими причинами. Внутренняя валидность зависит от систематического изме­нения влияния независимой и других переменных от неэквивалентности и изменения сравниваемых групп в ходе эксперимента.

Валидность конструктная — характеризует точность реализации теоретической гипоте­зы в процедуре эксперимента. Является одним из проявлений внутренней валидности. Определяет область явлений, исследуемых в эксперименте. В психологической диагнос­тике конструктная валидность характеризует степень измеряемого свойства в результа­тах тестирования.

Валидность критериальная — отражает соответствие диагноза и прогноза, полученного на основе данных тестирования, деятельностным и жизненным показателям; включает в себя текущую и прогностическую валидность.

Валидность операциональная — соответствие операций экспериментатора теоретиче­скому описанию переменных, контролируемых в исследовании. Варьируемые экспери­ментатором условия должны соответствовать независимой переменной. Операциональ­ная валидность является одним из проявлений внутренней валидности.

35. Привести классификацию экспериментальных планов: доэкспериментальные планы, планы истинных экспериментов и квазиэкспериментальные планы.

Доэксперементальные планы

Квазиэкспериментального планы строятся, исходя из такого определения понятия квазиэксперимента: квазиэкспериментом является исследование, направленное на установление причинно-послед- ного связи между двумя переменными, в котором, однако, отсутствует процедура предварительного выравнивания групп, то есть параллельный контроль с участием контрольной группы заменяется сравнением результатов тестирования группы до и после измерений. Существует несколько видов квазиэкспериментальных планов, например: план для двух неэквивалентных групп с тестированием до и после испытания; план по предыдущим и итоговым тестированием двух рандомизированных групп; планы дискретных временных серий для одной группы или для двух неэквивалентных групп. Квазиэксперимент очень распространены в современной психологии и является не хуже истинные. Для некоторых задач психологического исследования они необходимы и, несмотря на отсутствие процедуры предварительного выравнивания групп, они специальным средством решения проблем экспериментирования, если независимая переменная не является объектом манипулирования исследователя, а избирается им путем отбора неквивалентних групп. Скажем, если задачей эксперимента является проверка, как влияет уровень личностной тревожности учащихся на успешность сдачи ответственного итогового экзамена, специально формируются эквивалентны группы по предварительно измеряемым высоким и низким уровнями тревожности и изучается ее влияние на зависимую переменную — успешность выполнения тестов. Результаты выполнения тестов относятся в зависимость от этой личностной характеристики испытуемых, которая выбрана для создания неэквивалентных групп. Такой квазиэксперимент ничем не уступает реальному. Рассмотрим несколько примеров квазиэкспериментального плана. Например, в эксперименте с неэквивалентного контрольной группой сопоставляются результаты неэквивалентных групп до и после испытания. Это дает возможность осуществить контроль отдельных угроз валидности, причем в экспериментах с такими планами сравниваются изменения показателей — передекспериментального и постекспериментального тестирований в неэквивалентных группах. Эта разница между показателями потом оценивается по критерию t-Стьюдента для установления уровня значимости разногласий. Приведем пример эксперимента с работы Д. Мартина «Психологические эксперименты» . Цель эксперимента заключалась в том, чтобы исследовать, повышается производительность труда работников машиностроительного завода при оплате «от выработки». Независимая переменная — способ оплаты, зависимая переменная — производительность труда. В эксперименте участвовали две группы работников завода. Предварительно измерялась производительность их труда, после чего для одной из групп (группа А), участники которой добровольно согласились на эксперимент, вводилась оплата «от выработки». Измерение после эксперимента показали, что производительность труда участников группы А повышалась. В этом квазиэксперимент есть угрозы валидности, а именно: взаимодействие тестирования с результатами экспериментального воздействия, то есть предыдущий уровень производительности труда, может усиливать экспериментальный влияние. 50. Схемы контроля переменных в эмпирическом исследовании.

36. Объяснить факторный эксперимент. Переменные, гипотезы и схемы в факторном эксперименте.

Доэкспериментальные планы, точнее — исследования, которые проводились и проводятся до сих пор по определенным схемам, не учитывают требований, предъявляемых к плану классического экспериментального исследования. Причина — не­знание этих требований или невозможность их учета при проведении реального ис­следования в конкретных условиях. Исследования по схеме доэкспериментальных планов проводились еще до возникновения теории планирования эксперимента. Доэкспериментальные планы служат, скорее, в качестве иллюстрации. В прак­тике научных исследований по возможности их следует избегать. Квазиэкспериментальные планы являются попыткой учета реалий жизни при проведении эмпирических исследований. Квазиэкспери­ментальные планы создаются специально с отступлением от схемы «истинного экс­перимента». Исследователь осознает те источники артефактов — внешние перемен­ные, которые он не может контролировать. Для частичной компенсации и контроля эффектов, возникающих при нарушении планов «истинных экспериментов», иссле­дователи используют искусственные схемы, которые и называются квазиэкспери­ментальными планами. Квазиэксперимент является своеобразным компромиссом между реальностью и «строгостью» методологических предписаний. Однако квазиэксперимент использу­ется не только для решения прикладных проблем, но и для проведения научных ис­следований. Квазиэкспериментальный план используется тогда, когда применение лучшего плана невозможно.

Понятие валидности эксперимента включает в себя по меньшей мере три основных понятия: операциональной валидности, внешней валидности и внутренней валидности. Рассмотрим эти понятия и реальности, обозначаемые ими, более подробно.

Операциональная валидность

Понятие операциональной валидности тесно связано с определенной проблемой, которая объективно существует не только в экспериментальном, но и в любом другом эмпирическом исследовании. В частности, в экспериментальном исследовании эта проблема состоит в том, что исследуемая реальность представлена в нем двояким образом. Во-первых, в гипотезе исследования она представлена в форме ее словесного описания, а во-вторых, в методике исследования она представлена в форме конкретных явлений, которым свойственны определенные характеристики. Очевидно, что с точки зрения идеальных требований к проведению экспериментального исследования оно должно быть организовано так, чтобы между этими двумя формами представления исследуемой реальности было полное соответствие . Если же это соответствие не достигнуто, то экспериментальное исследование является неадекватным в том смысле, что его результаты нельзя использовать ни для подтверждения, ни для опровержения гипотезы.

В связи с указанной проблемой, понятие операциональная валидность можно определить как правомерность вывода о полноте соответствия исследуемой реальности, представленной в гипотезе исследования в словесной форме, той реальности, которая представлена в методике исследования в форме конкретных явлений.

В зависимости от степени полноты этого соответствия экспериментальное исследование может обладать операциональной валидностью в разной степени, т.е. быть более или менее операционально валидным.

На практике для того, чтобы оценить операциональную валидность экспериментального исследования, необходимо решить вопрос о правомерности соответствия между содержаниями основных терминов, которые используются для описания исследуемой реальности в гипотезе исследования, и тем, как эти содержания представлены в методике исследования.

Для иллюстрации проблемы операциональной валидности можно воспользоваться следующим примером. Допустим, в гипотезе исследования фигурирует термин «объем внимания», означающий количество элементов, которые человек может воспринять одновременно ясно и отчетливо, а в методике исследования для измерения объема внимания используется тахистоскоп, позволяющий зрительно предъявлять одновременно на короткое время набор элементов, и в качестве конкретного явления, характеризующего объем внимания, выступает количество элементов, которые испытуемые могут воспроизвести. В этом случае перед экспериментатором, проводящим это исследование, неизбежнодолжен возникнуть следующий вопрос, непосредственно имеющий отношение к проблеме операциональной валидности, а именно: соответствует ли количество воспроизводимых испытуемыми элементов количеству элементов, воспринимаемых ими ясно и отчетливо. Как известно из истории экспериментальной психологии, В. Вундт допускал существование такого соответствия. Однако в экспериментах Дж. Сперлинга с использованием методики частичного отчета было показано, что количество воспроизводимых испытуемыми элементов может быть меньше количества элементов, воспринимаемых ими ясно и отчетливо. Из приведенного примера следует, что автору этого гипотетического исследования необходимо более тщательно обосновать, почему он считает возможным использовать для измерения объема внимания показатель продуктивности воспроизведения, иначе его исследование может оказаться операционально невалидным.

В любом случае, конструктная валидность обусловливает теоретическую точность экспериментального исследования, т.е. насколько соотносится причинно-следственное отношение, сформулированное в теории, и причинно-следственная связь независимой и зависимой переменных, обнаруженная в результате исследования: « … конструктная валидность имеет отношение к теоретической точности: правильно ли мы объясняем причинно-следственные связи, которые были обнаружены в исследовании? … ».

Другими словами, конструктная валидность выражает точность экспериментальной реализации гипотезы в исследовательской процедуре: « … валидность конструктная – характеризует точность реализации теоретической гипотезы в процедуре эксперимента. Является одним из проявлений внутренней валидности. Определяет область явлений, исследуемых в эксперименте … »

Конструктная валидность контролируется содержательным планированием. Она определяет теоретическую точность конструирования идеального эксперимента. Уверенность в конструктной валидности приходит по мере получения всё большего количества подтверждающих результатов: « … конструктная валидность – особенно подходит для экспериментальных исследований. Она имеет отношение сразу к двум вопросам: является ли оцениваемый конструкт валидным, а инструмент, с помощью которого производится оценка, — наилучшим. Конструктная валиднось тесно связана с сущностью теории, построением гипотеза на основании теории и оценкой теорий, выведенных из результатов исследования. Конструктная валидность как таковая никогда не подтверждается и не разрушается одним исследованием, а также её невозможно доказать по тем же причинам, по каким невозможно доказать теорию. Уверенность в конструктной валидности растёт постепенно по мере получения исследователями подтверждающих результатов … »

Залогом высокой конструктной валидности нашего экспериментального исследования является исторический (креативный) метод обоснования конструекции идеального эксперимента, а практическим подтверждением высокой конструктной валидности исследования является реальный рост учебной мотивации. Как известно, в условиях современного образовательного процесса динамика учебной мотивации имеет противоположный знак.

Операциональная валидность

Ещё один вид внутренней валидности – операциональная валидность. Операциональная валидность обусловливает адекватность методики и плана экспериментального исследования проверяемой гипотезе. Операциональная валидность обусловливает соответствие реального эксперимента теоретической гипотезе, поскольку именно в гипотезе фиксируется характер связи независимой и зависимой переменных: « … валидность операциональная – соответствие операций экспериментатора теоретическому описанию переменных, контролируемых в исследовании. Варьируемые экспериментатором условия должны соответствовать независимой переменной. Операциональная валидность является одним из проявлений внутренней валидности … » .

Другими словами, операциональная ваалидность отвечает за то, что установленная в реальном исследовании связь представляет собой именно ту связь, которая сформулирована в гипотезе: « … решение вопроса о том, что установлена именно представленная в гипотезе связь, а не какая-то другая, зависит от оценки внутренней и операциональной валидности эксперимента … »

Способом контроля операциональной валидности, так же как и конструктной, является содержательное планирование. В данном случае с помощью содержательного планирования была операционализирована «независимая переменная» («схема» организации онтологического общения), «зависимая переменная» (психологическая сложность предметных задач), оценено влияние дополнительной переменной («разный психический возраст учащихся») и найдено решение за счёт дифференциации требований к учащимся различный психических возрастов: « … содержательное планирование включает решение (разрешение) всех вопросов конструктной и операциональной валидности, заключающихся в конкретизации и операционализации НЗП (независимой переменной), ЗП (зависимой переменной) и выбора уровней ДП (дополнительной переменной). Оно предполагает развёртывание содержательных доводов как с точки зрения обоснования экспериментальных гипотез, так и с точки зрения соотнесения используемых психологических конструктов и методических процедур измерения переменных … ».

Внешняя валидность

Внешняя валидность – является мерой соответствия экспериментальной процедуры исследуемому реальному объекту.

На внешнюю валидность влияют дополнительные переменные. Внешняя валидность контролируется путём контроля дополнительных переменных: « … соответствие реального исследования изучаемой объективной реальности назовём внешней валидностью … ».

Внешняя валидность зависит от репрезентативности выборки и сопоставимости контролируемых дополнительных переменных дополнительным переменным в других условиях: « … валидность внешняя – соответствие конкретного исследования природной реальности и/или другим подобным исследованиям. Определяет возможность переноса и/или обобщения результатов на другие объекты и условия исследования. Зависит от репрезентативности выборки и соответствия контролируемых в исследовании дополнительных переменных, их вариативности в других условиях. Частной формой внешней валидности является экологическая валидность, определяющая возможность распространить выводы конкретного исследования на реальные условия, а не на иные лабораторные условия … »

От внешней валидности зависит перенос результатов из лабораторных условий в реальность и обобщение результатов (выводов): « … внешняя валидность … — возможность переноса результатов эксперимента на определённую реально существующую совокупность, ситуацию или условия, отличающиеся от условий эксперимента … »

Поскольку наше исследование во многом организовывалось как полевое (естественное), особые проблемы с внешней валидностью не стояли. В результате экспериментальное обучение было проведено в условиях большого количества дополнительных переменных (наполняемость классов; возраст учащихся; тип образовательных учреждений; степень урбанизированности культурной и социальной среды; культура; этнопсихологические особенности; степень периферийности учебного заведения; стиль преподавания; социально-психологический климат в учебном заведении; социальное происхождение учащихся и пр. и пр.).

Полученные в результате данные свидетельствуют о их высокой внешней (экологической) валидности.

Критериальная валидность

В проведённом исследовании особое значение имел ещё один вид валидности – критериальная валидность. Необходимость её рассмотрения связана с тем, что в условиях экспериментального обучения получаемые результаты всегда соотносятся с критериями, на основании которых производится оценка эффективности и успешности экспериментального обучения: « … валидность названа «критериальной», потому что результаты рассматриваемых измерений соотносятся с некоторым значением или критерием … ».

Важность критериальной валидности заключается в том, что позволяет оценить эффективность экспериментального обучения с возможной эффективностью реальной жизнедеятельности: « … валидность критериальная – отражает соответствие диагноза и прогноза, полученного на основе данных тестирования, деятельностным и жизненным показателям, включает в себя текущую и прогностическую валидность … »

С этой точки зрения критериальная валидность представляет большую важность как мера прогностичности идеального исследования: « … отношение идеального исследования к реальности можно охарактеризовать как теоретическую, или прогностическую, валидность … ».

Пока отдельно были представлены некоторые типы психологических данных — как фиксируемых показателей и в контексте проблемы статистических решений. Теперь следует сделать следующий шаг — раскрыть проблему выбора психологических методик как средств операционализации переменных. По отношению к выборочным значениям ЗП принимаются статистические решения, по значения переменных выступают результатами использования определенных психологических методик.

Чтобы получить данные, психолог фиксирует как психофизиологические показатели, если гипотеза предполагает рассмотрение их связи с изучаемым процессом, так и самоотчеты испытуемых. Он может наблюдать за поведением, а может специально выделять лишь некоторые, методически специально выделенные аспекты активности испытуемого — время реакции, число предложенных решений, особенности ответа в неопределенной ситуации. Он применяет стандартизованные и не стандартизированные методики, с помощью которых фиксируются показатели когнитивной сферы человека (восприятия, внимания, памяти, мышления), а также его эмоционально-личностной сферы (мотивы, характерологические свойства и т.д.).

Из характеристик используемых методик не следует, каким методом проводилось исследование. Внешней характеристикой экспериментального исследования может служить указание на то, что в нем должны присутствовать как минимум две методики: для задания НП и измерения ЗП. И обе они оцениваются в аспектах репрезентативности — конструктов НП и ЗП или соответствия тем реальным условиям, аспекты которых моделируются.

Операциональная наличность — оценка эксперимента с точки зрения степени соответствия эмпирически нагруженным понятиям НП, ЗП и ДП тех методик задания и измерения переменных, которые используются в исследовании.

Наиболее простым путем было бы определение психологической переменной путем связывания ее с методикой получения тех или иных данных. Действительно, если определять различия между понятиями «метод» и «методика», то такой путь покажется логичным. Метод — это наиболее крупная единица анализа типа исследования. Методика — более мелкая единица. Методики могут кочевать из одного исследования в другое и использоваться при разных способах организации исследования.

Психологическая методика — это способы фиксации психологических данных, «техники» построения психологических показателей. С многообразием психологических методик студенты обычно знакомятся в предметном и исследовательском практикумах.

В то же время методика может не выглядеть психологической, но использоваться для задания, скажем, уровней независимой переменной или для измерения зависимой. Например, в оценке разного рода рекламы — как организуемого психологического воздействия — ее эффективность представлена в количестве единиц проданного продукта. Это экономический показатель. Он становится психологической переменной только в одном случае — когда связывается в психологической гипотезе с опосредствующим процессом психологического воздействия. Тогда разные виды рекламы одного и того же товара предстают разными уровнями НП (например, реклама постоянная или нет, в печатных или электронных СМИ и т.д.).

Выделение уровней НП также может осуществляться, казалось бы, безотносительно к арсеналу психологических методик. В приведенном в разделе 5.3.3 примере искусственной среды «Пятое измерение» ее можно трактовать в качестве единого (активного) уровня НП. Тогда контрольным (неактивным) уровнем будут обычные условия обучения и проведения ребенком своего досуга. В многочисленных исследованиях по инженерной психологии сравниваются разные условия выполнения человеком профессиональной деятельности, при том что разница условий задана особенностями используемых приборов, их расположением и т.д. Не продолжая примеров, можно сказать, что психологическими эти уровни экспериментальных факторов становятся именно благодаря тому, что в звене экспериментальной гипотезы они связываются с ожидаемыми изменениями изучаемого базисного процесса.

В самом общем виде под базисным процессом можно понимать центральное звено регуляции изменений, отражаемых в индексах, или показателях, 311. Показатель, фиксируемый методикой как отклик влияния НП, не сводится сам по себе к изучаемому базисному процессу.

В психологическом эксперименте это также входит в этап содержательного планирования исследования — обосновать, что подразумевается под изменениями индекса. Например, за показателем времени реакции можно предполагать совершенно разные процессы (обозначающие, что именно происходит в фиксируемые отрезки времени перед ответом испытуемого).

Если же речь пойдет о более сложных методиках, которые включают существенный пласт толкований психологом того или иного ее индекса, то интерпретационный процесс прямо будет задавать способ конструирования переменной. Например, применительно к проективной методике тематического апперцептивного теста (TAT) Е. Т. Соколовой прослежено изменение способов толкования того, как в рассказах по неопределенным картинкам (фотографиям) можно устанавливать проявление механизмов проекции, психологической защиты и т.д. От конца 30-х к концу 60-х гг. XX в. толкования существенно изменялись в зависимости от включения предположений о проявлении в рассказах испытуемых их рационального «Я» [Соколова, 1980].

Те же виды глубинной мотивации (социогенные потребности в классификации Г. Мюррея) могут диагностироваться с помощью опросника, который был предложен Л. Эдвардсом [Корнилова, 1997]. Проективный тест и вербальный, построенный в опроснике Эдвардса па основе приема вынужденного выбора предпочтений, могут давать разные местоположения испытуемого по отношению к конкретной мотивационной шкале, поскольку подразумевают проявление разных базисных процессов, стоящих за используемыми индексами двух процедурно разных методик.

Таким образом, одни и те же психологические конструкты (мотивация достижения, агрессия, аффилиация и т.д.) операционализируются по-разному. Их различие связано именно с подразумеваемыми механизмами осознанной оценки предпочтения или неосознаваемого проявления в рассказе субъекта той или иной глубинной мотивации (при инструкции «исследуется воображение»).

Итак, наиболее простой путь связывания сути психологической переменной с той или иной методикой может вводить в заблуждение относительно того, что репрезентирует фиксируемый показатель. Более адекватным является иной путь — косвенной реконструкции того, что репрезентируется показателем. Два условия должны выполняться.

Первое . Представленные в гипотезе как эмпирически нагруженные понятия — независимой и зависимой переменных — должны быть операционализированы, т.е. должен быть конкретизирован путь их методического представления в исследовании.

Второе . Эта операционализация должна быть такой, чтобы управление экспериментальным фактором или изменения базисного процесса могли быть представлены в виде той или иной шкалы, т.е. измерены.

Совсем не все методики позволяют выделять переменные. Например, методики наблюдения, предполагающие фиксацию данных в единицах естественного языка или в условных обозначениях, еще не выступают способами выделения переменных. Наблюдать изменения — это еще не значит их измерять. Современные исследования, выполняемые методом наблюдения, включают огромный арсенал стандартизованных методик. По для перехода к процедурам измерения должны выполняться дополнительные условия, в результате чего и достигается возможность выделения правил приписывания чисел психологическим объектам.

Именно измерение переменных выступает условием проведения психологического эксперимента, а также реализации ряда других методов — корреляционного, квазиэксперимента, лонгитюда.

Перечисление событий, установление их частоты — еще не измерение, но процедура, позволяющая строить ЗП. Приведем пример того, как происходит конструирование такой ЗП, когда ее индекс является производным, а не отражает фиксацию какого-либо методически заданного показателя.

В примере с искусственным экспериментальным условием «Пятое измерение» М. Коула, который будет представлен в главе 5 (экскурс 5.8), можно выделять множество переменных. В реальных условиях на пляже психологами была создана особая ситуация отдыха для детей, которые при этом — в игровой ситуации — овладевали рядом средств (в частности, компьютером) своей деятельности. 311 было несколько. Одна из них — упоминания в дневниковых записях студентов, которые работали с детьми, тех или иных «артефактов» в их инструментальном значении или в виде упоминания как ориентиров для опосредствования действий ребенка. Число упоминаний одних и тех же объектов среды в двух контекстах -ориентация на возможность их использования или опосредствование действий их использованием — дало автору возможность проследить временную динамику процесса «культурации» в косвенном (отражаемом помощником психолога) виде.

Рис. 3.1. Динамика переменных, отражающих инструментальное и ориентационное отношение к «артефактам» в созданном игровом контексте

На диаграмме, представленной на рис. 3.1, видно, как растет со временем пребывания в искусственной среде «Пятого измерения» количественный показатель инструментального отношения к ее элементам по сравнению с иной тенденцией — снижением индексов общей ориентировки на элементы среды. Таким образом, в естественных условиях проведения этого исследования выделялись те показатели, динамика которых служила верификации (эмпирической проверке) теоретической гипотезы о роли «артефактов» как задаваемых ребенку средств преобразования его игровой деятельности и тем самым — его развития.

27 Типичные нарушения внутренней валидности вывода

2. Типичные нарушения внутренней валидности вывода

Изменения исторического фона, матурация, несоответствие составов контрольной и экспериментальной групп, отсев респондентов, нестабильность инструментального комплекса, эффект тестирования, реактивный эффект. «Натурные» эксперименты.

На результаты эксперимента оказывают влияние любые события, происходящие во время проведения исследования, особенно если оно занимает продолжительное время. Сама зависимая переменная меняется под влиянием посторонних обстоятельств, и какое из них обусловило изменения, — остается неясным. Причины изменений обозначаются как изменения исторического фона. Под «историей» имеется в виду история эксперимента.

Предположим, проверяется гипотеза о воздействии пропаганды на поведение избирателей. В соответствии со схемой эксперимента осуществляется замер электоральных предпочтений до пропагандистской атаки и после нее. Затем сопоставляются значения этой переменной в двух группах: экспериментальной, подвергавшейся пропагандистскому воздействию, и контрольной, где на избирателей не оказывалось влияния. Предположим, далее, что установлены существенные различия между экспериментальной и контрольной

3 Кэмпбелл Дж, Модели эксперимента в социальной психологии и прикладных исследованиях: Пер. с англ. / Сост. и общ. ред. М.И. Бобневой; Вступ. ст. Г.М. Андреевой. М.: Прогресс, 1980. С.72 — 73.

199

труппами. Однако можем ли мы быть уверены, что различия обусловлены именно пропагандой. За короткий промежуток времени на мнения избирателей могли повлиять различные события: повышение цен, сенсационные разоблачения политических лидеров, рост инфляции. Все эти факторы могут служить основой альтернативных гипотез. Чем больше временной промежуток между претестом и посттестом, тем больше вероятность «исторических» искажений результатов эксперимента.

Модификацией «исторических» изменений являются естественные изменения в самом объекте экспериментирования — «матурация». С течением времени меняется не только внешняя среда, но и внутренние качества испытуемых. Предположим, что экспериментальной проверке подвергается метод преподавания и предварительные измерения отделены от итоговых измерений временем, занимающим почти весь учебный год. Разумеется, за этот период произойдут существенные сдвиги в уровне усвоения материала студентами — здесь нельзя сбрасывать со счетов то обстоятельство, что испытуемые стали взрослее и, вероятно, умнее. Результат может быть вызван и новым методом преподавания, и взрослением экспериментального контингента. Даже если эксперимент длится два-три часа, на его результаты может повлиять усталость и раздражение испытуемых.

Несоответствие составов групп. На внутреннюю валидность вывода оказывают искажающее влияние изменения в составе экспериментальной и контрольной групп. Особенно часто это случается тогда, когда для эксперимента выбираются примерно равные по возрасту классы, студенческие группы. Однако проконтролировать все различия довольно трудно. Например, более высокий уровень сплоченности в одной группе может привести к существенным искажениям результатов. Надежное средство выравнивания составов контрольной и экспериментальной групп — рандомизация.

Отсев испытуемых. Если эксперимент длится долго, вероятность избежать отсева испытуемых по разным причинам довольно высока. Поэтому при осуществлении итоговых измерений невозможно с уверенностью сказать, насколько повлияло выбытие испытуемых на результат. Чаще всего из экспериментов выбывают испытуемые из контрольных групп.

Рекомендуемые файлы

Нестабильность инструментального комплекса. Изменения могут затрагивать не только внешние обстоятельства (фон) и испытуемых, но и измерительный инструментарий исследования. Проблема заключается в том, что в отличие от естественных наук в социологии и психологии измерительные инструменты (в том числе интервьюер) меняются. А смена измерительного комплекса влечет за собой смещение данных. Здесь нельзя менять ни wording, ни калибровку, ни

200

стиль интервьюирования. При экспериментах, связанных с контролем успеваемости студентов, такого рода погрешности практически неизбежны. Необходимо не только сохранить критерии оценки знаний — часто интуитивные, но даже тот психологический настрой, который был присущ экзаменатору в момент первой проверки. Смена экзаменатора в данном случае эквивалентна смене инструмента и препятствует всяким сопоставлениям.

Экспериментальный инструментарий предполагает однократное применение к одному испытуемому. В противном случае возникнет эффект тестирования. Если экспериментатор обратится с тем же тествопросником вторично, результаты замера будут иными, поскольку испытуемый уже знаком с инструментом и будет осознанно или неосознанно корректировать свои реакции, например, стараться вспомнить, что говорил прошлый раз, и воспроизводить свои ответы. Собственно говоря, знакомый испытуемому тест-вопросник — уже другой инструмент, чем тот, который применялся на стадии претеста, и сравнение данных содержит существенную погрешность.

И, наконец, самые существенные искажения связаны с влиянием на результат эксперимента наряду с независимой переменной самой экспериментальной ситуации — часто такое влияние называют реактивным эффектом.

Лучше всего проиллюстрировать возникновение реактивного эффекта на примере проверки нового метода лечения. Зная о том, что на них испытывается новый метод лечения, пациенты обнаруживают заметные улучшения по крайней мере в клинической симптоматике заболевания. Лучше себя чувствуют даже те, кто входит в контрольную группу, т. е, не находится под воздействием экспериментальной переменной.

Влияние инструмента на реакции респондентов может быть самым неожиданным. В литературе хорошо описан «эффект интервьюера», когда ответы в значительной мере обусловлены невольным воздействием личности интервьюера. Реже упоминается, что вопросы, задаваемые в ходе одного интервью, обнаруживают более высокую корреляцию, чем те же вопросы, включенные в разные анкеты. Если вопросы интервью следуют друг за другом, наблюдается «галаэффект»: корреляция между ними выше, чем между такими же, но «отдаленными» вопросами. Корреляция между данными, полученными в один день, выше, чем корреляция между данными, полученными в разные дни.

Следует различать действие экспериментальной переменной и экспериментальной ситуации. В последнем случае мы имеем дело с реактивным эффектом. В медицине от него пытаются избавиться с помощью placebo — контрольным больным дают «видимость» экспе

201

риментальной переменной, например, таблетки такого же цвета и вкуса, какие дают экспериментальным больным. Таким образом, placebo является одним из способов выравнивания эффекта экспериментальной ситуации. В социологии применить placebo практически невозможно.

Имеются и другие факторы, снижающие внутреннюю валидность: взаимодействие фактора отбора с «матурацией», деморализация испытуемых, связанная с кажущимися неудачами; имитация воздействия и т. п.

В лекции «Классификация подземных вод по условиям их происхождения» также много полезной информации.

Нарушения внутренней валидности, обусловленные изменениями «исторических» обстоятельств эксперимента, компенсируются сравнением контрольной и экспериментальной групп — изменения в данном случае затрагивают и тех, и других испытуемых. Аналогичным образом изменения в измерительном инструментарии затрагивают обе группы. Реактивный эффект также оказывает одинаковое воздействие на всех испытуемых. Особенно серьезную опасность представляют посторонние переменные, связанные с недостаточным выравниванием групп.

Внешняя валидность, как уже говорилось, это возможность распространить установленные зависимости за рамки экспериментального материала. При высокой внутренней валидности, т. е. при уверенности, что изменения в переменной х вызывают определенные изменения в переменной у, внешняя валидность может оказаться совершенно неудовлетворительной.

Предполагается, что в отличие от лабораторного эксперимент «на натуре» ближе к жизни. Часто эксперименты, проводимые на улице, на производстве, в общественных учреждениях, по месту жительства и т. п. называют в отличие от лабораторных «естественными». Здесь этические проблемы, связанные с навязыванием ничего не подозревающим людям экспериментальной «легенды», стоят особенно остро.

В литературе имеются десятки примеров замаскированных полевых экспериментов, позволяющих сравнить ситуации с разными значениями независимой переменной. Изучалась реакция публики на «пешеходов» высокого и низкого социального статуса, переходящих проезжую часть на красный сигнал светофора. Разумеется, пешеходами были экспериментаторы, одетые так, как одеваются люди высокого и низкого социального положения. Рассылались письма с просьбой о приеме на работу, при этом в одной группе указывались сведения уголовного характера, в другой — нет. Зависимой переменной в данном случае являлись реакции работодателей. Женщина рядом с автомобилем, у которого села покрышка… В одних случаях она демонстрирует просьбу о помощи, в других — нет. «Нищие», внешний вид которых отчетливо идентифицируется с представителями опре

202

деленных этнических групп, сидят на тротуаре… «Джентльмен» спрашивает прохожих, не уронил ли кто только что найденную долларовую бумажку… Помощники экспериментатора собираются на улице в группы разной величины, а затем устанавливается число прохожих, привлеченных группой. Несколько «хулиганов» на улице пристают к дамам… Письма делового, любовного и «нейтрального» содержания, «по ошибке» попавшие в чужие руки… Перечень подобных естественных экспериментов бесконечен. Однако свидетельствуют ли они о связи переменных — неясно. Остается сомнение: являются ли естественные эксперименты более естественными и валидными, чем эксперименты в лабораториях. Очевидный «минус» естественных экспериментов — нарушение моральных норм, связанное с целенаправленным обманом испытуемых, не дававших согласия на участие в «социодраме». Отчасти исследователей извиняет то обстоятельство, что моделируемые ситуации входят в число повседневных и не связаны с ущербом, кроме незначительной потери времени. Но, бывает, мера превышается. Известны, например, опыты С. Мильгрема с кажущимся применением электрошока к испытуемым, создание ситуаций, связанных с угрозой верной гибели, и т. п.

Внутренняя валидность — Большая Энциклопедия Нефти и Газа, статья, страница 1

Внутренняя валидность

Cтраница 1

Внутренняя валидность каждого тестового задания определяется его способностью обеспечить то, для чего оно предназначено, то есть способностью обеспечить измерение уровня подготовленности испытуемых. В конечном счете это зависит от согласия с моделью Раша тех ответов испытуемых, которые даны на это задание. Внутренняя валидность ответов каждого испытуемого на все задания теста также, по существу, определяется их согласием с этой моделью.  [1]

Заинтересованные читатели могут ознакомиться с подробностями, например, с помощью работ [ 1, с. Результаты такого анализа определяют собой в ТМПТ то, что принято называть внутренней валидностью каждого тестового задания и внутренней валидностью ответов, каждого испытуемого. Внешняя валидность определяется, как обычно, по независимым критериям.  [2]

Заинтересованные читатели могут ознакомиться с подробностями, например, с помощью работ [ 1, с. Результаты такого анализа определяют собой в ТМПТ то, что принято называть внутренней валидностью каждого тестового задания и внутренней валидностью ответов, каждого испытуемого. Внешняя валидность определяется, как обычно, по независимым критериям.  [3]

Внутренняя валидность каждого тестового задания определяется его способностью обеспечить то, для чего оно предназначено, то есть способностью обеспечить измерение уровня подготовленности испытуемых. В конечном счете это зависит от согласия с моделью Раша тех ответов испытуемых, которые даны на это задание. Внутренняя валидность ответов каждого испытуемого на все задания теста также, по существу, определяется их согласием с этой моделью.  [4]

Страницы:      1

Разница между внутренней и внешней валидностью (образование)

Обоснованность говорит о обоснованности дизайна и методов исследования. При проведении эксперимента исследователь ставит перед собой две задачи, касающиеся достоверности, то есть делает выводы о влиянии независимой переменной на исследуемую группу и делает выводы о населении в целом. Первая цель подчеркивает внутренняя валидность, в то время как второй фокусируется на внешняя валидность.

Основное различие между внутренней и внешней достоверностью заключается в том, что первое говорит о связи между переменными, а второе касается универсальности результатов. Для дальнейшего понимания темы, прочитайте эту статью.

Содержание: Внутренняя валидность против внешней валидности

  1. Сравнительная таблица
  2. Определение
  3. Ключевые отличия
  4. Вывод

Сравнительная таблица

Основа для сравненияВнутренняя валидностьВнешняя валидность
СмыслВнутренняя достоверность — это степень, в которой эксперимент свободен от ошибок, и любая разница в измерении обусловлена ​​независимой переменной и ничем иным.. Внешняя достоверность — это степень, в которой результаты исследования могут быть выведены для всего мира..
Обеспокоенконтрольнатуральность
Что это? Это мера точности эксперимента.Он проверяет, могут ли случайные отношения, обнаруженные в эксперименте, быть обобщенными или нет.
ИдентифицируетНасколько сильны методы исследования?Можно ли применить результаты исследования к реальному миру??
ОписываетСтепень, до которой обоснован вывод.Степень, в которой обосновано исследование, чтобы обобщить результат в другой контекст.
Использовал кОбратитесь или исключите альтернативное объяснение результата.Обобщить результат.

Определение внутренней действительности

В статистике внутренняя достоверность используется для обозначения меры точности, которая проверяет обоснованность эксперимента, особенно в отношении смешения. Он измеряет, вызывают ли независимые переменные наблюдаемое влияние на зависимые переменные или нет. Когда наблюдаемые эффекты находятся под влиянием или смешиваются с посторонними переменными, тогда будет трудно сделать обоснованные выводы о взаимосвязи между переменными..

Просто внутренняя действительность относится к степень, в которой обоснованные причинно-следственные связи основаны на эксперименте, установлено, в какой степени эксперимент избегает систематических ошибок.

Высокая внутренняя достоверность позволяет исследователю с достаточной уверенностью выбирать одно объяснение из другого, поскольку оно игнорирует ошибки. Чем меньше путаницы в эксперименте, тем выше его внутренняя обоснованность.

Определение внешней действительности

Термин «внешняя достоверность» подразумевает определение того, можно ли обобщить случайные отношения, наблюдаемые в исследовании, или нет. Это констатирует, Можно ли обобщить результаты, полученные в ходе эксперимента, на другие ситуации и, если да, то на какие параметры, группы людей, время можно экстраполировать?

Внешняя валидность определяет правильность результатов исследования, изучая его применимость от одного параметра к другому. Угрозы внешней достоверности имеют место, когда конкретный набор условий исследования практически не учитывает взаимодействия других переменных реального мира..

Два типа внешней валидности, которая измеряет силу исследования:

  • Достоверность населения
  • Экологическая обоснованность

Ключевые различия между внутренней и внешней валидностью

Представленные вам пункты описывают различия между внутренней и внешней валидностью:

  1. Степень, в которой эксперимент свободен от ошибок и любой разницы в измерении, обусловлен независимой переменной, и ничто другое не известно как независимая переменная. Степень, в которой результаты исследований могут быть выведены для всего мира, известна как зависимая переменная.
  2. Внутренняя валидность — не что иное, как мера точности эксперимента. Напротив, внешняя достоверность проверяет, можно ли обобщить причинно-следственную связь между зависимой и независимой переменными, обнаруженными в эксперименте, или нет..
  3. Внутренняя валидность связана с контролем над посторонними переменными, тогда как внешняя валидность подчеркивает применимость результата к практическим ситуациям..
  4. Внутренняя валидность определяет силу методов исследования и дизайна. И наоборот, внешняя валидность исследует общность результатов исследования с реальным миром..
  5. Внутренняя действительность определяет степень, в которой заключение является обоснованным. В отличие от этого, внешняя достоверность определяет степень, в которой обосновано исследование для обобщения результата в другой контекст.
  6. Внутренняя валидность либо устраняет, либо устраняет альтернативное объяснение результата. Напротив, внешняя валидность используется для обобщения результатов.

Вывод

Ожидается, что экспериментальный дизайн будет иметь как внутреннюю, так и внешнюю валидность. Внутренняя достоверность является наиболее важным требованием, которое должно присутствовать в эксперименте до того, как будут сделаны какие-либо выводы относительно эффектов лечения. Чтобы установить внутреннюю действительность, необходимо контролировать внешнюю действительность. С другой стороны, внешняя валидность является краеугольным камнем хорошего эксперимента, и его немного сложно достичь..

Внешняя валидность и виды обобщений за пределами исследовательской ситуации

Сущность понятия «валидность»

Определение 1

Валидность – это комплексная характеристика методики, которая включает сведения об области исследуемых явлений и репрезентативности диагностической процедуры по отношению к ним.

Данное понятие относится к тому, что эта методика измеряет и как хорошо она это делает. Те тесты, которые не обладают валидностью, для практического использования не годятся.

Уровень валидности – это её коэффициент.

На валидность теста оказывают влияние систематические факторы, привносящие в результаты искажения. К ним относятся другие психические свойства, мешающие в результатах теста проявиться тому свойству, на которое направлен тест.

Например, необходимо измерить потенциал обученности, но время исполнения строго ограничено, и допущенную ошибку исправить невозможно. Таким образом, искомое психическое свойство смешается с другим – «стрессоустойчивостью». Те, у кого стрессоустойчивость высокая, выполнять тест будут лучше. Здесь проявляется эффект систематического искажения. Отсюда, единого и универсального подхода к определению валидности не существует.

Исходя из того, какая сторона валидности будет рассматриваться, будут использоваться и соответствующие способы доказательства.

Замечание 1

Методика имеет столько валидностей, сколько существует критериев.

В первом понимании валидность относится к самой методике – это валидность измерительного инструмента, а проверка получила название теоретической валидизации. Второе понимание относится уже не столько к методике, сколько к цели её использования – это прагматическая валидизация.

Для использования психодиагностических методик в практических целях, они должны быть проверены по ряду формальных критериев, которые являются главным элементом методик и доказывают их эффективность и высокое качество.

Основными критериями оценок являются надежность и валидность.

Критерий валидности представляет собой источник информации об измеряемом психическом свойстве, он не зависит от теста и по отношению к нему является внешним. Говорить о валидности теста можно только тогда, когда его результаты будут сравнимы с источником истиной информации об измеряемом свойстве, т.е. с критерием.

Готовые работы на аналогичную тему

В качестве критерия валидности на практике часто используется прагматический критерий, представляющий собой очевидный признак, проявляемый испытуемым независимо от исследуемого качества. Например, данные о выполнении разных заданий, контрольных проб и данные, полученные при помощи других методик, валидность которых доказана.

Виды валидности

В употребление понятие «валидность» было введено Д. Кемпбеллом, который им обозначил уверенность экспериментатора в том, что с помощью определенной методики, он измеряет именно то, что хотел измерить.

Рисунок 1. Основные виды валидности. Автор24 — интернет-биржа студенческих работ

Валидность эксперимента может быть внутренней и внешней. Признак хорошего эксперимента – это высокая внутренняя валидность и, если экспериментальный эффект вызван изменением независимой переменной, то внутренняя валидность будет выше.

Внутреннюю валидность эксперимента, по мнению Кемпбелла могут нарушить несколько основных факторов:

  • селекция – неэквивалентность, вызывающая систематическую ошибку в результатах;
  • статистическая регрессия является частным случаем селекции;
  • экспериментальный отсев при котором из группы происходит неравномерное выбывание испытуемых;
  • естественное развитие – изменение испытуемых в течение времени.

Теоретическая валидность, определить которую можно по соответствиям показателей исследуемых качеств, получена с помощью созданной методики. Проверить теоретическую валидность можно путем корреляции одного и того же свойства, который измеряется различными методами.

В пределах теоретической валидности выделяют конвергентную, конструктную, эмпирическую, внутреннюю валидность.

Благоприятная ситуация использования конвергентной валидности складывается тогда, когда уже есть в психологии валидная методика, которая проверяет изучаемое качество. Если между показателями этих методик корреляция высокая, то это значит, что для новой методики характерна конвергентная валидность.

Когда для измерения какого-либо свойства тест с известной валидностью не опробирован тогда исследователь выдвигает ряд гипотез – будет ли коррелировать новый тест с другими тестами. В основе выдвигаемых гипотез лежат теоретические представления об измеряемом свойстве. Когда они подтверждаются, то это указывает на валидность выдвигаемого конструкта, т. е. конструктную валидность (предполагаемую).

Что касается эмпирической валидности, то исследователь смотрит, насколько клиент в реальной жизни ведет себя соответственно результатам исследования. Кроме этих видов существует ложная, очевидная валидность, валидность, исходящая из опыта, валидность, основанная на желаниях, валидность всех тестовых методик.

Ложная валидность фиксирует видимость пригодности методики, а очевидная валидность соответствует подлинной только в дидактических тестах и иногда действительно исследует реально существующие факты.

В основе валидности, исходящей из опыта, лежат личные чувства психолога для измерения какого-либо качества испытуемого.

Валидность, основанная на желаниях предполагает желание видеть свою методику валидной, не замечая, при этом, противоречащих этому желанию фактов. Для расчета валидности, как показывает практика, должно быть не меньше 50 человек, но, лучше больше 200.

Внешняя валидность

Замечание 2

Внешняя валидность указывает, на какие популяции, ситуации, независимые переменные, параметры воздействия, переменные измерения можно распространить результаты эксперимента.

Например, можно ли использовать методику обучения плаванию 10-летних детей при обучении студентов.

Внешняя валидность определяет, в какой мере результаты, полученные в эксперименте, соответствуют жизненной ситуации.

Кроме того, она характеризует возможность обобщения переноса экспериментальных результатов на все жизненные условия — время, место, условия и группы людей.

Возможность переноса является следствием двух причин:

  1. когда условия эксперимента соответствуют его «первообразной» ситуации (репрезентативность эксперимента), например, исследование мотивации учащихся, есть репрезентативный эксперимент, потому что все они находятся в ситуации учебной деятельности и мотивированы на учебу;
  2. типичности ситуации для реальности (репрезентативность ситуации).

В эксперименте ситуация, выбранная для моделирования, может быть с точки зрения жизни совсем нерепрезентативной для испытуемых, может являться нетипичной, редкой.

Внешняя валидность делится на операциональную валидность и конструктную, которая объясняет поведение человека при прохождении им теста.

Кемпбелл говорит о причинах нарушения внешней валидности:

  • Реактивный эффект или эффект тестирования – это возможное увеличение или уменьшение восприимчивости испытуемых к экспериментальному воздействию. Результаты тех, кто прошел предварительное тестирование, будут нерепрезентативны относительно тех, кто предварительному тестированию не подвергался;
  • Условия, при которых организуется эксперимент, вызывают у испытуемого реакцию, значит, результат эксперимента нельзя переносить на тех, кто участия в эксперименте не принимал;
  • Взаимная интерференция – испытуемые имеют память и обладают обучаемостью, и если эксперимент будет состоять из нескольких серий, то, безусловно, первые воздействия бесследно для них не пройдут и скажутся на появлении эффектов от последующих воздействий.

Провести «правильное» исследование с учетом всех условий и требований в реальной практике невозможно. Чаще бывает так, что невозможно подобрать репрезентативные выборки, исключить эффекты селекции, выбывания и возможность переноса результатов на всю популяцию.

Общие сведения о внутренней и внешней действительности

Внутренняя и внешняя валидность — это концепции, которые отражают достоверность и значимость результатов исследования. В то время как внутренняя валидность связана с тем, насколько хорошо проведено исследование (его структура), внешняя валидность связана с тем, насколько результаты применимы к реальному миру.

Что такое внутренняя действительность?

Внутренняя валидность — это степень, в которой исследование устанавливает заслуживающую доверия причинно-следственную связь между лечением и результатом.Внутренняя валидность также отражает то, что данное исследование позволяет исключить альтернативные объяснения вывода.

Например, если вы реализуете программу отказа от курения с группой лиц, насколько вы можете быть уверены, что любое улучшение, наблюдаемое в экспериментальной группе, связано с лечением, которое вы провели?

Внутренняя валидность во многом зависит от процедур исследования и от того, насколько строго оно проводится.

Внутренняя валидность — это не концепция типа «да или нет».Вместо этого мы рассматриваем, насколько мы можем быть уверены в результатах исследования, основываясь на том, позволяет ли оно избежать ловушек, которые могут сделать результаты сомнительными.

Чем меньше шансов на «смешение» в исследовании, тем выше внутренняя валидность и тем больше мы можем быть уверены в результатах. Под сомнением понимается ситуация, в которой в игру вступают другие факторы, которые искажают результат исследования. Например, исследование может сделать нас неуверенными в том, можем ли мы доверять тому, что мы определили вышеупомянутый «причинно-следственный» сценарий.

Короче говоря, вы можете быть уверены в том, что ваше исследование внутренне достоверно, только если вы можете исключить альтернативные объяснения своих выводов. Вкратце, вы можете предположить причинно-следственную связь, только если вы соответствуете следующим трем критериям в своем исследовании:

  • Причина предшествовала следствию во времени.
  • Причина и следствие различаются.
  • Других возможных объяснений наблюдаемой вами взаимосвязи нет.

Факторы, улучшающие внутреннюю валидность

Если вы хотите повысить внутреннюю валидность исследования, вы захотите рассмотреть те аспекты дизайна вашего исследования, которые повысят вероятность того, что вы сможете отклонить альтернативные гипотезы.Есть много факторов, которые могут улучшить внутреннюю валидность.

  • Ослепление : участники (а иногда и исследователи), которые не знают, какое вмешательство они получают (например, с помощью плацебо в исследовании лекарств), чтобы избежать искажения этих знаний в их восприятии и поведении и, следовательно, на результатах исследования
  • Экспериментальная манипуляция : Манипулирование независимой переменной в исследовании (например, предоставление курильщикам программы отказа от курения) вместо простого наблюдения ассоциации без проведения какого-либо вмешательства (изучение взаимосвязи между упражнениями и курением)
  • Случайный выбор : Выбор участников наугад или таким образом, чтобы они представляли популяцию, которую вы хотите изучать
  • Рандомизация : случайное распределение участников по экспериментальным и контрольным группам и гарантирует отсутствие систематической ошибки между группами
  • Протокол исследования : Следование определенным процедурам для проведения лечения, чтобы не вызывать каких-либо эффектов, например, при различном поведении одной группы людей по сравнению с другой группой людей

Факторы, угрожающие внутренней валидности

Подобно тому, как существует множество способов убедиться, что исследование является внутренне достоверным, существует также список потенциальных угроз внутренней достоверности, которые следует учитывать при планировании исследования.

  • Исчезновение : участники выбывают из исследования или покидают его, что означает, что результаты основаны на предвзятой выборке только людей, которые не решили уйти (и, возможно, у всех есть что-то общее, например, более высокая мотивация)
  • Смешение : Ситуация, в которой изменения в переменной результата могут считаться результатом некоторой третьей переменной, которая связана с лечением, которое вы назначили.
  • Распространение : Это относится к лечению в исследовании, которое распространяется от экспериментальной группы к контрольной группе через группы, взаимодействующие и разговаривающие или наблюдающие друг за другом.Это также может привести к другой проблеме, называемой обиженной деморализацией, при которой контрольная группа старается меньше, потому что чувствует обиду на группу, в которой они находятся.
  • Исторические события : может повлиять на результаты исследований, проводимых в течение определенного периода времени, например, смена политического лидера или стихийное бедствие, которое влияет на то, как участники исследования себя чувствуют и действуют. иметь иначе.
  • Созревание : описывает влияние времени как переменной в исследовании. Если исследование проводится в течение периода времени, когда возможно, что участники каким-то образом изменились естественным путем (стали старше, устали), то может быть невозможно исключить, были ли эффекты, наблюдаемые в исследовании, просто следствием эффекта. времени.
  • Статистическая регрессия : естественный эффект участников на крайних концах меры, падающий в определенном направлении только по прошествии времени, а не эффект вмешательства
  • Тестирование : многократное тестирование участников с использованием тех же мер влияет на результаты.Если вы дадите кому-то один и тот же тест три раза, не кажется ли, что он лучше справится с ним по мере изучения теста или привыкнет к процессу тестирования и ответит по-разному?

Что такое внешняя действительность?

Внешняя валидность относится к тому, насколько хорошо можно ожидать, что результат исследования будет применим к другим условиям. Другими словами, этот тип достоверности относится к тому, насколько обобщаемы результаты. Например, применимы ли результаты к другим людям, условиям, ситуациям и временным периодам?

Экологическая валидность, аспект внешней валидности, относится к тому, можно ли обобщить результаты исследования на реальный мир.

В то время как строгие методы исследования могут гарантировать внутреннюю валидность, с другой стороны, внешняя валидность может быть ограничена этими методами.

Другой термин, называемый переносимостью, относится к внешней валидности и относится к качественному дизайну исследования. Переносимость относится к тому, переносятся ли результаты в ситуации с аналогичными характеристиками.

Факторы, улучшающие внешнюю валидность

Что вы можете сделать, чтобы повысить внешнюю валидность вашего исследования?

  • Учитывайте психологический реализм. : Убедитесь, что участники воспринимают события исследования как реальные события, рассказав им «прикрытие» о цели исследования.В противном случае в некоторых случаях участники могут вести себя иначе, чем в реальной жизни, если они знают, чего ожидать, или знают, какова цель исследования.
  • Выполните повторную обработку или калибровку. : Используйте статистические методы для устранения проблем, связанных с внешней достоверностью. Например, если в исследовании были неравные группы по какой-либо характеристике (например, возрасту), можно было бы использовать повторное взвешивание.
  • Реплика : повторите исследование с другими образцами или с другими настройками, чтобы увидеть, получите ли вы те же результаты.Когда было проведено много исследований, можно также использовать метаанализ , чтобы определить, является ли эффект независимой переменной надежным (на основе изучения результатов большого количества исследований по одной теме).
  • Попробуйте полевые эксперименты : Проведите исследование вне лаборатории в естественной обстановке.
  • Используйте критерии включения и исключения : Это гарантирует, что вы четко определили популяцию, которую изучаете в своем исследовании.

Факторы, угрожающие внешней действительности

Внешняя валидность оказывается под угрозой, когда исследование не принимает во внимание взаимодействия переменных в реальном мире.

  • Эффекты до и после тестирования : Когда предварительное или последующее тестирование каким-либо образом связано с эффектом, наблюдаемым в исследовании, так что причинно-следственная связь исчезает без этих дополнительных тестов
  • Характеристики выборки : когда какая-то особенность конкретной выборки была ответственна за эффект (или частично ответственна), что приводило к ограниченной обобщаемости результатов
  • Ошибка отбора : Также считается угрозой для внутренней достоверности, систематическая ошибка выбора описывает различия между группами в исследовании, которое может относиться к независимой переменной (опять же, что-то вроде мотивации или желания принять участие в исследовании, конкретные демографические данные людей с большей вероятностью примут участие в онлайн-опросе).
  • Ситуационные факторы : Время дня, местоположение, шум, характеристики исследователя и количество используемых мер могут повлиять на обобщаемость результатов.

Внутренняя и внешняя валидность

Внутренняя и внешняя значимость — две стороны одной медали. Вы можете провести исследование с хорошей внутренней достоверностью, но в целом оно может не иметь отношения к реальному миру. С другой стороны, вы можете провести полевое исследование, которое очень актуально для реального мира, но не даст достоверных результатов с точки зрения знания того, какие переменные повлияли на результаты, которые вы видите.

Сходства

В чем сходство внутренней и внешней действительности? Оба эти фактора следует учитывать при разработке исследования, и оба имеют значение с точки зрения того, имеют ли результаты исследования значение. Оба понятия не являются концепциями «либо / или», и поэтому вы всегда будете решать, в какой степени ваше исследование работает с точки зрения обоих типов достоверности.

Каждая из этих концепций обычно описывается в исследовательской статье, которая публикуется в научном журнале.Это сделано для того, чтобы другие исследователи могли оценить исследование и принять решение о том, являются ли результаты полезными и достоверными.

Отличия

Существенное различие между внутренней и внешней валидностью состоит в том, что внутренняя валидность относится к структуре исследования и его переменным, в то время как внешняя валидность связана с универсальностью результатов. Между ними есть и другие различия.

Внутренняя валидность
  • Выводы гарантированы

  • Управляет посторонними переменными

  • Исключает альтернативные объяснения

  • Ориентация на точность и надежные методы исследования

Внешняя валидность
  • Выводы можно обобщить

  • Результаты применимы к практическим ситуациям

  • Результаты применимы ко всему миру

  • Результаты можно перевести в другой контекст

Внутренняя валидность фокусируется на демонстрации разницы, обусловленной только независимой переменной, тогда как результаты внешней валидности могут быть переведены на мир в целом.

Примеры действия

Примером исследования с хорошей внутренней валидностью может быть гипотеза исследователя о том, что использование определенного приложения внимательности снизит негативное настроение. Чтобы проверить эту гипотезу, исследователь случайным образом распределяет выборку участников в одну из двух групп: тех, кто будет использовать приложение в течение определенного периода, и тех, кто занимается контрольной задачей.

Исследователь следит за тем, чтобы не было систематической предвзятости в распределении участников по группам, а также не позволяет своим научным сотрудникам видеть группы, в которых учащиеся находятся во время экспериментов.

Используется строгий протокол исследования, в котором излагаются процедуры исследования. Возможные искажающие переменные измеряются вместе с настроением, например, социально-экономический статус участников, пол, возраст и другие факторы. Если участники выбывают из исследования, их характеристики изучаются, чтобы убедиться в отсутствии систематической ошибки в отношении того, кто остается в исследовании.

Пример исследования с хорошей внешней валидностью может быть в приведенном выше примере, исследователь также удостоверился, что исследование имело внешнюю валидность, заставив участников использовать приложение дома, а не в лаборатории.Исследователь четко определяет интересующую нас совокупность и выбирает репрезентативную выборку, и он / она воспроизводит исследование для различных технологических устройств.

Слово от Verywell

Чтобы провести эксперимент так, чтобы он имел внутреннюю и внешнюю валидность, необходимо с самого начала помнить о факторах, которые могут повлиять на каждый аспект вашего исследования.

Лучше потратить дополнительное время на разработку структурно обоснованного исследования, имеющего далеко идущие последствия, а не торопиться через этап проектирования только для того, чтобы позже обнаружить проблемы.Только когда и внутренняя, и внешняя валидность высоки, можно сделать убедительные выводы о ваших результатах.

Внутренняя действительность | Определение, угрозы и примеры

Внутренняя достоверность — это степень, в которой вы можете быть уверены, что причинно-следственная связь, установленная в исследовании, не может быть объяснена другими факторами.

Другими словами, можете ли вы обоснованно провести причинно-следственную связь между вашим лечением и реакцией в эксперименте?

Почему важна внутренняя валидность

Внутренняя достоверность делает выводы о причинной связи достоверными и заслуживающими доверия.Без высокой внутренней достоверности эксперимент не может продемонстрировать причинную связь между двумя переменными.

Пример исследования: вы хотите проверить гипотезу о том, что чашка кофе улучшает память. Вы назначаете равное количество участников студенческого возраста на утренние и вечерние занятия в лаборатории. Для удобства вы относите всех участников утреннего сеанса к лечебной группе, а всех участников вечернего сеанса — к контрольной группе.

По прибытии в лабораторию участникам экспериментальной группы дают выпить чашку кофе, а участникам контрольной группы дают воду.Вы также даете обеим группам тесты памяти. Проанализировав результаты, вы обнаружите, что группа лечения показала лучшие результаты, чем контрольная группа, по тесту памяти.

Можете ли вы сделать вывод, что чашка кофе улучшает работу памяти?

Чтобы ваш вывод был действительным, вы должны иметь возможность исключить другие объяснения результатов.

Как проверить, имеет ли ваше исследование внутреннюю валидность

Есть три необходимых условия для внутренней действительности.Все три условия должны выполняться, чтобы экспериментально установить причинно-следственную связь между независимой переменной A (ваша переменная лечения) и зависимой переменной B (вашей переменной ответа).

  1. Переменные вашего лечения и реакции меняются вместе.
  2. Ваше лечение предшествует изменениям в ваших ответных переменных
  3. Никакие мешающие или посторонние факторы не могут объяснить результаты вашего исследования.

В приведенном выше примере исследования были выполнены только два из трех условий.

  • Употребление кофе и улучшение памяти улучшились одновременно.
  • Выпивка кофе произошла перед тестом памяти.
  • Время дня занятий — это посторонний фактор, который в равной степени может объяснить результаты исследования.

Поскольку вы распределили участников по группам на основе расписания, в начале исследования группы были разными. Любые различия в производительности памяти могут быть связаны с разницей во времени суток. Таким образом, вы не можете с уверенностью сказать, улучшило ли время суток или чашечку кофе производительность памяти.

Это означает, что ваше исследование имеет низкую внутреннюю валидность, и вы не можете установить причинно-следственную связь между употреблением кофе и производительностью памяти.

Какой у вас балл за плагиат?

Сравните вашу статью с более чем 60 миллиардами веб-страниц и 30 миллионами публикаций.

  • Лучшая программа для проверки плагиата 2021 года
  • Отчет о плагиате и процентное содержание
  • Самая большая база данных о плагиате

Scribbr Проверка на плагиат

Компромисс между внутренней и внешней достоверностью

Внешняя валидность — это степень, в которой вы можете обобщить результаты исследования на другие показатели, параметры или группы.Другими словами, можете ли вы применить результаты своего исследования в более широком контексте?

Существует неизбежный компромисс между внутренней и внешней достоверностью; чем больше вы контролируете посторонние факторы в своем исследовании, тем меньше вы можете обобщать свои выводы в более широком контексте.

Пример исследования В вашем исследовании кофе и памяти внешняя валидность зависит от выбора теста памяти, критериев включения участников и лабораторных условий. Например, ограничение участников только людьми студенческого возраста повышает внутреннюю валидность за счет внешней валидности — результаты исследования могут быть обобщены только на население студенческого возраста.

Угрозы внутренней действительности и способы борьбы с ними

Угрозы внутренней валидности важно распознавать и противодействовать при разработке надежного исследования. Различные угрозы могут относиться к исследованиям в одной и нескольких группах.

Одногрупповые занятия

Пример исследования (одиночная группа) Исследовательская группа хочет изучить, повышает ли комнатные растения на офисных столах продуктивность ИТ-сотрудников компании. Исследователи дают каждому из участвующих ИТ-сотрудников завод, который он может разместить возле своего рабочего стола для проведения месячного исследования.Все участники выполняют заданное по времени задание на продуктивность до (предварительное тестирование) и после исследования (последующее тестирование).
Угроза Значение Пример
История Несвязанное событие влияет на результаты. За неделю до окончания исследования всем сотрудникам сообщают, что будут увольнения. В день послетеста участники испытывают стресс, и результативность может пострадать.
Созревание Результаты исследования меняются в зависимости от времени. Большинство участников на момент предварительного тестирования впервые приступили к работе. Через месяц их производительность улучшилась за счет времени, проведенного на должности.
Приборы На этапах до и после тестирования используются различные меры. В предварительном тесте производительность измерялась в течение 15 минут, а в последующем — более 30 минут.
Тестирование Предварительный тест влияет на результаты последующего тестирования. Участники показали более высокую продуктивность в конце исследования, потому что был проведен тот же тест. Из-за того, что они были знакомы с целью исследования или были осведомлены о его целях, многие участники достигли высоких результатов.

Как противостоять угрозам в одногрупповых исследованиях

Изменение плана эксперимента может противостоять нескольким угрозам внутренней валидности в исследованиях в одной группе.

  • Добавление сопоставимой контрольной группы противостоит всем угрозам для исследований в одной группе.Если сопоставимые контрольные группы и группы лечения сталкиваются с одинаковыми угрозами, они не повлияют на результаты исследования.
  • Большой размер выборки счетчиков тестирования, потому что результаты будут более чувствительны к любой изменчивости результатов.
  • Использование заданий-заполнителей или анкет для сокрытия цели обучения также позволяет противодействовать тестовым угрозам.

Многогрупповые исследования

Пример исследования (с несколькими группами) Исследователь хочет сравнить, лучше ли приложение для телефона или традиционные карточки для изучения словарного запаса для SAT.Они делят 11-классников из одной школы на три группы на основе исходных (предтестовых) баллов по словарному запасу. В течение 15 минут в день группа A использует приложение для телефона, группа B использует карточки, а группа C тратит время на чтение в качестве контроля. Через три месяца проводятся послетестовые измерения словарного запаса.
Угроза Значение Пример
Смещение выбора Группы несопоставимы в начале исследования. человек с низкими оценками были помещены в группу A, а участники с высокими результатами были помещены в группу B. Поскольку уже существуют систематические различия между группами на исходном уровне, любые улучшения в групповых оценках могут быть вызваны причинами, отличными от лечения.
Регрессия к среднему Согласно статистике, люди, получившие очень низкие или высокие баллы по тесту, в следующий раз набирают средний балл. Поскольку участники распределяются по группам на основе их начальных баллов, трудно сказать, будут ли результаты зависеть от лечения или статистических норм.
Социальное взаимодействие Участники из разных групп могут сравнивать свои записи и либо выяснять цель исследования, либо испытывать обиду на других. Группы B и C могут возмущаться группой A из-за доступа к телефону во время занятий. Таким образом, они могут быть деморализованы и плохо работать.
Истощение Отсев участников 20% участников предоставили непригодные для использования данные. Практически все они были из группы С.В результате трудно сравнивать две экспериментальные группы с контрольной группой.

Как противодействовать угрозам в мультигрупповых исследованиях

Изменение экспериментального плана может противостоять нескольким угрозам внутренней валидности в многогрупповых исследованиях.

  • Случайное распределение участников по группам противодействует систематической ошибке отбора и регрессии к среднему значению, делая группы сопоставимыми в начале исследования.
  • Ослепление участников цели исследования противодействует эффектам социального взаимодействия.

Часто задаваемые вопросы

Внутренняя действительность: определение и примеры

Определения статистики> Внутренняя достоверность

Что такое внутренняя действительность?

Примечание : Если вы не знакомы с смешением, сначала прочтите эту статью:
Confounding Variables

Internal validity — это способ измерить, является ли исследование правильным (т. Е. Было ли исследование проведено правильно?).Это связано с тем, сколько мешающих переменных у вас есть в вашем эксперименте. Если вы проводите эксперимент и избегаете смешанных переменных, ваша внутренняя валидность высока; чем больше вы запутываете, тем ниже ваша внутренняя значимость. В идеальном мире ваш эксперимент имел бы высокую внутреннюю достоверность. Это позволит вам быть уверенным в том, что результаты вашего эксперимента обусловлены только одной независимой переменной.

Случайная выборка помогает повысить достоверность. Изображение: CSUS.edu

Например, предположим, что вы провели эксперимент, чтобы узнать, теряют ли мыши вес, когда они тренируются на колесе. Вы использовали хорошие экспериментальные методы, такие как случайные выборки, и вы использовали контрольные переменные для учета других факторов, которые могут вызвать потерю веса (изменение диеты, болезнь, возраст и т. Д.). Другими словами, вы учли смешанные переменные, которые могут повлиять на ваши данные, и ваш эксперимент имеет высокую достоверность.

С другой стороны, если вы вообще не использовали случайную выборку или контрольные переменные, ваш риск искажения чрезвычайно высок.Следовательно, ваша внутренняя значимость будет очень низкой.

Внешняя и внутренняя достоверность

Внутренняя валидность — это способ оценить, насколько сильны были ваши методы исследования. Внешняя валидность помогает ответить на вопрос: можно ли применить исследование к «реальному миру»? Если ваше исследование применимо к другим ситуациям, внешняя валидность высока. Если исследование не может быть воспроизведено в других ситуациях, внешняя валидность низкая.


Вещи, которые могут повлиять на действительность

Иногда смешивающие переменные могут быть не так очевидны.Список обычных подозреваемых в вещах, которые могут повлиять на внутреннюю валидность, велик. Включает:

  • Регрессия к среднему . Это означает, что участники эксперимента с экстремальными оценками будут стремиться приближаться к среднему.
  • Предметы предварительного тестирования. Это может иметь неожиданные последствия, поскольку может быть невозможно определить, как взаимодействуют предварительное и во время тестирования. Если «логическое рассуждение» является вашей зависимой переменной, участники могут получить подсказки из предварительного теста.
  • Смена инструментов во время учебы.
  • Участники выбыли из исследования. Обычно это большая угроза для экспериментальных проектов с более чем одной группой.
  • Невыполнение протоколов.
  • Что-то неожиданное изменилось во время эксперимента, влияя на зависимую переменную.

Список литературы

Додж Ю. (2008). Краткая энциклопедия статистики. Springer.
Everitt, B. S .; Скрондал, А. (2010), Кембриджский статистический словарь, Cambridge University Press.
Vogt, W.P. (2005). Словарь статистики и методологии: нетехническое руководство для социальных наук. МУДРЕЦ.
Wheelan, C. (2014). Голая статистика. W. W. Norton & Company

————————————————— ————————-

Нужна помощь с домашним заданием или контрольным вопросом? С Chegg Study вы можете получить пошаговые ответы на свои вопросы от эксперта в данной области.Ваши первые 30 минут с репетитором Chegg бесплатны!

Комментарии? Нужно опубликовать исправление? Пожалуйста, оставьте комментарий на нашей странице в Facebook .


Внутренняя валидность в исследовании: определение, угрозы, примеры

Как исследователь, вы можете узнать точность своего исследования только в том случае, если нет никаких факторов, которые могли бы оспорить ваш вывод. Уверенность в результате называется внутренней достоверностью. В этом посте мы рассмотрим концепцию внутренней валидности, ее важность и способы ее проверки.

Что такое внутренняя валидность

Внутренняя валидность — это понятие того, насколько вы уверены в результате своего исследования. Это связано с тем, что чем меньше вероятность смешивания переменных в исследовании, тем выше внутренняя валидность и тем более уверенным в исследовании может быть исследователь.

Это означает, что внутренняя достоверность — это степень, в которой вы можете установить причинно-следственную связь между вашим состоянием лечения и результатом вашего исследования.Это лучший способ избежать ловушек, которые могут повлиять на ваш исследовательский результат.

Внутренняя валидность также показывает, что знание стандартных данных помогает исследователю извлечь незначительные результаты в исследовании. При точном выборе групп образцов и правильном измерении результат взаимосвязи между данными будет действительным.

Читать: 21 Chrome Extensions для академических исследователей

Типы внутренней валидности

Есть 4 основных типа валидности:

. что он был предназначен для измерения.Он хочет проверить, была ли удовлетворена цель проведения теста.

Проверка содержимого проверяет, действительно ли тест поддерживает то, что он хочет проверить. Это относится к используемому методу тестирования. Валидность содержания проверяет, является ли это наиболее подходящим методом для исследования.

Лицевая валидность объясняет, действительно ли содержание или данные исследования отражают цели теста. Это проверяет, достаточно ли собранные данные для проведения теста.

Критерий достоверности определяет, совпадает ли результат теста с результатом другого теста, имеющего те же данные.Это означает, что когда вы завершаете свой тест, он сравнивает результат со стандартным результатом.

Важность внутренней валидности

То, что внутренняя валидность делает для исследования, делает выводы исследователя достоверными. Это делается, когда эксперимент показывает сердечную связь между двумя данными. Высокая внутренняя валидность устраняет дальнейшие сомнения, которые могут возникнуть в связи с исследованием.

Примером может быть ситуация, когда вы решаете провести проверку гипотез о том, улучшает ли здоровье ежедневное яблоко.Затем вы приглашаете добровольцев для участия в вашем исследовании. Вы выбрали четное количество людей среднего возраста, сгруппировали их, распределили по утренним и вечерним группам. Утренняя группа является экспериментальной, а вечерняя — контрольной.

Чтобы подтвердить свою гипотезу, вы даете каждому по яблоку экспериментальной группе и даете каждому по моркови контрольной группе. Также обе группы прошли тестирование на определение состояния их здоровья. После сбора результатов тестирования и их анализа вы понимаете, что экспериментальная группа прошла тестирование лучше, чем контрольная.Достаточно ли этого, чтобы сделать вывод, что одно яблоко в день улучшает здоровье?

Чтобы сделать такой вывод, вы должны сначала исключить другие причины, которые могли бы объяснить результат вашего исследования.

Внутренняя валидность важна для подтверждения достоверности результатов вашего исследования.

Читать: Отчет об исследовании: Определение, Типы + [Руководство по написанию]

Как проверить внутреннюю валидность

Мы можем установить внутреннюю валидность, если присутствуют три необходимых условия.Чтобы определить внутреннюю валидность исследования, эти три условия должны присутствовать, чтобы определить, существует ли связь между вашим лечением (независимые переменные) и вашими мерами контроля (зависимые переменные).

  1. Если ваши лечебные переменные и контрольные переменные взаимодействуют вместе
  2. Если ваше лечение вызывает реакцию в ваших контрольных переменных.
  3. Если никакое непонятное значение (смешивающая переменная) не может объяснить результаты вашего исследования.

Теперь, если вы посмотрите на пример исследования, процитированный выше, два условия из трех заявленных условий, которые должны быть установлены во внутренней действительности, были выполнены.Давайте посмотрим, как они применяются на примере.

  1. Съедание яблока в день и улучшение здоровья произошло вместе.
  2. Поедание яблока произошло до улучшения самочувствия тестовой группы.

Условие номер три, которое не было выполнено в примере, — это время, когда яблоко было съедено.

Поскольку яблоко едят утром, есть вероятность, что ночной сон и утреннее спокойствие повлияли на улучшение.

Таким образом, нельзя быть уверенным, что утреннее употребление яблока несет полную ответственность за улучшение здоровья, зарегистрированное в исследуемой группе.

Отсутствие этого окончательного вывода означает, что ваше исследование не имеет высокой внутренней достоверности. Следовательно, нельзя с уверенностью сделать вывод о причинно-следственной связи между яблоком и хорошим здоровьем.

Чтение: Погрешность — определение, формула + приложение

Угрозы внутренней действительности

Существует три категории угроз внутренней действительности.Эти три категории:

Под угрозами для внутренней валидности из одной группы понимаются угрозы, которые могут возникнуть, когда ваше исследуемое лечение сосредоточено на одной группе. Это относится к критике или сбивающей с толку переменной, которая может возникнуть, когда ваше исследование сосредоточено на одной группе образцов.

Множественные групповые угрозы внутренней достоверности относятся к угрозам и критике, которые могут возникнуть, когда ваше исследование сосредоточено на нескольких группах.

Социальные угрозы внутренней действительности подразумевают угрозы, которые возникают из-за реакции людей на то, что влияет на них и других.

Важно определить угрозы внутренней достоверности исследования. Это поможет исследователям разработать меры контроля для исследования.

Рассмотрим эти 12 угроз внутренней действительности;

1. Истощение: Истощение плохо сказывается на ваших исследованиях, потому что ведет к смещению. Когда ваши участники покинут ваше исследование, ваши выводы будут полагаться на тех участников, которые решили иначе отказаться от исследования.Это, безусловно, повлияет на доверие к вашему исследованию, потому что у вас будет меньше выводов, из которых можно было бы сделать выводы.

2. Смешивающие переменные: Если в вашем исследовании есть дополнительная переменная, связанная с обработкой, которую вы применили к вашей группе выборки, которая влияет на ваши результаты, это приводит к путанице. Смешивающие переменные снижают внутреннюю валидность вашего исследования.

3. Распространение: Это непростой вопрос. Распространение — это когда лечение в исследованиях распространяется от группы, которую вы вводите, к контрольной группе.Это происходит, когда между двумя группами происходит взаимодействие и наблюдение.

Распространение представляет угрозу для ваших исследований, поскольку может привести к тому, что исследователи называют злобной деморализацией. Это когда контрольная группа менее мотивирована, потому что они возмущены группой, в которой они находятся.

4. Предвзятость исследователя: Это когда исследователь ведет себя по-разному по отношению к одной группе. (Это может быть в пользу группы или резко против группы). Эта предвзятость исследователя может повлиять на результаты исследования.

5. Исторические события : Прошедшее событие может прямо или косвенно повлиять на результат исследования через участников. Некоторые вещи, такие как стихийные бедствия или политика, могут повлиять на координацию участников исследования и их работу.

6. Инструментарий: Вы можете направить участников вашего исследования к определенным действиям с помощью используемого метода исследования. Это может привести к тому, что ваши участники будут действовать иначе, чем они бы действовали изначально.

7. Созревание: Это означает, что время следует рассматривать как важную переменную в исследованиях. Если ваши участники стали старше или претерпели биологические (временные) изменения в причине вашего исследования, может быть трудно доказать, что на результаты исследования не повлияло время.

8. Статистическая регрессия: Это угроза для внутренней достоверности, поскольку участники на крайних концах лечения могут естественным образом отклониться от курса, потому что время идет, а не из-за назначенного лечения.

9. Повторное тестирование: Повторное тестирование участников вашего исследования повлияет на результаты вашего исследования. Вполне естественно, что когда вы даете кому-то конкретный тест несколько раз, он к нему привыкает.

10. Выбор предметов: Это предвзятость, которая может возникнуть в результате выбора учебных групп. Если размер вашей выборки невелик, это может вызвать парадокс Симпсона

11. Взаимодействие отбор-созревание: Когда вы выбираете исследуемую группу, разница во времени между назначением лечения группам может привести к противоречивым результатам, и исследователь может сделать вывод, что Проведенное лечение повлияло на результат.Это может быть неправильный вывод.

12. Эффект Джона Генри: Эффект Джона Генри относится к случаю, когда человек по имени Джон Генри превзошел машину в эксперименте, потому что он знал, что эксперимент проводился между ним и машиной.

Как противодействовать угрозам внутренней достоверности

Манипулирование экспериментальным планом может изменить или уменьшить многие угрозы внутренней достоверности. Вот несколько способов сделать это:

  • Включите сопоставимую контрольную группу, чтобы противостоять всем угрозам со стороны экспериментальной группы.противостоит всем угрозам для занятий в одной группе. Если группа лечения и контрольная группа вашего исследования сталкиваются с аналогичными угрозами, угрозы не должны влиять на результаты вашего исследования.
  • Используйте большой размер выборки, чтобы исключить угрозы в вашем тесте. Это обеспечит чувствительность результатов вашего исследования к другим переменным, которые могут появиться в тесте.
  • Вы также можете устранить угрозы в своих тестах, используя в своих исследованиях задачи-заполнители. Это потому, что задания-заполнители скроют истинную цель вашего исследования.
  • Случайным образом распределите участников по группам выборки, чтобы исключить регрессию и систематическую ошибку отбора. Это позволит сопоставить группы до того, как вы начнете тест.
  • Еще один способ эффективно устранить угрозы внутренней достоверности вашего исследования — сделать так, чтобы участники не понимали цели вашего исследования. Это будет препятствовать взаимодействию между вашими учебными группами.
  • Экспериментальная манипуляция: это когда исследователь манипулирует независимой переменной в исследовании.Исследователь применяет вмешательство для экспериментальной группы в течение периода исследования.

Примеры внутренней действительности

Вот три примера внутренней действительности. Посмотрим на них по очереди. Эти примеры показывают, как надлежащие процедуры повышают вероятность внутренней достоверности.

Пример 1

Исследователь выдвинул гипотезу, что приложения-головоломки будут противостоять негативным мыслям. Чтобы проверить гипотезу, исследователь произвольно и равномерно распределил участников на две группы.Группа лечения (те, которые будут использовать приложение) и контрольная группа.

Помимо случайного распределения участников, исследователь убедился, что участники не знали о целях исследования и другой тестовой группе.

Пример 2

Страховая компания хочет выяснить, обеспечит ли переход на гибкий рабочий график удовлетворение от работы среди ее сотрудников.

Чтобы узнать это, они выбрали две группы из своих сотрудников для участия в эксперименте.

Первая группа — это лечебная группа с гибким рабочим временем и контрольная группа с фиксированным рабочим временем.

Эксперимент продлится 9 месяцев. Чтобы получить точный результат по целям исследования, все участвующие сотрудники заполнили анкету, описывающую удовлетворенность их рабочим временем перед тестом, что представляет собой предварительное тестирование. Они также заполнили анкету, чтобы описать свой опыт после теста. Это пост-тест.

Пример 3

Исследование должно проводиться исследователем.Цель исследования — проверить, повышает ли стресс-мяч на офисном столе продуктивность маркетинговой команды ИТ-компании. Исследователь вручил стресс-мяч всем сотрудникам, участвующим в исследовании, которое продлится 3 месяца. Всем участникам было предложено заполнить анкету с указанием уровня их продуктивности до проведения стресс-теста и после исследования.

Приведенные примеры описывают, как можно уменьшить смешение и угрозы для внутренней достоверности при соблюдении надлежащих процедур.

Заключение

В этом посте мы смогли установить, что внутренняя валидность показывает достоверность результатов исследования, исключая другие объяснения, которые могут повлиять на результат теста.

Соберите достоверные данные для своего исследования

Что такое внутренняя валидность в исследованиях? — Определение и примеры — Видео и стенограмма урока

Важность

Вам может быть интересно, почему мы должны заботиться о внутренней действительности.Если люди, которые работают больше всего, получают больше всего, то почему бы просто не сказать, что происходит, и не положить этому конец?

Целью большинства исследований является изучение того, как одна вещь (называемая независимой переменной) влияет на другую (называемую зависимой переменной). Самое сильное утверждение в исследованиях — это причинно-следственная связь. То есть, если мы можем сказать, что независимая переменная вызывает зависимую переменную, мы сделали самое сильное утверждение, какое есть в исследовании.

Но это невозможно, если эксперимент имеет низкую внутреннюю валидность.Помните наш пример сверху? Как мы узнаем, что оплата усложняет работу, если есть другие возможности, например конкуренция или мотивация? Ответ — нет. Вот почему так важна внутренняя обоснованность.

Лучшие эксперименты разработаны, чтобы попытаться исключить возможность того, что что-либо, кроме независимой переменной, вызвало изменения в зависимой переменной. В нашем эксперименте мы попытаемся устранить все остальное, что могло бы вызвать тяжелую работу рабочих.Если мы сможем это сделать, то сможем показать, что чем выше оплата, тем тяжелее работа.

Угрозы

Но разработать исследование, которое позволит вам доказать причинно-следственную связь, не так просто, как может показаться. Это потому, что существует несколько общих угроз внутренней действительности. Это вещи, которые затрудняют доказательство того, что независимая переменная вызывает изменения в зависимой переменной.

Одна угроза внутренней действительности — отбор. Это просто факт, что люди, которых изучают, могут быть ненормальными.Работают ли люди в компании Шона, которым больше всего платят, потому что им много платят, или они получают много, потому что они по своей природе трудолюбивые? Изучая их, мы могли бы изучать просто людей, которые уже много работают; мы случайно выбрали людей, чей опыт не отражает чужой.

Другая угроза внутренней действительности — созревание. Как мы узнаем, что люди не изменятся во время исследования, потому что они повзрослели, а не из-за эффекта независимой переменной? Например, представьте, что мы смотрим на продуктивность Шона до и после того, как он получил повышение, и выясняем, что он стал более продуктивным после повышения.

Но что, если он станет более трудолюбивым, потому что стареет и становится более ответственным? Что, если бы он стал более продуктивным, потому что у него было больше времени на работе и он научился делать ее лучше? Мы не знаем, является ли одна из этих причин причиной или причиной является повышение.

Точно так же, если происходит одноразовое историческое событие, которое влияет на продуктивность Шона, это угроза истории. Может быть, жена Шона родила ребенка примерно в то время, когда он получил повышение; Отцовство сделало его более ответственным и трудолюбивым.

Может быть, мы посмотрим, насколько продуктивен Шон за неделю до повышения и через неделю после повышения. Но что, если неделя до повышения была для него плохой, а через неделю он вернется к своему нормальному уровню продуктивности? Нам кажется, что он работает усерднее, но правда в том, что неделей ранее ему было очень плохо. Эта угроза называется регрессом к среднему.

А что, если наше измерение производительности на самом деле не лучший показатель? Например, мы измеряем, как долго человек остается на работе, но Шон может выполнять свою работу быстрее.Он выполняет тот же объем работы, но за меньшее время. Это проблема с нашим оборудованием.

Что, если мы дадим Шону тест в первую неделю, чтобы определить, насколько он трудолюбив? На второй неделе, после повышения, мы снова даем ему тест. Поскольку он уже прошел тест, он лучше справляется с ним во второй раз. Это называется тестовыми эффектами.

Наконец, что, если мы измеряем продуктивность Шона до повышения, но вскоре после повышения он уходит? Поскольку он больше не работает в компании, мы не можем измерить его производительность после повышения.Этот тип угрозы внутренней валидности называется смертностью, и он случается, когда участники исследования по какой-то причине покидают исследование.

Краткое изложение урока

Эксперимент с высокой внутренней достоверностью может доказать, что независимая переменная вызвала зависимую переменную, а никакая другая переменная не сделала. Это важно для того, чтобы показать причинно-следственную связь между переменными. Однако существует несколько угроз внутренней валидности, включая отбор, созревание, анамнез, регресс к среднему значению, инструменты, тестирование и смертность.

Результаты обучения

По завершении этого урока вы сможете:

  • Определить внутреннюю достоверность
  • Определите важность исследования, имеющего внутреннюю валидность
  • Объясните угрозы внутренней действительности

Внутренняя достоверность — Voxco

Необходимые файлы cookie помогают сделать веб-сайт пригодным для использования, обеспечивая такие основные функции, как навигация по страницам и доступ к защищенным областям веб-сайта.Веб-сайт не может работать должным образом без этих файлов cookie.

Имя Домен Назначение Срок годности Тип
hubspotutk voxco.com Функциональный файл cookie HubSpot. 1 год HTTP
lhc_dir_locale ampifyreach.com 52 года
lhc_dirclass ampifyreach.com 52 года

Маркетинговые файлы cookie используются для отслеживания посетителей на веб-сайтах. Намерение состоит в том, чтобы отображать рекламу, которая актуальна и интересна для отдельного пользователя и, следовательно, более ценна для издателей и сторонних рекламодателей.

Имя Домен Назначение Срок годности Тип
_fbp voxco.com Facebook Pixel реклама собственных файлов cookie 3 месяца HTTP
__hstc voxco.com Файл cookie маркетинговой платформы Hubspot. 1 год HTTP
__hssrc voxco.com Файл cookie маркетинговой платформы Hubspot. 52 года HTTP
__hssc voxco.com Файл cookie маркетинговой платформы Hubspot. Сессия HTTP

Файлы cookie аналитики помогают владельцам веб-сайтов понять, как посетители взаимодействуют с веб-сайтами, путем анонимного сбора и передачи информации.

Имя Домен Назначение Срок годности Тип
_gid voxco.com Кратковременный уникальный идентификатор отслеживания пользователя Google Universal Analytics. 1 дней HTTP
MUID bing.com Файл cookie отслеживания идентификатора пользователя Microsoft, используемый Bing Ads. 1 год HTTP
MR bat.bing.com Файл cookie отслеживания идентификатора пользователя Microsoft, используемый Bing Ads. 7 дней HTTP
IDE двойной щелчок.нетто Рекламный файл cookie Google, используемый для отслеживания пользователей и таргетинга рекламы. 2 года HTTP
_vwo_uuid_v2 voxco.com Универсальный файл cookie отслеживания пользователя визуального оптимизатора веб-сайта (VWO). 1 год HTTP
_vis_opt_s voxco.com Универсальный файл cookie отслеживания пользователя визуального оптимизатора веб-сайта (VWO), который определяет, является ли пользователь новым или возвращается к определенной кампании. 3 месяца HTTP
_vis_opt_test_cookie voxco.com Сессионный (временный) файл cookie, используемый универсальным визуальным оптимизатором веб-сайта (VWO) для определения того, включены ли файлы cookie в браузере пользователя или нет. 52 года HTTP
_ga voxco.com Google Universal Analytics — давний уникальный идентификатор отслеживания пользователей. 2 года HTTP
_uetsid voxco.com Файл cookie для отслеживания универсальных событий (UET) Microsoft Bing Ads. 1 дней HTTP
vuid vimeo.com Файл cookie отслеживания Vimeo 2 года HTTP

Файлы cookie предпочтений позволяют веб-сайту запоминать информацию, которая меняет его поведение или внешний вид, например, ваш предпочтительный язык или регион, в котором вы находитесь.

Имя Домен Назначение Срок годности Тип
__cf_bm узловая точка.com Общий функциональный файл cookie CloudFlare. Сессия HTTP

Неклассифицированные файлы cookie — это файлы cookie, которые мы классифицируем вместе с поставщиками отдельных файлов cookie.

Имя Домен Назначение Срок годности Тип
_gcl_au voxco.com 3 месяца
_gat_gtag_UA_3262734_1 voxco.com Сессия
_clck voxco.com 1 год
_ga_HNFQQ528PZ voxco.com 2 года
_clsk voxco.com 1 дней
visitor_id18452 pardot.com 10 лет
visitor_id18452-hash пардо.com 10 лет
лпв 18452 pi.pardot.com Сессия
lhc_per voxco.com 6 месяцев
_uetvid voxco.com 1 год

Внутренняя валидность — обзор

Внутренняя и внешняя валидность

Причинная связь одной концепции с другой иногда также обсуждается с точки зрения валидности. Внутренняя валидность относится к устойчивости отношения одного понятия к другому, внутреннему по отношению к изучаемому вопросу исследования. Большая часть обсуждения в разделе «Угрозы действительности и тесты на валидность» относятся к внутренней валидности меры по сравнению с другой концепцией, с которой она теоретически коррелирует. Внешняя достоверность относится к большей обобщаемости отношений между двумя исследуемыми концепциями. Применимы ли выявленные отношения вне исследовательского исследования?

Связь между одним показателем и другим может быть истинным отношением, или это может быть ложное отношение, вызванное неверным измерением одного из показателей.То есть две меры могут быть связаны из-за неправильного измерения, а не потому, что эти две меры действительно коррелированы друг с другом. Точно так же две меры, которые действительно связаны, могут остаться необнаруженными, потому что неверное измерение препятствует обнаружению корреляции. К настоящему времени читатель должен осознавать, что не все меры являются полностью верными, и есть надежда, что ошибка, вызванная проецированием теории на реальный мир, мала и беспристрастна, так что взаимосвязи, будь то выводы о том, что две меры коррелированы или не коррелированы, правильно определены.

Все угрозы действительности относятся к силе внутренней достоверности взаимосвязи между двумя показателями, поскольку эти две меры должны быть действительными, чтобы можно было определить истинную взаимосвязь между ними, если таковая существует. Большая часть обсуждения тестов содержания и конвергентной валидности также относится к внутренней валидности. Кроме того, исследователи должны учитывать правила вывода при определении того, являются ли отношения настоящими или ложными. Есть ли неконтролируемые факторы, влияющие на отношения? Классическим примером анализа временных рядов является коинтеграция, перемещение двух рядов вместе во времени, таких как размер населения и размер экономики, или любой другой показатель, который увеличивается или уменьшается с течением времени.В предыдущем примере явки избирателей смешивающее влияние роста неприемлемого населения привело к тому, что исследователи неправильно коррелировали в значительной степени неверную меру снижения явки избирателей с негативной рекламой, упадком социального капитала, ростом кабельного телевидения, финансированием избирательной кампании, смертью поколения Второй мировой войны, глобализации и упадка усилий политических партий по мобилизации избирателей.

Внешняя валидность относится к обобщаемости отношений вне рамок исследования.Возможно, наиболее отличительной чертой социальных наук от точных наук является то, что социологи не могут позволить себе роскошь проводить контролируемые эксперименты. Невозможно вернуться в историю и изменить события, чтобы определить гипотетические противоречия, в то время как физики могут неоднократно сталкивать частицы вместе и наблюдать, как меняющиеся условия меняют результаты. Ближе всего социальные науки подходят к контролируемым экспериментам в лабораторных условиях, где наблюдают, как люди реагируют на стимулы в контролируемых ситуациях.Но применимы ли эти лабораторные эксперименты к реальным ситуациям извне?

В классическом психологическом эксперименте испытуемому, сидящему на стуле, говорят, что кнопка перед ним соединена с электрическим датчиком, прикрепленным ко второму испытуемому. Когда кнопка нажата, подается возрастающее напряжение. Неизвестный субъекту, кнопка прикреплена только к динамику, имитируя крики боли. При определенных обстоятельствах субъекты вынуждены подавать смертельные дозы напряжения.

Такие лабораторные эксперименты поднимают вопрос о том, будут ли в реальных ситуациях испытуемые реагировать аналогичным образом и передавать смертельный заряд другому человеку, т.е. является ли эксперимент внешне достоверным? Психологи, социологи, политологи, экономисты, теоретики когнитивной науки и другие, кто участвует в лабораторных экспериментах в области социальных наук, старательно приближают лабораторию к реальному миру, насколько это возможно, чтобы контролировать сбивающее с толку влияние, которое люди могут вести себя по-разному, если они знают, что наблюдаются.Например, это может быть одностороннее окно для наблюдения за поведением ребенка. К сожалению, иногда лабораторную атмосферу невозможно удалить, например, когда субъекты занимаются компьютерным моделированием, и субъекты, как правило, до начала лабораторного эксперимента знают, что за ними наблюдают.

Внешняя достоверность также является проблемой при прогнозировании, когда взаимосвязи, основанные на наблюдаемых взаимосвязях, могут потерпеть неудачу при прогнозировании гипотетических или ненаблюдаемых событий.Например, экономисты часто описывают фондовый рынок как случайное блуждание. Несмотря на аналитические графики, на которых показаны уровни поддержки и простые линии тренда, не существует модели, которая могла бы предсказать, что произойдет в будущем. По этой причине паевые инвестиционные фонды приходят с оговоркой: «прошлые результаты не являются гарантией будущих доходов». Успешный управляющий паевым инвестиционным фондом, вероятно, будет не более успешным, чем другой в следующем деловом квартале.

Фондовый рынок, пожалуй, лучший пример системы, которая очень быстро реагирует на внешние шоки.Непредвиденные потрясения — это проклятие для прогнозирования. Пока условия остаются постоянными, моделирование будет, по крайней мере, в некоторой степени точным, но если мир кардинально изменится, модель может потерпеть неудачу. Точно так же прогнозы экстремальных значений, выходящие за рамки плана исследования, также могут быть ошибочными, или, когда мир действует в пределах погрешности прогноза, прогнозы, такие как победитель президентских выборов 2000 года, могут быть неопределенными.

About the Author

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Related Posts