Наблюдение сплошное и выборочное в психологии: Сплошное и выборочное наблюдение: теоретический аспект

Содержание

Наблюдение выборочное | Понятия и категории

НАБЛЮДЕНИЕ ВЫБОРОЧНОЕ — метод несплошного статистического наблюдения, при к-ром отобранная с помощью специальных приемов ч. объектов по составу и величине обобщающихся характеристик представляет всю изучаемую совокупность (см. Совокупность генеральная). От других форм несплошного наблюдения выборочный метод отличается тем, что обеспечивает определенные гарантии распространения полученных выводов по части на целое.

К преимуществам Н.в. по сравнению со сплошным следует отнести экономичность, быстроту, гибкость и возможность получения информации более высокого качества. Выборочный метод широко используется там, где получение информации о каждом элементе совокупности невозможно или слишком дорого. При обследовании ч. объектов появляется возможность больше внимания уделять организационным вопросам, в частности контролю качества процедур.

Отправной точкой в истории науч. теории выборочного метода считают работы норвежского статистика А.

Киаэра, который в 1895 впервые внес на обсуждение в Международном институте статистики вопрос о применении выборочного метода как самостоятельного инструмента статистического обследования. До этого времени различного рода несплошные наблюдения проводились во многих странах на фоне переписей населения и, как правило, без основания используемых процедур отбора. В России первые упоминания о практическом применении Н.в. относятся к 70-м гг. 19 в. в связи с изучением условий жизни терского казачества. Затем с середины 1880-х гг. выборочный метод постепенно находит более широкое применение в практике земских статистиков. Именно в стат. практике впервые зародились идеи Н.в. и были разработаны гл. положения метода. Основные предпосылки для корректного применения выборочного метода: требование достаточно большого объема выборочных единиц и равномерность их распределения по пространству генеральной совокупности обеспечивались либо механическим отбором, либо стратификацией совокупности с послед, механическим отбором или отбором типичных объектов.

Однако до нач. 20 в. единственным критерием представительности результатов выборочного наблюдения было лишь их совпадение с данными сплошных исследований.

В 1902 англ. статистик А. Боули впервые дал науч. обоснование выборочного метода на основе теории вероятностей и указал априорные критерии точности результатов. Теория Боули позволяет в зависимости от объема выборочной совокупности определить теоретически допустимые пределы, за которые не выйдут отклонения результатов выборочного исследования о генеральных данных, и в зависимости от допустимой величины этих отклонений определенный минимум объем выборочной совокупности. Для решения этих задач требуется, чтобы каждый элемент совокупности имел равный шанс выбора. Чтобы результаты носили научный характер, способ отбора единиц должен быть строго объективен и лишен всякой, даже бессознательной тенденциозности. В различии между приемами, которыми гарантируется объективность выбора, и коренятся принципиальные различия между отд. формами Н.

в. (см. Выборка случайная, Выборка неслучайная).

Г.Н. Сотникова

Литература:

Четвериков Н. О выборочном иссл-и // Вест, статистики. 1919. № 8—12;

Ковалевский А.Г. Основы теории выборочного метода // Уч. записки Саратовского ун-та. Саратов, 1924;

Бокунин Н.Ч., Чернышева Т.М. Методы выборочных обследований. Минск, 1997;

Juo Poh Seng. Historical Survey of Development of the Sampling Theories and Practice // Journal of the Royal Statistical Society. Ser. A. 1958. V. CXIV. P. 2.

Социологический словарь / отв. ред. Г.В. Осипов, Л.Н. Москвичев. М, 2014, с. 268-269.

Tags:

Социология

Понятие:

Выборочное наблюдение

Наблюдение

Выборочное наблюдение | это… Что такое Выборочное наблюдение?

статистическое наблюдение, при котором исследованию подвергают не все элементы изучаемой совокупности (называемой при этом «генеральной»), а только некоторую, определённым образом отобранную их часть. Отобранная часть элементов совокупности (выборка) будет представлять всю совокупность с приемлемой точностью при двух условиях: она должна быть достаточно многочисленной, чтобы в ней могли проявиться закономерности, существующие в генеральной совокупности; элементы выборки должны быть отобраны объективно, независимо от воли исследователя, так чтобы каждый из них имел одинаковые шансы быть отобранным или же чтобы шансы эти были известны исследователю. Эти условия устанавливаются математической теорией выборочного метода (См. Выборочный метод). Она основана на ряде важнейших теорем теории вероятностей, составляющих так называемый закон больших чисел (см. Больших чисел закон). Лишь при соблюдении этих условий возникает объективная возможность оценить точность В. н. на основании самих выборочных данных. Точность В. н. измеряется с помощью средней ошибки выборки, величина которой прямо пропорциональна степени вариации изучаемых признаков и обратно пропорциональна объёму выборки. В. н. можно произвести быстрее сплошного, с меньшими затратами и получить результаты, по точности мало уступающие результатам сплошного наблюдения, а с учётом же возможности более тщательного наблюдения — даже нередко превосходящие их.

При социально-экономических исследованиях для отбора в большинстве случаев требуется основа выборки, т. е. список или перечень единиц, из которого будет вестись отбор. Объекты на местности, например, дома, населённые пункты, участки территории, удобно отбирать по карте. Полезны также некоторые предварительные сведения о характере изучаемой совокупности для правильного расчёта объёма выборки. Представительность, или репрезентативность, выборки обеспечивается не только её объёмом, но и строгим соблюдением научно обоснованных правил отбора, гарантирующих его объективность. Способы отбора весьма разнообразны. В социально-экономических обследованиях распространён систематический (механический) отбор, т. е. отбор единиц по их списку через установленный интервал. Реже применяется простой случайный отбор, при котором единицы отбираются по жребию, по таблице случайных чисел или иным аналогичным способом. Если предварительно имеются сведения о подлежащей изучению совокупности, то её разбивают на более или менее однородные, типические группы и производят отбор из каждой такой группы отдельно, получая типическую или расслоённую выборку.

Отбирать можно как отдельные элементы (например, людей), так и группы таких элементов (например, семьи). В последнем случае отбор называется гнездовым, или серийным. При обследованиях крупного масштаба выборка производится обычно в несколько ступеней, т. е. сначала отбирают более крупные единицы (например, населённые пункты), а затем в них — более мелкие единицы (семьи). Разные способы отбора на практике обычно комбинируют.

В. н. широко практиковалось русской дореволюционной земской статистикой. Некоторые приёмы, в частности высоко оценённый В. И. Лениным многофазный отбор, не потеряли значения и до настоящего времени. ЦСУ СССР регулярно проводит обследование около 62 тыс. бюджетов семей рабочих, служащих и колхозников, а также ведёт единовременные обследования в разных областях социально-экономической статистики. Выборочным путём получена часть сведений при Всесоюзной переписи населения 1970. Выборочные обследования широко практикуются научными учреждениями, в частности при социологических исследованиях.

Развивается и самостоятельная область В. н. — контроль качества промышленной продукции.

Лит.: Ковалевский А. Г., Основы теории выборочного метода, Саратов. 1924; Боярский А. Я., Старовский В. Н. [и др.], Теория математической статистики, М., 1930 и М., 1931; Юл Дж. Э. и Кендэл М. Дж., Теория статистики, пер. с англ., 14 изд., пересмотр, и расшир., М., 1960; Иойтс Ф., Выборочный метод в переписях и обследованиях, пер. с англ., М., 1965; Выборочное наблюдение в статистике СССР. Сб. статей под ред. А. Я. Боярского [и др.], М., 1966; Дружинин Н. К., Выборочный метод и его применение в социально-экономических исследованиях, М., 1970.

А. Г. Волков.

Методы прямого наблюдения: практическое руководство для исследователей в области здравоохранения

[1] Fix GM, Hyde JK, Bolton RE, Parker VA, Dvorin K, Wu J, Skolnik AA, McInnes DK, Midboe AM, Asch SM, Gifford AL, Bokhour БГ, Моральный дискурс поставщиков услуг по ВИЧ в контексте их организации: этнографическое тематическое исследование, «Образование пациентов».

101(12) (2018) 2226–2232. [Статья PMC бесплатно] [PubMed] [Google Scholar]

[2] Керин С.Л., Майер Дж., Харрод М. и др., Идентификация и характеристика неудач в практике предотвращения передачи инфекционных агентов в больницах: качественное исследование, JAMA Internal Медицина (2018). [Бесплатная статья PMC] [PubMed] [Google Scholar]

[3] Рубинштейн Э.Б., Миллер В.Л., Хадсон С.В. и др., Уход за выжившими после рака в передовой практике первичной медико-санитарной помощи: качественное исследование проблем и возможностей, JAMA Internal Medicine 177 (12) (2017) 1726–1732. [Бесплатная статья PMC] [PubMed] [Google Scholar]

[4] Маккалоу М.Б., Чоу А.Ф., Соломон Дж.Л., Петракис Б.А., Ким Б., Парк А.М., Бенедикт А.Дж., Гамильтон А.Б., Роуз А.Дж., Взаимодействие контекстуальных элементов в реализация: этнографический пример, BMC Health Serv Res 15 (2015) 62. [Бесплатная статья PMC] [PubMed] [Google Scholar]

[5] Кин М., Коуз-Лукас Дж., Карлайн Дж., Маукш Л., Использование формы наблюдения, ориентированной на пациента: Оценка программы онлайн-обучения, Обучение пациентов и консультирование 98(6) (2015) 753–761. [PubMed] [Google Scholar]

[6] Wolfe HL, Fix GM, Bolton RE, Ruben MA, Bokhour BG, Разработка рейтинговых шкал наблюдения для оценки коммуникации, ориентированной на пациента, в рамках целостного медицинского подхода к уходу, Explore (Нью-Йорк) (2020). [Бесплатная статья PMC] [PubMed] [Google Scholar]

[7] Fix GM, Bokhour BG, Понимание контекста переживаний пациентов для изучения соблюдения рекомендаций по вторичной профилактике после операции на сердце, Хроническое заболевание 8(4) (2012) 265–77. [PubMed] [Академия Google]

[8] Sankar A, Golin C, Simoni JM, Luborsky M, Pearson C, Как качественные методы способствуют пониманию приверженности к комбинированной антиретровирусной терапии, Jaids-Journal of Acquired ImmunoDeficiency Syndromes 43 (2006) С54–С68. [Статья бесплатно PMC] [PubMed] [Google Scholar]

[9] ван дер Стратен А., Стадлер Дж., Люкке Э., Лаборде Н., Хартманн М., Монтгомери Э.Т. Перспективы использования пероральных и вагинальных антиретровирусных препаратов для профилактики ВИЧ: Качественное исследование VOICE-C в Йоханнесбурге, Южная Африка, J Int AIDS Soc 17 (3 Приложение 2) (2014) 19146. [Бесплатная статья PMC] [PubMed] [Google Scholar]

[10] Hunleth JM, Steinmetz EK, McQueen A, James AS, Beyond Adherence: Health Care Disparities and the Struggle to Get Screening for Colon Cancer, Качественные исследования в области здравоохранения 26(1) (2016) 17–31. [Бесплатная статья PMC] [PubMed] [Google Scholar]

[11] Bernard HR, Research Methods in Anthropology: Quality and Quantitative Approaches, Alta Mira, Walnut Creek, CA, 2002. [Google Scholar]

[12] Spradley JP, Включенное наблюдение, Холт, Райнхарт и Уинстон 1979. [Google Scholar]

[13] Мид М. Совершеннолетие на Самоа: психологическое исследование примитивной молодежи для западной цивилизации, Уильям Морроу и Ко. 1928. [Google Scholar]

[14] Палинкас Л., Ааронс Г., Хорвиц С., Чемберлен П., Хёрлбурт М., Ландсверк Дж. Смешанные методы в исследованиях по внедрению, администрация и политика в области психического здоровья и исследований служб психического здоровья 38(1) (2011) 44–53. [Бесплатная статья PMC] [PubMed] [Google Scholar]

[15] Fetters MD, Curry LA, Creswell JW, Achieving Integration in Mixed Methods Designs—Principles and Practices, Health Services Research 48(6) (2013). [Бесплатная статья PMC] [PubMed] [Google Scholar]

[16] Вайзель Д.Б., Рубен М.А., Бланч-Хартиган Д., Холл Дж.А., Мейер Э.К., Блюм Р.Х., Сочувствующее и клиническое поведение резидентов в смоделированной встрече с информированным согласием, Анестезиология 132 (1) (2020) 159–169. [PubMed] [Google Scholar]

[17] Бланч-Хартиган Д., Рубен М.А., Холл Дж.А., Шмид Маст М., Измерение невербального поведения в клинических взаимодействиях: практическое руководство, Patient Educ Couns (2018). [PubMed] [Google Scholar]

[18] Kuhn H, Park A, Kim B, Lukesh W, Rose A, Доля работы, подходящая для фармацевтов в антикоагулянтных клиниках, Am J Health Syst Pharm 73(5) (2016) 322–7. [PubMed] [Академия Google]

[19] Амбади Н., Розенталь Р., Полминуты: прогнозирование оценок учителей на основе тонких срезов невербального поведения и физической привлекательности, Журнал личности и социальной психологии 64 (3) (1993) 431–441. [Google Scholar]

[20] Гость Г., Банс А., Джонсон Л. Сколько интервью достаточно? Эксперимент с насыщением и изменчивостью данных, полевые методы 18 (1) (2006) 59–82. [Google Scholar]

[21] Альтманн Дж. Наблюдательное исследование поведения, поведение 48 (1974) 1–41. [Google Scholar]

[22] Мерфи Н.А. Использование тонких срезов для поведенческого кодирования // Журнал невербального поведения. 29(4) (2005) 235–246. [Google Scholar]

[23] Стрит Р.Л., Макул Г., Арора Н.К., Эпштейн Р.М. Как общение исцеляет? Пути, связывающие общение врача и пациента с результатами в отношении здоровья, обучением пациентов и консультированием 74 (3) (2009) 295–301. [PubMed] [Google Scholar]

[24] Ротер Д., Ларсон С., Система анализа взаимодействий Ротера (RIAS): полезность и гибкость для анализа медицинских взаимодействий, Обучающие советы пациентов 46 (4) (2002) 243–51. [PubMed] [Академия Google]

[25] Bylund CL, Makoul G, Эмпатическая коммуникация и гендер в отношениях между врачом и пациентом, Обучающие пациенты 48(3) (2002) 207–16. [PubMed] [Google Scholar]

[26] Musante K, DeWalt BR, Включенное наблюдение: руководство для полевых исследователей, Rowman Altamira; 2010. [Google Scholar]

[27] Suen HK, Ary D, Analyzing Quantitative Behavioral Observation Data, Psychology Press; 1989. [Google Scholar]

[28] Лопетеги М., Йен П.Ю., Лай А., Джеффрис Дж., Эмби П., Пейн П. Исследования движения времени в здравоохранении: о чем мы говорим?, J Biomed Inform 49(2014) 292–9. [Бесплатная статья PMC] [PubMed] [Google Scholar]

[29] Stuckey HL, Kraschnewski JL, Miller-Day M, Palm K, Larosa C, Sciamanna C, «Взвешивание» двух качественных методов: интервью с самоотчетом и прямое Наблюдения за выбором продуктов питания участниками, полевые методы 26(4) (2014) 343–361. [Google Scholar]

[30] Эванс С., Ламберт Х. Реализация общественных мероприятий по профилактике ВИЧ: выводы из проекта по этнографии, социальным наукам и медицине 66 (2) (2008) 467–478. [PubMed] [Академия Google]

[31] Рич М. , Ламола С., Амори С., Шнайдер Л. Астма в жизненном контексте: Видеооценка вмешательства/профилактики (VIA), Педиатрия 105 (3 часть 1) (2000) 469–77. [PubMed] [Google Scholar]

[32] Смит-Моррис С., Лопес Г., Османелли Л., Гетц Л., Диксон-Лоусон К. Этнография, верность и доказательства, которые добавляет антропология: дополнение процесса верности в клинических испытаниях поддерживаемого трудоустройства, Med Anthropol Q 28(2) (2014) 141–61. [PubMed] [Google Scholar]

[33] Goodwin MA, Stange KC, Zyzanski SJ, Crabtree BF, Borawski EA, Flocke SA, Эффект Хоторна в исследованиях прямого наблюдения с участием врачей и пациентов, Journal of Evaluation in Clinical Practice 23(6) (2017) 1322–1328. [Бесплатная статья PMC] [PubMed] [Google Scholar]

[34] Finley EP, Huynh AK, Farmer MM, Bean-Mayberry B, Moin T, Oishi SM, Moreau JL, Dyer KE, Lanham HJ, Leykum L, Hamilton AB, Периодические размышления: метод управляемых дискуссий для документирования явления реализации, Методология медицинских исследований BMC 18(1) (2018) 153. [Бесплатная статья PMC] [PubMed] [Google Scholar]

[35] Evans C, Lambert H, Реализация общественных мероприятий по профилактике ВИЧ: выводы из этнографии проекта, Soc Sci Med 66 (2) (2008) 467–478. [PubMed] [Академия Google]

[36] Bunce AE, Gold R, Davis JV, McMullen CK, Jaworski V, Mercer M, Nelson C, Этнографическая оценка процесса в первичной медико-санитарной помощи: объяснение сложности реализации, BMC Health Serv Res 14(1) (2014) 607. [Бесплатная статья PMC] [PubMed] [Google Scholar]

[37] Leslie M, Paradis E, Gropper MA, Kitto S, Reeves S, Pronovost P, An Ethnographic Study of Health Information Использование технологий в трех отделениях интенсивной терапии, исследования в области здравоохранения 52(4) (2017) 1330–1348. [Бесплатная статья PMC] [PubMed] [Google Scholar]

[38] Neuwirth EB, Bellows J, Jackson AH, Price PM, Как компания Kaiser Permanente использует видеоэтнографию пациентов для улучшения качества, например, при переходе к более качественному уходу, по вопросам здравоохранения 31(6) (2012) 1244–1250. [PubMed] [Google Scholar]

[39] Палинкас Л.А., Зацик Д., Процедура быстрой оценки, информированная клиническая этнография (RAPICE) в прагматических клинических испытаниях внедрения услуг в области психического здоровья: методы и прикладное исследование, Adm Policy Ment Health 46(2) (2019) 255–270. [Бесплатная статья PMC] [PubMed] [Google Scholar]

[40] Боас Ф., Читатель Франца Боаса: формирование американской антропологии, 1883-1911, University of Chicago Press; 1989. [Google Scholar]

[41] Мартин Э. Женщина в теле: культурный анализ репродукции, Beacon Press; 2001. [Google Scholar]

[42] Бенедикт Р. Образцы культуры, Mariner Books; 1989. [Google Scholar]

[43] Голафшани Н. Понимание надежности и достоверности качественных исследований. Качественный отчет. 8(4) (2003) 597–607. [Академия Google]

[44] Raisio H, Планировщики реформы здравоохранения и коварные проблемы: серьезно ли воспринимаются коварные проблемы или их вообще замечают? Журнал организации и управления здравоохранением 23(5) (2009) 477–93. [PubMed] [Google Scholar]

[45] Slattery P, Saeri AK, Bragge P, Совместное проектирование исследований в области здравоохранения: быстрый обзор обзоров, Политика и системы исследований в области здравоохранения / BioMed Central 18(1) (2020) 17. [Бесплатная статья PMC] [PubMed] [Google Scholar]

[46] McCarron TL, Moffat K, Wilkinson G, Zelinsky S, Boyd JM, White D, Hassay D, Lorenzetti DL, Марлетт Н.Дж., Носеворти Т., Понимание вовлеченности пациентов в процесс принятия решений в системе здравоохранения: совместно разработанный предварительный обзор, Syst Rev. 8(1) (2019 г.) 97. [Бесплатная статья PMC] [PubMed] [Google Scholar]

Основы эксперимента – Методы исследования в психологии – 2-е канадское издание

Глава 6: Экспериментальные исследования

Объясните, что такое эксперимент, и определите примеры исследований, которые являются экспериментами, и исследований, которые не являются экспериментами.
Объясните, что такое внутренняя валидность и почему считается, что эксперименты обладают высокой внутренней валидностью.
Объясните, что такое внешняя валидность, и оцените исследования с точки зрения их внешней валидности.
Проведите различие между манипулированием независимой переменной и управлением посторонними переменными и объясните важность каждой из них.
Распознавать примеры смешанных переменных и объяснять, как они влияют на внутреннюю валидность исследования.

Как мы видели ранее в книге, – это тип исследования, специально предназначенный для ответа на вопрос о том, существует ли причинно-следственная связь между двумя переменными. Другими словами, вызывают ли изменения в независимой переменной изменения в зависимой переменной. Эксперименты имеют две основные особенности. Во-первых, исследователи манипулируют или систематически изменяют уровень независимой переменной. Различные уровни независимой переменной называются . Например, в эксперименте Дарли и Латане независимой переменной было количество свидетелей, которые, по мнению участников, присутствовали. Исследователи манипулировали этой независимой переменной, сообщая участникам, что в обсуждении участвовали один, два или пять других студентов, тем самым создавая три условия. Начинающему исследователю легко спутать эти термины, полагая, что в этой ситуации есть три независимые переменные: один, два или пять студентов, участвующих в обсуждении, но на самом деле есть только одна независимая переменная (количество свидетелей) с тремя разными условия (один, два или пять студентов). Вторая фундаментальная особенность эксперимента заключается в том, что исследователь контролирует или минимизирует изменчивость переменных, отличных от независимой и зависимой переменных. Эти другие переменные называются . Дарли и Латане проверили всех своих участников в одной комнате, подвергли их одной и той же чрезвычайной ситуации и так далее. Они также случайным образом распределили своих участников по условиям, чтобы три группы были похожи друг на друга с самого начала. Обратите внимание, что хотя слова «манипулирование» и «контроль» имеют схожие значения в повседневном языке, исследователи проводят между ними четкое различие. Они манипулируют независимой переменной, систематически изменяя ее уровни, и контролируют другие переменные, поддерживая их постоянными.

Когда мы читаем об экспериментах в области психологии с критическим взглядом, возникает один вопрос: «Обосновано ли это исследование?» Однако этот вопрос не так прост, как кажется, потому что в психологии существует множество различных видов валидности. Исследователи сосредоточились на четырех валидностях, чтобы помочь оценить, является ли эксперимент обоснованным (Judd & Kenny, 1981; Morling, 2014) ^[1] ^[2]: внутренняя валидность, внешняя валидность, конструктная валидность и статистическая валидность. Мы подробно изучим каждую валидность.

Внутренняя валидность

Напомним, что две переменные, будучи статистически связанными, не обязательно означают, что одна является причиной другой. «Корреляция не подразумевает причинно-следственной связи». Например, если бы люди, регулярно занимающиеся физическими упражнениями, были счастливее тех, кто не занимается спортом регулярно, это не обязательно означало бы, что занятия спортом повышают уровень счастья людей. Вместо этого это может означать, что большее счастье заставляет людей заниматься спортом (проблема направленности) или что что-то вроде улучшения физического здоровья заставляет людей заниматься спортом и быть счастливее (задача с третьей переменной).

Цель эксперимента, однако, состоит в том, чтобы показать, что две переменные статистически связаны, и сделать это таким образом, чтобы подтвердить вывод о том, что независимая переменная вызвала любые наблюдаемые различия в зависимой переменной. Логика основана на следующем предположении: если исследователь создает два или более очень похожих условия, а затем манипулирует независимой переменной, чтобы получить только одно различие между ними, то любое последующее различие между условиями должно быть вызвано независимой переменной. Например, поскольку единственное различие между условиями Дарли и Латане заключалось в количестве студентов, которые, по мнению участников, участвовали в обсуждении, это различие в убеждениях должно было быть ответственным за различия в оказании помощи между условиями.

Считается, что эмпирическое исследование имеет высокий уровень , если способ его проведения подтверждает вывод о том, что независимая переменная вызвала любые наблюдаемые различия в зависимой переменной. Таким образом, эксперименты обладают высокой внутренней валидностью, потому что способ их проведения — с манипулированием независимой переменной и контролем посторонних переменных — обеспечивает сильную поддержку причинно-следственных выводов.

Внешняя действительность
В то же время то, как проводятся эксперименты, иногда вызывает разного рода критику. В частности, необходимость манипулировать независимой переменной и контролировать внешние переменные означает, что эксперименты часто проводятся в условиях, которые кажутся искусственными (Bauman, McGraw, Bartels, & Warren, 2014) ^[3] .Во многих экспериментах по психологии все участники являются студентами бакалавриата и приходят в класс или лабораторию, чтобы заполнить серию бумажных и карандашных вопросников или выполнить тщательно разработанную компьютеризированную задачу. Рассмотрим, например, эксперимент, в котором исследователь Барбара Фредриксон и ее коллеги предложили студентам бакалавриата прийти в лабораторию на территории кампуса и выполнить тест по математике в купальниках (Fredrickson, Roberts, Noll, Quinn, & Twenge, 199).8) ^[4] .Поначалу эта манипуляция может показаться глупой. Когда студенты бакалавриата когда-нибудь должны будут выполнять тесты по математике в купальниках помимо этого эксперимента?
Мы столкнулись с проблемой . Эмпирическое исследование имеет высокую внешнюю валидность, если способ его проведения позволяет обобщать результаты на людей и ситуации, выходящие за рамки реально изученных. Как правило, исследования имеют более высокую внешнюю валидность, когда участники и изучаемая ситуация аналогичны тем, которые исследователи хотят обобщить, а участники сталкиваются с ними каждый день, что часто описывается как . ^{Представьте, например, что группу исследователей интересует, как на покупателей в крупных продуктовых магазинах влияет то, упакованы ли хлопья для завтрака в желтые или фиолетовые коробки. Их исследование имело бы высокую внешнюю достоверность и высокий реализм, если бы они изучали решения обычных людей, совершающих еженедельные покупки в реальном продуктовом магазине. Если бы покупатели купили намного больше хлопьев в фиолетовых коробках, исследователи были бы вполне уверены, что это увеличение будет справедливо для других покупателей в других магазинах. Однако их исследование было бы относительно низким по внешней валидности, если бы они изучали выборку студентов бакалавриата в лаборатории избирательного университета, которые просто оценивали привлекательность различных цветов, представленных на экране компьютера; однако это исследование имело бы высокие результаты, если бы один и тот же мыслительный процесс использовался как в лаборатории, так и в реальном мире. Если бы учащиеся сочли фиолетовый цвет более привлекательным, чем желтый, исследователи не были бы уверены в том, что это предпочтение имеет отношение к решениям покупателей о покупке хлопьев из-за низкой внешней валидности, но они могли бы быть уверены, что визуальная обработка цветов имеет высокое значение. психологический реализм.}
Однако нам следует быть осторожными, чтобы не сделать опрометчивого вывода, что эксперименты имеют низкую внешнюю валидность. Одна из причин заключается в том, что эксперименты не должны казаться искусственными. Учтите, что эксперимент Дарли и Латане обеспечил достаточно хорошую симуляцию реальной чрезвычайной ситуации. Или рассмотрите полевые эксперименты, которые проводятся полностью за пределами лаборатории. В одном из таких экспериментов Роберт Чалдини и его коллеги изучали, предпочитают ли гости отеля повторно использовать свои полотенца в течение второго дня, а не стирать их, чтобы сэкономить воду и энергию (Cialdini, 2005) ^[5] .Эти исследователи манипулировали сообщением на карточке, оставленной в большом количестве гостиничных номеров. В одной версии сообщения подчеркивалось уважение к окружающей среде, в другой подчеркивалось, что отель пожертвует часть своих сбережений на экологические цели, а в третьей подчеркивалось, что большинство гостей отеля предпочитают повторно использовать свои полотенца. В результате гости, получившие сообщение о том, что большинство постояльцев отелей предпочитают повторно использовать свои полотенца, повторно использовали свои собственные полотенца значительно чаще, чем гости, получившие любое из двух других сообщений. Учитывая то, как они провели свое исследование, весьма вероятно, что их результаты будут справедливы и для других гостей в других отелях.
Вторая причина, по которой не следует делать общий вывод о том, что эксперименты имеют низкую внешнюю валидность, заключается в том, что они часто проводятся для изучения психологических процессов , которые могут проявляться у различных людей и ситуаций. Вернемся к эксперименту Фредриксона и его коллег. Они обнаружили, что женщины в их исследовании, но не мужчины, хуже справлялись с тестом по математике, когда были в купальниках. Они утверждали, что это гендерное различие было связано с большей склонностью женщин объективировать себя — думать о себе с точки зрения стороннего наблюдателя, — что отвлекает их внимание от других задач. Кроме того, они утверждали, что этот процесс самообъективации и его влияние на внимание, вероятно, проявляются у самых разных женщин и ситуаций, даже если ни одна из них никогда не сдает математический тест в купальнике.
Конструктивная валидность
В дополнение к обобщаемости результатов эксперимента еще одним элементом, который необходимо тщательно изучить в исследовании, является качество манипуляций эксперимента, или . Исследовательский вопрос, с которого начали Дарли и Латане, звучит так: «Распространяется ли помогающее поведение?» Они предположили, что участники лаборатории с меньшей вероятностью будут помогать, если будут считать, что кроме них самих есть еще потенциальные помощники. Этот переход от исследовательского вопроса к плану эксперимента называется (дополнительную информацию об определении операции см. в главе 2). Дарли и Латане ввели в действие независимую переменную распределения ответственности, увеличив количество потенциальных помощников. Оценивая этот план, мы бы сказали, что валидность конструкции была очень высокой, потому что манипуляции эксперимента очень четко говорят об исследовательском вопросе; был кризис, способ помочь участнику, и увеличение числа других студентов, вовлеченных в дискуссию, они предоставили способ проверить распространение.
Что, если количество состояний в исследовании Дарли и Латане изменится? Подумайте, если бы было только два условия: один студент участвовал в обсуждении или два. Несмотря на то, что мы можем видеть уменьшение помощи, добавляя еще одного человека, это может быть не явной демонстрацией рассеяния ответственности, а просто присутствием других. Мы могли бы подумать, что это была форма социального торможения Бандуры (обсуждается в главе 4). Конструктивная валидность будет ниже. Однако, если бы было пять условий, возможно, мы бы увидели, что снижение продолжится с большим количеством людей в обсуждении, или, возможно, оно остановится после определенного количества людей. В этой ситуации мы не обязательно узнаем больше о распределении ответственности, или это может стать другим явлением. При добавлении дополнительных условий валидность конструкции может не повыситься. При планировании собственного эксперимента подумайте, насколько хорошо исследовательский вопрос используется в вашем исследовании.
Статистическая достоверность
Обычная критика экспериментов заключается в том, что в исследовании недостаточно участников. Основная причина этой критики заключается в том, что трудно сделать обобщение о населении на основе небольшой выборки. Вначале кажется, что эта критика касается внешней валидности, но есть исследования, в которых небольшие размеры выборки не являются проблемой (в главе 10 будет обсуждаться, как небольшие выборки, даже всего из одного человека, по-прежнему очень полезны для психологических исследований). Таким образом, небольшие размеры выборки на самом деле являются критикой . Статистическая достоверность говорит о том, подтверждают ли статистические данные, проведенные в исследовании, сделанные выводы.
Необходимо провести надлежащий статистический анализ данных, чтобы определить, были ли обнаружены предсказанные различия или взаимосвязи. Количество условий и общее количество участников будут определять общий размер эффекта. С помощью этой информации можно провести анализ мощности, чтобы убедиться, что вы, вероятно, найдете реальную разницу. При разработке исследования лучше всего подумать об анализе мощности, чтобы можно было набрать и протестировать соответствующее количество участников (подробнее о величине эффекта в главе 12). Чтобы спланировать статистически достоверный эксперимент, размышление о статистических тестах в начале планирования поможет убедиться, что результатам можно верить.
Приоритизация достоверности
Эти четыре большие валидности — внутренняя, внешняя, конструкционная и статистическая — полезно иметь в виду, когда читаешь о других экспериментах и планируешь свои собственные. Однако исследователи должны расставить приоритеты, и часто невозможно иметь высокую достоверность во всех четырех областях. В исследовании Чалдини об использовании полотенец в отелях внешняя валидность была высокой, но статистическая валидность была скромнее. Это несоответствие не делает исследование недействительным, но показывает, что можно улучшить для будущих последующих исследований (Goldstein, Cialdini, & Griskevicius, 2008) ^[6] . Морлинг (2014) отмечает, что большинство психологических исследований имеют высокую внутреннюю и конструктивную валидность, но иногда приносят в жертву внешнюю валидность.
Опять же, для независимая переменная означает систематическое изменение ее уровня, так что разные группы участников подвергаются воздействию разных уровней этой переменной, или одна и та же группа участников подвергается воздействию разных уровней в разное время. Например, чтобы увидеть, влияет ли экспрессивное письмо на здоровье людей, исследователь может поручить некоторым участникам писать о травматических переживаниях, а другим — о нейтральных переживаниях. Как обсуждалось ранее в этой главе, различные уровни независимой переменной называются условиями, и исследователи часто дают состояниям короткие описательные имена, чтобы о них было легко говорить и писать. В этом случае состояния можно назвать «травматическим состоянием» и «нейтральным состоянием».
Обратите внимание, что манипулирование независимой переменной должно включать активное вмешательство исследователя. Сравнение групп людей, различающихся по независимой переменной, до начала исследования — это не то же самое, что манипулирование этой переменной. Например, исследователь, который сравнивает здоровье людей, которые уже ведут дневник, со здоровьем людей, которые не ведут дневник, не манипулировал этой переменной и, следовательно, не проводил эксперимент. Это различие важно, потому что группы, которые уже различаются по одному признаку в начале исследования, скорее всего, будут отличаться и по другим признакам. Например, люди, которые предпочитают вести дневники, также могут быть более добросовестными, более интровертными или менее подверженными стрессу, чем люди, которые этого не делают. Следовательно, любое наблюдаемое различие между двумя группами с точки зрения их здоровья могло быть вызвано тем, ведут ли они дневник или нет, или могло быть вызвано любым другим различием между людьми, которые ведут и не ведут дневники. Таким образом, активное манипулирование независимой переменной имеет решающее значение для устранения проблемы с третьей переменной.
Конечно, есть много ситуаций, в которых независимая переменная не может быть изменена по практическим или этическим причинам, и поэтому эксперимент невозможен. Например, нельзя манипулировать тем, имеют ли люди значительный опыт раннего заболевания или нет, что делает невозможным проведение эксперимента по влиянию раннего опыта болезни на развитие ипохондрии. Это предостережение не означает, что невозможно изучить взаимосвязь между ранним опытом болезни и ипохондрией — только то, что это должно быть сделано с использованием неэкспериментальных подходов. Мы подробно обсудим этот тип методологии далее в книге.
Во многих экспериментах независимая переменная является конструкцией, которой можно манипулировать только косвенно. Например, исследователь может попытаться косвенно манипулировать уровнем стресса участников, говоря некоторым из них, что у них есть пять минут, чтобы подготовить короткую речь, которую они затем должны будут произнести перед аудиторией других участников. В таких ситуациях исследователи часто включают 90 113 в свои процедуры. Проверка манипулирования – это отдельная мера конструкции, которой исследователь пытается манипулировать. Например, исследователи, пытающиеся манипулировать уровнем стресса участников, могут дать им бумажный опросник или измерить их кровяное давление — возможно, сразу после манипуляции или в конце процедуры — чтобы убедиться, что они успешно манипулировали этой переменной.
Как мы видели ранее в этой главе, посторонняя переменная – это все, что изменяется в контексте исследования, кроме независимых и зависимых переменных. В эксперименте по влиянию экспрессивного письма на здоровье, например, внешние переменные будут включать переменные участников (индивидуальные различия), такие как их способность писать, их диета и размер их обуви. Они также будут включать переменные ситуации или задачи, такие как время суток, когда участники пишут, пишут ли они от руки или на компьютере, а также погода. Посторонние переменные создают проблему, потому что многие из них могут иметь некоторое влияние на зависимую переменную. Например, на здоровье участников будут влиять многие другие факторы, помимо того, занимаются ли они экспрессивным письмом или нет. Этот влияющий фактор может затруднить отделение влияния независимой переменной от влияния посторонних переменных, поэтому важно посторонние переменные, удерживая их постоянными.
Посторонние переменные затрудняют обнаружение влияния независимой переменной двумя способами. Один из них заключается в добавлении к данным изменчивости или «шума». Представьте себе простой эксперимент по влиянию настроения (счастливого или грустного) на количество счастливых детских событий, которые люди могут вспомнить. Участников настраивают на негативное или позитивное настроение (показывая им счастливый или грустный видеоклип), а затем просят вспомнить как можно больше счастливых событий из детства. В табл. 6.1 показано, как могли бы выглядеть данные, если бы не было посторонних переменных, а количество воспоминаний участников о счастливых детских событиях зависело только от их настроения. Каждый участник в состоянии счастливого настроения вспомнил ровно четыре счастливых события детства, а каждый участник в состоянии грустного настроения вспомнил ровно три. Влияние настроения здесь совершенно очевидно.
Таблица 6.1 Гипотетические бесшумные данные
Количество счастливых детских событий, которые вспоминаются в хорошем настроении Количество счастливых детских событий, которые вспоминаются в грустном настроении
4 3
4 3
4 3
4 3
4 3
4 3
4 3
4 3
4 3
4 3
М = 4 М = 3
В действительности, однако, данные, вероятно, больше походили бы на Таблицу 6. 2. Даже в состоянии хорошего настроения некоторые участники будут вспоминать меньше счастливых воспоминаний, потому что у них меньше возможностей для извлечения информации, они используют менее эффективные стратегии вспоминания или менее мотивированы. И даже в состоянии грустного настроения некоторые участники вспоминали больше счастливых детских воспоминаний, потому что у них было больше счастливых воспоминаний, они использовали более эффективные стратегии вспоминания или были более мотивированы.
Таблица 6.2 Реалистичные шумовые данные
Количество счастливых детских событий, которые вспоминаются в хорошем настроении Количество счастливых детских событий, которые вспоминаются в грустном настроении
3 1
6 3
2 4
4 0
5 5
2 7
3 2
1 5
6 1
8 2
М = 4 М = 3
Хотя средняя разница между двумя группами такая же, как и в идеализированных данных, эта разница гораздо менее очевидна в контексте большей изменчивости данных. Таким образом, одна из причин, по которой исследователи пытаются контролировать посторонние переменные, заключается в том, что их данные больше похожи на идеализированные данные в таблице 6.1, что облегчает обнаружение влияния независимой переменной (хотя реальные данные никогда не выглядят совершенно , что хорошо).
Одним из способов управления внешними переменными является сохранение их постоянными. Этот метод может означать сохранение постоянными переменных ситуации или задачи путем тестирования всех участников в одном и том же месте, предоставления им одинаковых инструкций, одинакового обращения с ними и т. д. Это также может означать, что переменные участников остаются постоянными. Например, многие исследования языка ограничивают участников правшами, у которых языковые области обычно изолированы в левом полушарии мозга. У левшей более вероятно, что их языковые области изолированы в правом полушарии мозга или распределены по обоим полушариям, что может изменить способ обработки речи и, таким образом, добавить шум к данным.
В принципе, исследователи могут контролировать внешние переменные, ограничивая участников одной очень конкретной категорией людей, например, 20-летними, гетеросексуалами, женщинами, правшами, специализирующимися на психологии. Очевидным недостатком этого подхода является то, что он снизит внешнюю валидность исследования, в частности, степень, в которой результаты могут быть обобщены за пределами реально изучаемых людей. Например, может быть неясно, применимы ли результаты, полученные на выборке молодых гетеросексуальных женщин, к гомосексуальным мужчинам старшего возраста. Во многих ситуациях преимущества разнородной выборки перевешивают уменьшение шума, достигаемое однородной выборкой.
Второй способ, которым посторонние переменные могут затруднить обнаружение эффекта независимой переменной, заключается в том, что они становятся мешающими переменными. 90 113 – это внешняя переменная, которая отличается в среднем на 90 126 на 90 127 уровней независимой переменной. Например, почти во всех экспериментах коэффициенты интеллекта участников (IQ) будут посторонней переменной. Но пока есть участники с более низким и более высоким IQ на каждом уровне независимой переменной, так что средний IQ примерно одинаков, тогда такая вариация, вероятно, приемлема (и может быть даже желательна). Однако было бы плохо, если бы участники на одном уровне независимой переменной имели в среднем значительно более низкий IQ, а участники на другом уровне имели бы в среднем значительно более высокий IQ. В этом случае IQ будет смешанной переменной.
Спутать означает спутать, и именно поэтому смешанные переменные нежелательны. Поскольку они различаются в зависимости от условий — как и независимая переменная — они обеспечивают альтернативное объяснение любой наблюдаемой разницы в зависимой переменной. На рисунке 6.1 показаны результаты гипотетического исследования, в котором участники в хорошем настроении набрали больше баллов в задаче на память, чем участники в плохом настроении. Но если IQ является мешающей переменной — участники с положительным настроением имеют в среднем более высокий IQ, чем участники с отрицательным настроением, — тогда неясно, было ли положительное настроение или более высокий IQ причиной того, что участники с первым состоянием оценка выше. Один из способов избежать смешения переменных — оставить лишние переменные постоянными. Например, можно предотвратить превращение IQ в мешающую переменную, ограничив участников только теми, у кого IQ ровно 100. Но этот подход не всегда желателен по причинам, которые мы уже обсуждали. Второй и гораздо более общий подход — случайное присвоение условий — будет подробно рассмотрен в ближайшее время.
Рис. 6.1. Гипотетические результаты исследования влияния настроения на память. Поскольку IQ также различается в зависимости от условий, это смешанная переменная.
Эксперимент — это тип эмпирического исследования, в котором используются манипулирование независимой переменной, измерение зависимой переменной и контроль посторонних переменных.
Исследования обладают высокой внутренней валидностью в той мере, в какой способ их проведения подтверждает вывод о том, что независимая переменная вызвала любые наблюдаемые различия в зависимой переменной. Эксперименты, как правило, имеют высокую внутреннюю достоверность из-за манипулирования независимой переменной и контроля посторонних переменных.
Внешняя валидность исследований высока в той мере, в какой результат можно обобщить на людей и ситуации, выходящие за рамки реально изучаемых. Хотя эксперименты могут показаться «искусственными» и малопривлекательными, важно учитывать, могут ли изучаемые психологические процессы проявляться в других людях и ситуациях.
Практика. Перечислите пять переменных, которыми исследователь может управлять в ходе эксперимента. Перечислите пять переменных, которыми исследователь не может манипулировать в ходе эксперимента.
Практика: Для каждой из следующих тем решите, можно ли изучать эту тему с помощью плана экспериментального исследования, и объясните, почему или почему нет.
Влияние повреждения теменной доли на способность людей выполнять основные арифметические действия.
Влияние клинической депрессии на количество близких друзей.
Влияние группового обучения на социальные навыки подростков с синдромом Аспергера.
Влияние платы людям за прохождение теста IQ на их результаты в этом тесте.
Джадд, К.М. и Кенни, Д.А. (1981). Оценка воздействия социальных вмешательств . Кембридж, Массачусетс: Издательство Кембриджского университета. ↵
Морлинг, Б. (2014, апрель). Научите своих учеников быть лучшими потребителями. Наблюдатель АПС . Получено с http://www.psychologicalscience.org/index.php/publications/observer/2014/april-14/teach-your-students-to-be-better-consumers.html ↵
Bauman, C.W., McGraw, А.П., Бартельс, Д.М., и Уоррен, К. (2014). Пересматривая внешнюю валидность: озабоченность проблемами троллейбусов и другими жертвенными дилеммами в моральной психологии. Компас социальной психологии и психологии личности, 8/9 , 536-554. ↵
Фредриксон, Б.Л., Робертс, Т.-А., Нолл, С.М., Куинн, Д.М., и Твенге, Дж.М. (1998). Купальник становится вами: половые различия в самообъективации, воздержании от еды и математических способностях.