Причинно-следственные связи развития и формирования функциональных заболеваний ЖКТ
Стенограмма выступления профессора Шептулина А.А. на II Международном Интернет Конгрессе специалистов по внутренним болезням (день 2).
Профессор Шептулин А.А.: – Добрый день, глубокоуважаемые коллеги. Следующая сессия будет посвящена функциональным заболеваниям желудочно-кишечного тракта. И я сделаю сообщение о причинно-следственных связях при формировании функциональных расстройств желудочно-кишечного тракта. И в основном речь пойдет о двух заболеваниях: синдроме раздраженного кишечника и функциональной диспепсии. Это самые распространенные функциональные расстройства.
Достаточно сказать, что больные с синдромом раздраженного кишечника составляют 12% среди всех пациентов, которые обращаются к участковым терапевтам, 5% составляют больные с функциональной диспепсией. А вот среди всех больных, которые обращаются к гастроэнтерологу, эти два заболевания: синдром раздраженного кишечника и функциональная диспепсия – составляют более 50%.
Давайте вспомним определение функциональной диспепсии и синдрома раздраженного кишечника по последним Римским критериям III 2006 года. Скоро будут предложены и утверждены Римские критерии IV. Мы пока не знаем, можем только предполагать о том, какие изменения в них будут даны. Пока ориентируемся на Римские критерии III. Применительно к функциональной диспепсии, они включают в себя три положения.
Прежде всего, это определенный комплекс клинических симптомов для функциональной диспепсии: боли или ощущение жжения в подложечной области, раннее насыщение, чувство переполнения в подложечной области после еды. Обязательным условием постановки диагноза функциональной диспепсии является отсутствие признаков органического поражения верхних отделов желудочно-кишечного тракта при обследовании больного. И необходима также определенная длительность клинических симптомов.
Эти симптомы должны наблюдаться в течение трех последних месяцев при общей продолжительности в течение полугода.Если говорить об определении синдрома раздраженного кишечника, то он определяется как комплекс функциональных расстройств, продолжающихся не менее трех дней в месяц также на протяжении последних трех месяцев, и включает в себя следующие симптомы: боль или ощущение дискомфорта в животе. При этом боли характеризуются следующими особенностями: они связаны с актом дефекации, они исчезают или уменьшаются после акта дефекации и сочетаются с изменением частоты стула (урежение или учащение) и с изменениями его консистенции. Общая продолжительность жалоб, необходимая для постановки диагноза, должна быть не менее шести месяцев.
Если посмотреть в отношении сочетания синдрома раздраженного кишечника и функциональной диспепсии, насколько возможно и насколько часто встречается такое сочетание, я приведу выдержку из Римских критериев II, которые предшествовали Римским критериям III.
В Римских критериях II говорилось, что у большинства пациентов с функциональной диспепсией при правильной интерпретации их жалоб нет выраженных кишечных расстройств, и сочетание синдрома раздраженного кишечника и функциональной диспепсии отмечается лишь у отдельных больных. Но, как говорится, времена меняются, а с ними меняемся и мы, и наше представление о вещах. И уже в Римских критериях III было отмечено, что перекрест сочетания симптомов функциональной диспепсии и кишечных расстройств, свойственных синдрому раздраженного кишечника встречается нередко. Наличие синдрома раздраженного кишечника не исключает диагноза других функциональных расстройств желудочно-кишечного тракта.
Есть таблицы, в которых указано, насколько часто встречается сочетание синдрома раздраженного кишечника и функциональной диспепсии. Частота синдрома раздраженного кишечника у больных функциональной диспепсией колеблется от 13% до 70%. В свою очередь, частота сопутствующей функциональной диспепсии у больных с синдромом раздраженного кишечника – от 23% до 87%. Такой большой размах в цифрах определяется тем, что авторы, которые приводили те или иные данные, пользовались различными критериями для постановки диагноза СРК и ФД: Римские критерии III, Римские критерии II, Римские критерии I и даже старые Римские критерии Маннинга. Естественно, при разных критериях и получалась разная частота тех или иных функциональных расстройств.
Академик Ивашкин В.Т.:
Профессор Шептулин А.А.: – Объяснением может быть то, что у нас не было случайного подбора больных. Дело в том, что наша клиника очень интенсивно занимается как проблемой функциональной диспепсии, так и проблемой СРК. У нас очень много и тех и других больных, и, соответственно, у нас очень часто выявляется такое сочетание. Я думаю, что это просто несколько искусственный подбор больных. У нас нет такого случайного сочетания, а есть целенаправленное.
Академик Ивашкин В.Т.: – То есть вы считаете, что это показатель, отражающий частоту сочетания в специализированных клиниках? А вот большинство пациентов – из популяций. Допустим, если бы она, я так думаю, взяла бы группу пациентов из нашей поликлиники, то наша поликлиника дала бы высокие цифры. К нам идет большое количество этих пациентов.
Профессор Шептулин А.А.: – У нас специализированная клиника, и люди знают, что мы занимаемся функциональными расстройствами.
Академик Ивашкин В.Т.: – А если, скажем, в городской поликлинике – цифры были бы значительно ниже.
Профессор Шептулин А.А.: – Абсолютно с вами согласен. Высока частота сочетания функциональной диспепсии и других функциональных расстройств: функциональный метеоризм, функциональная диарея, функциональные запоры и функциональная абдоминальная боль. И в свое время в литературе даже была представлена такая точка зрения, что нет отдельных функциональных расстройств тех или иных отделов желудочно-кишечного тракта, а есть общее заболевание, которое характеризуется функциональными нарушениями. Но в зависимости от тех или иных обстоятельств в определенное время на первый план может выступать или явление синдрома раздраженного кишечника, или явление дискинезии желчевыводящих путей.
Академик Ивашкин В.Т.: – Аркадий Александрович, вы знаете, вы ведь, пожалуй, самый крупный эксперт в области функциональной патологии желудочно-кишечного тракта у нас в стране. Я не побоюсь это сказать, потому что и ваши знания литературы, и ваш непосредственный опыт на протяжении уже десятков лет. Вот ваша точка зрения – это расстройство всей системы, начиная от ротовой полости и кончая анусом, или это все-таки действительно вот такое фрагментарное поражение отдельных сегментов желудочно-кишечного тракта?
Профессор Шептулин А. А.: – Здесь сложно ответить, Владимир Трофимович. Но я все-таки склоняюсь к точке зрения, что между этими заболеваниями значительно больше общего, нежели различий. Вот мы будем рассматривать этиологические и патогенетические механизмы этих расстройств. И мы увидим, что они до боли сходные между собой. И главное, мы это видим как клиницисты. Один и тот же пациент в этот раз к нам пришел с симптомами раздраженного кишечника. Мы ему помогли, он выписался, но он вернулся, скажем, через полгода уже с симптомами функциональной диспепсии. То есть мы имеем дело с нестабильностью клинических проявлений, которые очень динамичны. Но все они, в конце концов, укладываются в рамки именно функциональных расстройств.
Академик Ивашкин В.Т.: – Мне очень импонирует ваш ответ в том плане, что до настоящего времени, к сожалению, в гастроэнтерологии доминирует принцип дискретной оценки, разной оценки различных отделов: желудка, тонкой кишки, тощей, подвздошной, толстой кишки.
Профессор Шептулин А.А.: – Вы абсолютно правы. Очень высока частота сочетания функциональной диспепсии, гастроэзофагеальной рефлюксной болезни и синдрома раздраженного кишечника. Мне могут возразить, что гастроэзофагеальная рефлюксная болезнь, если мы возьмем такие ее формы, как эрозивный рефлюкс-эзофагит или пищевод Барретта – это не функциональные расстройства. Это действительно так.
Но в рамках гастроэзофагеальной рефлюксной болезни есть одна форма, которая относится к неэрозивной форме, при которой есть типичные симптомы рефлюкса. Они связаны с эпизодами заброса, я имею в виду клинические жалобы. Но это эпизоды физиологического рефлюкса, которые бывают в норме. И этих пациентов обозначают как больных, страдающих гиперсенситивным пищеводом или синдромом раздраженного пищевода. И вот этих пациентов наряду с больными с функциональной изжогой тоже можно рассматривать в рамках функциональной патологии желудочно-кишечного тракта.
Мы можем посмотреть на данные, которые указывают на общность патофизиологических механизмов и неэрозивных форм: гастроэзофагеальной рефлюксной болезни, функциональной диспепсии и синдрома раздраженного кишечника. Мы можем заметить, что для всех этих трех заболеваний, во-первых, характерно нарушение моторики, и оно у всех разное. В одном случае – это тонус нижнего пищеводного сфинктера, пищеводный клиренс, внутрижелудочное давление.
Для всех трех заболеваний характерен такой механизм как висцеральная гиперчувствительность. То есть повышенная чувствительность рецепторного аппарата стенок пищевода, желудка, толстой кишки к растяжению. Поэтому диспепсические расстройства в большинстве случаев возникают у таких пациентов при меньшей степени растяжения соответствующих отделов желудочно-кишечного тракта, чем у здоровых. В последние годы доказано значение нарушений защитного барьера слизистой оболочки и в развитии гастроэзофагеальной рефлюксной болезни, и синдрома раздраженного кишечника, и функциональной диспепсии. Ну и, наконец, при всех этих трех заболеваниях большую роль играют психологические факторы.
Давайте рассмотрим общую концепцию патогенеза функциональных расстройств. Это знаменитый американский ученый Дроссман, имеющий две докторские степени: по гастроэнтерологии и по психиатрии. Он как раз является координатором всех научных исследований по проблеме функциональных расстройств. И принято рассматривать содержание функциональных расстройств желудочно-кишечного тракта с позиции биопсихосоциального заболевания. О том, что же это означает, есть краткая схема развития любого функционального расстройства.
Во-первых, должны быть какие-то предрасполагающие факторы, к которым относится наследственность. Сейчас очень большое значение уделяется этому фактору. Это условия детства, в которых воспитывался больной. Имеют значение такие факторы, как заласканность, вседозволенность и, наоборот, забитость, какие-то меры физического воздействия, которые применялись к ребенку. Все это можно рассматривать в виде факторов, которые во взрослом состоянии будут способствовать развитию функционального расстройства. Ну, и психосоциальные факторы в виде, как принято говорить, значимых событий жизни: развод, смерть близкого человека и так далее. Вот этот комплекс факторов запускает патофизиологические звенья. В настоящее время рассматривается два ведущих патофизиологических звена для функциональных расстройств: нарушение моторики и нарушение висцеральной чувствительности. И вот уже эти патофизиологические звенья ответственны за возникновение клинических симптомов заболеваний.
Академик Ивашкин В.Т.: – Аркадий Александрович, когда невропатологи смотрят пациентов и говорят: «Имеется симптоматика нарушений верхнего моторного нейрона. Имеется симптоматика нарушений нижнего моторного нейрона» – как правило, речь идет действительно о нарушениях двух функций: двигательной и чувствительной. Оказывается, что это общая закономерность, это вопрос, который, может быть, нам следует с вами изучать. Может быть, это одно из проявлений верхнего или нижнего моторного нейрона? Вот это очень интересно. По-моему, этот вопрос никто не ставил.
Профессор Шептулин А.А.: – Согласен с вами. Все исследования, которые проводились в этом направлении, имеют достаточно грубый дизайн: введение баллона и его раздувание и наблюдение, при каком пороге раздувания у пациента появятся боли.
Академик Ивашкин В.Т.: – Вот мне академик Николай Николаевич Яхно при встрече все время напоминает о том, что нервная система едина для всех, и что неплохо бы нам было объединиться. А как вы думаете, может быть, мы действительно объединимся с невропатологами именно в этом ключе? Мне кажется, это было бы очень интересно.
Профессор Шептулин А.А.: – Это было бы интересно, и у нас есть такой опыт. Одна моя аспирантка Анна Мамедова из Туркмении, у которой параллельно было два научных руководителя, изучала состояние вегетативной нервной системы у больных с синдромом раздраженного кишечника. Я курировал эту аспирантку как руководитель-гастроэнтеролог, а профессор Соловьева из лаборатории Вейна, очень известный специалист по патологии вегетативной нервной системы, курировала как невропатолог. И на апробации, я помню, Александр Моисеевич Вейн говорил, что у такого сотрудничества очень большое будущее, вы правильно сказали.
Давайте сейчас посмотрим и сопоставим этиологию функциональной диспепсии и этиологию синдрома раздраженного кишечника. Мы можем отметить значение нервно-психических факторов при функциональной диспепсии, которые влияют на моторику желудка, на висцеральную чувствительность, усиливают выраженность клинических симптомов.
Во многих случаях именно нервно-психические факторы определяют обращаемость больных за медицинской помощью и влияют на общее самочувствие больных, снижают их физическую активность и качество жизни. А вот значение нервно-психических факторов при синдроме раздраженного кишечника – 50% больных с этим заболеванием связывают его возникновение или обострение со стрессовыми событиями жизни. Треть больных с синдромом раздраженного кишечника указывают на эпизоды физического насилия или сексуального принуждения в анамнезе. И давно доказано то, что у больных с синдромом раздраженного кишечника чаще встречаются тревожно-депрессивные расстройства и фобические состояния.
Что касается наследственной предрасположенности, то недавние работы показали, что возникновение функциональной диспепсии может иметь определенное значение – полиморфизм гена GN-β-3. И при определенных генотипах этого гена риск развития функциональной диспепсии, в частности дискинетического варианта, оказывается в 2 раза выше, чем у носителей другого генотипа. Применительно к синдрому раздраженного кишечника также показано значение полиморфизма нуклеотидов в генах, которые кодируют белок плотных контактов и гены интерлейкина-6, участвующих в проницаемости слизистой оболочки кишечника. И это может иметь значение при некоторых формах синдрома раздраженного кишечника.
В последнее время большое внимание уделяется такому фактору, как роль инфекций. Оказывается, что у больных, которые переносят пищевую токсикоинфекцию, например, инфекционный гастроэнтерит – в 20% случаев потом формируется синдром функциональной диспепсии, которую можно рассматривать как постинфекционную. И уже показано, что при этой форме функциональной диспепсии может быть нарушено расслабление фундального отдела желудка. Это обусловлено дисфункцией NO-зависимых нейронов, а также повышается уровень висцеральной чувствительности. Также подтверждено значение инфекции в развитии синдрома раздраженного кишечника.
Данные мета-анализа показали, что перенесенные кишечные инфекции в последующем повышают риск развития СРК в 7 раз. Но есть и другие факторы. Не у всех больных потом все-таки развивается СРК, есть и другие факторы риска: женский пол, наличие исходной депрессии, жизненно значимые события, курение и прием антибиотиков – это все повышает риск развития постинфекционного синдрома раздраженного кишечника. Мы говорили о патогенезе, о значении нарушений моторики и висцеральной чувствительности. Для функциональной диспепсии характерны следующие нарушения моторики: расстройство аккомодации, расстройство перистальтики, замедление эвакуации из желудка, нарушение координации между моторикой антрального отдела и двенадцатиперстной кишки. Все эти нарушения коррелируют с клиническим вариантом функциональной диспепсии.
При дискинетическом варианте чаще встречается замедление эвакуации из желудка. Точно так же нарушения моторики кишечника характерны для синдрома раздраженного кишечника. И именно эти нарушения моторики под влиянием различных факторов: стрессов, приема пищи – служат основной причиной последующего возникновения болей у больных с синдромом СРК.
Что касается нарушения висцеральной чувствительности, то я уже говорил о достаточно грубых методиках, которые были применены для этого: введение баллона и его раздувания воздухом. Тем не менее было показано, что при функциональной диспепсии жалобы возникают при меньшей степени растяжения стенки желудка, чем у здоровых. Точно такие же данные были получены применительно к синдрому раздраженного кишечника. Было показано, что при введении баллона в прямую кишку и его растяжении у больных СРК боли возникают раньше. Но интересно то, что модулирующую роль при этом может играть измененная активность центральной нервной системы. Оказалось, что у больных с синдромом раздраженного кишечника при растяжении прямой кишки активируются не лимбические структуры, как у здоровых, а префронтальная зона, которая ответственная за возникновение депрессивных реакций. Поэтому значение центральной нервной системы при синдроме раздраженного кишечника все-таки велико.
В последние годы большое внимание уделяется роли местных изменений слизистой оболочки, особенно в патогенезе синдрома раздраженного кишечника. Робин Спиллер – это очень большой авторитет в области синдрома раздраженного кишечника и постинфекционного синдрома раздраженного кишечника. Он пришел к такому выводу, что, конечно, при синдроме раздраженного кишечника нет тех изменений в слизистой оболочке, которые отмечаются у больных с язвенными колитами, в частности, полиморфноклеточной нейтрофильной инфильтрации. Однако признаки активации иммунной системы: повышение экспрессии цитокинов, увеличение содержания тучных клеток и так далее – у таких пациентов есть.
И скоро будет аспирант нашей клиники защищать очень интересную работу об изменении баланса цитокинов и клаудинов – белков плотных контактов, которые влияют на проницаемость слизистой оболочки кишечника и играют роль в развитии синдрома раздраженного кишечника. Эта работа представлялась неоднократно за рубежом в виде докладов, и вызвала очень большой интерес. В свою очередь, у больных функциональной диспепсией также были выявлены изменения в слизистой оболочке двенадцатиперстной кишки, снижение экспрессии белков межклеточной адгезии, повышение содержания эозинофилов, тучных клеток. И был сделан вывод, что эти нарушения могут способствовать расстройствам целостности защитного барьера.
Таким образом, если мы попробуем подвести какой-то итог, то можно сказать, что сочетание между собой различных функциональных заболеваний желудочно-кишечного тракта является, скорее, правилом, а не исключением. Обращает на себя внимание и нестабильность ведущих клинических симптомов. Мы отметили на примере своих больных, что в разные периоды течения заболевания на передний план в клинической картине попеременно могут наступать то симптомы функциональной диспепсии, то синдромы раздраженного кишечника.
Что касается нестабильности ведущих клинических симптомов, было показано, что помимо синдрома раздраженного кишечника в круг функциональных кишечных расстройств входит такое понятие как функциональный запор или функциональная диарея. Отличаются функциональные запоры от синдрома раздраженного кишечника запорами только наличием боли. Если есть боль и нарушение стула, то это синдром раздраженного кишечника. Если есть только функциональное нарушение стула – это функциональный запор или функциональная диарея. Оказалось, что в течение года треть больных СРК с запорами переходят в категорию пациентов, которых можно рассматривать как больных функциональными запорами. И, наоборот, треть больных с функциональными запорами приобретают черты пациентов синдрома раздраженного кишечника с запорами. Это мы с вами уже обсуждали.
И в заключение хочу сказать о том, что разработка схемы лечения, безусловно, должна включать препараты, которые будут воздействовать на общие звенья патогенеза: нарушения моторики и висцеральную гиперчувствительность. В следующем докладе Мария Анатольевна Ливзан будет говорить о таком препарате как «Тримебутин». Это препарат, который сочетает в себе действие и на моторику желудочно-кишечного тракта, и на висцеральную чувствительность.
Причина и следствие / Хабр
Первая статья в серии «Методы выявления причинно-следственной связи в динамическом ценообразовании», продолжающая доклад «Causal Methods in Dynamic Pricing» (Ваня Горбань, Денис Пятых) ODS’21.Мы привыкли, что Machine Learning предоставляет нам большое количество предиктивных методов, которые с каждым годом предсказывают события лучше и лучше. Деревья, леса, бустинги, нейронные сети, обучение с подкреплением и другие алгоритмы машинного обучения позволяют предвидеть будущее все более отчетливо. Казалось бы, что нужно еще? Просто улучшать методы и тогда мы рано или поздно будем жить в будущем так же спокойно, как и в настоящем. Однако не все так просто.
Когда мы рассматриваем бизнес задачи, мы часто сталкиваемся с двумя моментами. Во-первых, мы хотим понять что к чему относится и что с чем связано. Нам важна интерпретация. Чем сложнее модели мы используем, тем более нелинейные они. Тем больше они похожи на черную коробку, в которой очень сложно выявить связи, понятные человеческому разуму. Все же мы привыкли мыслить довольно линейно или близко к тому. Во-вторых, мы хотим понять — если мы подергаем вот эту «ручку», изменится ли результат в будущем и насколько? То есть, мы хотим увидеть причинно-следственную связь между нашим целевым событием и некоторым фактором. Как сказал Рубин — без манипуляции нет причинно следственной связи. Мы часто ошибочно принимаем обыкновенную корреляцию за эту связь. В этой серии статей мы сконцентрируемся на причинах и следствиях.
Но что не так с привычными нам методами ML? Мы строим модель, а значит, предсказывая значение целевого события мы можем менять значение одного из факторов — одной из фич и тогда мы получим соответствующее изменение таргета. Вот нам и предсказание. Все не так просто. По конструкции, большинство ML методов отлично выявляют корреляцию между признаком и таргетом, но ничего не говорят о том, произошло ли изменение целевого события именно из-за изменения значения фичи. То есть, ничего не говорят нам о том — что здесь было причиной, а что следствием.
Чтобы прояснить о чем я, давайте посмотрим на задачу с другой стороны — чуть более формальной. Часто можно встретить следующую запись для модели машинного обучения:
Здесь y — наше целевое событие, a(X) — некоторый ML алгоритм, — неустранимая ошибка. На самом деле a(X) в уравнении выше мы не знаем и часть просто предполагаем, что он именно такой, исходя из известных нам свойств целевого события и признакового пространства.
После «обучения» модели, мы получаем оценку алгоритма , с помощью которого получаем предсказания:
При этом, существует некоторая ошибка нашей оценки , которую мы можем найти. Наш алгоритм строится с целью минимизации различных функций потерь от предсказания и фактического значения целевой переменной.
Вернемся к основному вопросу. Предположим, среди наших X присутствует некоторый признак, через который мы можем влиять на таргет, что мы очень хотим делать. Назовем его T. Оставшееся множество признаков обозначим
Для того, чтобы это вписать в нашу формулу, предлагаю записать множество признаков следующим образом: . Тогда наше предсказание выглядит:
Под «воздействием» мы понимаем следующее: действительно ли, меняя T в реальности, я изменю y? Обозначим
Записывая строго (и предпологая определенный вид распределения ошибки и данных), мы хотим, чтобы следующее утверждение было верно:
То есть, мы хотим, чтобы изменив T мы получили результат и были уверены в нем также, как если бы он был изменен естественным образом. Однако, оказывается, что модели машинного обучения часто так не работают. Они находят корреляции, но это не значит, что изменив наше воздействие мы изменим результат.
Иллюстрацию этого удобно привести с помощью графа причинно-следственных связей. Подробности этого мы оставим за пределами этой статьи, но то, что я покажу будет понятно на интуитивном уровне. Предположим, наши данные описываются следующим образом:
Здесь стандартно: Y — таргет, X — признаки объекта, T — наше воздействие. За C мы принимаем здесь так называемый Confounder — переменную, воздействующую на T и на Y. Если переменная C является не наблюдаемой для нас, то стандартная модель машинного обучения, глядя на корреляцию между изменениями T и Y сможет заметить эту связь. Однако, очевидно что изменяя T мы не изменим Y — для этого должна измениться C! Здесь мы увидели частный случай проблемы эндогенности — проблема упущенной переменной. Видно, что когда мы пытаемся не просто найти корреляции между переменными и прогнозировать изменения в таргете, исходя из наблюдений, а пытаемся влиять на таргет — все становится немного сложнее.
Давайте попробуем также посмотреть на проблемы причинно-следственной связи с точки зрения их отличий от проблем Machine Learning и Statistical Learning. Отличная иллюстрация приводится в книге Elements of Causal Inference: Foundations and Learning Algorithms (Peters et al., 2017):
Типичные задачи эконометрики — statistical learning, машинного обучения — probabilistic reasoning и их связь с задачами causal learning — выявления причинно-следственных связей и causal reasoning — предсказания (управления) с учетом этих связей.Ещё одна иллюстрация, которая помогает понять эволюцию мысли от корреляции к причинно-следственной связи (из книги The Book of Why: The New Science of Cause and Effect (Judea Pearl, Dana Mackenzie)):
Иллюстрация Maayan Harel. Мысль эволюционирует от связи наблюдений с результатом в попытки изменить реальность с помощью доступных инструментов. Финальной ступенью является сослагательное наклонение и создание воображаемых миров для понимания реальных процессов и альтернативных исходов.Но давайте вернемся к эндогенности. Следующий раздел для того, чтобы узнать или вспомнить что же это такое.
Эндогенность
Строго говоря, эндогенность — это корреляция объясняющей переменной (признака) с ошибкой. В математической записи это выглядит следующим образом:
Если говорить о предыдущем примере, то в нем как раз это и происходит, за счет того, что . Давайте посмотрим — какие еще бывают варианты эндогенности.
Принято выделять следующие проблемы:
Проблема упущенной переменной (omitted variable)
Обратная причинно-следственная связь (reverse causality)
Ошибка в измерениях (measurement error)
Все эти типы эндогенности отличаются присутствием корреляции ошибки и одного из признаков.
Выглядит очень теоретически. К чему это приводит на практике? Сейчас приготовьтесь испытать дежавю (особенно, если вы смотрели телевизор в последние несколько лет):
Иллюстрации взяты из источника: https://www.tylervigen.com/spurious-correlations. Первая и третья иллюстрация действительно могут быть названы «ложными», так как процесс, который объединяет их сложно формализуем и лежит глубоко, однако второй пример вполне может быть признаком активности автомобильного рынка и притока водителей-новичков на дороги. В целом, постаравшись, все эти процессы можно объяснить проблемой ommited variable (кроме разве что маргарина).Поставим себя на место парламентария — законотворца, который к нашему всеобщему сожалению не освоил отличие корреляций от причинно-следственных связей. Дабы укрепить семейные связи в первом случае наш герой может принять решение запретить маргарин к примеру. Это будет логично. Во втором случае, для спасения жизней своих сограждан он, пожалуй, предложит наложить эмбарго на продажу японских автомобилей, что вызовет политическую напряженность, но главное, что благое дело сделано. И, наконец, он избавит граждан США от заразы науки и технологий, тем самым пытаясь значительно снизить смертность. Что ж, может быть и не стоит изучать причинно-следственные связи, в конце концов срок депутата ограничен.
Задача
Что ж, надеюсь, что вы как минимум порадовались, посмотрев на красивые картинки, теперь перейдем к задаче, которую мы излагали в докладе. Перед нами стояла проблема улучшения системы ценообразования для товаров (мобильной техники и аксессуаров) с целью повышения прибыли бизнеса с партии этих товаров. Давайте разберем эту формулировку по словам, чтобы понять — что же от нас хотят. Начнем с конца:
Партия товаров
Я предлагаю рассматривать некоторый аксессуар. Например, некоторое универсальное зарядное устройство для смартфонов. Для простоты, пусть его технология не будет подвержена старению, хотя бы на горизонте года. Пусть его продажи несильно зависят от выхода новых моделей смартфонов. Партия (stock) это заранее известный объем закупки. Мы можем воспринимать её как набор зарядных устройств, который мы купили, скажем, в январе и следующая поставка будет через год.
Повышение прибыли
Прибыль давайте также понимать довольно просто. Это наша выручка (цена, умноженная на количество проданного товара) минус наши издержки (стоимость закупки). Цену хранения единицы товара будем считать пренебрежимо малой. В конце концов, для зарядных устройств это очень близко к правде. Записывая формально:
Здесь — прибыль, — розничная цена, — количество проданного товара, -оптовая цена закупки товара.
Улучшение системы ценообразования Из предыдущего упрощенного уравнения не понятно — причем здесь цена? Максимум для здесь достигается за счет увеличения цены до бесконечности. Но на то она и упрощенная. Давайте сделаем её чуть реалистичней:
Здесь мы отразили немного больше зависимостей. Очевидно, объем проданного товара зависит от цены. При этом, чем выше цена, тем меньше объем продаж. При этом, закупка у нас фиксирована и мы имеем закупленную партию как факт, так что цена закупки — константа.
Казалось бы, давайте просто решим простейшую задачу оптимизации и выставим оптимальную цену. Но, все не так просто. Во-первых у нас целый год. Все, что не будет продано за год будет продаваться с большим дисконтом и приносить убыток, хранить это станет также дорого. Мы можем считать, что все, что не продано за год — выброшено.
Во-вторых, есть конкуренты и, повышая цену, мы теряем в продажах гораздо больше, чем было бы, будь мы монополистами. В-третьих, у нас может быть очень мало истории колебания цен, чтобы выявить зависимость q(p) при больших изменениях цены.
Начнем с казалось бы более простых задач и попробуем решить все проблемы, которые описали выше и некоторые другие.
Оптимальная цена
Начнем с выставления оптимальной в моменте цены. Как выставить эту цену?
На помощь здесь конечно придет простейшая теория оптимизации и основы микроэкономики. Решим задачу оптимизации, дабы найти оптимальную цену. Из FOC:
$$ $$
И что мы видим? Нам позарез нужно понять зависимость q(p) для решения уравнения. Для начала мы решили оценить её с помощью простой модели линейной регрессии:
Здесь X — набор признаков, и, соответственно, коэффициентов при нем тоже несколько, надеюсь, никого не запутает такая нотация. предполагаем i.i.d (это очень сильное предположение, особенно учитывая автокорреляцию ошибок, если мы смотрим во времени, но, чтобы не размывать целей примера, здесь я не буду углубляться в решение этой задачи).
В результате решения этой задачи мы можем получить некую оценку , которая показывает нам каким образом количество продаж товара зависит от цены. Звучит это просто, но на деле конечно нас ждут не дождутся проблемы:
На каждый товар не так много наблюдений, потому есть большой риск не увидеть статистической значимости в нашем коэффициенте
Есть товары, цена которых исторически не менялась, а значит наша модель не сработает для них в целом (нарушены базовые предположения OLS)
Есть товары, для которых мы видим положительную оценку (как бы вы интерпретировали её?)
Так как мы являемся последователями стоической философии, то мы представляли даже худшие варианты развития событий — такие как столкновение с метеоритом или чума, так что то, что мы увидели нас даже обрадовало. Какие идеи у нас возникли для решения этих задач?
Число наблюдений
Очевидным способом борьбы с этой бедой кажется объединение товаров в одну выборку. Но каким образом различать их? Предположим, что зависимости не универсальны и не отличаются от товара к товару. Первой попыткой может быть добавить dummy переменные (или fixed effects) на различные товары. Но тогда мы добавим огромное число переменных и выигрыш от объединения будет крайне невелик.
Есть другой вариант — в рамках одного класса товаров, давайте опишем их некоторыми признаками, присутствие которых обусловленно классом товара, а их значения могут отличаться от одного товара к другому. Например, если это зарядные устройства, то они могут различаться типом, производителем, мощностью. Таким образом мы, вводя некоторые вполне валидные предположения, выиграем от роста количества наблюдений.
Отсутствие изменения цены
Здесь мы можем пойти двумя путями. Первый уже произошел автоматически. В результате перехода от индивидуальных товаров к их группе, мы уже добавили вариацию в цену (предполагая единую зависимость от цены для всей группы). Второй путь — рандомизация. Для тех товаров, которые не имели исторических изменений в цене, мы можем волевым усилием устроить случайные изменения цены в разумных пределах.
Положительная корреляция цены и продаж
Эта проблема интересна, особенно в контексте нашей прошлой дискуссии о причинно-следственной связи и проблеме эндогенности. Давайте подумаем — может ли быть такое, что повышая цену мы начинаем продавать больше товара? Вполне возможно, но рост продаж вряд ли будет объясняться ростом цены, особенно в контексте наших товаров. Переводя на графический язык, положительный коэффициент говорит нам о следующей зависимости между ценой и продажами:
Думаю этот график довольно наглядно показывает, что как бы нам ни хотелось ничего не делать с этим коэффициентом — не выйдет. Маловероятно, что повышая цену мы добьемся этим увеличения продаж. В противном случае, нам стоило бы поставить цену на данное зарядное устройство равной бесконечности и перепрофилировать бизнес.
И снова эндогенность
Мы задумались. То ли половина наших товаров “неправильные”, то ли здесь где-то зарыта какая-то другая собака 🐕 . Тут мы вспоминаем про проблемы эндогенности, которые мы недавно разбирали в теории и думаем — возможно ли что где-то здесь мы столкнулись с одной из них? Вполне. Давайте посмотрим что это могло быть. Огласим весь список снова:
Упущенная переменная
Обратно причинно-следственная связь
Ошибка измерений
Предположим, что третье мы можем исключить. Мы верим нашим данным — там все хорошо и нет систематически искажающей результаты ошибки. Что насчет остальных?
Упущенная переменная. Вполне может быть. Что если мы в рамках года взяли только осень и забыли включить сезонную компоненту в анализ? Мы увидим повышение цен на товары (которое мы проводили) и повышение спроса. Более того, здесь мы чувствуем сразу присутствие и второй проблемы — мы повысили цену зная, что будет повышение спроса, а значит, повысятся продажи, а значит мы можем безболезненно поднять цену, чтобы подогнать оптимальную под возросший спрос. Вот вам и обратная причинно-следственная связь.
Еще? Давайте подумаем. Конкуренты. Что если в момент повышения наших цен — конкуренты подняли цены ещё больше. Все покупатели конечно расстроились, что такое вот происходит, но пришли к нам, так как у нас стало дешевле. Тогда можно сказать, что цены конкурентов являются упущенной переменной. Включив её, мы скорректируем нашу ошибку, наш bias.
Можно продолжить. Но зачем? Эти упражнения полезны и интересны для кого-то, но помогают ли они нам решить проблему на практике? Как получить адекватную и близкую к реальной зависимость спроса от предложения? Очень просто. Omitted variable, которую мы можем таки отыскать, мы можем просто включить в регрессионную модель, тем самым скорректировав отклонение. Однако кто гарантирует, что мы не забыли что-нибудь? Кто гарантирует, что мы включили все упущенные переменные, а тем более — кто гарантирует, что мы не забыли где-нибудь обратную причинно следственную связь? Что с ней делать?
Здесь нам на помощь приходят инструментальные переменные.
https://www.microsoft.com/en-us/research/blog/adversarial-machine-learning-and-instrumental-variables-for-flexible-causal-modeling/Стандартно инструментальные переменные обозначаются как Z. На картинке выше видно, что инструментальная переменная должна быть подобрана так, чтобы воздействовать на итоговую зависимую переменную только через treatment переменную, которую мы хотим избавить от эндогенности (в случае на картинке — от unobserved confounder).
Давайте посмотрим как выглядит наша проблема в более строгой формулировке.
Второе слагаемое и есть bias, который мы получаем за счет эндогенности. Если существует переменная, коррелирующая с Y и X, соответственно
Классический пример использования инструментальной переменной — 2-stage least squares (2SLS) оценка. Название может подсказать нам, что этот метод имеет нечто общее с OLS (ordinary least squares) или МНК оценкой.
Шаги здесь следующие и довольно простые. Пусть у нас есть парочка инструментальных переменных . Также есть наша переменная являющаяся эндогенной (в нашем примере — это цена). Тогда два этапа выглядят так:
Оценить OLS:
где — экзогенные иксы , а — инструментальные переменные для . В итоге получим некоторую .
Наша оценка получается из подстановки результата предыдущего этапа вместо Так как экзогенная по определению, то при выполнении некоторых предположений несмещенной оценкой является :
Мы здесь опустили некоторые предположения касательно инструментов, но это все же статья не только об инструментальных переменных и не такая техническая, как это возможно, поэтому интересующихся отсылаю к наилучшему источнику по теме: J.M. Wooldridge, Econometric Analysis of Cross Section and Panel Data, Chapter 5.
А не слабовато?
Вкратце — все конечно зависит от инструментов, но в целом, часто мы получаем достаточно маломощные оценки интересующего нас эффекта. В случае нашей задачи — оценки эластичности цены. Чем мощнее эта оценка, тем точнее мы можем оптимизировать цену и тем меньше изначальная выборка нам требуется для этой оптимизации.
Method of Direct Estimation
Данный метод был представлен в статье M. Ratkovic, D. Tingley, Causal Inference Through the Method of Direct Estimation. Он позволяет проводить оценку причинно-следственных связей, фокусируясь на мгновенном причинно-следственном эффекте (instantaneous causal effect), который иначе можно рассматривать как причинно-следственный эффект на уровне одного наблюдения. В своей статье Ratkovic and Tingley строят регрессию с высокой степенью нелинейности между ковариатами и treatment переменной (это например наша цена), которую затем используют для предсказания альтернативных исходов (counterfactuals). Другими словами, они строят регрессию, а затем, подставляя другие значения treatment переменной пытаются понять что с этим наблюдением было б если бы все было иначе.
Пока это выглядит немного смазанно. Давайте посмотрим подробнее на алгоритм, думаю станет понятней.
Пусть наша цена — treatment и обозначим её за T. Также, спрос (который у нас является таргетом) обозначим за Y(T). Причинно-следственный эффект изменения цены на спрос можно тогда обозначить за
здесь , a , где дельта — небольшое изменение нашей цены. В пределе мы хотим оценить частную производную:
Здесь видно, что если мы оценим линейной моделью, то получим просто коэффициент при эффекте воздействия. Однако мы не хотим делать предположения о линейной зависимости и добавляем нелинейные взаимодействия тритмента и переменных. В статье предлагается вид:
— параметры модели, — B-spline базис. Далее предлагается отфильтровать нелинейные компоненты при помощи L1 регуляризатора. Полученное подмножество называем . В дальнейшем после оценки параметров регрессии мы получаем искомый предел как:
Казалось бы, все просто. Однако здесь нигде не учитывается эндогенность. Как мы оценим то же самое, если включим инструментальные переменные?
В статье предлагается аналог 2SLS оценки, называемый LICE (Local Instantaneous Causal Effect). Во-первых, оценивается так называемый instantaneous encouragement — эффект от небольшого изменения инструмента на одном наблюдении. Он показывает эффект от изменения инструмента на тритмент (переменную воздействия):
Вторая часть оценки LICE — instantaneous intent to treat on the treated — показывает эффект от изменения инструмента на целевую переменную:
Итак, в итоге:
Можно показать, что:
Отсюда видно, что для фиксированных параметров наблюдения мы можем предсказать эффект от воздействия на него, имея наше воздействие T и инструментальную переменную Z.
ML модификация MDE
Мы не удовлетворились имеющимися моделями линейной регрессии и решили обобщить метод на работу с произвольным алгоритмом следующим образом. Давайте для начала посмотрим как выглядят модели линейной регрессии в статье:
Заменим линейную регрессию на произвольный алгоритм:
В качестве алгоритмов мы выбрали модели случайного леса. И конечно это лишь звучит просто, в дальнейшем возникло много особенностей ввиду того, что в общем случае решение, выдаваемое лесом не является гладким, так что нам пришлось аппроксимировать его гладкой функцией. Но об этом в другой раз.
Во второй части этой статьи вы узнаете как мы в итоге решили проблему негладкости решения, а также как реализовали систему динамической оптимизации цены. Надеюсь эта статья была вам полезна, ну или хотя бы расширила ваш кругозор. Спасибо!
Корреляция и причинно-следственная связь
Горячая математикаА корреляция является мерой или степенью взаимосвязи между двумя переменными. Набор данных может иметь положительную корреляцию, отрицательную корреляцию или вообще не коррелировать. Когда один набор значений увеличивается, другой набор имеет тенденцию к увеличению, тогда это называется положительной корреляцией.
Когда один набор значений увеличивается, другой набор имеет тенденцию к уменьшению, тогда это называется отрицательной корреляцией.
Если изменение значений одного набора не влияет на значения другого, то говорят, что переменные не имеют «корреляции» или «нулевой корреляции».
А причинно-следственная связь между двумя событиями существует, если появление первого вызывает другое. Первое событие называется причиной, а второе событие – следствием. Корреляция между двумя переменными не означает причинно-следственной связи. С другой стороны, если между двумя переменными существует причинно-следственная связь, они должны быть коррелированы.
Пример:
Исследование показывает, что существует отрицательная корреляция между тревогой учащегося перед тестом и оценкой учащегося на тесте. Но нельзя сказать, что тревога причины низкий балл на тесте; могут быть и другие причины, например, ученик плохо учился. Таким образом, корреляция здесь не подразумевает причинно-следственную связь.
Однако обратите внимание на положительную корреляцию между количеством часов, которые вы тратите на подготовку к тесту, и оценкой, которую вы получаете за тест. Здесь тоже есть причинность; если вы тратите больше времени на учебу, это приводит к более высокой оценке.
Одной из наиболее часто используемых мер корреляции является корреляция момента продукта Пирсона или коэффициент корреляции Пирсона. Измеряется по формуле,
р Икс у «=» н ∑ Икс у − ∑ Икс ∑ у ( н ∑ Икс 2 − ( ∑ Икс ) 2 ) ( н ∑ у 2 − ( ∑ у ) 2 )
Значение коэффициента корреляции Пирсона варьируется от − 1 к + 1 где –1 указывает на сильную отрицательную корреляцию и + 1 указывает на сильную положительную корреляцию.
9.2 Причинность
9.2 Причинность Умение устанавливать причинно-следственные связи в мире важно. Что связывает причину и следствие невидимо нам (Юм). Но мы можем заметить корреляции и из них иногда сделать выводы о причинно-следственных связях. Не все корреляции существуют потому что есть причинно-следственная связь.Корреляции
Заявления о корреляции выражают отношение между двумя свойствами (значениями переменных) в пределах одной совокупности.Курильщики | Некурящие | |
Американские мужчины | 51 | 49 |
американки | 34 | 66 |
А положительно коррелирует с В тогда и только тогда, когда процент А среди В больше, чем процент As среди не-Bs.
А отрицательно коррелирует с В тогда и только тогда, когда процент А среди В меньше процента As среди не-Bs.
А не коррелирует с В процент As среди Bs такой же, как процент As среди не-Bs.
Оценка корреляций
Предвзятость внимания при оценке корреляций:
Медсестер попросили просмотреть 100 карточек с пациентами. информацию о них, а затем судить, были ли отношения или Связь конкретного симптома с конкретным заболеванием. Каждый карта указывала, присутствует ли симптом или нет, а также болезнь была или отсутствовала. (Смедслунд, 1963 г.)Здесь частота симптомов и заболеваний на 100 пациентов.
Болезнь | Нет болезни | |
Симптом | 37 | 33 |
Нет симптомов | 17 | 13 |
Здесь нет корреляции, хотя 85% медсестры думали, что существует положительная корреляция между симптомом и болезнь. Присутствующая/присутствующая клетка была лучшим предиктором суждения субъекта; высокая цифра в этой ячейке вызвала положительное суждение.
Обратите внимание, что как для группы симптомов, так и для бессимптомная группа примерно у тех, у кого есть заболевание, и у тех, у кого его нет заболевание (имеют чуть больше, чем не имеют в обеих группах; 37-33 с симптомом, 17-13 без симптома). Есть у вас болезнь или нет, примерно в два раза больше людей имеют симптом, чем не имеют его.
Субъекты склонны смотреть только на избранных ячейки для соответствующей информации.
Другой пример: отвечает ли Бог на молитвы? Многие говорят да, потому что много раз молитвы были успешными. Но что насчет остальные клетки?
Другой пример:
Испытуемых спросили, действительно ли мистер Максвелл, вымышленный человек, которого им предложили представить, которого они встретили на вечеринке, был профессором. Им сказали, что он либо профессор, либо руководитель, и что он принадлежал к Медвежьему клубу. Затем испытуемых спрашивали, что дополнительную информацию, которую они хотели бы иметь, чтобы вынести свое суждение. Например, какой процент профессоров в партии являются членами Медвежий клуб, или какой процент руководителей на вечеринке были членами Медвежьего клуба? 89% испытуемых хотели получить первую порцию информации, но только 54% хотели вторую часть, хотя обе части важны. (Также актуальна информация о проценте профессоров на вечеринке.)
Эффекты предшествующей веры в оценку корреляций: 90 082 Клинические психологи иногда используют метод «Нарисуй человека». тесты, с помощью которых пациенты, как считается, проецируют аспекты своей личности в рисунки. Большие глаза могут указывать на то, что пациент подозревает другие или параноик; широкие плечи могут указывать на озабоченность мужественностью.
Исследования показали бесполезность этих тестов. как индикаторы личностных качеств. Но в исследованиях, в которых картины и метки черт связаны таким образом, что не отражают никакой корреляции, необученные субъекты все еще заявляют, что «обнаружили», что определенные черты коррелируют с некоторые аспекты рисунков. Даже профессионалы сохраняют доверие в них, узнав об их неэффективности. Аналогичные результаты применимы к тесту Роршаха. тесты. Цитата: «Я знаю, что параноики, похоже, не привлекают большого внимания в исследованиях. лаборатории, но они делают это в моем кабинете» (Чепмен и Чепмен, 19 лет).67, 1969)
Предварительное убеждение может усилить предвзятость внимания:
Испытуемым сообщают об эксперименте, в котором детям в интернате дают определенные комбинации продуктов, чтобы увидеть влияют ли они на вероятность простуды. Прежде чем увидеть данных испытуемых просят сформулировать свои собственные гипотезы. После показа данных, на их интерпретации явно влияют их собственные гипотезы. Несмотря на то, что данные не отражают никакой корреляции, испытуемые, предположившие заранее, что тип воды (бутылированная или водопроводная) может иметь значение для простудиться также сказали, что они видели такую корреляцию в примере данные. Субъекты, которые, например, предположили, что тип горчицы вызовет простуду, обратит внимание на данные о горчице/простуде и проигнорирует данные о горчице/нет холодные данные.Причинно-следственные связи:
Причинное обобщение, например, что курение вызывает рак легких, не относится к конкретному курильщику, а констатирует особое существует связь между свойством курения и свойством получить рак легких. В качестве причинно-следственной связи это говорит не только о том, что является соотношением между двумя свойствами.Некоторые причинные условия являются необходимыми условиями: наличие кислорода – необходимое условие горения; в без кислорода нет горения. «Причина» часто используется в этом смысл, когда устранение причины направлено на устранение следствия (что вызывает боль?)
Некоторые причинные условия являются достаточными условиями: при наличии достаточного условия эффект должен произойти (находясь в диапазон температур R в присутствии кислорода достаточен для горения многих веществ. «Причина» часто используется в этом смысле, когда мы пытаемся произвести эффект (Что делает этот металл таким прочным?)
Поиск особых обстоятельств: что было причина пожара? Кислород? или спичка поджигателя?
Причинами иногда называют INUS-состояния в том, что они являются недостаточными, но необходимыми частями ненужного, но Достаточный набор условий для эффекта. Можно сказать, что зажег спичку быть причиной его освещения. Предположим, что есть некоторый набор условий этого достаточно для зажигания спички. Сюда можно отнести присутствие кислорода, соответствующие химические вещества в спичечной головке и зажигании. Можно сказать, что удар является необходимой частью этого набора (хотя и недостаточным). само по себе), потому что без поразительного среди этих других условий спичка не зажглась бы. Но сам набор хоть и достаточен, но не необходимо, потому что другие наборы условий могли произвести освещение матча.
Чем причинно-следственные связи отличаются от корреляций?
1. Утверждение о корреляции симметрично в то время как утверждение о причинно-следственной связи асимметрично. Если быть мужчина положительно коррелирует с тем, чтобы быть курильщиком, быть курильщиком также положительно коррелирует с принадлежностью к мужскому полу. Но если курение вызывает легкие рака не обязательно, что рак легких вызывает курение.2. Корреляции касаются фактических популяций и не являются законопослушными. Причинно-следственные связи закономерны в том смысле, что они касаются как гипотетического населения, так и фактического населения. Когда говорят, что А является причиной В, мы говорим, что если бы произошло увеличение при заболеваемости А будет увеличиваться заболеваемость В; или если бы случаи А уменьшились, случаи Б также уменьшились бы. (Если меньше люди курили, было бы меньше рака легких.) Простые корреляции относятся только к фактическому населению. Если успех Национальной лиги в Суперкубке просто коррелирует с падением фондового рынка, то нам не следует ожидать изменения на фондовом рынке, чтобы повлиять на исход Суперкубка (или наоборот).
Как можно судить о причинно-следственных связях на основании утверждений о корреляциях?
Например, существует сильная положительная корреляция между увеличением числа занятий по половому воспитанию и ростом в темпе гонореи. Предположим, мы пришли к выводу, что увеличение числа занятий по половому воспитанию вызвало увеличение заболеваемости гонореей.
(A) Статистическая предпосылка (утверждение о корреляции) верно или обосновано?
(B) Какие альтернативные объяснения доступны?
1. Корреляция может быть случайной или случайно. Увеличение государственного долга положительно коррелирует с увеличение заболеваемости гонореей, но причинно-следственной связи нет.
2. Связь может быть ложной, как увеличение числа занятий по половому воспитанию и увеличение частота гонореи, являющейся следствием одной и той же причины.
3. Причинно-следственная связь может быть обратной. Может ли рост заболеваемости гонореей быть причиной ощущаете потребность в дополнительных занятиях по половому воспитанию?
4. Причинно-следственная связь могла быть более сложнее, чем следует из заключения. Увеличение количества занятий по половому воспитанию могло вызвать изменение отношения к сексу, что привело к увеличению в половой жизни, что привело к увеличению заболеваемости гонореей.
5. Указанная причинно-следственная связь может быть незначительной по сравнению с другими факторами, ответственными за рост гонореи ставка.
Предполагается ли наличие причинно-следственной связи в приведенных ниже случаях?
Одно время была сильная положительная корреляция между количеством мулов в государстве и жалованьем, выплачиваемым профессорам (чем больше мулов, тем ниже зарплата).Существует сильная положительная корреляция между количество пожарных машин в районе Нью-Йорка и количество пожаров, которые происходят там.
Существует сильная положительная корреляция между Размер стопы и качество письма.
Существует сильная отрицательная корреляция между количество передач вперед, брошенных в футбольном матче и выигравших игра.
Употребление большого количества кофе положительно коррелирует с сердечными приступами.
Посещение больницы положительно коррелирует с умиранием.
Увеличение количества часов просмотра детьми Телевидение положительно коррелирует со снижением результатов SAT.
Употребление марихуаны отрицательно коррелирует с высокий средний балл.
Другой пример:
«Хотя половина населения страны имеет фторированные источники воды, а половина нет, девяносто процентов случаев СПИДа прибывают из цветущих районов, и только десять процентов прибывают из неорошаемые районы».
Любая связь?
1. Сообщества разного размера: процветающие сообщества (вероятно, большие города) могут содержать гораздо больше чем половина населения.
2. Связь может быть ложной: космополитическая/прогрессивная отношения могут поощрять как фторирование, так и образ жизни, связанный с СПИД
Другой пример:
Существует ли причинно-следственная связь между классом посещаемость и полученные оценки?
«Студенты с самой низкой посещаемостью заработали самые плохие оценки. Те, кто посещал 79 процентов занятий или меньше оказался в диапазоне низких C; 90 процентов и выше получили оценку выше средней B. Студент, сидевший впереди, получил «значительно более высокие оценки», но Уолш [тот исследователь] думает, что они могли бы больше интересоваться предметами».
Джон Стюарт Милль, Система логики, 1843
А не является достаточным условием для В, если А встречается без Б.А не является необходимым условием для В, если В встречается без А.
Прямой метод согласования
Найдите причинно-следственную связь между эффектом и a необходимое условиеКакой фактор всегда присутствует, когда эффект настоящее?
При наличии среди проживающих в общежитии это сыпь из-за расстройства желудка, мы, вероятно, будем искать один продукт, который все пациенты ели как причину.
1. Заключение относится только к случаям обдуманный.
2. Только вероятные: другие важные условия могли быть пропущены; это могло быть сочетанием факторов
Обратный метод согласования
Найдите причинно-следственную связь между эффектом и a достаточное условиеКакой фактор всегда отсутствует, когда вхождения эффекта нет?
Пять фабричных рабочих признаны неэффективными относительно других, выполняющих ту же работу. Эффективные работники и неэффективные работники оказались похожими во всех отношениях, за исключением один: неэффективные не были частью плана распределения прибыли. Заключение: участие в прибылях вызывает эффективность.
1. Заключение относится только к случаям обдуманный.
2. Только вероятные: другие важные условия могли быть пропущены; это могло быть сочетанием факторов
Двойной метод соглашения
Найдите причину, которая является одновременно необходимой и достаточное условиеКакой фактор всегда присутствует, когда эффект настоящее?
Какой фактор всегда отсутствует при возникновении эффекта нет?
Восемь пациентов имеют заболевание, и каждый дано то или иное средство. Четыре пациента, которым вводили сыворотку S, вылечились. Из тех, кто излечился, никакое другое лекарство не было дано всем. Принадлежащий четверо, которые не были вылечены, каждому пациенту давали по крайней мере одно из лекарств (но не сыворотка S). Сыворотка S признана лекарством.
1. Заключение относится только к событиям обдуманный.
2. Только вероятные: другие важные условия могли быть пропущены; это могло быть сочетанием факторов
Метод разности
Определите достаточное условие среди возможные кандидаты в конкретном случаеФактор единственный, который присутствует когда явление присутствует и отсутствует, когда явление отсутствует.
Две идентичные белые мыши в контролируемом эксперименту давали одинаковое количество четырех разных продуктов. Кроме того, одной из мышей давали определенный препарат. Через некоторое время мышь, которая накормлен препаратом, стал нервным и возбужденным. Исследователи пришли к выводу что наркотик вызвал нервозность.
1. Менее общий вывод, чем обратный метод различия, который применяется ко всем перечисленным вхождениям