Репрезентативная выборка это выборка: Репрезентативность выборочных данных | Loginom

Содержание

Репрезентативность выборочных данных | Loginom

Репрезентативность — важнейшее свойство данных, используемых для построения аналитических моделей. Независимо от того, в какой предметной области и какими методами производятся выборочные исследования, отсутствие репрезентативности выборки приводит к некорректным результатам. В статье рассказываем подробнее об этом важном свойстве.

  • Обеспечение репрезентативности
  • Качественная репрезентативность
  • Количественная репрезентативность
  • Методы оценки репрезентативности
  • Статистические методы
  • Нестатистические методы
  • Ремонт выборки

Репрезентативность — важнейшее свойство данных, используемых для построения аналитических моделей. Оно отражает способность данных представлять зависимости и закономерности исследуемой предметной области, которые должна обнаружить и научиться воспроизводить построенная модель. Иными словами, репрезентативность показывает, содержат ли анализируемые данные достаточно информации для построения качественной модели, а так же, может ли эта информация быть использована алгоритмом построения модели.

Репрезентативность генеральной совокупности отражает способность совокупности описывать существенные свойства, зависимости и закономерности объектов, процессов и явлений предметной области. Она достигается за счёт правильной организации сбора и консолидации первичных данных.

Репрезентативность выборки описывает способность выборочных данных отражать структурные свойства совокупности, из которой они были извлечены. Т.е. даёт ответ на вопрос: можно ли в исследовании заменить совокупность на выборку без значимого ухудшения результатов анализа. Репрезентативность выборки достигается с помощью правильного выбора метода сэмплинга.

Таким образом, репрезентативность выборки касается только воспроизведения характеристик совокупности. Если сама исходная совокупность плохо представляет предметную область, то, даже если полученная из неё выборка будет репрезентативной, построить на её основе корректную с точки зрения предметной области модель будут невозможно.

Например, пусть компания собирается вывести на рынок новый продукт. При этом она хочет провести маркетинговые исследования в виде опроса клиентов о желаемых характеристиках и параметрах продукта. Число клиентов компании насчитывает сотни тысяч человек (генеральная совокупность), поэтому опросить их всех не представляется возможным физически, не является целесообразным экономически.

Поэтому компания формирует выборку клиентов для проведения опроса. Если мнение клиентов из выборки отражает мнение большинства клиентов и может быть использовано для принятия решений о параметрах и характеристиках нового продукта, то такая выборка будет репрезентативной.

Независимо от того, в какой предметной области и какими методами производятся выборочные исследования, отсутствие репрезентативности выборки приводит к некорректным результатам. Поэтому в процессе анализа необходимо убедиться, что сформированная выборка репрезентативна.

Таким образом, репрезентативная выборка — это такая выборка, в которой представлены все подгруппы, важные для исследования. Помимо этого, характер распределения рассматриваемых параметров в выборке должен быть таким же, как в генеральной совокупности.

Особенно важным является обеспечение репрезентативности в машинном обучении, для построения моделей классификации и регрессии используется несколько выборок: обучающая, тестовая и валидационная, которые тем или иным способом отбираются из исходного набора данных. И все эти выборки должны быть репрезентативными.

Обеспечение репрезентативности

В основе построения репрезентативной выборки лежит правильный выбор используемого алгоритма сэмплинга. При этом размер выборки, хотя и является важным, сам по себе не гарантирует ее репрезентативности. Например, интернет-опрос может показать, что 100% людей пользуется интернетом, хотя это не соответствует действительности (т.е. репрезентативность нарушена).

Выделяют качественную (структурную) и количественную репрезентативность.

Рисунок 1. Количественная и качественная репрезентативность

Качественная репрезентативность

Качественная репрезентативность показывает, что все группы, присутствующие в совокупности, будут представлены и в выборке. Для этого каждый элемент совокупности должен иметь равную вероятность, быть выбранным, а сама выборка должна производиться из однородных групп.

Наиболее оптимальным способом формирования репрезентативной выборки является простой случайный сэмплинг, поскольку в этом случае у любого представителя генеральной совокупности будет одинаковая вероятность попасть в выборку.

Например, при формировании выборки клиентов для опроса, в нее попадут люди из различных социальных групп пропорционально их долям в генеральной совокупности. В результате, выборка будет представлять собой уменьшенную копию генеральной совокупности.

Случайность отбора респондентов в выборку может обеспечивается различными методами. Например, для опроса клиентов берутся номера клиентских карт, которые случайным образом отбираются компьютерной программой с использованием генератора случайных чисел.

Однако, на практике применить простой случайный сэмплинг не всегда представляется возможным. Это связано с тем, что генеральная совокупность может быть неоднородной и будет содержать группы объектов.

Например, если опрос будет проводиться по телефону, то большинство откликов будет получено от пенсионеров, как людей менее занятых и более склонных идти на контакт. Очевидно, что если опрос проводится о продукте, ориентированном на молодёжь, то ценность мнения пенсионеров вряд ли будет высокой.

Чтобы решить эту проблему, можно использовать случайный стратифицированный сэмплинг, когда исходная совокупность сначала разделяется на слои (страты) по некоторому признаку. Например, клиенты могут быть стратифицированы по возрасту. Тогда страты могут быть сформированы пропорционально доле объектов в группах, что позволит уменьшить или увеличить долю той или иной группы, сохранив репрезентативность.

Другой вариант — использовать кластерный (групповой) сэмплинг, когда клиенты предварительно разбиваются на качественно однородные группы — кластеры, и отбор производится из каждого кластера независимо. При этом вероятность отбора может быть одинаковой для всех кластеров, или различной. {2}\cdot 0,25\cdot 0,75}\approx 188 клиентов.

Таким образом, необходимый объем выборки при безвозвратном отборе меньше, чем при возвратном (соответственнo, 188 и 300).

В целом, число наблюдений, требуемое для получения репрезентативной выборки, изменяется обратно пропорционально квадрату допустимой ошибки.

Методы оценки репрезентативности

Формально, выборку называют репрезентативной, когда результат оценки определенного параметра по данной выборке совпадает с результатом, оцененным по генеральной совокупности с учетом допустимой погрешности (ошибки репрезентативности). Если выборочная оценка отличается от оценки по генеральной совокупности более, чем на заданный уровень погрешности, то такая выборка считается нерепрезентативной.

Репрезентативность оценивается по отдельным параметрам выборки и совокупности. При этом выборка может оказаться репрезентативной по одним параметрам и нерепрезентативной по другим. Поэтому говорить о репрезентативности как о дихотомическом свойстве выборки (репрезентативна или нерепрезентативна) было бы не верно: выборка может одни параметры генеральной совокупности воспроизводить более точно, а другие — менее. Поэтому правильнее говорить о мере репрезентативности определённой выборки по конкретным параметрам.

Основным моментом в определении репрезентативности выборки является обоснование погрешности, в пределах которой выборка признается репрезентативной. Одна и та же выборка может быть достаточно репрезентативной для одной задачи и недостаточно для другой. Кроме этого, нужно проверять репрезентативность выборки по параметрам, имеющим существенное значение для предметной области исследования. Например, в маркетинговых исследованиях для анализа клиентов важны пол, возрасту, образование и пр.

Следует отметить, что далеко не все задачи бизнес-аналитики требуют строгого статистического подтверждения репрезентативности выборок. Как правило, это задачи точного прогнозирования. Что касается обычных задач, связанных, например, с определением предпочтений действующих и потенциальных клиентов, то они решаются охватом типичной клиентуры, которую можно найти непосредственно в торговых центрах.

Статистические методы

Данные, полученные в результате выборочных обследований, являются реализациями случайных величин (возраст, стаж работы, доход и т.д.). Обычно, на практике считают, что выборка является репрезентативной, если её статистические параметры (среднее значение, дисперсия, среднеквадратичное отклонение и т.д.) отличаются от параметров совокупности не более, чем на 5%.

Однако, данный подход применим только при условии, что вся генеральная совокупность известна и для неё можно вычислить статистические характеристики. Но на практике такое встречается редко, поскольку часть потенциально интересных для исследования объектов оказывается недоступной для наблюдения.

В этом случае прибегают к формированию двух независимых выборок, вычисляют и сравнивают их характеристики, и если они совпадают (не различаются значимо), то выборки считаются репрезентативными. В теоретическом плане такой подход является достаточно привлекательным, однако, на практике сложно реализуем. Во-первых, формирование нескольких выборок ведёт к дополнительным затратам, а во-вторых, если параметры выборок значимо различаются, то невозможно сказать, какая из них репрезентативна.

Для сравнения двух выборок используются два вида критериев: непараметрические и параметрические. Первые не используют в расчётах значений параметров статистических распределений, а оперируют частотами и рангами. К числу наиболее популярных непараметрических критериев можно отнести критерий Уилкоксона и U-критерий Манна-Уитни. Второй рекомендуется использовать, если число наблюдений превышает 30. К числу популярных параметрических критериев относится t-критерий Стьюдента, критерий однородности Смирнова, Q-критерий Розенбаума и др.

Нестатистические методы

Статистические методы оценки репрезентативности выборочных данных, хотя и являются строго обоснованными, но довольно сложны в использовании (особенно для пользователей, не имеющих достаточной математической подготовки). Кроме этого они могут иметь ограничения (например, независимость выборок), удовлетворить которым достаточно сложно.

Статистические подходы к оценке репрезентативности выборок имеет смысл использовать, если для анализа данных используются статистические методы. Методы машинного обучения, которые является эвристическими и в большинстве случаев не обеспечивают точного и единственного решения, вообще говоря, не нуждаются в точной оценке репрезентативности обучающих выборок. Поэтому в них используются свои техники для определения того, насколько обучающая или тестовая выборка хорошо представляют исходную совокупность.

Ещё одной особенностью выборок, используемых в машинном обучении, является то, что объём исходной совокупности, из которой формируются обучающее, тестовое, а при необходимости, и валидационное множество, известен, поскольку данные содержатся в консолидированных таблицах источника данных.

Обычно нестатистические меры репрезентативности используют расстояния между векторами наблюдений в пространстве признаков. Рассмотрим, например, такой показатель как индекс ближайшего соседа (Nearest Neighbours Index — NNI). {n}D_{i}

где D_i — расстояние от i-го объекта до остальных объектов выборки, n — число объектов выборки.

Затем вычислим величину:

\overline{D}_{total}=\sqrt{\frac{D_{_{total}}}{N}}

где D_{_{total}} — общее расстояние по всей совокупности, N — число наблюдений совокупности.

Тогда индекс ближайшего соседа будет:

NNI=\frac{\overline{D}_{sample}}{\overline{D}_{total}}

Если значение данного показателя близко к 1, то точки выборки имеют равномерное пространственное распределение. Если меньше 1, то пространственное распределение точек неоднородно. Если NNI больше 1, то имеет место значительная дисперсия значений внутри выборки.

Очевидно, что наилучшим вариантом с точки зрения репрезентативности будет первый случай, когда пространственное распределение точек данных в совокупности и выборке примерно одинаковое. Второй случай показывает, что внутри выборки могут присутствовать некоторое локальные особенности, нехарактерные для всей совокупности.

В литературе можно найти больше количество разнообразных алгоритмов и методов оценки репрезентативности выборок для машинного обучения, разработанных для различных предметных областей исследования и типов задач анализа. Большинство их них являются эвристическими и не гарантируют получения наилучшего результата. Поэтому самым надёжным критерием репрезентативности выборки, на основе которой строилась определённая обучаемая модель, является точность и обобщающая способность самой модели.

Ремонт выборки

Возникает вопрос: а что делать в ситуации, когда аналитику доступна только выборка «как есть», а её репрезентативность неудовлетворительная? При этом доступ к генеральной совокупности для формирования более репрезентативной выборки у него отсутствует (например, из-за проблем с сетью, невозможности повторных исследований из-за высоких затрат и т.д.). В этом случае улучшить ситуацию может специальная процедура, которая называется «ремонт выборки».

Все действия аналитика, связанные с репрезентативностью, можно разделить на два этапа: контроль и ремонт.

  1. Контроль выборки — процедура сравнения генеральной совокупности и выборки, выявление степени их расхождения, обнаружение причин отклонений и разработка возможных способов их устранения.
  2. Ремонт выборки — процесс устранения расхождения генеральной совокупности и выборки.

Контроль и ремонт выборки рассматриваются как обязательные этапы любого выборочного исследования. Хотя, некоторые авторы не разделяют эти два этапа, а включают ремонт в общую процедуру контроля выборки. Ряд вопросов, связанных с контролем выборки был рассмотрен выше.

Основной целью ремонта является повышение качества выборки в смысле отражения ею зависимостей и закономерностей исследуемых процессов и явлений, которые требуется обнаружить в процессе анализа. При этом не следует путать ремонт выборки с повышением качества данных вообще.

Ремонт выборки, обычно, включает следующие задачи:

  1. Коррекция выборки. Заключается в замене ранее выбранных объектов совокупности. Коррекция может потребоваться, например, если в выборке произошло искажение распределения объектов относительно исходной совокупности, например, получился избыток пенсионеров, мужчин, женщин или людей с определённым уровнем образования. Замена может быть произвольной (например, следующий клиент по списку) или эквивалентной (подыскивается клиент с теми же параметрами — пенсионера меняем на пенсионера и т.д.).
  2. Расширение основы выборки. Позволяет включить в выборку большее разнообразие наблюдений. Основа выборки — это подмножество элементов генеральной совокупности, из которого будет формироваться выборка. Использование основы выборки позволяет сделать отбор более целевым, исключив обработку данных, не относящихся к задаче анализа, лучше сфокусироваться на целевой группе. В анализе клиентской базы основой выборки могут быть только мужчины, только женщины, люди в возрасте от 30 до 60 и т.д. Если выборка получилась недостаточно репрезентативной, то решить проблему можно расширяя границы основы выборки. Например, если изначально основой выборки являлась только люди пенсионного возраста, то при необходимости она может быть расширена и на людей предпенсионного возраста.
  3. Взвешивание. При взвешивании объектам выборки могут присваиваться весовые коэффициенты, которые могут учитываться в алгоритме анализа. Например, повышенные весовые коэффициенты могут присваиваться клиентам, которые наиболее активно пользовались услугами компании (купили товаров и услуг на сумму выше некоторого порога). Логично предположить, что мнение таких клиентов будет более значимым.

Следует отметить, что единого, строго обоснованного подхода к ремонту выборок, вообще говоря, не существует, хотя в литературе можно встретить некоторые общие рекомендации. В большинстве практических случаев аналитику приходится самостоятельно выбирать, какие преобразования следует применить к выборке для повышения её репрезентативности.

 

Другие материалы по теме:

Обработка пропусков в данных

Loginom Data Quality. Очистка клиентских данных. Деморолик

О репрезентативности выборки в наглядных примерах

Чтобы посредством опроса получить максимально точные данные о какой-либо группе людей, например, о ее поведении и предпочтениях, было бы логично опросить эту группу целиком. Но что, если интересующая нас группа очень велика? Опрос всех потребителей молока в России или всех жителей Южного административного округа Москвы займет много времени и обойдется в астрономическую сумму денег. А нужно ли опрашивать их всех?
О размере выборки и статистической ошибке измерений подробно написано в статье «Выборка. Размер – не главное. Или главное» . В этой статье будет рассмотрено второе требование к выборке, также обеспечивающее качество исследования – репрезентативность.

Согласно теории выборочного метода, неоднократно подтвержденной практикой, опрашивать всех нет необходимости, а можно опросить лишь часть группы, которая может быть в тысячи раз меньше. Эта маленькая часть называется выборкой (или выборочной совокупностью), а большая группа, которую она представляет, называется генеральной совокупностью.

При этом если выборка сформирована правильно, выводы, полученные на основе изучения выборки, могут быть перенесены и на генеральную совокупность. Например, если в выборке женщины значимо чаще, чем мужчины, пользуются дезодорантами, то делается вывод, что и в генеральной совокупности (например, в исследованном городе) присутствует такая закономерность. Процесс переноса выводов с выборки на генеральную совокупность называется генерализацией. А свойство выборки отражать характеристики генеральной совокупности называется репрезентативностью. Для более комфортного запоминания термина на рис.1. приведены иллюстрации, когда выборка отражает свойства генеральной совокупности и когда свойства выборки отличаются от свойств генеральной совокупности.



Рис.1. Иллюстративные примеры соответствия (несоответствия) свойств генеральной совокупности и выборки

Не стоит путать понятие репрезентативности с такими понятиями как валидность и релевантность, хотя они тоже относятся к характеристикам качества исследования. В социальных науках валидность понимается довольно широко, но чаще всего – как обоснованность. Понятие валидности относится не к выборке, а к исследовательской методике. Методика или измерение (анкета, блок вопросов, тест) считается валидным, если фиксирует именно то понятие или свойство, которое планируется измерить. Например, если мы захотим оценить уровень лояльности клиента к магазину и выберем для этого лишь показатель частоты посещения магазина, валидность этого подхода будет неполной: возможно, респондент часто заходит в магазин только из-за банкомата, который там установлен. Валидная методика в данном примере должна включать и другие показатели: предпочтение магазина, суммы покупок в этом и других магазинах, готовность переключиться на другие магазины, готовность рекомендовать магазин и др.

При установлении валидности решающую роль играет обоснование и последующая проверка гипотезы релевантности, то есть соответствия измеряемых параметров характеристикам исследуемого объекта. Житейский пример нерелевантности – измерять уровень счастья человека количеством денег у него (хотя, наверное, не все с этим согласятся). Очевидный пример нерелевантности – попытка измерить массу тела по его температуре.

Но вернемся к понятию репрезентативности. В то время как точность измерений зависит от размера выборки, размер выборки не гарантирует ее репрезентативности. Репрезентативность выборки главным образом обеспечивается способом отбора ее участников (респондентов). Примером явного нарушения репрезентативности может послужить шутка о том, что интернет-опрос показал, что 100% людей пользуется интернетом.

Можно выделить несколько вариантов нарушения репрезентативности выборки: когда опрошены не те люди и когда опрошено слишком много (или мало) определенных людей (например, женщин намного больше, чем мужчин). Кроме того, чем меньше размер выборки, тем меньше вероятность того, что она будет репрезентативной. Например, допустим, 1% населения мог бы заинтересоваться новой услугой. Это 1 из 100 людей. Если размер выборки составляет всего 60 человек, то в вашей выборке может отсутствовать человек, который, скорее всего, будет заинтересован в услуге. Ваша выборка менее репрезентативна, потому что она меньше. Ваши результаты будут разными в зависимости от того, содержит ли ваша выборка одного из этих людей или нет. Пример репрезентативной и нерепрезентативной выборки показан на рис.2.


Рис.2. Пример репрезентативной и нерепрезентативной выборки

На рис.3 показана та же по составу генеральная совокупность, но с другим расположением объектов внутри круга.


Рис.3. Пример репрезентативной и нерепрезентативной выборки при другом расположении объектов генеральной совокупности

Говоря простым языком, репрезентативная выборка – это такая выборка, в которой представлены все подгруппы, важные для исследования. Помимо этого, характер распределения рассматриваемых параметров в выборке должен быть таким же, как в генеральной совокупности.

Простой случайный отбор респондентов представляется оптимальным способом формирования репрезентативной выборки.

Поскольку в этом случае у любого представителя генеральной совокупности одинаковая вероятность попасть в выборку, в нее попадут люди с разными характеристиками пропорционально их долям в генеральной совокупности. В итоге выборка будет представлять собой нечто вроде уменьшенной копии генеральной совокупности.

Случайность отбора респондентов в выборку обеспечивается разными способами. Например, для телефонного опроса жителей города берется база данных всех телефонных номеров, и номера респондентов случайным образом выбираются компьютером (с использованием генератора случайных чисел). При уличном опросе интервьюеров распределяют по случайно выбранным точкам и инструктируют опрашивать каждого N-ного прохожего.

Наглядным примером репрезентативной выборки может служить пицца. Если целая пицца – это генеральная совокупность, которую мы хотим изучить, то кусок пиццы – это выборка. Как правило, достаточно одного куска пиццы, чтобы судить обо всей пицце (при условии, что ингредиенты равномерно распределены по ее поверхности).

Таким образом, кусок пиццы пиццы на рис.4 – это репрезентативная выборка из пиццы.


Рис.4. Наглядный пример репрезентативной выборки (пицца)

Важно отметить, что не любой кусок пиццы будет репрезентативной выборкой. Разные способы получения куска пиццы могут принципиально повлиять на качество исследования и выводы, которые будут получены при анализе каждого варианта выборки (рис.4)

(рисунок в сушильной камере, готовится к публикации)

Рис.5. Наглядный пример формирования репрезентативной и нерепрезентативной выборки.

Еще один показательный пример формирования репрезентативной выборки – кастрюля, содержимое которой мы должны узнать (допустим, там скрывается борщ). Мы только один раз можем зачерпнуть из кастрюли ложкой (провести исследование). В нашем примере ложка – это выборка, а содержимое кастрюли – генеральная совокупность.

Если мы зачерпнем сверху, то придем к выводу, что в кастрюле бульон. Если снизу – решим, что в кастрюле мясо. Зачерпнув где-то посередине, мы получим картошку или капусту. В любом из трех случаев выводы будут неверны. Чтобы получить достоверный результат, нам стоит хорошенько перемешать содержимое кастрюли, перед тем как пробовать его. Перемешивание в данном случае – аналог процедуры простого случайного отбора, поскольку оно предоставляет всем ингредиентам примерно равную вероятность попадания в ложку-выборку (или тарелку-выборку).


Рис.6. Борщ как модель, демонстрирующая репрезентативность выборки.

В реальности применить простой случайный отбор респондентов не всегда удается в полной мере. Например, мы можем абсолютно корректно отобрать в выборку нужное количество номеров домашних телефонов случайным образом, но при их прозвоне выяснится, что дозвониться и поговорить удается преимущественно с пенсионерами, а «поймать» дома молодежь и работающих людей получается плохо.

Возвращаясь к примеру с борщом, если у нас вместо кастрюли – огромный ресторанный котел, а в руках все та же обычная ложка, перемешивание будет неэффективным. Чтобы решить задачу, потребуются иные подходы. Например, мы можем теоретически разделить глубину котла на несколько слоев и постараться зачерпнуть содержимое из каждого слоя (из случайного места слоя: не только в центре, но и по краям). Таким образом, наша итоговая выборка будет состоять уже из нескольких выборок и при этом адекватно отражать содержимое всех слоев котла. Подобные альтернативные подходы называются типами выборки, которых придумано достаточно много для того, чтобы максимизировать репрезентативность выборки в сложных условиях реального мира.

Последствия нарушения репрезентативности выборки: некорректные выводы исследования, выброшенный на ветер бюджет исследования, финансовые потери вследствие применения неправильных выводов. Вы можете выбрать валидную исследовательскую методику, рассчитать объем выборки, обеспечивающий приемлемую точность измерений, но, если выборка исследования нерепрезентативна, получить достоверную информацию не удастся.

ПРИМЕРЫ НАРУШЕНИЯ РЕПРЕЗЕНТАТИВНОСТИ ВЫБОРКИ

ПРЕДВЫБОРНЫЙ ОПРОС

Самым известным примером нарушения репрезентативности выборки является история провала американского журнала «Литературный дайджест».

В 1936 году журнал в очередной раз провел почтовый опрос общественного мнения о вероятных результатах грядущих президентских выборов в США. До 1936 года опрос всегда правильно предсказывал победителя. Опрос 1936 года показал, что победителем с большим отрывом станет кандидат от республиканцев, но в итоге победителем оказался представитель демократов.

Таким образом, гигантская выборка (около 2,4 млн. человек) не обеспечила достоверных результатов. В чем же заключалась причина ошибки?

Называются две основные причины провала: смещение при формировании выборки и смещение вследствие отказа респондентов от участия в опросе.

Прежде всего, журнал включил своих подписчиков в список для рассылки анкет и, желая расширить выборку, использовал два других доступных тогда списка граждан: зарегистрированных автовладельцев и пользователей телефонов. Во времена Великой Депрессии представители этих групп отличались от остального населения более высоким доходом, как и подписчики самого журнала. Таким образом, полученная база для рассылки не являлась корректным отражением структуры населения США.

Вторая проблема с опросом заключалась в том, что из 10 миллионов человек, чьи имена были в первоначальном списке рассылки, только 2,4 миллиона ответили на опрос. Вероятно, высокий процент отказов был связан с тем, что опрос проводился по почте. Уже в те времена американцы относились к почтовым рассылкам как к спаму. Таким образом, размер выборки составил примерно одну четверть от того, что первоначально планировалось. Когда доля ответивших низка (как это было в данном случае), считается, что исследование страдает от необъективности ответов.

У этой истории две морали: Большая, но неправильно сформированная выборка гораздо хуже маленькой, но правильно сформированной выборки. При проведении опроса не упускайте из внимания смещение отбора и смещение в результате отказов.

СИСТЕМАТИЧЕСКАЯ ОШИБКА ВЫЖИВШЕГО

Пример из военной практики. Во Вторую мировую войну американские военные столкнулись со следующей проблемой. Не все американские бомбардировщики после задания возвращались на базу. На вернувшихся самолетах оставалось множество пробоин от выстрелов противника, но распределены они были неравномерно: больше всего на фюзеляже и прочих частях, меньше в топливной системе и гораздо меньше — в двигателе. Командованию казалось логичным, что в наиболее поврежденных местах нужно установить больше брони.
Привлеченный к решению задачи математик возразил: данные как раз показывают, что самолет, получивший пробоины в этих местах, еще может вернуться на базу. А самолет, которому попали в бензобак или двигатель, выходит из строя и не возвращается. Поэтому укреплять следует те места, которые у вернувшихся самолетов повреждены меньше всего.


Рис .7. Пробоины на вернувшихся самолётах.
Получившие повреждения в других местах не смогли вернуться на базу

Эта задача служит примером нарушения репрезентативности выборки, когда в нее включены не те респонденты: в данном случае, вернувшиеся самолеты, в то время как не вернувшиеся проигнорированы.

Применительно к маркетинговым исследованиям, эта ситуация подобна следующей. При опросе клиентов бизнеса будет ошибкой опрашивать только текущих клиентов и не опрашивать потерянных клиентов (а какие «пробоины» получили они?).

НЕПРАВИЛЬНЫЕ МЕСТА ОПРОСА

При опросе посетителей ТРЦ важно правильно расставить интервьюеров. Например, если поставить интервьюеров только у главного входа, в выборку не попадут посетители, приехавшие в ТРЦ на автомобиле и попавшие в него через парковку. Как следствие, выводы, полученные на собранных данных, будут корректны только для той части посетителей, которые приходят в ТРЦ пешком, а значит, делают меньше покупок, не покупают габаритные товары, живут ближе к ТРЦ, чем приезжающие на автомобиле.

ОТСУТСТВИЕ КВОТИРОВАНИЯ

Другой пример. Бывает, что в разных районах города сбор анкет идет с разной скоростью: где-то (например, в центре города) большой пешеходный поток и у людей есть время на участие в опросе (отдыхающие, в отпуске, офисные сотрудники на обеде), а на окраинах либо мало людей на улицах, либо все спешат на работу и отказываются участвовать. В результате, если не ограничивать доли районов, в выборке будут преобладать люди из центрального района, которые могут значимо отличаться от остальных людей родом занятий, уровнем дохода и образования, уровнем осведомленности о магазинах и др. Таким образом, собранная выборка уже не будет репрезентативной по отношению к населению всего города.


ОНЛАЙН-ОПРОСЫ (ОНЛАЙН-ПАНЕЛИ)

Несмотря на многие положительные стороны онлайн-опросов, такие как экономичность, оперативность сбора информации, удобство ее обработки и т. д., некоторые их особенности напрямую угрожают репрезентативности исследования:

Во-первых, участники онлайн-опросов – это, как правило, активные пользователи интернета, хорошо в нем разбирающиеся и больше подверженные влиянию интернет-культуры, чем обычные люди.

Во-вторых, люди, у которых есть время и желание регулярно участвовать в онлайн-опросах за небольшое вознаграждение, скорее всего, значительно отличаются от остальных людей как по социально-демографическим, так и по психографическим характеристикам.

В-третьих, профессиональное участие в опросах приводит к так называемой профессиональной деформации, когда ответы респондентов на вопросы новых исследований обусловлены предыдущим опытом, но не жизненным, а опытом участия в других опросах.

Таким образом, в данном случае возникает та ситуация, когда опрашиваются не те люди, хотя по формальным характеристикам они подходят под описание целевой аудитории.

ВЫВОДЫ

Итак, чтобы получить достаточно точные данные об интересующей нас группе людей, необязательно опрашивать их всех, благодаря свойству репрезентативности выборки.

«Чем больше, тем лучше» – неправильный подход к формированию выборки.

Небольшая репрезентативная выборка лучше большой, но нерепрезентативной выборки. Применительно к выборке не стоит пугаться слова «случайная». Это вовсе не значит, что в исследовании будут получены случайные результаты. Напротив, случайный подход к формированию выборки делает ее максимально похожей на генеральную совокупность, а значит, репрезентативной.

При проектировании выборки следует учитывать опасность смещения структуры выборки вследствие особенностей сбора информации и других условий.

Вы можете подписаться на уведомления о новых материалах СканМаркет

Подписаться на рассылку

Возврат к списку

Поделиться:

Репрезентативная выборка: определения и примеры

Попробуйте Qualtrics бесплатно

Бесплатная учетная запись

13 минут чтения
В маркетинговых исследованиях нецелесообразно и нецелесообразно проводить опросы или опросы всех представителей целевой группы. Тем не менее, вам все еще нужно получить результаты опроса, которые точно отражают взгляды, мнения или поведение этой большей группы населения. Так что ты можешь сделать? Узнайте здесь.

В маркетинговых исследованиях нецелесообразно и нецелесообразно проводить опросы или опросы всех представителей целевой группы.

Тем не менее, вам по-прежнему необходимо получать результаты опроса, которые точно отражают взгляды, мнения или поведение большей части населения. Так что ты можешь сделать?

Ответ состоит в том, чтобы провести опрос небольшой группы населения таким образом, чтобы получить репрезентативный набор результатов, отражающий больший размер выборки.

Этот меньший образец известен как репрезентативная проба .

В этом руководстве мы познакомим вас с репрезентативной выборкой, в том числе с тем, что это такое, с различными типами репрезентативных выборок, которые вы можете использовать, почему репрезентативные выборки важны для исследования рынка и, наконец, с тем, как создать репрезентативную выборку для вашего исследования. .

Бесплатная электронная книга: Как определить размер выборки

Что такое репрезентативная выборка?

Репрезентативная выборка — это выборка из большей группы, которая точно отражает характеристики большей совокупности.

Она известна как репрезентативная выборка, потому что ответы, полученные из нее, точно отражают результаты, которые можно получить, опросив все население.

Например, на складе с выборкой из 1000 человек, разделенной поровну на 500 мужчин и 500 женщин, меньшая группа из 100 мужчин и 100 женщин может создать репрезентативную выборку для большей группы.

Поскольку репрезентативные выборки просты в проведении и экономически эффективны, они широко используются для сбора данных во всех видах исследований. И если все сделано правильно, результаты будут такими же точными, как и в крупномасштабном опросе.

Методы репрезентативной выборки

Создать репрезентативную выборку относительно просто, но есть несколько моментов, которые следует учитывать — один из них — размер совокупностей или групп, которые вы хотите изучить, и то, как это будет определять размер выборочной группы. точно отражать точку зрения большей группы.

Однако размер группы — не единственное, что следует учитывать при построении репрезентативной выборки.

Например, если вы проводили исследование о том, как мировой финансовый кризис повлиял на семьи со средним и низким доходом, вам может потребоваться определить социально-экономический статус вашей выборки. Таким образом, вы можете исключить из своего исследования лиц с самым высоким доходом (или семьи с высоким доходом), гарантируя, что вы получите точную и репрезентативную выборку вашей целевой аудитории.

Также важно, чтобы ваша выборка имела те же свойства, что и вся совокупность. Например, правильное распределение по полу и/или возрасту, чтобы гарантировать, что вы представляете большую выборку.

Существует два типа выборки, которые можно использовать для репрезентативной выборки.

Вероятностная выборка

Вероятностная выборка — это когда вы выбираете меньшую группу из большей совокупности с помощью рандомизированного процесса.

В этом процессе каждый член населения имеет равные шансы быть выбранным для выборки.

В зависимости от размера большой совокупности можно непреднамеренно получить избыточную выборку для одной ее части.

Подробнее: Вероятностная выборка: что это такое и как ее использовать Однако при выборе выборки это может привести к систематической ошибке в некоторых опросах, поскольку вы знаете характеристики каждого участника.

Неправдоподобная выборка не только увеличивает систематическую ошибку, но и требует дополнительных действий администратора, поскольку необходимо отобрать участников.

Одним из примеров невероятностной выборки является квотная выборка, которая часто используется при попытке найти репрезентативную выборку для всего населения, такого как США или Великобритания.

В обоих случаях размер каждой выборки должен составлять около 1500 или 2000, чтобы точно отразить все население.

В этой большой группе будет ряд подмножеств. Например, шесть возрастных групп (16–24 и 24–35), две разбивки по полу и, как правило, 15 регионов (потенциально меньше в Великобритании) для создания репрезентативной выборки страны.

Подробнее: Что такое невероятностная выборка? Все, что вам нужно знать

Чем он отличается от других методов отбора проб?

Хотя репрезентативная выборка является одним из способов проведения опроса, существуют и другие методы выборки, которые вы можете использовать (без опроса каждого отдельного члена совокупности), при этом сопоставляя характеристики меньшей группы с большей.

Вот несколько других методов выборки, которые вы могли бы рассмотреть:

Случайная выборка

Случайная выборка — это метод вероятностной выборки, который обеспечивает равную вероятность того, что каждый член большой совокупности будет выбран для исследования.

Он также используется, когда вы хотите создать репрезентативную выборку всего населения. Например, если вам нужна выборка, которая будет представлять всю страну, вы, скорее всего, будете использовать вероятностную выборку.

Программное обеспечение для проведения опросов или другие инструменты (например, генераторы случайных чисел) часто используются для обеспечения случайного выбора выборки.

Подробнее: Руководство по простой случайной выборке

Систематическая выборка

Систематическая выборка аналогична случайной выборке тем, что в процессе отбора присутствует элемент случайности.

Однако, в отличие от случайной выборки, вместо произвольного выбора людей каждому человеку присваивается номер, а затем через равные промежутки времени отбираются участники.

Например, в группе из 50 человек каждый получает номер, а затем случайным образом выбирается начальная точка — т.е. процесс отбора начнется с номера 7. Затем будет выбран каждый 4-й человек. Таким образом, выбранные числа будут такими: 7, 11, 15, 19.и так далее, пока не будет достигнут размер выборки.

Подробнее: Полное руководство по систематической случайной выборке

Стратифицированная выборка

При стратифицированной выборке каждый член более крупной совокупности классифицируется в другую подгруппу на основе характеристик. Например, возраст, пол, доход и так далее.

После того, как вы определили свои подмножества, вы определяете, сколько людей из каждого подмножества вам потребуется для создания репрезентативной выборки. Затем вы используете систематическую выборку или случайную выборку, чтобы сделать окончательный выбор.

Подробнее: Как использовать стратифицированную случайную выборку

Кластерная выборка

Кластерная выборка аналогична стратифицированной выборке в том смысле, что каждый участник помещается в меньшую подгруппу на основе определенной характеристики.

Однако вместо случайного выбора участников из каждой подгруппы вы просто выбираете целую подгруппу для формирования окончательной выборки.

Выборка для удобства

Как следует из названия, выборка для удобства предполагает выбор участников, которые вам удобны. Например, если вы хотите оценить удовлетворенность сотрудников, вы можете опросить своих сотрудников.

Подробнее: Удобный метод отбора проб: как и когда его использовать?

Выборка добровольных ответов

Выборка добровольных ответов — это когда ваша выборка состоит из участников, которые вызвались участвовать в составе группы выборки. Эти участники обычно добровольно вызываются, потому что у них есть твердое мнение по предмету опроса.

Целевая выборка

Целевая выборка, также называемая выборочной выборкой или выборочной выборкой, заключается в том, что вы полагаетесь на свой опыт при выборе представителей населения для участия в обследовании.

Выборка методом снежного кома

Выборка методом снежного кома, также называемая цепной реферальной выборкой, представляет собой метод невероятностной выборки, при котором образцы обладают редкими или труднообнаружимыми характеристиками. В этом методе выборки существующие испытуемые требуют будущих испытуемых из числа своих знакомых и друзей, что вызывает эффект снежного кома. По мере того, как выборка накапливается, она в конечном итоге достигает точки, когда собрано достаточно данных, чтобы сделать ее полезной для исследования.

Почему репрезентативная выборка важна для исследования рынка?

Создание репрезентативной выборки важно для исследования рынка, чтобы гарантировать сбор точных данных и сведений об аудитории, которые помогут принять более взвешенные решения или улучшить процессы.

Без репрезентативной выборки вы не можете быть уверены, что данные вашего исследования будут точно отражать взгляды или поведение людей, которых вы хотите лучше понять.

Самые точные данные всегда будут поступать от вашей целевой аудитории, а репрезентативная выборка обеспечит вам высокий уровень точности и позволит избежать ошибок выборки.

Вот еще несколько причин, по которым важна репрезентативная выборка:

Это практично и эффективно: Репрезентативная выборка заключается в использовании меньшей группы людей для понимания гораздо большей совокупности и, таким образом, для получения точных сведений без затрат и административных затрат. обследование всего населения.

Помогает принимать точные решения: Без репрезентативной выборки вашей целевой аудитории вы не можете быть уверены, что принимаете решения, которые приносят пользу вашему бизнесу. Образцы должны быть тщательно отобраны, чтобы гарантировать, что они будут соответствовать вашей более широкой аудитории.

Это помогает избежать ошибки выборки: Как мы уже упоминали, не гарантируя, что ваша выборка репрезентативна, вы не можете быть уверены, что собираемые вами данные точны или соответствуют тому, что вы пытаетесь раскрыть.

Обеспечивает хорошую рентабельность инвестиций: Единственный способ убедиться, что ваши бизнес-решения приведут к улучшениям, — это узнать точку зрения аудитории, на которую они повлияют. Репрезентативная выборка гарантирует, что вы нацелитесь на правильную аудиторию, получая информацию, которая поможет вам улучшить продукты, услуги и процессы.

Бесплатная электронная книга:  Как свести к минимуму ошибки выборки и ошибки, не связанные с выборкой

Как построить репрезентативную выборку несколько простых шагов, которые помогут сделать процесс отбора проб более простым и экономичным.

1 – Определите численность населения : Понимание численности вашей целевой аудитории может помочь вам определить размер выборки, необходимый для того, чтобы она была репрезентативной.

2 – Определите размер выборки: Зная размер генеральной совокупности, вы сможете определить размер необходимой вам выборки. Узнайте, как рассчитать размер выборки.

3 – Определите характеристики вашего образца : В зависимости от выбранного вами типа метода отбора проб вам необходимо определить характеристики вашего образца. Затем вы можете начать либо выбирать свою выборку случайным образом, либо делить их на подмножества, чтобы сузить круг тех, кого вы ищете.

После того, как вы сузили выборку, характеристики и методологию выборки, вы можете начать опрос.

Создание репрезентативной выборки с помощью Qualtrics

Репрезентативная выборка является ключевым элементом получения точных результатов, а с Qualtrics CoreXM вы можете связаться с нужными людьми в нужное время.

С помощью решения Qualtrics Audience Management Solution получайте ценную информацию по запросу с отзывами нужных людей в нужное время. Вы можете:

  • Создавайте подробные профили своих клиентов и потенциальных клиентов и учитывайте их отзывы при принятии наиболее важных решений.
  • Получите больше информации, запустив исследование на панель быстрее, чем когда-либо
  • Сократите расходы на исследования с помощью собственной выборки респондентов по запросу
  • Быстро действуйте в соответствии с идеями, получая ответы в режиме реального времени
  • Повышайте уровень ответов на опросы с помощью заинтересованной группы респондентов

И это еще не все — если вам нужна помощь в определении ваших выборок или включении перспектив труднодоступной аудитории, Qualtrics Research Services может вам помочь. Помимо поиска идеальной целевой аудитории и развертывания исследований, их команда экспертов может помочь с дизайном исследования, анализом результатов и даже с индивидуальными рекомендациями для презентаций на уровне руководителей.

Используя методы репрезентативной выборки, ваши исследования станут более эффективными и практичными, но при этом будут предлагать важные идеи, которые значительно улучшат деловые решения.

Посредством репрезентативной выборки вы можете повысить точность своих результатов, достоверность своих исследований (позволяя вам постепенно стать первопроходцем в плане практических идей) и удобство использования собранных вами идей. В свою очередь, вы можете использовать всю собранную информацию, чтобы заложить прочную основу для стратегий или проектов, которые вы хотите реализовать в будущем.

Конечно, чтобы максимально использовать эти данные, вам нужно решение для их анализа, понимания и упрощения — не только для того, чтобы вы могли понять результаты, но и для того, чтобы вы могли поделиться этими данными с другими.

Бесплатная электронная книга: Как определить размер выборки

Загрузить сейчас

Связанные ресурсы

УЗНАТЬ БОЛЬШЕ

Запросить демонстрацию

Имя *

Пожалуйста, введите ваше имя.

Фамилия *

Пожалуйста, введите вашу фамилию.

Компания *

Пожалуйста, введите название вашей компании.

Должность *

Пожалуйста, введите вашу должность.

Рабочий адрес электронной почты *

Пожалуйста, введите действующий рабочий адрес электронной почты. Ой! Это похоже на личный адрес электронной почты. Введите свой рабочий адрес электронной почты. Ой! Это похоже на личный адрес электронной почты. Введите свой рабочий адрес электронной почты.

Номер телефона *

Введите правильный номер телефона.

— select an option — AfghanistanAlbaniaAlgeriaAmerican SamoaAndorraAngolaAnguillaAntarcticaAntigua and BarbudaArgentinaArmeniaArubaAustraliaAustriaAzerbaijanBahamasBahrainBangladeshBarbadosBelarusBelgiumBelizeBeninBermudaBhutanBoliviaBonaire, Sint Eustatius and SabaBosnia and HerzegovinaBotswanaBouvet IslandBrazilBritish Indian Ocean TerritoryBrunei DarussalamBulgariaBurkina FasoBurundiCambodiaCameroonCanadaCape VerdeCayman IslandsCentral African RepublicChadChileChinaChristmas IslandCocos (Keeling) IslandsColombiaComorosCongo, Republic of theCook IslandsCosta RicaCroatiaCuraçaoCyprusCzech RepublicCôte d’IvoireDenmarkDjiboutiDominicaDominican RepublicEcuadorEgyptEl SalvadorEquatorial GuineaEritreaEstoniaEswatiniEthiopiaFalkland Islands ( Malvinas)Faroe IslandsFijiFinlandFranceFrench GuianaFrench PolynesiaFrench Southern TerritoriesGabonGambiaGeorgiaGermanyGhanaGibraltarGreeceGreenlandGrenadaGuadeloupeGuamGuatemalaGuernseyGuineaGuinea-BissauGuyanaHaitiHeard Island and McDonald IslandsHoly See (Vatican City State)HondurasHong Kong, ChinaHungaryIcelandIndiaIndonesiaIraqIrelandIsle of ManIsraelItalyJamaicaJapanJerseyJordanKazakhstanKenyaKiribatiKuwaitKyrgyzstanLao People’s Democratic RepublicLatviaLebanonLesothoLiberiaLibyaLiechtensteinLithuaniaLuxembourgMacao, ChinaMacedonia, NorthMadagascarMalawiMalaysiaMaldivesMaliMaltaMarshall IslandsMartiniqueMauritaniaMauritiusMayotteMexicoMicronesiaMoldovaMonacoMongoliaMontenegroMontserratMoroccoMozambiqueMyanmarNamibiaNauruNepalNetherlandsNew CaledoniaNew ZealandNicaraguaNigerNigeriaNiueNorfolk IslandNorthern Mariana IslandsNorwayOmanPakistanPalauPalestinePanamaPapua New GuineaParaguayPeruPhilippinesPitcairnPolandPortugalPuerto RicoQatarRomaniaRussia, excluding CrimeaRwandaRéunionSaint BarthélemySaint Helena, Ascension and Tristan da CunhaSaint Kitts and NevisSaint LuciaSaint Martin (French part)Saint Pierre and MiquelonSaint Vincent and the GrenadinesSamoaSan MarinoSao Tome and PrincipeSaudi ArabiaSenegalSerbiaSeychellesSierra LeoneSingaporeSint Maarten (Dutch part)SlovakiaSloveniaSolomon IslandsSomaliaSouth AfricaSouth Georgia and the South Sandwich IslandsSouth KoreaSouth SudanSpainSri LankaSudanSurinameSvalbard and Jan MayenSwedenSwitzerlandTaiwan, ChinaTajikistanTanzaniaThailandTimor-LesteTogoTokelauTongaTrinidad и ТобагоТунисТурцияТуркменистанОстрова Теркс и КайкосТувалуУгандаУкраина, кроме КрымаОбъединенные Арабские ЭмиратыВеликобританияСоединенные ШтатыОтдаленные малые острова СШАУругвайУзбекистанВануатуВенесуэлаВьетнамВиргинские острова, Британские Виргинские острова, СШАУоллис и ФутунаЗападная СахараЙеменЗамбияЗимбабвеАландские острова; Страна *

Пожалуйста, выберите вашу страну.

Пожалуйста, введите свой запрос здесь…

Предоставляя эту информацию, вы соглашаетесь с тем, что мы можем обрабатывать ваши персональные данные в соответствии с нашим Заявлением о конфиденциальности

Отправляя эту форму, вы соглашаетесь получать маркетинговую информацию от Qualtrics как указано в наших Условиях обслуживания и Заявлении о конфиденциальности. Вы можете отменить подписку в любое время.

Да, я хочу получать маркетинговые сообщения о продуктах, услугах и мероприятиях Qualtrics

Укажите, что вы готовы получать маркетинговые сообщения.

Отправляя заявку, я соглашаюсь с Условиями обслуживания и Заявлением о конфиденциальности Qualtrics

Step /2

Готовы узнать больше о Qualtrics?

Запросить демонстрацию

Репрезентативная выборка: определение, значение и примеры

Что такое репрезентативная выборка?

Репрезентативная выборка — это подмножество населения, стремящееся точно отразить характеристики большей группы. Например, класс из 30 учеников, в котором 15 мальчиков и 15 девочек, может создать репрезентативную выборку, в которую могут входить шесть учеников: три мальчика и три девочки. Выборки полезны в статистическом анализе, когда размеры популяции велики, потому что они содержат меньшие, управляемые версии большей группы.

Ключевые выводы

  • Репрезентативная выборка — это один из методов, который можно использовать для получения информации и наблюдений о целевой группе населения.
  • Репрезентативная выборка — это небольшая подгруппа, которая стремится пропорционально отразить определенные характеристики, представленные в качестве примера в целевой совокупности.
  • Для крупных обследований исследователи могут разделить население на страты в соответствии с этническими маркерами, гендерными характеристиками, возрастными группами, доходом или географическим положением, чтобы убедиться, что они используют репрезентативную выборку.
  • В США Бюро переписи населения проводит несколько обследований деловой и демографической среды, используя репрезентативные выборки для обеспечения точного охвата.
  • Репрезентативные образцы часто дают наилучшие результаты, но они могут быть наиболее сложными для получения.
Репрезентативная проба

Понимание репрезентативной пробы

Выборка используется в методологиях статистического анализа для получения информации и наблюдений о группе населения. Статистики могут использовать различные методы выборки для построения выборок, которые стремятся достичь целей своих исследований. Репрезентативные выборки являются одним из видов метода выборки. Этот метод использует стратифицированную случайную выборку, чтобы помочь идентифицировать ее компоненты. Другие методы могут включать случайную выборку и систематическую выборку.

Репрезентативная выборка направлена ​​на то, чтобы выбрать компоненты, которые соответствуют ключевым характеристикам всей исследуемой совокупности.

Статистики могут выбирать репрезентативные характеристики, которые, по их мнению, лучше всего соответствуют целям их исследования. Как правило, характеристики репрезентативной выборки сосредоточены на демографических категориях. Некоторые примеры ключевых характеристик могут включать пол, возраст, уровень образования, социально-экономическое положение и семейное положение. Как правило, чем больше исследуемая совокупность, тем больше характеристик может возникнуть для рассмотрения.

Типы методов отбора проб

Выбор метода выборки может зависеть от множества факторов. Репрезентативные выборки обычно являются идеальным выбором для анализа выборки, поскольку ожидается, что они дадут информацию и наблюдения, которые тесно связаны со всей группой населения.

Когда выборка не является репрезентативной, ее можно назвать случайной выборкой. Хотя случайная выборка является упрощенным подходом к выборке, она сопряжена с более высоким риском ошибки выборки, которая потенциально может привести к неправильным результатам или стратегиям, которые могут быть дорогостоящими. Случайная выборка может выбирать компоненты полностью случайным образом, например, случайным образом выбирая имена из списка. Снова используя пример класса, случайная выборка может включать шесть учеников мужского пола.

Систематическая выборка — это еще один тип метода выборки, целью которого является систематизация ее компонентов. Этот тип выборки может включать выбор каждого пятого человека из списка населения для сбора выборки. Хотя этот метод использует систематический подход, он все же может привести к случайной выборке.

Стратифицированная случайная выборка

Стратифицированная случайная выборка может быть важной частью процесса создания репрезентативной выборки. Стратифицированная случайная выборка исследует характеристики группы населения и разбивает население на так называемые страты. Разделение населения по слоям помогает аналитику легко выбрать подходящее количество людей из каждого слоя на основе пропорций населения. Хотя этот метод требует больше времени и часто более дорогостоящий, поскольку требует больше предварительной информации, получаемая информация обычно имеет более высокое качество.

Одним из примеров репрезентативной выборки является исследование американского сообщества, ежегодное исследование ключевых демографических характеристик страны. Для обеспечения репрезентативности выборки Бюро переписи населения проводит стратификацию населения по уездам, жизненному положению и другим демографическим характеристикам. Это гарантирует, что выбранная совокупность является точным снимком совокупности в целом.

Особые указания

Обычно ожидается, что репрезентативная выборка даст наилучший набор результатов. Репрезентативные выборки известны тем, что собирают результаты, идеи и наблюдения, на которые можно с уверенностью полагаться как на представление большей изучаемой совокупности. Таким образом, репрезентативная выборка обычно является лучшим методом для маркетинговых или психологических исследований.

Хотя репрезентативные выборки часто являются предпочтительным методом выборки, они все же имеют некоторые барьеры. Зачастую сбор данных, необходимых для построения репрезентативной выборки, нецелесообразен с точки зрения времени, бюджета и усилий. Используя стратифицированную случайную выборку, исследователи должны определить характеристики, разделить население на страты и пропорционально отобрать людей для репрезентативной выборки.

В целом, чем больше целевая группа населения, тем сложнее может быть репрезентативная выборка. Этот метод может быть особенно сложным для очень большого населения, такого как целая страна или раса. При работе с большим населением также может быть сложно привлечь желаемых членов для участия. Например, люди, которые слишком заняты, чтобы участвовать, будут недостаточно представлены в репрезентативной выборке. Понимание плюсов и минусов как репрезентативной, так и случайной выборки может помочь исследователям выбрать наилучший подход для своего конкретного исследования.

Как лучше всего избежать смещения выборки?

Самый простой способ избежать систематической ошибки выборки — использовать простую случайную выборку, при которой каждый член совокупности имеет равные шансы быть включенным в выборку. Хотя этот тип выборки является статистически наиболее надежным, все же возможно получить предвзятую выборку из-за случайности или ошибки выборки.

Как обеспечить репрезентативность образца?

Для того чтобы гарантировать, что их выборка является точным поперечным сечением населения, исследователи иногда используют систематические или стратифицированные методы выборки, чтобы гарантировать, что выборка напоминает известные характеристики населения. Например, если испытуемая популяция состоит из 55% мужчин и 45% женщин, они намеренно выберут выборку, состоящую из 55% мужчин. Обратите внимание, что этот метод требует от исследователей определенного уровня уверенности в отношении выборки населения.

Каковы недостатки репрезентативной выборки?

Как и другие статистические инструменты, репрезентативная выборка иногда может давать необъективные или неточные результаты. Кроме того, время и стоимость создания репрезентативной выборки могут быть непомерно высокими, особенно если население рассредоточено по обширной географической территории.

About the Author

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Related Posts