Простая случайная и стратифицированная случайная выборка: обзор
Простые случайные выборки и стратифицированные случайные выборки являются инструментами статистического измерения. Простая случайная выборка используется для представления всей совокупности данных. Стратифицированная случайная выборка делит население на более мелкие группы или слои на основе общих характеристик.
Население - это совокупность наблюдений или данных. Выборка представляет собой набор наблюдений от населения. Метод отбора проб - это процесс, используемый для отбора проб из популяции.
Простой случайный образец
Простая случайная выборка - это статистический инструмент, используемый для описания очень простой выборки, взятой из совокупности данных. Этот образец представляет собой эквивалент всей популяции.
Простая случайная выборка часто используется, когда имеется очень мало доступной информации о совокупности данных, когда совокупность данных имеет слишком много различий, чтобы разделить ее на различные подмножества, или когда среди совокупности данных имеется только одна отличительная характеристика.
Например, кондитерская компания может захотеть изучить покупательские привычки своих клиентов, чтобы определить будущее своей продуктовой линейки. Если есть 10 000 клиентов, он может использовать выбор 100 из этих клиентов в качестве случайной выборки. Затем он может применить то, что находит от этих 100 клиентов, к остальной части своей базы.
Статистики разработают исчерпывающий список совокупности данных, а затем выберут случайную выборку в этой большой группе. В этой выборке каждый член населения имеет равные шансы быть выбранным в качестве части выборки. Их можно выбрать двумя способами:
- Через ручную лотерею, в которой каждому члену населения присваивается номер. Числа затем рисуются случайным образом кем-то для включения в выборку. Это лучше всего использовать при взгляде на небольшую группу. Компьютерная выборка. Этот метод лучше всего работает с большими наборами данных, используя компьютер для выбора образцов, а не человека.
Использование простой случайной выборки позволяет исследователям делать обобщения о конкретной популяции и исключать любые отклонения. Это может помочь определить, как принимать будущие решения. Так что кондитерская компания из приведенного выше примера может использовать этот инструмент для разработки нового вкуса конфет для производства на основе текущих вкусов 100 покупателей. Но имейте в виду, что это обобщения, поэтому есть место для ошибки. В конце концов, это простой образец. Эти 100 клиентов могут не иметь точного представления о вкусах всего населения.
Стратифицированная случайная выборка
В отличие от простых случайных выборок, стратифицированные случайные выборки используются с популяциями, которые можно легко разбить на различные подгруппы или подмножества. Эти группы основаны на определенных критериях, затем случайным образом выбирают элементы из каждого пропорционально размеру группы по отношению к населению.
Этот метод выборки означает, что будут выборки из каждой отдельной группы, размер которой зависит от ее пропорции ко всему населению. Но исследователи должны убедиться, что слои не перекрываются. Каждая точка в популяции должна принадлежать только одному слою, поэтому каждая точка является взаимоисключающей. Перекрывающиеся слои увеличат вероятность включения некоторых данных, что приведет к перекосу выборки.
Компания по производству конфет может решить использовать метод случайной стратифицированной выборки, разделив свои 100 клиентов на разные возрастные группы, чтобы помочь определить будущее своего производства.
Менеджеры портфелей могут использовать стратифицированную случайную выборку для создания портфелей путем репликации индекса, такого как индекс облигаций.
Стратифицированная выборка имеет некоторые преимущества и недостатки по сравнению с простой случайной выборкой. Поскольку он использует конкретные характеристики, он может обеспечить более точное представление населения на основе того, что используется для его разделения на различные подмножества. Это часто требует меньшего размера выборки, что может сэкономить ресурсы и время. Кроме того, путем включения достаточных точек выборки из каждого слоя, исследователи могут провести отдельный анализ для каждого отдельного слоя.
Но требуется больше работы, чтобы вытащить стратифицированную выборку, чем случайную выборку. Исследователи должны индивидуально отслеживать и проверять данные для каждого слоя для включения, что может занять гораздо больше времени по сравнению со случайной выборкой.
Ключевые вынос
- Простые случайные и стратифицированные случайные выборки являются инструментами статистического измерения. Простая случайная выборка берет небольшую базовую часть всей совокупности для представления всего набора данных. Население делится на разные группы, которые имеют сходные характеристики, из которых берется стратифицированная случайная выборка.
