Что такое распределение выборки?
Распределение выборки - это распределение вероятностей статистики, полученной с помощью большого числа выборок, взятых из определенной совокупности. Распределение выборки для данной популяции - это распределение частот ряда различных результатов, которые могут иметь место для статистики популяции.
Понимание распределения выборки
Многие данные, полученные и используемые академиками, статистиками, исследователями, маркетологами, аналитиками и т. Д., На самом деле являются выборками, а не популяциями. Выборка является подмножеством населения. Например, медицинский исследователь, который хотел сравнить средний вес всех детей, родившихся в Северной Америке с 1995 по 2005 год, с детьми, родившимися в Южной Америке за тот же период времени, не может в разумные сроки собрать данные для всей популяции. более миллиона родов за десять лет. Вместо этого он будет использовать вес, скажем, 100 младенцев на каждом континенте, чтобы сделать вывод. Вес 200 использованных младенцев - это образец, а средний вес - это среднее значение.
Теперь предположим, что вместо того, чтобы брать только одну выборку из 100 весов новорожденных с каждого континента, медицинский исследователь берет повторные случайные выборки из общей популяции и вычисляет среднее значение выборки для каждой группы выборок. Так, для Северной Америки он собирает данные для 100 весов новорожденных, зарегистрированных в США, Канаде и Мексике, следующим образом: четыре 100 выборок из отдельных больниц в США, пять 70 выборок из Канады и три 150 записей из Мексики, в общей сложности 1200 весов новорожденных сгруппированы в 12 комплектов. Он также собирает данные выборки из 100 весов при рождении из каждой из 12 стран Южной Америки.
Каждый образец имеет свое собственное среднее значение выборки, а распределение средних значений образца называется распределением выборки.
Средний вес, рассчитанный для каждого набора образцов, представляет собой выборочное распределение среднего значения. Не только среднее значение может быть рассчитано по выборке. Другие статистические данные, такие как стандартное отклонение, дисперсия, пропорция и диапазон, могут быть рассчитаны на основе данных выборки. Стандартное отклонение и дисперсия измеряют изменчивость распределения выборки.
Количество наблюдений в популяции, количество наблюдений в выборке и процедура, используемая для составления выборочных наборов, определяют изменчивость распределения выборки. Стандартное отклонение выборочного распределения называется стандартной ошибкой. Хотя среднее значение распределения выборки равно среднему значению для популяции, стандартная ошибка зависит от стандартного отклонения для популяции, размера популяции и размера выборки.
Знание того, как разнесены средние значения каждого из наборов выборок друг от друга и от среднего значения по совокупности, даст представление о том, насколько среднее значение по выборке близко к среднему значению по совокупности. Стандартная ошибка распределения выборки уменьшается с увеличением размера выборки.
Особые соображения
Население или один набор чисел будет иметь нормальное распределение. Однако, поскольку выборочное распределение включает в себя несколько наборов наблюдений, оно не обязательно будет иметь форму изогнутого колокола.
Следуя нашему примеру, средний вес детей в Северной Америке и в Южной Америке имеет нормальное распределение, потому что у некоторых детей вес будет ниже (ниже среднего) или избыточного веса (выше среднего), при этом большинство младенцев падают между (около среднего значения).). Если средний вес новорожденных в Северной Америке составляет семь фунтов, то средний вес выборки в каждом из 12 наборов наблюдений, зарегистрированных для Северной Америки, также будет близок к семи фунтам.
Однако, если вы построите график каждого из средних значений, рассчитанных в каждой из 1200 групп выборок, результирующая фигура может привести к равномерному распределению, но трудно с уверенностью предсказать, какой будет фактическая форма. Чем больше выборок использует исследователь из популяции, насчитывающей более миллиона весовых показателей, тем больше график начнет формировать нормальное распределение.
- Распределение выборки - это распределение вероятностей статистики, полученной с помощью большого числа выборок, взятых из конкретной совокупности. Распределение выборки для данной совокупности - это распределение частот диапазона различных результатов, которые могут произойти для статистики Население. Многие данные, полученные и используемые академиками, статистиками, исследователями, маркетологами и аналитиками, на самом деле являются выборками, а не популяциями.
