Что такое непараметрическая статистика?
Непараметрическая статистика относится к статистическому методу, при котором данные не обязаны соответствовать нормальному распределению. Непараметрическая статистика использует данные, которые часто являются порядковыми, то есть они не зависят от чисел, а скорее от ранжирования или порядка сортировки. Например, опрос, отражающий предпочтения потребителей в зависимости от того, нравится или не нравится, будет считаться порядковыми данными.
Непараметрическая статистика включает непараметрическую описательную статистику, статистические модели, логический вывод и статистические тесты. Структура модели непараметрических моделей не указывается априори, а определяется по данным. Термин « непараметрический» не означает, что в таких моделях отсутствуют параметры, а означает, что число и характер параметров являются гибкими и не фиксируются заранее. Гистограмма является примером непараметрической оценки распределения вероятностей.
Понимание непараметрической статистики
В статистике параметрическая статистика включает такие параметры, как среднее значение, медиана, стандартное отклонение, дисперсия и т. Д. В этой форме статистики используются наблюдаемые данные для оценки параметров распределения. При параметрической статистике предполагается, что данные соответствуют нормальному распределению с неизвестными параметрами μ (средняя численность населения) и σ 2 (дисперсия населения), которые затем оцениваются с использованием среднего значения выборки и дисперсии выборки.
Непараметрическая статистика не делает никаких предположений о размере выборки или о том, являются ли наблюдаемые данные количественными.
Непараметрическая статистика не предполагает, что данные взяты из нормального распределения. Вместо этого форма распределения оценивается при этой форме статистического измерения. Хотя существует много ситуаций, в которых можно предположить нормальное распределение, существуют также некоторые сценарии, в которых невозможно определить, будут ли данные нормально распределены.
Примеры непараметрической статистики
В первом примере рассмотрим, как исследователь, который хочет оценить количество детей в Северной Америке, родившихся с карими глазами, может принять решение взять выборку из 150 000 детей и провести анализ набора данных. Измерение, которое они получают, будет использовано для оценки всей популяции детей с карими глазами, родившимися в следующем году.
В качестве второго примера рассмотрим другого исследователя, который хочет знать, связано ли раннее или позднее ложиться спать с тем, как часто он заболевает. Предполагая, что выборка выбирается случайным образом из популяции, можно предположить, что распределение частоты заболеваемости по размеру выборки является нормальным. Однако нельзя предположить, что эксперимент, который измеряет устойчивость человеческого организма к штамму бактерий, имеет нормальное распределение.
Это связано с тем, что случайно выбранные данные образца могут быть устойчивы к деформации. С другой стороны, если исследователь учитывает такие факторы, как генетический состав и этническая принадлежность, он может обнаружить, что размер выборки, выбранный с использованием этих характеристик, может не быть устойчивым к штамму. Следовательно, нельзя предполагать нормальное распределение.
Этот метод полезен, когда данные не имеют четкой числовой интерпретации, и его лучше всего использовать с данными, имеющими ранжирование. Например, тест оценки личности может иметь ранжирование своих показателей, установленных как строго не согласные, не согласные, равнодушные, согласные и полностью согласные. В этом случае следует использовать непараметрические методы.
Особые соображения
Непараметрическая статистика получила признание благодаря простоте использования. По мере того, как потребность в параметрах уменьшается, данные становятся более применимыми для более широкого спектра испытаний. Этот тип статистики может использоваться без среднего значения, размера выборки, стандартного отклонения или оценки любых других связанных параметров, если ни одна из этих данных недоступна.
Поскольку непараметрическая статистика делает меньше предположений о данных выборки, ее применение шире по охвату, чем параметрическая статистика. В тех случаях, когда параметрическое тестирование является более подходящим, непараметрические методы будут менее эффективными. Это связано с тем, что результаты, полученные из непараметрической статистики, имеют меньшую степень достоверности, чем если бы результаты были получены с использованием параметрической статистики.
Ключевые вынос
- Непараметрические статистические данные просты в использовании, но не обеспечивают точной точности других статистических моделей. Этот тип анализа лучше всего подходит при рассмотрении порядка чего-либо, когда даже при изменении числовых данных результаты, скорее всего, останутся прежними.
