Что такое доверительный интервал?
Доверительный интервал в статистике относится к вероятности того, что параметр совокупности попадет между двумя заданными значениями в течение определенной доли времени. Доверительные интервалы измеряют степень неопределенности или достоверности в методе выборки. Доверительный интервал может принимать любое число вероятностей, при этом наиболее распространенным является уровень достоверности 95% или 99%.
Доверительный интервал и уровень достоверности взаимосвязаны, но не совсем одинаковы.
Понимание доверительного интервала
Статистики используют доверительные интервалы для измерения неопределенности. Например, исследователь случайным образом выбирает разные выборки из одной популяции и вычисляет доверительный интервал для каждой выборки. Полученные наборы данных все разные; некоторые интервалы включают в себя истинный параметр населения, а другие нет.
Доверительный интервал - это диапазон значений, который, вероятно, будет содержать неизвестный параметр совокупности. Уровень достоверности относится к проценту вероятности или достоверности того, что доверительный интервал будет содержать истинный параметр совокупности, когда вы много раз рисуете случайную выборку. Или, говоря местным языком: «Мы на 99% уверены ( уровень достоверности), что большинство этих наборов данных (доверительные интервалы) содержат истинный параметр совокупности».
Ключевые вынос
- Доверительный интервал вычисляет вероятность того, что параметр совокупности попадет между двумя установленными значениями. Доверительные интервалы измеряют степень неопределенности или определенности в методе выборки. Чаще всего доверительные интервалы отражают уровни достоверности 95% или 99%.
Расчет доверительного интервала
Предположим, что группа исследователей изучает высоты баскетболистов средней школы. Исследователи берут случайную выборку у населения и устанавливают средний рост в 74 дюйма. Среднее значение 74 дюймов является точечной оценкой среднего значения для населения. Точечная оценка сама по себе имеет ограниченную полезность, потому что она не раскрывает неопределенность, связанную с оценкой; у вас нет четкого представления о том, как далеко это среднее значение 74-дюймовой выборки может быть от среднего значения популяции. Чего не хватает, так это степени неопределенности в этом единственном образце.
Доверительные интервалы дают больше информации, чем точечные оценки. Установив 95% доверительный интервал, используя среднее значение и стандартное отклонение выборки, и предположив нормальное распределение, представленное кривой колокола, исследователи приходят к верхней и нижней границе, которая содержит истинное среднее значение 95% времени. Предположим, что интервал составляет от 72 до 76 дюймов. Если исследователи берут 100 случайных выборок из совокупности школьников-баскетболистов в целом, среднее значение должно упасть между 72 и 76 дюймов в 95 из этих образцов.
Если исследователи хотят еще большей уверенности, они могут увеличить интервал до 99%. Это неизменно создает более широкий диапазон, так как освобождает место для большего количества образцов. Если они установят, что доверительный интервал 99% составляет от 70 до 78 дюймов, они могут ожидать, что 99 из 100 выборок будут содержать среднее значение между этими числами. Уровень достоверности 90% означает, что мы ожидаем, что 90% интервальных оценок будут включать параметр совокупности. Аналогично, уровень достоверности 99% означает, что 95% интервалов будут включать параметр.
Распространенные заблуждения о доверительном интервале
Самое большое заблуждение относительно доверительных интервалов состоит в том, что они представляют процент данных от данной выборки, который находится между верхней и нижней границами. Например, можно ошибочно интерпретировать вышеупомянутый доверительный интервал 99% от 70 до 78 дюймов как указание, что 99% данных в случайной выборке попадают между этими числами. Это неверно, хотя для такого определения существует отдельный метод статистического анализа. Это включает в себя определение среднего значения и стандартного отклонения выборки и нанесение этих цифр на кривую колокольчика.
