Что такое эмпирическое правило?
Эмпирическое правило, также называемое правилом трех сигм или правилом 68-95-99.7, является статистическим правилом, которое гласит, что для нормального распределения почти все данные попадают в три стандартных отклонения (обозначенные σ) от среднего значения (обозначается через µ). Сломанное эмпирическое правило показывает, что 68% попадают в первое стандартное отклонение (µ ± σ), 95% - в первые два стандартных отклонения (µ ± 2σ) и 99, 7% - в первые три стандартных отклонения (µ ± 3σ).,
Эмпирическое правило
Понимание эмпирического правила
Эмпирическое правило часто используется в статистике для прогнозирования конечных результатов. После расчета стандартного отклонения и перед сбором точных данных это правило можно использовать как приблизительную оценку результатов предстоящих данных. Эта вероятность может использоваться в промежуточный период, поскольку сбор соответствующих данных может занимать много времени или даже невозможен. Эмпирическое правило также используется как грубый способ проверки «нормальности» распределения. Если слишком много точек данных выходят за границы трех стандартных отклонений, это говорит о том, что распределение не является нормальным.
Ключевые вынос
- Эмпирическое правило гласит, что почти все данные находятся в пределах 3 стандартных отклонений от среднего значения для нормального распределения. Согласно этому правилу, 68% данных попадают в одно стандартное отклонение. Девяносто пять процентов данных находятся в пределах двух стандартных отклонений. три стандартных отклонения составляет 99, 7% данных.
Примеры эмпирического правила
Давайте предположим, что популяция животных в зоопарке, как известно, нормально распределена. Каждое животное доживает до 13, 1 года (в среднем), а стандартное отклонение продолжительности жизни составляет 1, 5 года. Если кто-то хочет знать вероятность того, что животное будет жить дольше, чем 14, 6 года, он может использовать эмпирическое правило. Зная, что среднее значение распределения составляет 13, 1 года, для каждого стандартного отклонения наблюдаются следующие возрастные диапазоны:
- Одно стандартное отклонение (µ ± σ): (от 13, 1 до 1, 5) до (13, 1 + 1, 5) или от 11, 6 до 14, 6; два стандартных отклонения (µ ± 2σ): от 13, 1 - (2 x 1, 5) до 13, 1 + (2 x 1, 5), или от 10, 1 до 16, 1: три стандартных отклонения (µ ± 3σ): от 13, 1 - (3 x 1, 5) до 13, 1 + (3 x 1, 5) или от 8, 6 до 17, 6
Человек, решающий эту проблему, должен рассчитать общую вероятность того, что животное проживет 14, 6 лет или дольше. Эмпирическое правило показывает, что 68% распределения лежит в пределах одного стандартного отклонения, в данном случае от 11, 6 до 14, 6 лет. Таким образом, оставшиеся 32% распределения находятся за пределами этого диапазона. Половина лежит выше 14, 6, а половина - ниже 11, 6. Таким образом, вероятность того, что животное живет более 14, 6, составляет 16% (рассчитывается как 32%, деленное на два).
В качестве другого примера, предположим, что животное в зоопарке доживает в среднем до 10 лет со стандартным отклонением 1, 4 года. Предположим, зоопарк пытается выяснить вероятность того, что животное живет более 7, 2 лет. Это распределение выглядит следующим образом:
- Одно стандартное отклонение (µ ± σ): от 8, 6 до 11, 4 года. Два стандартных отклонения (µ ± 2σ): от 7, 2 до 12, 8 года. Три стандартных отклонения ((µ ± 3σ): от 5, 8 до 14, 2 года.
Эмпирическое правило гласит, что 95% распределения лежит в пределах двух стандартных отклонений. Таким образом, 5% лежит за пределами двух стандартных отклонений; половина выше 12, 8 лет и половина ниже 7, 2 года. Таким образом, вероятность прожить более 7, 2 лет составляет:
95% + (5% / 2) = 97, 5%