Формула нормального распределения основана на двух простых параметрах - среднем и стандартном отклонении, - которые количественно определяют характеристики данного набора данных. В то время как среднее значение указывает «центральное» или среднее значение всего набора данных, стандартное отклонение указывает «разброс» или изменение точек данных вокруг этого среднего значения.
Рассмотрим следующие 2 набора данных:
Набор данных 1 = {10, 10, 10, 10, 10, 10, 10, 10, 10, 10}
Набор данных 2 = {6, 8, 10, 12, 14, 14, 12, 10, 8, 6}
Для набора данных 1 среднее значение = 10 и стандартное отклонение (стандартное отклонение) = 0
Для набора данных 2 среднее значение = 10 и стандартное отклонение (стандартное отклонение) = 2, 83
Давайте построим эти значения для DataSet1:
Аналогично для DataSet2:
Красная горизонтальная линия на обоих вышеприведенных графиках указывает «среднее» или среднее значение каждого набора данных (10 в обоих случаях). Розовые стрелки на втором графике показывают разброс или отклонение значений данных от среднего значения. Это представлено значением стандартного отклонения 2, 83 в случае DataSet2. Поскольку DataSet1 имеет все значения одинаковые (по 10 для каждого) и не имеет вариаций, значение stddev равно нулю, поэтому розовые стрелки не применимы.
Значение stddev имеет несколько важных и полезных характеристик, которые чрезвычайно полезны при анализе данных. Для нормального распределения значения данных симметрично распределены по обе стороны от среднего значения. Для любого нормально распределенного набора данных, построение графика с stddev на горизонтальной оси и нет. значений данных по вертикальной оси получается следующий график.
Свойства нормального распределения
- Нормальная кривая симметрична относительно среднего; среднее находится в середине и делит область на две половины; общая площадь под кривой равна 1 для среднего = 0 и stdev = 1; распределение полностью описывается его средним и стандартный
Как видно из приведенного выше графика, stddev представляет собой следующее:
- 68, 3% значений данных находятся в пределах 1 стандартного отклонения от среднего значения (от -1 до +1) 95, 4% значений данных находятся в пределах 2 стандартных отклонений от среднего значения (от -2 до +2) 99, 7% значений данных находятся в пределах 3 стандартных отклонений среднего (от -3 до +3)
Область под кривой в форме колокола, когда измеряется, указывает на желаемую вероятность данного диапазона:
- меньше чем X: - например, вероятность того, что значения данных меньше чем на 70 больше, чем X - например, вероятность того, что значения данных будут больше чем 95 между X 1 и X 2 - например, вероятность значений данных между 65 и 85
где Х представляет интересующее значение (примеры ниже).
Построение и расчет площади не всегда удобно, поскольку разные наборы данных будут иметь разные средние значения и значения stddev. Чтобы упростить единый стандартный метод для простых вычислений и применимости к реальным задачам, было введено стандартное преобразование в Z-значения, которые составляют часть таблицы нормального распределения.
Z = (X - среднее) / stddev, где X - случайная величина.
По сути, это преобразование приводит к тому, что среднее значение и стандартное отклонение стандартизируются в 0 и 1 соответственно, что позволяет использовать стандартный определенный набор Z-значений (из таблицы нормального распределения) для простых вычислений. Снимок стандартной таблицы z-значений, содержащей значения вероятности, выглядит следующим образом:
Z |
0, 00 |
0, 01 |
0.02 |
0.03 |
0.04 |
0, 05 |
0, 06 |
0.0 |
0, 00000 |
0, 00399 |
0, 00798 |
0, 01197 |
0, 01595 |
0, 01994 |
… |
0, 1 |
0, 0398 |
0, 04380 |
0, 04776 |
0, 05172 |
0, 05567 |
0, 05966 |
… |
0.2 |
0, 0793 |
0, 08317 |
0, 08706 |
0, 09095 |
0, 09483 |
0, 09871 |
… |
0, 3 |
0, 11791 |
0, 12172 |
0, 12552 |
0, 12930 |
0, 13307 |
0, 13683 |
… |
0, 4 |
0, 15542 |
0, 15910 |
0, 16276 |
0, 16640 |
0, 17003 |
0, 17364 |
… |
0, 5 |
0, 19146 |
0, 19497 |
0, 19847 |
0, 20194 |
0, 20540 |
0, 20884 |
… |
0.6 |
0, 22575 |
0, 22907 |
0, 23237 |
0, 23565 |
0, 23891 |
0, 24215 |
… |
0.7 |
0, 25804 |
0, 26115 |
0, 26424 |
0, 26730 |
0, 27035 |
0, 27337 |
… |
... |
… |
… |
… |
… |
… |
… |
… |
Чтобы найти вероятность, связанную с z-значением 0, 239865, сначала округлите ее до 2 десятичных знаков (т. Е. 0, 24). Затем проверьте первые 2 значащие цифры (0, 2) в строках и наименее значимые цифры (оставшиеся 0, 04) в столбце. Это приведет к значению 0, 09483.
Полная таблица нормального распределения с точностью до 5 десятичных знаков для значений вероятности (включая значения для отрицательных значений) находится здесь.
Давайте посмотрим на некоторые примеры из реальной жизни. Рост людей в большой группе следует нормальному распределению. Предположим, что у нас есть набор из 100 человек, чьи высоты записаны, а среднее значение и стандартное отклонение рассчитаны для 66 и 6 дюймов соответственно.
Вот несколько примеров вопросов, на которые легко ответить с помощью таблицы z-значений:
- Какова вероятность того, что человек в группе составляет 70 дюймов или меньше?
Вопрос состоит в том, чтобы найти кумулятивное значение P (X <= 70), т.е. во всем наборе данных из 100, сколько значений будет между 0 и 70.
Давайте сначала преобразуем X-значение 70 в эквивалентное Z-значение.
Z = (X - среднее) / стандартное отклонение = (70-66) / 6 = 4/6 = 0, 66667 = 0, 67 (округлено до 2 десятичных знаков)
Теперь нам нужно найти P (Z <= 0, 67) = 0. 24857 (из таблицы z выше)
т. е. есть вероятность 24, 857%, что человек в группе будет меньше или равен 70 дюймам.
Но держись - вышесказанное неполно. Помните, мы ищем вероятность всех возможных высот до 70, то есть от 0 до 70. Вышеприведенное просто дает вам часть от среднего до желаемого значения (то есть от 66 до 70). Нам нужно включить вторую половину - от 0 до 66 - чтобы получить правильный ответ.
Поскольку от 0 до 66 представляет половинную часть (то есть одно среднее от среднего до среднего), его вероятность просто равна 0, 5.
Следовательно, правильная вероятность того, что человек составляет 70 дюймов или меньше = 0, 24857 + 0, 5 = 0. 74857 = 74, 857%
Графически (путем вычисления площади) это две суммированные области, представляющие решение:
- Какова вероятность того, что человек составляет 75 дюймов или выше?
т.е. найти дополнительный кумулятивный P (X> = 75).
Z = (X - среднее) / стандартное отклонение = (75-66) / 6 = 9/6 = 1, 5
P (Z> = 1, 5) = 1- P (Z <= 1, 5) = 1 - (0, 5 + 0, 43319) = 0, 06681 = 6, 681%
- Какова вероятность того, что человек находится между 52 дюймов и 67 дюймов?
Найти P (52 <= X <= 67).
P (52 <= X <= 67) = P = P (-2, 33 <= Z <= 0, 17)
= P (Z <= 0, 17) –P (Z <= -0, 233) = (0, 5 + 0, 56749) - (.40905) =
Эта таблица нормального распределения (и значения z) обычно находит применение для любых вероятностных расчетов ожидаемых изменений цен на фондовом рынке для акций и индексов. Они используются в торговле на основе диапазона, для определения восходящего или нисходящего тренда, уровней поддержки или сопротивления и других технических индикаторов, основанных на понятиях нормального распределения среднего и стандартного отклонения.
Сравнить инвестиционные счета × Предложения, представленные в этой таблице, поступили от партнерств, от которых Investopedia получает компенсацию. Название провайдера ОписаниеСтатьи по Теме
Трейдинг Базовое образование
Проверка гипотез в финансах: понятие и примеры
Управление рисками
Оптимизируйте свое портфолио, используя нормальное распределение
Технический анализ базового образования
Линейная регрессия времени и цены
Управление рисками
Использование и пределы волатильности
Финансовый анализ
Как рассчитать стоимость под риском (VaR) в Excel
Инструменты для фундаментального анализа
Понимание измерений волатильности
Партнерские ссылкиСвязанные условия
Определение доверительного интервала Доверительный интервал в статистике относится к вероятности того, что параметр совокупности попадет между двумя заданными значениями. больше Управление рисками в финансах В финансовом мире управление рисками - это процесс выявления, анализа и принятия или смягчения неопределенности в инвестиционных решениях. Управление рисками происходит в любое время, когда инвестор или управляющий фондом анализирует и пытается определить потенциальные потери в инвестициях. подробнее Понимание кривой казначейства спот-курса Казначейская кривая спот-курса определяется как кривая доходности, построенная с использованием казначейских спот-курсов, а не доходностей. Кривая казначейства спот-курса может использоваться в качестве ориентира для ценообразования облигаций. больше Определение индекса Джини Индекс Джини - это статистическая мера распределения, часто используемая в качестве индикатора экономического неравенства. подробнее Модель ценообразования основных фондов (CAPM) Модель ценообразования основных фондов - это модель, которая описывает взаимосвязь между риском и ожидаемой доходностью. больше Понимание гармонического среднего. Гармоническое среднее - это среднее, которое используется в финансах, чтобы усреднить множители, такие как соотношение цены и прибыли. Больше