Что такое T-распределение?
T-распределение, также известное как t-распределение Стьюдента, является типом распределения вероятностей, которое похоже на нормальное распределение с его формой колокола, но имеет более тяжелые хвосты. T-распределения имеют больший шанс для экстремальных значений, чем нормальные распределения, следовательно, более толстые хвосты.
Ключевые вынос
- Распределение T представляет собой непрерывное распределение вероятностей z-показателя, когда в знаменателе используется предполагаемое стандартное отклонение, а не истинное стандартное отклонение. Распределение T, как и нормальное распределение, имеет форму колокола и симметрично, но имеет более тяжелое Хвосты, что означает, что он имеет тенденцию производить значения, далекие от его среднего. Т-тесты используются в статистике для оценки значимости.
Что говорит вам T-распределение?
Тяжесть хвоста определяется параметром распределения T, называемым степенями свободы, с меньшими значениями, дающими более тяжелые хвосты, а с более высокими значениями распределение T напоминает стандартное нормальное распределение со средним значением 0 и стандартным отклонением 1. T-распределение также известно как «T-распределение Стьюдента».
Синяя область иллюстрирует двусторонний тест гипотезы. CKTaylor
Когда выборка из n наблюдений берется из нормально распределенной популяции, имеющей среднее значение M и стандартное отклонение D, среднее значение выборки m и стандартное отклонение выборки d будут отличаться от значений M и D из-за случайности выборки.
Z-показатель может быть рассчитан со стандартным отклонением популяции как Z = (m - M) / {D / sqrt (n)}, и это значение имеет нормальное распределение со средним 0 и стандартным отклонением 1. Но когда это z- оценка рассчитывается с использованием расчетного стандартного отклонения, давая T = (m - M) / {d / sqrt (n)}, разница между d и D делает распределение T распределением с (n - 1) степенями свободы, а не нормальное распределение со средним 0 и стандартным отклонением 1.
Пример использования T-Distribution
Возьмем следующий пример того, как t-распределения используются в статистическом анализе. Во-первых, помните, что доверительный интервал для среднего значения - это диапазон значений, рассчитанный на основе данных, предназначенных для определения среднего значения «совокупности». Этот интервал равен m + - t * d / sqrt (n), где t является критическим значением из распределения T.
Например, 95-процентный доверительный интервал для средней доходности промышленного индекса Доу-Джонса за 27 торговых дней, предшествовавших 9/11/2001, составляет -0, 33%, (+/- 2, 055) * 1, 07 / sqrt (27), давая (постоянный) средний доход в виде некоторого числа между -0, 75% и + 0, 09%. Число 2.055, количество стандартных ошибок для корректировки, определяется из T-распределения.
Поскольку распределение T имеет более толстые хвосты, чем нормальное распределение, его можно использовать в качестве модели для финансовых прибылей, которые демонстрируют избыточный эксцесс, что позволит в таких случаях более реалистично рассчитать стоимость под риском (VaR).
Разница между T-распределением и нормальным распределением
Нормальные распределения используются, когда предполагается, что распределение населения является нормальным. Распределение Т аналогично нормальному, только с более толстыми хвостами. Оба предполагают нормально распределенное население. Распределения T имеют более высокий эксцесс, чем нормальные распределения. Вероятность получения значений, очень далеких от среднего, выше при распределении T, чем при нормальном распределении.
Ограничения использования T-распределения
Т распределение может искажать точность относительно нормального распределения. Его недостаток возникает только тогда, когда есть потребность в идеальной нормальности. Однако разница между использованием нормального и T-распределения относительно невелика.
