Содержание
- Что такое T-тест?
- Объясняя T-тест
- Неоднозначные результаты испытаний
- Предположения T-теста
- Расчет Т-тестов
- Коррелированный (или парный) T-тест
- Равный дисперсионный (объединенный) T-тест
- Неравномерность дисперсии T-тест
- Определение, какой T-тест использовать
- Пример T-теста на неравномерную дисперсию
Что такое T-тест?
T-критерий - это тип логической статистики, используемой для определения существенной разницы между средними значениями двух групп, которые могут быть связаны по определенным признакам. Он в основном используется, когда наборы данных, такие как набор данных, записанный как результат бросания монеты 100 раз, будут следовать нормальному распределению и могут иметь неизвестные отклонения. В качестве инструмента проверки гипотез используется t-критерий, который позволяет проверить предположение, применимое к совокупности.
T-критерий проверяет t-статистику, значения t-распределения и степени свободы для определения вероятности различия между двумя наборами данных. Чтобы провести тест с тремя или более переменными, необходимо использовать дисперсионный анализ.
Т-тест
Объясняя T-тест
По сути, t-критерий позволяет нам сравнивать средние значения двух наборов данных и определять, пришли ли они из одной популяции. В приведенных выше примерах, если бы мы взяли выборку учащихся из класса А и другую выборку учащихся из класса В, мы не ожидали бы, что они будут иметь точно такое же среднее значение и стандартное отклонение. Аналогичным образом, образцы, взятые у контрольной группы, получавшей плацебо, и образцы, взятые из группы, предписанной для приема лекарств, должны иметь немного другое среднее значение и стандартное отклонение.
Математически t-критерий берет выборку из каждого из двух наборов и устанавливает постановку задачи, предполагая нулевую гипотезу о том, что два средних значения равны. На основе применимых формул определенные значения рассчитываются и сравниваются со стандартными значениями, и предполагаемая нулевая гипотеза принимается или отклоняется соответствующим образом.
Если нулевая гипотеза может быть отклонена, это означает, что показания данных сильны и не случайны. T-критерий является лишь одним из многих тестов, используемых для этой цели. Статистики должны дополнительно использовать тесты, отличные от t-критерия, для проверки большего количества переменных и тестов с большим размером выборки. Для большого размера выборки статистики используют z-тест. Другие варианты тестирования включают тест хи-квадрат и f-тест.
Существует три типа t-тестов, и они классифицируются как зависимые и независимые t-тесты.
Ключевые вынос
- T-критерий - это тип логической статистики, используемый для определения существенной разницы между средствами двух групп, которые могут быть связаны по определенным признакам. T-критерий является одним из многих тестов, используемых для проверки гипотез. в статистике. Для вычисления t-критерия требуются три ключевых значения данных. Они включают в себя разницу между средними значениями из каждого набора данных (называемые средней разницей), стандартным отклонением каждой группы и количеством значений данных в каждой группе. Существует несколько различных типов t-теста, которые могут быть выполнены в зависимости от на данных и тип анализа требуется.
Неоднозначные результаты испытаний
Учтите, что производитель лекарств хочет проверить новое изобретение. Он следует стандартной процедуре опробования препарата на одной группе пациентов и введения плацебо другой группе, называемой контрольной группой. Плацебо, данное контрольной группе, является веществом, не имеющим предполагаемой терапевтической ценности, и служит эталоном для измерения реакции другой группы, которой дают фактическое лекарственное средство.
После испытания препарата члены контрольной группы, получавшей плацебо, сообщили об увеличении средней ожидаемой продолжительности жизни на три года, в то время как члены группы, которым прописано новое лекарство, сообщили об увеличении средней ожидаемой продолжительности жизни на четыре года. Мгновенное наблюдение может указывать на то, что препарат действительно работает, так как результаты лучше для группы, использующей препарат. Однако также возможно, что наблюдение может быть связано с случайностью, особенно с неожиданной удачей. T-критерий полезен для того, чтобы сделать вывод, что результаты действительно правильные и применимы ко всему населению.
В школе 100 учеников в классе А набрали в среднем 85% со стандартным отклонением 3%. Еще 100 учеников, принадлежащих к классу В, набрали в среднем 87% со стандартным отклонением 4%. Хотя среднее по классу B лучше, чем по классу A, может быть неверно делать вывод, что общая успеваемость учащихся в классе B лучше, чем у учащихся класса A. Это связано с тем, что наряду с означает, что стандартное отклонение класса B также выше, чем у класса A. Это указывает на то, что их предельные проценты, с более низкой и более высокой сторон, были гораздо более разбросаны по сравнению с классом A. С помощью t-критерия можно определить какой класс был лучше
Предположения T-теста
- Первое предположение, сделанное в отношении t-тестов, касается масштаба измерения. Предположение для t-теста состоит в том, что шкала измерения, применяемая к собранным данным, следует непрерывной или порядковой шкале, такой как баллы для теста IQ. Второе предположение состоит в том, что для простой случайной выборки данные Собран из репрезентативной, случайно выбранной части общей популяции. Третье допущение - это данные, которые при построении графика приводят к нормальному распределению в виде колоколообразной кривой распределения. Четвертое допущение - это достаточно большой размер выборки. Больший размер выборки означает, что распределение результатов должно приближаться к нормальной кривой в форме колокола. Окончательное предположение - однородность дисперсии. Однородная или равная дисперсия существует, когда стандартные отклонения образцов приблизительно равны.
Расчет Т-тестов
Расчет t-теста требует трех ключевых значений данных. Они включают в себя разницу между средними значениями из каждого набора данных (называемые средней разницей), стандартным отклонением каждой группы и количеством значений данных в каждой группе.
Результат t-теста дает значение t. Это вычисленное t-значение затем сравнивается со значением, полученным из таблицы критических значений (называемой T-Distribution Table). Это сравнение помогает определить, насколько вероятно, что различие между средними значениями произошло случайно или действительно ли наборы данных имеют внутренние различия. T-критерий ставит вопрос о том, представляет ли разница между группами истинную разницу в исследовании или, скорее всего, это бессмысленная статистическая разница.
T-таблицы распределения
T-Distribution Table доступен в форматах с одним и двумя хвостами. Первый используется для оценки случаев, которые имеют фиксированное значение или диапазон с четким направлением (положительным или отрицательным). Например, какова вероятность того, что выходное значение останется ниже -3 или будет больше семи при броске пары костей? Последний используется для анализа границ диапазона, например, для запроса, находятся ли координаты между -2 и +2.
Расчеты могут быть выполнены с помощью стандартных программ, которые поддерживают необходимые статистические функции, например, в MS Excel.
T-значения и степени свободы
В результате t-теста выдается два значения: t-значение и степени свободы. Значение t представляет собой отношение разницы между средним значением двух наборов выборок и разницей, существующей в наборах выборок. Хотя значение числителя (разность между средним из двух наборов выборок) вычислить несложно, знаменатель (разница, существующая в наборах выборок) может стать немного сложнее в зависимости от типа используемых значений данных. Знаменатель отношения является измерением дисперсии или изменчивости. Более высокие значения t-значения, также называемые t-показателями, указывают на то, что между двумя наборами выборок существует большая разница. Чем меньше значение t, тем больше сходства между двумя наборами выборок.
- Большой t-показатель означает, что группы различны. Небольшой t-показатель означает, что группы похожи.
Степени свободы относятся к ценностям в исследовании, которые могут варьироваться и имеют важное значение для оценки важности и обоснованности нулевой гипотезы. Вычисление этих значений обычно зависит от количества записей данных, доступных в наборе выборок.
Коррелированный (или парный) T-тест
Коррелированный критерий Стьюдента выполняется, когда выборки, как правило, состоят из совпадающих пар одинаковых единиц, или когда есть случаи повторных измерений. Например, могут быть случаи повторного тестирования одних и тех же пациентов - до и после получения определенного лечения. В таких случаях каждый пациент используется в качестве контрольного образца против самих себя.
Этот метод также применяется к случаям, когда образцы связаны каким-либо образом или имеют совпадающие характеристики, например сравнительный анализ с участием детей, родителей или братьев и сестер. Коррелированные или парные t-тесты являются зависимым типом, поскольку они включают случаи, когда два набора образцов связаны между собой.
Формула для вычисления t-значения и степеней свободы для парного t-теста:
- Среднее1 и среднее2 - это средние значения каждого из наборов выборок, тогда как var1 и var2 представляют дисперсию каждого из наборов выборок.
Оставшиеся два типа относятся к независимым t-тестам. Выборки этих типов выбираются независимо друг от друга, то есть наборы данных в двух группах не ссылаются на одни и те же значения. Они включают случаи, когда группу из 100 пациентов разделяют на две группы по 50 пациентов в каждой. Одна из групп становится контрольной группой и получает плацебо, в то время как другая группа получает назначенное лечение. Это составляет две независимые группы выборки, которые не связаны друг с другом.
Т-тест равной дисперсии (или пула)
Т-критерий равной дисперсии используется, когда число выборок в каждой группе одинаково или дисперсия двух наборов данных одинакова. Следующая формула используется для вычисления t-значения и степеней свободы для t-критерия равной дисперсии:
T-значение = n1 + n2−2 (n1−1) × var12 + (n2−1) × var22 × n11 + n21 mean1 − mean2, где: mean1 и mean2 = средние значения каждого из наборов выборокvar1 и var2 = дисперсия каждого из наборов выборок n1 и n2 = количество записей в каждом наборе выборок
и, Степени свободы = n1 + n2−2 где: n1 и n2 = количество записей в каждом наборе выборок
Неравномерность дисперсии T-тест
T-критерий неравной дисперсии используется, когда число выборок в каждой группе различно, а дисперсия двух наборов данных также различна. Этот тест также называется t-тестом Уэлча. Следующая формула используется для вычисления t-значения и степеней свободы для t-критерия с неравной дисперсией:
T-значение = n1var12 + n2var22 среднее1-среднее2, где: среднее1 и среднее2 = средние значения каждого из наборов выборкиvar1 и var2 = дисперсия каждого из наборов выборкиn1 и n2 = количество записей в каждом наборе выборки
и, Степени свободы = n1−1 (n1var12) 2 + n2−1 (n2var22) 2 (n1var12 + n2var22) 2 где: var1 и var2 = дисперсия каждого из наборов выборок n1 и n2 = число записей в каждом наборе образцов
Определение правильного T-критерия для использования
Следующая блок-схема может быть использована для определения того, какой t-критерий следует использовать на основе характеристик наборов образцов. Ключевыми элементами, которые следует учитывать, являются одинаковые записи выборки, количество записей данных в каждом наборе выборок и дисперсия каждого набора выборок.
Изображение Джули Бэнг © Investopedia 2019
Пример T-теста на неравномерную дисперсию
Предположим, что мы проводим диагональные измерения картин, полученных в художественной галерее. Одна группа образцов включает 10 картин, а другая - 20 картин. Наборы данных с соответствующими средними и дисперсионными значениями следующие:
Комплект 1 | Набор 2 | |
19, 7 | 28, 3 | |
20, 4 | 26, 7 | |
19, 6 | 20, 1 | |
17, 8 | 23, 3 | |
18, 5 | 25, 2 | |
18, 9 | 22, 1 | |
18, 3 | 17, 7 | |
18, 9 | 27, 6 | |
+19, 5 | 20, 6 | |
21, 95 | 13, 7 | |
23, 2 | ||
17, 5 | ||
20, 6 | ||
18 | ||
23, 9 | ||
21, 6 | ||
24, 3 | ||
20, 4 | ||
23, 9 | ||
13, 3 | ||
Жадный | 19, 4 | 21, 6 |
отклонение | 1.4 | 17, 1 |
Хотя среднее значение из набора 2 выше, чем из набора 1, мы не можем сделать вывод, что все рисунки имеют среднюю длину около 21, 6 единиц, поскольку дисперсия из набора 2 значительно выше, чем из набора 1. Это случайно или действительно существуют различия? в общей численности населения все картины, полученные в художественной галерее? Мы устанавливаем проблему, предполагая нулевую гипотезу о том, что среднее значение одинаково между двумя наборами выборок, и проводим t-тест, чтобы подтвердить, верна ли гипотеза.
Поскольку количество записей данных различно (n1 = 10 и n2 = 20) и дисперсия также отличается, t-значение и степени свободы вычисляются для вышеуказанного набора данных с использованием формулы, упомянутой в T-тесте неравной дисперсии раздел.
Т-значение -2, 24787. Поскольку знак минуса можно игнорировать при сравнении двух значений t, вычисленное значение равно 2, 24787.
Значение степени свободы равно 24, 38 и уменьшено до 24 вследствие определения формулы, требующего округления значения до минимально возможного целочисленного значения.
Когда предполагается нормальное распределение, в качестве критерия приемлемости можно указать уровень вероятности (альфа-уровень, уровень значимости, p ). В большинстве случаев можно принять значение 5%.
Используя значение степени свободы как 24 и уровень значимости 5%, взгляд на таблицу распределения значений t дает значение 2, 064. Сравнение этого значения с вычисленным значением 2, 247 показывает, что вычисленное t-значение больше табличного значения на уровне значимости 5%. Поэтому можно с уверенностью отвергнуть нулевую гипотезу о том, что между средствами нет никакой разницы. Набор населения имеет внутренние различия, и они не случайно.
Сравнить инвестиционные счета × Предложения, представленные в этой таблице, поступили от партнерств, от которых Investopedia получает компенсацию. Название провайдера ОписаниеСвязанные условия
Как работает дисперсионный анализ (ANOVA) Анализ дисперсии (ANOVA) - это инструмент статистического анализа, который разделяет общую изменчивость, обнаруженную в наборе данных, на два компонента: случайные и систематические факторы. подробнее Определение Z-критерия Z-критерий - это статистический критерий, используемый для определения того, различаются ли два значения совокупности, когда известны различия и размер выборки велик. больше степеней определения свободы Степени свободы относятся к максимальному количеству логически независимых значений, которые являются значениями, которые могут свободно варьироваться в выборке данных. подробнее Понимание распределения T Распределение AT - это тип функции вероятности, который подходит для оценки параметров популяции для небольших размеров выборки или неизвестных отклонений. подробнее Что измеряет полуотклонение Полуотклонение - это метод оценки колебаний среднего уровня доходности инвестиций. Используется как альтернатива стандартному отклонению. больше Тест Бонферрони Тест Бонферрони - это тип многократного сравнительного теста, используемого в статистическом анализе. больше партнерских ссылокСтатьи по Теме
экономика
Какие предположения сделаны при проведении t-теста?
Управление рисками
Использование исторической волатильности для оценки будущего риска
Биржевая стратегия и образование
Как использовать Excel для моделирования цен на акции
Финансовые коэффициенты
Как вы рассчитываете IRR в Excel?
Математика и статистика
Что такое относительная стандартная ошибка
Финансовые коэффициенты
Какова формула для расчета чистой приведенной стоимости (NPV) в Excel?
