Каковы степени свободы?
Степени свободы относятся к максимальному количеству логически независимых значений, которые являются значениями, которые могут свободно варьироваться в выборке данных.
Ключевые вынос
- Степени свободы относятся к максимальному количеству логически независимых значений, которые являются значениями, которые могут свободно варьироваться в выборке данных. Степени свободы обычно обсуждаются в связи с различными формами проверки гипотез в статистике, такими как Квадрат. Расчет степеней свободы является ключевым моментом при попытке понять важность статистики хи-квадрат и обоснованность нулевой гипотезы.
Понимание степеней свободы
Самый простой способ концептуального понимания степеней свободы - на примере:
- Для простоты рассмотрим выборку данных, состоящую из пяти целых положительных чисел. Значения могут быть любым числом без какой-либо известной связи между ними. Эта выборка данных теоретически будет иметь пять степеней свободы. Четыре числа в выборке: {3, 8, 5 и 4}, а среднее значение всей выборки данных будет равно 6. Это должно означать, что пятое число должно быть 10. Это не может быть ничего другого. Он не имеет свободы для изменения. Таким образом, степень свободы для этого образца данных составляет 4.
Формула для степеней свободы равна размеру выборки данных минус один:
Df = N − 1 где: Df = степени свободыN = размер выборки
Степени свободы обычно обсуждаются в связи с различными формами проверки гипотез в статистике, такими как хи-квадрат. При расчете важности статистики хи-квадрат и обоснованности нулевой гипотезы важно рассчитывать степени свободы.
Тесты хи-квадрат
Существует два вида тестов хи-квадрат: тест на независимость, который задает вопрос о взаимоотношениях, например: «Есть ли связь между полом и баллами SAT?»; и тест на пригодность, который спрашивает что-то вроде: «Если монету подбрасывают 100 раз, поднимется ли она в голову 50 раз, а в хвост - 50 раз?»
Для этих тестов используются степени свободы, чтобы определить, можно ли отклонить определенную нулевую гипотезу на основе общего количества переменных и выборок в эксперименте. Например, при рассмотрении вопроса о студентах и выборе курса размер выборки в 30 или 40 студентов, вероятно, недостаточно велик для получения значимых данных. Получение таких же или аналогичных результатов исследования с использованием выборки из 400 или 500 студентов является более обоснованным.
История степеней свободы
Самая ранняя и самая основная концепция степеней свободы была отмечена в начале 1800-х годов, переплетенных в работах математика и астронома Карла Фридриха Гаусса. Современное использование и понимание этого термина было впервые изложено английским статистиком Уильямом Сили Госсетом в его статье «Вероятная ошибка среднего», опубликованной в «Биометрике» в 1908 году под псевдонимом, чтобы сохранить свою анонимность.
В своих работах Госсет специально не использовал термин «Степени свободы». Он, однако, дал объяснение концепции на протяжении всего курса разработки того, что в конечном итоге будет известно как T-распределение Стьюдента. Фактический термин не был популярен до 1922 года. Английский биолог и статистик Рональд Фишер начал использовать термин «Степени свободы», когда он начал публиковать отчеты и данные о своей работе по разработке хи-квадратов.
