Что такое Goodness-Fit-Fit?
Проверка пригодности - это проверка статистической гипотезы, позволяющая определить, насколько хорошо выборочные данные соответствуют распределению из популяции с нормальным распределением. Иными словами, этот тест показывает, представляют ли ваши выборочные данные те данные, которые вы ожидаете найти в фактической совокупности, или они как-то искажены. Пригодность соответствия устанавливает несоответствие между наблюдаемыми значениями и теми, которые можно ожидать от модели в случае нормального распределения.
Существует несколько методов определения пригодности. Некоторые из наиболее популярных методов, используемых в статистике, включают в себя критерий хи-квадрат, критерий Колмогорова-Смирнова, критерий Андерсона-Дарлинга и критерий Шипиро-Уилка.
Ключевые вынос
- Тесты на соответствие требованиям - это статистические тесты, целью которых является определение того, соответствует ли набор наблюдаемых значений тем, которые ожидаются согласно применяемой модели. Существует несколько типов тестов на соответствие, но наиболее распространенным является критерий хи-квадрат. тесты могут показать, соответствуют ли ваши выборочные данные ожидаемому набору данных из популяции с нормальным распределением.
Понимание Good-Of-Fit-Fit
Тесты на соответствие требованиям часто используются при принятии деловых решений. Чтобы рассчитать критерий соответствия хи-квадрат, необходимо сначала сформулировать нулевую гипотезу и альтернативную гипотезу, выбрать уровень значимости (например, = 0, 5) и определить критическое значение.
Наиболее распространенным критерием соответствия является критерий хи-квадрат, обычно используемый для дискретных распределений. Критерий хи-квадрат используется исключительно для данных, помещаемых в классы (ячейки), и для получения точных результатов требуется достаточный размер выборки.
Тесты на пригодность для подгонки обычно используются для проверки нормальности остатков или для определения, взяты ли два образца из идентичных распределений.
Пример проверки соответствия
Например, небольшой спортивный зал может работать при условии, что он имеет самую высокую посещаемость по понедельникам, вторникам и субботам, среднюю посещаемость по средам и четвергам и самую низкую посещаемость по пятницам и воскресеньям. Исходя из этих предположений, в тренажерном зале каждый день работает определенное количество сотрудников, которые проверяют участников, убирают помещения, предлагают услуги по обучению и проводят занятия.
Тем не менее, тренажерный зал неэффективен в финансовом отношении, и владелец хочет знать, правильны ли эти предположения о посещаемости и штатном расписании. Владелец решает подсчитывать количество посетителей тренажерного зала каждый день в течение шести недель. Затем он может сравнить предполагаемую посещаемость тренажерного зала с его наблюдаемой посещаемостью, например, с помощью критерия соответствия хи-квадрат. С новыми данными он может определить, как лучше управлять тренажерным залом и повысить прибыльность.
