Что такое дисперсионный анализ (ANOVA)?
Дисперсионный анализ (ANOVA) - это инструмент анализа, используемый в статистике, который разделяет наблюдаемую совокупную изменчивость, обнаруженную в наборе данных, на две части: систематические факторы и случайные факторы. Систематические факторы оказывают статистическое влияние на данный набор данных, а случайные факторы - нет. Аналитики используют тест ANOVA для определения влияния независимых переменных на зависимую переменную в регрессионном исследовании.
Методы t- и z-теста, разработанные в 20-м веке, использовались для статистического анализа до 1918 года, когда Рональд Фишер создал метод дисперсионного анализа. ANOVA также называется дисперсионным анализом Фишера и является продолжением t- и z-тестов. Этот термин стал известен в 1925 году после появления в книге Фишера «Статистические методы для научных работников». Это использовалось в экспериментальной психологии и позже расширилось до предметов, которые были более сложными.
Формула для ANOVA это:
F = MSEMST где: F = коэффициент ANOVAMST = средняя сумма квадратов из-за обработкиMSE = средняя сумма квадратов из-за ошибки
Что показывает анализ отклонений?
Тест ANOVA является начальным этапом анализа факторов, влияющих на данный набор данных. По завершении теста аналитик проводит дополнительное тестирование методических факторов, которые в значительной мере способствуют несогласованности набора данных. Аналитик использует результаты теста ANOVA в f-тесте для получения дополнительных данных, которые соответствуют предлагаемым регрессионным моделям.
Тест ANOVA позволяет сравнивать более двух групп одновременно, чтобы определить, существует ли связь между ними. Результат формулы ANOVA, F-статистика (также называемая F-отношением), позволяет анализировать несколько групп данных, чтобы определить изменчивость между выборками и внутри выборок.
Если между испытуемыми группами нет реальной разницы, что называется нулевой гипотезой, результат статистики F-отношения ANOVA будет близок к 1. Колебания в ее выборке, вероятно, будут следовать распределению F Фишера. На самом деле это группа функций распределения с двумя характерными числами, называемыми степенями свободы числителя и знаменателями степеней свободы.
Ключевые вынос
- Дисперсионный анализ, или ANOVA, представляет собой статистический метод, который разделяет данные наблюдаемой дисперсии на различные компоненты для использования в дополнительных тестах. Односторонний анализ ANOVA используется для трех или более групп данных, чтобы получить информацию о взаимосвязи между зависимым и независимые переменные. Если между группами нет истинной дисперсии, F-отношение ANOVA должно быть близко к 1.
Пример использования ANOVA
Например, исследователь может проверить студентов из нескольких колледжей, чтобы определить, превосходят ли учащиеся одного из колледжей учащихся других колледжей. В бизнес-приложении исследователь R & D может протестировать два разных процесса создания продукта, чтобы увидеть, является ли один процесс лучше другого с точки зрения экономической эффективности.
Тип используемого теста ANOVA зависит от ряда факторов. Применяется, когда данные должны быть экспериментальными. Дисперсионный анализ применяется, если нет доступа к статистическому программному обеспечению, что приводит к вычислению ANOVA вручную. Он прост в использовании и лучше всего подходит для небольших образцов. Во многих экспериментальных проектах размеры выборки должны быть одинаковыми для различных комбинаций уровней факторов.
ANOVA полезен для тестирования трех или более переменных. Это похоже на множественные t-тесты с двумя образцами. Однако это приводит к меньшему количеству ошибок типа I и подходит для ряда проблем. ANOVA группирует различия путем сравнения средств каждой группы и включает в себя распространение дисперсии на различные источники. Он используется с предметами, тестовыми группами, между группами и внутри групп.
Односторонний ANOVA и двухсторонний ANOVA
Существует два типа ANOVA: односторонний (или однонаправленный) и двусторонний. Односторонний или двусторонний относится к числу независимых переменных в вашем анализе дисперсионного теста. Односторонняя ANOVA оценивает влияние единственного фактора на единственную переменную ответа. Он определяет, все ли образцы одинаковы. Односторонний ANOVA используется для определения наличия статистически значимых различий между средствами трех или более независимых (не связанных) групп.
Двухсторонний ANOVA является продолжением одностороннего ANOVA. В одностороннем порядке у вас есть одна независимая переменная, влияющая на зависимую переменную. С двухсторонним ANOVA есть два независимых. Например, двусторонняя ANOVA позволяет компании сравнивать производительность труда на основе двух независимых переменных, таких как зарплата и набор навыков. Он используется для наблюдения за взаимодействием двух факторов и проверки влияния двух факторов одновременно.
