Что такое фактор инфляции дисперсии?
Инфляция дисперсии Коэффициент инфляции дисперсии (VIF) является мерой количества мультиколлинеарности в множестве переменных регрессии. Математически VIF для переменной модели регрессии равен отношению общей дисперсии модели к дисперсии модели, которая включает только эту единственную независимую переменную. Это соотношение рассчитывается для каждой независимой переменной. Высокий VIF указывает на то, что связанная независимая переменная очень коллинеарна с другими переменными в модели.
Ключевые вынос
- Коэффициент инфляции дисперсии (VIF) обеспечивает меру мультиколлинеарности среди независимых переменных в модели множественной регрессии. Обнаружение мультиколлинеарности важно, потому что, хотя оно и не уменьшает объяснительную силу модели, оно снижает статистическую значимость независимых переменных. Большой VIF на независимой переменной указывает на высокую коллинеарную связь с другими переменными, которые следует учитывать или корректировать в структуре модели и выборе независимых переменных.
Понимание фактора инфляции дисперсии
Множественная регрессия используется, когда человек хочет проверить влияние нескольких переменных на конкретный результат. Зависимая переменная - это результат, на который воздействуют независимые переменные, которые являются входными данными для модели. Мультиколлинеарность существует, когда существует линейная связь или корреляция между одной или несколькими независимыми переменными или входами. Мультиколлинеарность создает проблему в множественной регрессии, потому что, поскольку все входные данные влияют друг на друга, они на самом деле не являются независимыми, и трудно проверить, насколько комбинация независимых переменных влияет на зависимую переменную или результат в рамках регрессионной модели., С точки зрения статистики, модель множественной регрессии, где существует высокая мультиколлинеарность, усложнит оценку взаимосвязи между каждой из независимых переменных и зависимой переменной. Небольшие изменения в используемых данных или в структуре модельного уравнения могут привести к значительным и неустойчивым изменениям в оценочных коэффициентах для независимых переменных.
Чтобы убедиться, что модель правильно указана и функционирует правильно, существуют тесты, которые можно запустить на мультиколлинеарность. Дисперсионный фактор инфляции является одним из таких инструментов измерения. Использование дисперсионных факторов инфляции помогает выявить серьезность любых проблем мультиколлинеарности, чтобы можно было скорректировать модель. Коэффициент инфляции дисперсии измеряет, насколько поведение (дисперсия) независимой переменной зависит или раздувается ее взаимодействием / корреляцией с другими независимыми переменными. Коэффициенты инфляции дисперсии позволяют быстро измерить, насколько переменная вносит вклад в стандартную ошибку в регрессии. При наличии существенных проблем мультиколлинеарности коэффициент инфляции дисперсии будет очень большим для задействованных переменных. После определения этих переменных можно использовать несколько подходов для исключения или объединения коллинеарных переменных, что позволяет решить проблему мультиколлинеарности.
Хотя мультиколлинеарность не уменьшает общую предсказательную силу модели, она может давать оценки коэффициентов регрессии, которые не являются статистически значимыми. В некотором смысле это можно рассматривать как разновидность двойного счета в модели. Когда две или более независимые переменные тесно связаны или измеряют почти одно и то же, тогда основной эффект, который они измеряют, учитывается дважды (или более) по переменным, и становится трудно или невозможно сказать, какая переменная действительно влияет на независимая переменная. Это проблема, потому что целью многих эконометрических моделей является проверка именно такого рода статистических отношений между независимыми переменными и зависимой переменной.
Например, если экономист хочет проверить, существует ли статистически значимая связь между уровнем безработицы (в качестве независимой переменной) и уровнем инфляции (в качестве зависимой переменной). Включение дополнительных независимых переменных, связанных с уровнем безработицы, таких как новые первичные заявки на пособие по безработице, может привести к мультиколлинеарности в модели. Общая модель может показывать сильную, статистически достаточную объяснительную силу, но не сможет определить, вызван ли этот эффект главным образом уровнем безработицы или новыми первоначальными заявлениями по безработице. Это то, что обнаружил бы VIF, и он предложил бы исключить одну из переменных из модели или найти какой-либо способ их объединения, чтобы отразить их совместный эффект, в зависимости от того, какую конкретную гипотезу интересует исследователь.
