Что такое мультиколлинеарность?
Мультиколлинеарность - это проявление высокой взаимной корреляции между независимыми переменными в модели множественной регрессии. Мультиколлинеарность может привести к искаженным или вводящим в заблуждение результатам, когда исследователь или аналитик пытается определить, насколько хорошо каждая независимая переменная может использоваться наиболее эффективно для прогнозирования или понимания зависимой переменной в статистической модели. В общем, мультиколлинеарность может привести к более широким доверительным интервалам и менее надежным значениям вероятности для независимых переменных. То есть статистические выводы из модели с мультиколлинеарностью могут быть ненадежными.
Понимание мультиколлинеарности
Статистические аналитики используют модели множественной регрессии для прогнозирования значения указанной зависимой переменной на основе значений двух или более независимых переменных. Зависимую переменную иногда называют переменной результата, цели или критерия. Примером является многомерная регрессионная модель, которая пытается предвидеть доходность акций на основе таких элементов, как отношение цены к прибыли, рыночная капитализация, результаты прошлых периодов или другие данные. Возврат акций является зависимой переменной, а различные биты финансовых данных являются независимыми переменными.
Ключевые вынос
- Мультиколлинеарность - это статистическая концепция, в которой независимые переменные в модели коррелированы. Мультиколлинеарность среди независимых переменных приведет к менее надежным статистическим выводам. Лучше использовать независимые переменные, которые не коррелированы или повторяются при построении нескольких моделей регрессии, которые используют две или более переменных,
Мультиколлинеарность в модели множественной регрессии показывает, что коллинеарные независимые переменные связаны каким-либо образом, хотя связь может быть или не быть случайной. Например, прошлые результаты могут быть связаны с рыночной капитализацией, поскольку акции, которые показали хорошие результаты в прошлом, будут иметь растущую рыночную стоимость. Другими словами, мультиколлинеарность может существовать, когда две независимые переменные сильно коррелированы. Это также может произойти, если независимая переменная вычисляется из других переменных в наборе данных или если две независимые переменные дают схожие и повторяющиеся результаты.
Одним из наиболее распространенных способов устранения проблемы мультиколлинеарности является сначала выявление коллинеарных независимых переменных, а затем удаление всех, кроме одной. Также возможно устранить мультиколлинеарность путем объединения двух или более коллинеарных переменных в одну переменную. Затем можно провести статистический анализ для изучения взаимосвязи между указанной зависимой переменной и только одной независимой переменной.
Пример мультиколлинеарности
Для инвестирования мультиколлинеарность является общим соображением при выполнении технического анализа, чтобы предсказать вероятные будущие движения цены ценной бумаги, такой как акция или товарное будущее. Аналитики рынка хотят избегать использования технических индикаторов, которые коллинеарны в том смысле, что они основаны на очень похожих или связанных исходных данных; они имеют тенденцию показывать подобные предсказания относительно зависимой переменной движения цены. Вместо этого анализ рынка должен основываться на заметно разных независимых переменных, чтобы гарантировать, что они анализируют рынок с разных независимых аналитических точек зрения.
Известный технический аналитик Джон Боллингер, создатель индикатора Bollinger Bands, отмечает, что «кардинальное правило для успешного использования технического анализа требует избегать мультиколлинеарности среди индикаторов».
Для решения проблемы аналитики избегают использования двух или более технических индикаторов одного типа. Вместо этого они анализируют ценную бумагу с использованием одного типа индикатора, такого как индикатор импульса, а затем проводят отдельный анализ с использованием другого типа индикатора, такого как индикатор тренда.
Примером потенциальной проблемы мультиколлинеарности является выполнение технического анализа только с использованием нескольких похожих индикаторов, таких как стохастик, индекс относительной силы (RSI) и Williams% R, которые являются индикаторами импульса, которые основаны на аналогичных входных данных и, вероятно, будут давать аналогичные Результаты. В этом случае лучше удалить все индикаторы, кроме одного, или найти способ объединить несколько из них в один индикатор, а также добавить индикатор тренда, который вряд ли будет сильно коррелировать с индикатором импульса.
