Что такое ступенчатая регрессия?
Регрессионный анализ является широко используемым статистическим подходом, целью которого является выявление взаимосвязей между переменными. Идея заключается в объединении соответствующих данных для принятия более обоснованных решений и является обычной практикой в мире инвестирования. Пошаговая регрессия - это пошаговое итеративное построение регрессионной модели, которое включает автоматический выбор независимых переменных. Доступность пакетов статистического программного обеспечения делает возможной ступенчатую регрессию даже в моделях с сотнями переменных.
Типы ступенчатой регрессии
Основная цель ступенчатой регрессии состоит в том, чтобы с помощью серии тестов (F-тесты, t-тесты) найти набор независимых переменных, которые значительно влияют на зависимую переменную. Это делается с помощью компьютеров посредством итерации, которая представляет собой процесс получения результатов или решений путем повторяющихся циклов или циклов анализа. Автоматическое проведение тестов с помощью статистических пакетов программного обеспечения позволяет сэкономить время для человека.
Ключевые вынос
- Регрессионный анализ - это статистический подход, который стремится понять и измерить отношения между независимыми и зависимыми переменными. Пошаговая регрессия - это метод, который проверяет статистическую значимость каждой независимой переменной в модели. Подход прямого выбора добавляет переменную, а затем проверяет статистическую значимость. Метод обратного исключения начинается с модели, загруженной многими переменными, а затем удаляет одну переменную для проверки ее важности по отношению к общим результатам. Пошаговая регрессия имеет много критиков, поскольку именно такой подход позволяет вписать данные в модель для достижения желаемого результата.
Пошаговая регрессия может быть достигнута либо путем опробования одной независимой переменной за раз и включения ее в модель регрессии, если она статистически значима, либо путем включения всех потенциальных независимых переменных в модель и исключения тех, которые не являются статистически значимыми. Некоторые используют комбинацию обоих методов, и поэтому существует три подхода к ступенчатой регрессии:
- Прямой выбор начинается с отсутствия переменных в модели, проверяет каждую переменную по мере ее добавления в модель, затем сохраняет те из них, которые считаются наиболее статистически значимыми, - повторяя процесс до тех пор, пока результаты не станут оптимальными. Исключение из обратной последовательности начинается с набора независимых переменных, удаляя по одному, затем проверяя, является ли удаленная переменная статистически значимой. Двунаправленное исключение - это комбинация первых двух методов, которая проверяет, какие переменные должны быть включены или исключены.
Примером ступенчатой регрессии с использованием метода обратной ликвидации может быть попытка понять использование энергии на заводе с использованием таких переменных, как время работы оборудования, возраст оборудования, численность персонала, температура на улице и время года. Модель включает в себя все переменные - затем каждая из них удаляется, по одной, чтобы определить, какие из них наименее статистически значимы. В конце модель может показать, что время года и температуры являются наиболее значимыми, возможно, предполагая, что пиковое потребление энергии на заводе - это когда использование кондиционера является самым высоким.
Ограничения ступенчатой регрессии
Регрессионный анализ, как линейный, так и многомерный, сегодня широко используется в инвестиционном мире. Идея состоит в том, чтобы часто находить модели, которые существовали в прошлом и которые могли бы повториться в будущем. Например, простая линейная регрессия может посмотреть на соотношение цены и прибыли и доходность акций за многие годы, чтобы определить, предлагают ли акции с низким отношением P / E (независимая переменная) более высокую доходность (зависимая переменная). Проблема этого подхода заключается в том, что рыночные условия часто меняются, и отношения, которые существовали в прошлом, не обязательно сохраняются в настоящем или будущем.
Между тем, у процесса пошаговой регрессии есть много критиков, и есть даже призывы вообще прекратить использование метода. Статистики отмечают несколько недостатков этого подхода, в том числе неверные результаты, присущие самому процессу смещения и необходимость значительных вычислительных мощностей для разработки сложных регрессионных моделей посредством итерации.