Что такое линейная регрессия?
Линейная регрессия - это график данных, который отображает линейную зависимость между независимой и зависимой переменной. Обычно он используется для визуального отображения силы взаимосвязи и разброса результатов - все с целью объяснения поведения зависимой переменной.
Скажем, мы хотели проверить силу взаимосвязи между количеством съеденного мороженого и ожирением. Мы взяли бы независимую переменную, количество мороженого, и связали бы ее с зависимой переменной, тучностью, чтобы видеть, была ли связь. Учитывая, что регрессия является графическим отображением этой взаимосвязи, чем ниже изменчивость данных, тем сильнее взаимосвязь и тем плотнее соответствие линии регрессии.
Ключевые вынос
- Линейная регрессия моделирует отношения между зависимой и независимой переменными. Анализ регрессии может быть выполнен, если переменные независимы, нет гетероскедастичности, и условия ошибок переменных не коррелируют. Моделирование линейной регрессии в Excel легче с Пакет анализа данных.
Важные соображения
Есть несколько критических предположений о вашем наборе данных, которые должны быть верны, чтобы продолжить регрессионный анализ:
- Переменные должны быть действительно независимыми (с использованием критерия хи-квадрат). Данные не должны иметь разных отклонений ошибок (это называется гетероскедастичностью (также пишется гетероскедастичность)). Термины ошибок каждой переменной должны быть некоррелированными. Если нет, это означает, что переменные последовательно коррелируют.
Если эти три вещи кажутся сложными, они есть. Но эффект от того, что одно из этих соображений не соответствует действительности, является предвзятой оценкой. По сути, вы бы исказили отношения, которые вы измеряете.
Вывод регрессии в Excel
Первым шагом в запуске регрессионного анализа в Excel является повторная проверка того, что установлен бесплатный плагин Excel для анализа данных. Этот плагин позволяет легко вычислять статистику. Не требуется строить график линейной регрессии, но это упрощает создание таблиц статистики. Чтобы проверить, установлен ли он, выберите «Данные» на панели инструментов. Если опция «Анализ данных» является опцией, эта функция установлена и готова к использованию. Если он не установлен, вы можете запросить эту опцию, нажав кнопку Office и выбрав «Параметры Excel».
Используя Data Analysis ToolPak, для создания регрессионного вывода достаточно нескольких щелчков мышью.
Независимая переменная входит в диапазон X.
С учетом доходности S & P 500, скажем, мы хотим знать, можем ли мы оценить силу и соотношение доходности акций Visa (V). Запас Visa (V) возвращает данные, заполняет столбец 1 как зависимую переменную. S & P 500 возвращает данные, заполняющие столбец 2 как независимую переменную.
- Выберите «Данные» на панели инструментов. Появится меню «Данные». Выберите «Анализ данных». Откроется диалоговое окно «Анализ данных - Инструменты анализа». В меню выберите «Регрессия» и нажмите «ОК». В диалоговом окне «Регрессия» щелкните поле «Диапазон ввода Y» и выберите данные зависимой переменной (запас Visa (V)). возвращает). Нажмите на поле «Диапазон ввода X» и выберите данные независимой переменной (возвращает S & P 500). Нажмите «OK», чтобы запустить результаты.
Интерпретировать результаты
Используя эти данные (то же самое из нашей статьи R-squared), мы получаем следующую таблицу:
Значение R 2, также известное как коэффициент детерминации, измеряет долю вариации в зависимой переменной, объясняемой независимой переменной, или насколько хорошо регрессионная модель соответствует данным. Значение R 2 колеблется от 0 до 1, а более высокое значение указывает на лучшее соответствие. Значение p или значение вероятности также колеблется от 0 до 1 и указывает, является ли тест значимым. В отличие от значения R 2, меньшее значение p является благоприятным, поскольку оно указывает на корреляцию между зависимой и независимой переменными.
Диаграмма регрессии в Excel
Мы можем построить регрессию в Excel, выделив данные и представив их в виде точечной диаграммы. Чтобы добавить линию регрессии, выберите «Макет» в меню «Инструменты диаграммы». В диалоговом окне выберите «Линия тренда», а затем «Линейная линия тренда». Чтобы добавить значение R 2, выберите «Дополнительные параметры линии тренда» в «Меню линии тренда. Наконец, выберите« Показать значение R в квадрате на графике ». Визуальный результат суммирует силу отношений, хотя и за счет отсутствия так подробно, как в таблице выше.
