Что такое линия наилучшего соответствия
Линия наилучшего соответствия относится к линии на точечной диаграмме точек данных, которая наилучшим образом отражает взаимосвязь между этими точками. Статистики обычно используют метод наименьших квадратов для получения геометрического уравнения для линии, либо с помощью ручных расчетов, либо с помощью программного обеспечения регрессионного анализа. Прямая линия будет получена в результате простого линейного регрессионного анализа двух или более независимых переменных. В некоторых случаях регрессия с участием нескольких связанных переменных может привести к изогнутой линии.
Линия наилучшего соответствия
Основы линии Best Fit
Линия наилучшего соответствия является одним из наиболее важных результатов регрессионного анализа. Регрессия - это количественная мера взаимосвязи между одной или несколькими независимыми переменными и получающейся зависимой переменной. Регрессия полезна для профессионалов в широком спектре областей от науки и государственной службы до финансового анализа.
Для проведения регрессионного анализа статистик собирает набор точек данных, каждая из которых включает в себя полный набор зависимых и независимых переменных. Например, зависимой переменной может быть цена акций фирмы, а независимыми переменными могут быть индекс Standard and Poor's 500 и национальный уровень безработицы, при условии, что акции не указаны в S & P 500. Выборочный набор может быть каждым из этих три набора данных за последние 20 лет.
На диаграмме эти точки данных будут отображаться в виде точечной диаграммы, набора точек, которые могут или не могут быть организованы вдоль какой-либо линии. Если линейный рисунок очевиден, может быть возможно нарисовать линию наилучшего соответствия, которая минимизирует расстояние этих точек от этой линии. Если организующая ось не видна визуально, регрессионный анализ может создать линию на основе метода наименьших квадратов. Этот метод строит линию, которая минимизирует квадрат расстояния каждой точки от линии наилучшего соответствия.
Чтобы определить формулу для этой линии, статистик вводит эти три результата за последние 20 лет в программное приложение регрессии. Программное обеспечение создает линейную формулу, которая выражает причинно-следственную связь между S & P 500, уровнем безработицы и ценой акций рассматриваемой компании. Это уравнение является формулой для линии наилучшего соответствия. Это инструмент прогнозирования, предоставляющий аналитикам и трейдерам механизм для прогнозирования будущей цены акций фирмы на основе этих двух независимых переменных.
Линия уравнения наилучшего соответствия и ее составляющие
Регрессия с двумя независимыми переменными, как, например, в рассмотренном выше примере, даст формулу с этой базовой структурой:
y = c + b 1 (x 1) + b 2 (x 2)
В этом уравнении y является зависимой переменной, c является константой, b 1 является первым коэффициентом регрессии и x 1 является первой независимой переменной. Второй коэффициент и вторая независимая переменная - это b 2 и x 2. Исходя из приведенного выше примера, цена акций будет y, S & P 500 будет х 1, а уровень безработицы будет х 2. Коэффициент каждой независимой переменной представляет степень изменения y для каждой дополнительной единицы в этой переменной. Если S & P 500 увеличивается на единицу, результирующая цена y или акции вырастет на величину коэффициента. То же самое относится и ко второй независимой переменной - уровню безработицы. В простой регрессии с одной независимой переменной этот коэффициент является наклоном линии наилучшего соответствия. В этом примере или любой регрессии с двумя независимыми переменными наклон представляет собой смесь двух коэффициентов. Константа c - это y-точка пересечения линии наилучшего соответствия.
Ключевые вынос
- Линия наилучшего соответствия используется для выражения взаимосвязи на диаграмме разброса различных точек данных. Она является результатом регрессионного анализа и может использоваться в качестве инструмента прогнозирования для индикаторов и ценовых движений.