Что такое коэффициент определения?
Коэффициент детерминации - это показатель, используемый в статистическом анализе, который оценивает, насколько хорошо модель объясняет и предсказывает будущие результаты. Это указывает на уровень объясненной изменчивости в наборе данных. Коэффициент детерминации, также известный как «R-квадрат», используется в качестве ориентира для измерения точности модели.
Один из способов интерпретации этого рисунка состоит в том, чтобы сказать, что переменные, включенные в данную модель, объясняют приблизительно х% наблюдаемого отклонения. Таким образом, если R 2 = 0, 50, то примерно половина наблюдаемого изменения может быть объяснена моделью.
Р-Брусковый
Ключевые вынос
- Коэффициент детерминации представляет собой сложную идею, основанную на статистическом анализе будущей модели данных. Коэффициент детерминации используется для объяснения того, насколько изменчивость одного фактора может быть вызвана его отношением к другому фактору.
Понимание коэффициента определения
Коэффициент детерминации используется для объяснения того, насколько изменчивость одного фактора может быть вызвана его отношением к другому фактору. На него в значительной степени опирается анализ тренда, и он представлен в виде значения от 0 до 1.
Чем ближе значение к 1, тем лучше соответствие или взаимосвязь между двумя факторами. Коэффициент детерминации представляет собой квадрат коэффициента корреляции, также известный как «R», который позволяет ему отображать степень линейной корреляции между двумя переменными.
Эта корреляция известна как «доброта соответствия». Значение 1, 0 указывает на идеальное соответствие, и, таким образом, это очень надежная модель для будущих прогнозов, указывающая, что модель объясняет все наблюдаемые изменения. Значение 0, с другой стороны, указывает на то, что модель вообще не может точно моделировать данные. Для модели с несколькими переменными, такой как модель множественной регрессии, скорректированный R 2 является лучшим коэффициентом детерминации. В экономике значение R 2 выше 0, 60 считается целесообразным.
Преимущества анализа коэффициента определения
Коэффициент детерминации - это квадрат корреляции между прогнозируемыми баллами в наборе данных и фактическим набором баллов. Он также может быть выражен как квадрат корреляции между баллами X и Y, где X является независимой переменной, а Y является зависимой переменной.
Независимо от представления, R-квадрат, равный 0, означает, что зависимая переменная не может быть предсказана с использованием независимой переменной. И наоборот, если оно равно 1, это означает, что независимая переменная всегда прогнозируется зависимой переменной.
Коэффициент детерминации, который попадает в этот диапазон, измеряет степень, в которой зависимая переменная прогнозируется независимой переменной. Например, R-квадрат 0, 20 означает, что 20% зависимой переменной прогнозируется независимой переменной.
Качество соответствия или степень линейной корреляции измеряет расстояние между подобранной линией на графике и всеми точками данных, которые разбросаны по графику. Узкий набор данных будет иметь линию регрессии, которая очень близка к точкам, и будет иметь высокий уровень соответствия, что означает, что расстояние между линией и данными очень мало. Хорошая посадка имеет R-квадрат, близкий к 1.
Однако R-квадрат не может определить, смещены ли точки данных или прогнозы. Он также не сообщает аналитику или пользователю, хорош ли коэффициент определения или нет. Например, низкий R-квадрат неплох, и человек должен принять решение на основе R-квадрата.
Коэффициент детерминации не следует интерпретировать наивно. Например, если R-квадрат модели указан на уровне 75%, дисперсия ее ошибок на 75% меньше, чем дисперсия зависимой переменной, а стандартное отклонение ее ошибок на 50% меньше стандартного отклонения зависимой переменная. Стандартное отклонение ошибок модели составляет примерно одну треть от размера стандартного отклонения ошибок, которые вы получите при использовании модели с постоянной величиной.
Наконец, даже если значение R-квадрата велико, статистическая значимость объясняющих переменных в модели может отсутствовать, или эффективный размер этих переменных может быть очень маленьким с практической точки зрения.