Содержание
- Формула для корреляции
- Распространенные ошибки с корреляцией
- Нахождение корреляции в Excel
Корреляция измеряет линейную зависимость двух переменных. Измеряя и соотнося дисперсию каждой переменной, корреляция дает представление о силе взаимосвязи. Или, другими словами, корреляция отвечает на вопрос: насколько переменная A (независимая переменная) объясняет переменную B (зависимую переменную)?
Ключевые вынос
- Корреляция - это статистическая линейная зависимость вариации между двумя переменными. В финансах корреляция используется в нескольких аспектах анализа, включая стандартное отклонение расчета или портфеля. Корреляция вычислений может занимать много времени, но программное обеспечение, такое как Excel, позволяет легко вычислять.
Формула для корреляции
Корреляция объединяет несколько важных и связанных статистических понятий, а именно, дисперсию и стандартное отклонение. Дисперсия - это дисперсия переменной вокруг среднего, а стандартное отклонение - квадратный корень дисперсии.
Формула:
Поскольку корреляция хочет оценить линейную зависимость двух переменных, на самом деле требуется выяснить, какую степень ковариации имеют эти две переменные, и в какой степени эта ковариация отражается стандартными отклонениями каждой переменной в отдельности.
Распространенные ошибки с корреляцией
Единственная наиболее распространенная ошибка - допустить, что корреляция, приближающаяся к +/- 1, является статистически значимой. Чтение, приближающееся к +/- 1, определенно увеличивает шансы фактической статистической значимости, но без дальнейшего тестирования невозможно узнать. Статистическая проверка корреляции может усложняться по ряду причин; это совсем не просто. Критическое предположение о корреляции состоит в том, что переменные независимы и что связь между ними является линейной. Теоретически, вы бы проверили эти утверждения, чтобы определить, подходит ли расчет корреляции.
Помните, что корреляция между двумя переменными НЕ подразумевает, что A вызвало B или наоборот.
Вторая самая распространенная ошибка - забывание нормализовать данные в общую единицу. Если вычислить корреляцию по двум бета-версиям, то единицы уже нормализованы: сама бета является единицей. Однако, если вы хотите соотнести акции, важно, чтобы вы нормализовали их в процентном доходе, а не изменили цену акций. Это происходит слишком часто, даже среди специалистов по инвестициям.
Для корреляции цены акций вы задаете два вопроса: каков доход за определенное количество периодов и как он соотносится с доходом другой ценной бумаги за тот же период? Именно поэтому корреляция цен на акции затруднена: две ценные бумаги могут иметь высокую корреляцию, если доходность представляет собой ежедневные процентные изменения за последние 52 недели, но низкую корреляцию, если доходность является ежемесячной, изменяется за последние 52 недели. Какой лучше"? Там действительно нет идеального ответа, и это зависит от цели теста.
Нахождение корреляции в Excel
Существует несколько способов расчета корреляции в Excel. Самое простое - получить два набора данных бок о бок и использовать встроенную формулу корреляции:
Это удобный способ вычислить корреляцию только между двумя наборами данных. Но что, если вы хотите создать корреляционную матрицу для множества наборов данных? Для этого вам нужно использовать плагин Excel для анализа данных. Плагин находится на вкладке «Данные» в разделе «Анализ».
Выберите таблицу возвратов. В этом случае наши столбцы имеют заголовки, поэтому мы хотим установить флажок «Метки в первой строке», чтобы Excel знал, что их следует рассматривать как заголовки. Затем вы можете выбрать вывод на тот же лист или на новый лист.
Как только вы нажмете ввод, данные автоматически создаются. Вы можете добавить текст и условное форматирование, чтобы очистить результат.
