Что такое ложная корреляция
В статистике ложная корреляция, или ложная связь, относится к связи между двумя переменными, которая выглядит причинно-следственной, но это не так. Ложные отношения часто имеют вид одной переменной, влияющей на другую. Эта ложная корреляция часто вызвана третьим фактором, который не очевиден во время исследования, иногда называемый смешанным фактором.
Ключевые вынос
- Ложная корреляция, или ложная корреляция, - это когда два фактора кажутся случайно связанными, но это не так. Появление причинно-следственной связи часто происходит из-за сходного движения на графике, которое оказывается случайным или вызванным третьим «смешанным» фактором. Ложная корреляция часто может быть вызвано небольшими размерами выборки или произвольными конечными точками.
Как работает ложная корреляция
Когда две случайные величины тесно отслеживают друг друга на графике, легко предположить корреляцию или взаимосвязь между двумя факторами, когда изменение влияет на другой. Оставляя в стороне «причинность», еще одну тему, это наблюдение может привести читателя диаграммы к мысли, что движение переменной A связано с движением в переменной B или наоборот. но иногда, при ближайшем статистическом рассмотрении, выровненные движения являются случайными или вызваны третьим фактором, который влияет на первые два. Это ложная корреляция. Исследования, проведенные с небольшими размерами выборки или произвольными конечными точками, являются особенностью, подверженной ложным результатам.
Пример ложных корреляций
Это не слишком сложно, чтобы обнаружить интересные взаимосвязи. Однако многие окажутся поддельными. Для мужского вида на Уолл-стрит две популярные ложные корреляции касаются женщин и спорта. В 1920-х годах появилась теория длины юбки, согласно которой длина юбки и направление на фондовом рынке взаимосвязаны. Если длина юбки большая, это означает, что фондовый рынок идет вниз; если они короткие, рынок идет вверх. Примерно в конце января говорят о так называемом индикаторе Super Bowl, который говорит о том, что победа команды АФК, скорее всего, означает, что фондовый рынок упадет в следующем году, тогда как победа команды NFC предвещает рост рынок. С 1966 года показатель имеет показатель точности 80%. Это забавная беседа, но, вероятно, не то, что серьезный финансовый консультант рекомендовал бы в качестве инвестиционной стратегии для клиентов.
Вот еще несколько примеров распространенных ложных корреляций:
- Утопление растет, когда продажи мороженого растут. Может показаться, что увеличение продаж мороженого приводит к еще большему утоплению, но на самом деле повышение температуры может привести к тому, что больше людей будут плавать, а также покупать больше мороженого. Уровень убийств в США в 2006-2011 годах снизился с той же скоростью, что и Microsoft Internet Explorer. Использование. Исполнительные, которые говорят «пожалуйста» и «спасибо», чаще наслаждаются лучшей игрой. Люди, которые носят экипировку команды «Окленд Рейдерс», чаще совершают преступления.
Как определить ложные корреляции
Статистики и другие ученые, которые анализируют данные, должны постоянно искать ложные отношения. Есть множество методов, которые они используют, в том числе:
- Обеспечение правильной репрезентативной выборки. Получение адекватного размера выборки. Остерегайтесь произвольных конечных точек. Контролируйте как можно больше внешних переменных. Используя нулевую гипотезу и проверяйте сильное значение p.
