Что такое смещение выборки?
Смещение выборки - это тип смещения, вызванный выбором неслучайных данных для статистического анализа. Смещение существует из-за недостатка в процессе выбора выборки, когда подмножество данных систематически исключается из-за определенного атрибута. Исключение подмножества может повлиять на статистическую значимость теста или привести к искаженным результатам.
Понимание смещения выборки
Уклон выживаемости является распространенным типом смещения при отборе выборки. Например, при повторном тестировании инвестиционной стратегии для большой группы акций может быть удобно искать ценные бумаги, которые имеют данные за весь период выборки. Если бы мы собирались проверить стратегию на основе данных о запасах за 15 лет, мы могли бы искать акции, которые имеют полную информацию за весь 15-летний период. Однако устранение акции, которая прекратила торговать или вскоре покинула рынок, внесло бы смещение в нашу выборку данных. Поскольку мы включаем только акции, которые продлились 15 лет, наши окончательные результаты будут ошибочными, так как они показали себя достаточно хорошо, чтобы выжить на рынке.
Индексы производительности хедж-фондов являются одним из примеров систематической ошибки выбора выборки с учетом выживаемости. Поскольку хедж-фонды, которые не выжили, перестают сообщать о своей эффективности агрегаторам индексов, результирующие индексы естественным образом склоняются к фондам и стратегиям, которые остаются, а значит, «выживают». Это также может быть проблемой с популярными службами отчетности взаимных фондов.
Аналитики могут приспособиться, чтобы учесть эти предвзятости, но могут вносить предвзятые новости в процесс
