Что значит Winsorized?
Среднее Winsorized - это метод усреднения, который первоначально заменяет самые маленькие и самые большие значения на самые близкие к ним наблюдения. Это делается для ограничения влияния аномальных экстремальных значений или выбросов на расчет. После замены значений используется формула среднего арифметического для вычисления среднего значения Winsorized.
Формула для Worsorized Среднее есть
Среднее Winsorized = Nxn… xn + 1 + xn + 2… xn где: n = количество самых больших и самых маленьких точек данных, которые должны быть заменены наблюдением
Worsorized средства выражены двумя способами. Среднее значение «k n » относится к замене наименьших и самых больших наблюдений «k», где «k» - целое число. Среднее значение «X%» включает замену заданного процента значений с обоих концов данных.
Как рассчитать Worsorized среднее
Среднее значение Winsorized рассчитывается путем замены наименьших и самых больших точек данных, затем суммирования всех точек данных и деления суммы на общее количество точек данных.
Что говорит вам Worsorized?
Среднее значение Winsorized менее чувствительно к выбросам, поскольку оно может заменить их менее экстремальными значениями. То есть он менее восприимчив к контурам по сравнению со средним. Однако, если у распределения есть жирные хвосты, эффект удаления самых высоких и самых низких значений в распределении будет иметь небольшое влияние из-за большого количества изменчивости в показателях распределения.
Ключевые вынос
- Метод усреднения, который включает в себя замену наименьших и наибольших значений на наиболее близкие к ним наблюдения. Меньше чувствителен к выбросам, потому что он может заменить их на менее экстремальные значения. В отличие от усеченного среднего, который включает в себя удаление точек данных - хотя результат двух как правило, быть рядом.
Пример использования Winsorized Mean
Можно вычислить среднее значение worsorized для следующего набора данных: 1, 5, 7, 8, 9, 10, 14. В этом примере мы предполагаем, что среднее значение winsorized находится в первом порядке, мы заменяем самые маленькие и самые большие значения их ближайшие наблюдения.
Набор данных теперь выглядит следующим образом: 5, 5, 7, 8, 9, 10, 10. Если взять среднее арифметическое для нового набора, получится среднее значение winsorized 7, 7, или (5 + 5 + 7 + 8 + 9 + 10 + 10) делится на 7.
Или рассмотрите 20% -ное значение worsorized, которое берет верхние 10% и нижние 10% и заменяет их следующим ближайшим значением. Мы украсим следующий набор данных: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. Два самые маленькие и самые большие точки данных, или 10%, будут заменены их ближайшими ближайшими значениями. Таким образом, новый набор данных: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61. среднее значение составляет 33, 9, или сумма данных (678) делится на общее количество точек данных (20).
Разница между средним и усеченным средним
Усредненное среднее включает в себя изменение точек данных, в то время как усеченное среднее включает удаление точек данных. Обычно worsorized среднее и обрезанное среднее значение находятся рядом.
Ограничения использования Winsorized Среднее
Одним из основных недостатков винзорсированных средств является то, что они вносят смещение в набор данных. Конечно, после модификации набор данных в идеале будет менее предвзятым, чем если бы выбросы остались.
Узнайте больше о Winsorized Mean
Для понимания, о разнице между вычислениями среднего значения.
