Что такое квартиль?
Квартиль - это статистический термин, описывающий разделение наблюдений на четыре определенных интервала на основе значений данных и их сравнения со всем набором наблюдений.
Понимание квартилей
Чтобы понять квартиль, важно понимать медиану как меру центральной тенденции. Медиана в статистике - это среднее значение набора чисел. Это точка, в которой ровно половина данных лежит ниже и выше центрального значения.
Итак, учитывая набор из 13 чисел, медиана будет седьмым числом. Шесть чисел, предшествующих этому значению, являются самыми низкими числами в данных, а шесть чисел после медианы являются самыми высокими числами в данном наборе данных. Поскольку на медиану не влияют экстремальные значения или выбросы в распределении, иногда она предпочтительнее среднего значения.
Медиана является надежной оценкой местоположения, но ничего не говорит о том, как данные по обе стороны от их значения распространяются или рассеиваются. Вот где вступает квартиль. Квартиль измеряет разброс значений выше и ниже среднего, деля распределение на четыре группы.
Ключевые вынос
- В квартиле измеряется разброс значений выше и ниже среднего путем деления распределения на четыре группы. Квартиль делит данные на три точки - нижний квартиль, медиана и верхний квартиль - для формирования четырех групп набора данных. Используются кварталы рассчитать межквартильный диапазон, который является мерой изменчивости вокруг медианы.
Как работают кварталы
Точно так же, как медиана делит данные на половину, так что 50% измерений лежит ниже медианы, а 50% лежит выше ее, квартиль разбивает данные на четверти, так что 25% измерений меньше нижнего квартиля 50. % меньше среднего, а 75% меньше верхнего квартиля.
Квартиль делит данные на три точки - нижний квартиль, медиана и верхний квартиль - для формирования четырех групп набора данных. Нижний квартиль или первый квартиль обозначается как Q1 и представляет собой среднее число, которое находится между наименьшим значением набора данных и медианой. Второй квартиль, Q2, также является медианой. Верхний или третий квартиль, обозначаемый как Q3, является центральной точкой, которая лежит между медианой и наибольшим числом распределения.
Теперь мы можем наметить четыре группы, сформированные из квартилей. Первая группа значений содержит наименьшее число до Q1; вторая группа включает Q1 до медианы; третий набор является медианой для Q3; четвертая категория включает в себя Q3 к самой высокой точке данных из всего набора.
Каждый квартиль содержит 25% от общего числа наблюдений. Обычно данные располагаются от наименьшего к наибольшему:
- Первый квартиль: самые низкие 25% чисел. Второй квартиль: между 25, 1% и 50% (до медианы). Третий квартиль: от 51% до 75% (выше медианы). Четвертый квартиль: самые высокие 25% чисел.
Пример квартиля
Давайте работать с примером. Предположим, что распределение оценок по математике в классе из 19 учеников в порядке возрастания:
59, 60, 65, 65, 68, 69, 70, 72, 75, 75, 76, 77, 81, 82, 84, 87, 90, 95, 98
Сначала отметьте медиану Q2, которая в данном случае является десятым значением: 75.
Q1 является центральной точкой между наименьшей оценкой и медианой. В этом случае Q1 попадает между первым и пятым счетом: 68.
Q3 - это среднее значение между Q2 и наивысшим баллом: 84.
Теперь, когда у нас есть квартили, давайте интерпретируем их числа. Оценка 68 (Q1) представляет первый квартиль и является 25- м процентилем. 68 - медиана нижней половины балла, установленного в доступных данных, то есть медиана баллов от 59 до 75.
Q1 говорит нам, что 25% баллов меньше 68, а 75% баллов в классе выше. Q2 (медиана) представляет собой 50- й процентиль и показывает, что 50% баллов меньше 75, а 50% баллов выше 75. Наконец, Q3, 75- й процентиль, показывает, что 25% баллов больше и 75% меньше 84.
Особые соображения
Если точка данных для Q1 находится дальше от медианы, чем Q3 от медианы, то мы можем сказать, что существует больший разброс между меньшими значениями набора данных, чем среди больших значений. Та же логика применима, если Q3 находится дальше от Q2, чем Q1 от медианы.
В качестве альтернативы, если имеется четное количество точек данных, медиана будет средним из двух средних чисел. В нашем примере выше, если у нас было 20 учеников вместо 19, медиана их баллов будет средним арифметическим числа десятого и одиннадцатого числа.
Квартили используются для расчета межквартильного диапазона, который является мерой изменчивости вокруг медианы. Межквартильный диапазон просто рассчитывается как разница между первым и третьим квартилем: Q3 - Q1. По сути, это диапазон средней половины данных, который показывает, насколько разбросаны данные.
Для больших наборов данных Microsoft Excel имеет функцию QUARTILE для расчета квартилей.