Що таке Квартиль?
Квартиль - це статистичний термін, що описує поділ спостережень на чотири визначені інтервали на основі значень даних та їх порівняння з усім набором спостережень.
Розуміння квартілів
Щоб зрозуміти квартиль, важливо розуміти медіану як міру центральної тенденції. Медіана в статистиці - це середнє значення набору чисел. Це точка, в якій рівно половина даних лежить нижче і вище центрального значення.
Отже, враховуючи набір з 13 чисел, медіана була б сьомим числом. Шість чисел, що передують цьому значенню, є найнижчими числами в даних, а шість цифр після медіани - найвищі числа в даному наборі даних. Оскільки на медіану не впливають екстремальні величини чи переживачі в розподілі, її іноді віддають перевагу середній величині.
Медіана є надійною оцінкою місця розташування, але нічого не говорить про те, як розповсюджуються або розповсюджуються дані з будь-якої сторони її значення. Ось де відбувається крокетний крок. Квартиль вимірює поширення значень вище та нижче середнього, діливши розподіл на чотири групи.
Ключові вивезення
- Квартиль вимірює поширення значень вище та нижче середнього, поділяючи розподіл на чотири групи. Квартиль ділить дані на три точки - нижній квартал, медіану та верхній квартиль - для формування чотирьох груп набору даних. Використовуються квартілі обчислити міжквартильний діапазон, який є мірою мінливості навколо медіани.
Як працюють квартілі
Так само, як медіана ділить дані навпіл, так що 50% вимірювання лежить нижче медіани і 50% лежить над нею, четвертиль розбиває дані на чверті, так що 25% вимірювання менше, ніж нижній квартиль, 50 % менше середнього, а на 75% менше, ніж у верхньому кварталі.
Квартиль ділить дані на три точки - нижній квартал, медіану та верхній квартал - для формування чотирьох груп набору даних. Нижній квартал або перший квартал позначається як Q1 і є середнім числом, яке падає між найменшим значенням набору даних та медіаною. Другий квартал, Q2, також є медіаною. Верхня або третя чверть, позначена як Q3, є центральною точкою, що лежить між медіаною і найбільшою кількістю розподілу.
Тепер ми можемо відзначити чотири групи, утворені з квартилів. Перша група значень містить найменше число до Q1; друга група включає Q1 до медіани; третій набір - медіана до Q3; четверта категорія включає Q3 до найвищої точки даних усього набору.
Кожен квартал містить 25% від загальних спостережень. Як правило, дані розташовані від найменших до найбільших:
- Перший квартал: найнижчі 25% чисел. Другий квартиль: від 25, 1% до 50% (до медіани) Третій квартал: 51% до 75% (вище медіани) Четвертий квартал: найвищі 25% чисел
Квартильний приклад
Давайте попрацюємо з прикладом. Припустимо, розподіл математичних балів у класі 19 учнів у порядку зростання:
59, 60, 65, 65, 68, 69, 70, 72, 75, 75, 76, 77, 81, 82, 84, 87, 90, 95, 98
Спочатку відмітьте медіану Q2, яка в цьому випадку є десятим значенням: 75.
Q1 - центральна точка між найменшою оцінкою та медіаною. У цьому випадку Q1 потрапляє між першою та п'ятою оцінкою: 68.
Q3 - середнє значення між Q2 та найвищим балом: 84.
Тепер, коли у нас є свої квартилі, давайте інтерпретувати їх кількість. Оцінка 68 (Q1) являє собою перший квартал і є 25- м перцентилем. 68 - медіана нижньої половини балу, встановлена в доступних даних, тобто медіана балів від 59 до 75.
Q1 говорить про те, що 25% балів менше 68, а 75% балів за клас більше. Q2 (медіана) - 50- й перцентиль і показує, що 50% балів менше 75, а 50% балів вище 75. Нарешті, Q3, 75- й перцентиль, показує, що 25% балів - це більше і на 75% менше 84.
Спеціальні міркування
Якщо точка даних для Q1 віддалена від медіани, ніж Q3, від медіани, то можна сказати, що серед менших значень набору даних більша дисперсія, ніж серед більших значень. Ця ж логіка застосовується, якщо Q3 далі від Q2, ніж Q1 - від медіани.
Крім того, якщо є парне число точок даних, медіана буде середнім середніми двома числами. У нашому прикладі вище, якщо у нас було 20 учнів замість 19, медіана їх балів буде середнім арифметичним числом десятого та одинадцятого числа.
Квартілі використовуються для обчислення міжквартильного діапазону, який є мірою мінливості навколо медіани. Інтерквартильний діапазон просто обчислюється як різниця між першим та третім кварталом: Q3 - Q1. Насправді саме діапазон середньої половини даних показує, наскільки розподілені дані.
Для великих наборів даних Microsoft Excel має функцію QUARTILE для обчислення квартилів.
