Квартильний

Що таке квартиль?

Квартиль – це статистичний термін, що описує розподіл спостережень на чотири визначені інтервали на основі значень даних та їх порівняння з усім набором спостережень. 

Розуміння квартилів

Щоб зрозуміти квартиль, важливо розуміти  медіану  як  міру центральної тенденції. Медіана статистики – це середнє значення набору чисел. Це точка, в якій рівно половина даних лежить нижче і вище центрального значення.

Отже, якщо взяти набір з 13 чисел, медіаною було б сьоме число. Шість чисел, що передують цьому значенню, є найнижчими числами в даних, а шість чисел після медіани – це найвищі числа в поданому наборі даних. Оскільки на медіану не впливають екстремальні значення або викиди в розподілі, її іноді надають перевагу  середній.

Медіана – це надійний оцінювач місцеположення, але нічого не говорить про те, як дані по обидві сторони від їх значення поширюються або розподіляються. Це місце, де вступає квартиль. Квартиль вимірює розподіл значень вище і нижче середнього, поділивши розподіл на чотири групи.

Ключові винос

  • Квартиль вимірює розподіл значень вище і нижче середнього, поділивши розподіл на чотири групи.
  • Квартиль ділить дані на три точки – нижній квартиль, медіана та верхній квартиль – утворюючи чотири групи набору даних.
  • Квартилі використовуються для обчислення інтерквартильного діапазону, який є мірою мінливості навколо медіани.

Як працюють квартилі

Подібно до того, як медіана ділить дані навпіл, так що 50% виміру лежить нижче медіани, а 50% лежить вище неї, квартиль розбиває дані на чверті, так що 25% вимірювань менше, ніж нижній квартиль, 50 % менше медіани, а 75% менше верхнього квартиля.

Квартиль ділить дані на три точки – нижній квартиль, медіана та верхній квартиль – утворюючи чотири групи набору даних. Нижній квартиль, або перший квартиль, позначається як Q1 і є середнім числом, яке знаходиться між найменшим значенням набору даних та медіаною. Другий квартиль, Q2, також є медіаною. Верхній або третій квартиль, позначений як Q3, є центральною точкою, яка лежить між медіаною та найбільшим числом розподілу.

Тепер ми можемо скласти карту чотирьох груп, утворених з квартилів. Перша група значень містить найменше число до Q1; друга група включає Q1 до медіани; третій набір – медіана Q3; четверта категорія включає Q3 до найвищої точки даних усього набору.

Кожен квартиль містить 25% від загальної кількості спостережень. Як правило, дані розташовуються від найменших до найбільших:

  1. Перший квартиль: найнижчі 25% чисельності
  2. Другий квартиль : від 25,1% до 50% (до медіани)
  3. Третій квартиль: 50,1% до 75% (вище медіани)
  4. Четвертий квартиль: найвищі 25% чисельності

Приклад Квартилі

Припустимо, розподіл математичних балів у класі 19 учнів у порядку зростання:

59, 60, 65, 65, 68, 69, 70, 72, 75, 75, 76, 77, 81, 82, 84, 87, 90, 95, 98

Спочатку відзначте медіану Q2, яка в цьому випадку дорівнює 10- му значенню: 75.

Q1 – центральна точка між найменшою оцінкою та медіаною. У цьому випадку Q1 потрапляє між першим та п’ятим балами: 68. [Зверніть увагу, що медіана також може бути включена при обчисленні Q1 або Q3 для непарного набору значень. Якби ми включили медіану по обидві сторони від середньої точки, то Q1 буде середнім значенням між першим і 10- м балом, що є середнім значенням п’ятого та шостого балів— (п’ятий + шостий) / 2 = ( 68 + 69) / 2 = 68,5].

Q3 – це середнє значення між Q2 і найвищим балом: 84. [Або якщо включити медіану, Q3 = (82 + 84) / 2 = 83].

Тепер, коли у нас є свої квартилі, давайте розтлумачимо їх кількість. Оцінка 68 (Q1) являє собою перший квартиль і є 25- м  процентилем. 68 є медіаною нижньої половини балів, встановленої в наявних даних, тобто медіаною балів від 59 до 75.

Q1 говорить нам, що 25% балів менше 68, а 75% балів більше. Q2 (медіана) є 50- м  процентилем і показує, що 50% балів менше 75, а 50% балів вище 75. Нарешті, Q3, 75- й процентиль, показує, що 25% балів більше і 75% менше 84.

Особливі міркування

Якщо точка даних для Q1 віддалена від медіани, ніж Q3 від медіани, тоді можна сказати, що серед менших значень набору даних є більша дисперсія, ніж серед більших значень. Та сама логіка застосовується, якщо Q3 знаходиться далі від Q2, ніж Q1 від медіани.

В іншому випадку, якщо існує парна кількість точок даних, медіаною буде середнє значення середніх двох чисел. У нашому прикладі вище, якщо у нас було 20 учнів замість 19, медіаною їхніх балів буде  середнє арифметичне  10- го та 11- го числа.

Квартилі використовуються для обчислення інтерквартильного діапазону, який є мірою мінливості навколо медіани. Міжквартильний діапазон просто обчислюється як різниця між першим і третім квартилями: Q3 – Q1. По суті, саме діапазон середньої половини даних показує, наскільки розподілені дані.

Для великих наборів даних Microsoft Excel має функцію QUARTILE для обчислення квартилів.