Квінтилі

Що таке квінтилі?

Квінтиль – це статистичне значення набору даних, яке представляє 20% даної сукупності, тому перший квінтил представляє найнижчу п’яту частину даних (від 1% до 20%); другий квінтиль представляє другу п’яту (від 21% до 40%) тощо.

Квінтилі використовуються для створення граничних точок для даної популяції; соціально-економічне дослідження, яке фінансується урядом, може використовувати квінтилі для визначення максимального багатства, яке може мати сім’я, щоб належати до найнижчого квінтилю суспільства. Потім цю межу можна використовувати як передумову для отримання сім’єю спеціальної державної субсидії, спрямованої на допомогу менш щасливим суспільству.

Ключові винос

  • Квінтилі представляють 20% даної популяції. Отже, перший квінтиль представляє найнижчу п’яту частину даних, а остаточний квінтиль представляє остаточну або останню п’яту частину даних.
  • Як правило, вони використовуються для великих наборів даних, і до них часто звертаються політики та економісти для обговорення концепцій економічної та соціальної справедливості.
  • Залежно від чисельності популяції, альтернативою квінтилам є квартилі та тертилі.

Розуміння квінтилів

Квінтиль – це тип квантилю, який визначається як однакові за розміром верстви населення. Одна з найпоширеніших метрик статистичного аналізу, медіана, насправді є лише результатом поділу сукупності на два квантилі. Квінтил – це одне з п’яти значень, які ділять діапазон даних на п’ять рівних частин, кожна з яких становить 1/5 (20 відсотків) діапазону. Населення, розділене на три рівні частини, поділяється на тертилі, тоді як одне розділене на четверті діляться на квартилі. Чим більший набір даних, тим простіше його розділити на більші квантилі. Економісти часто використовують квінтилі для аналізу дуже великих наборів даних, таких як населення Сполучених Штатів.

Наприклад, якби ми розглянули всі ціни закриття певної акції на кожен день у минулому році, верхні 20% цих цін представляли б верхній квінтиль даних. Найнижчі 20% цих цін представляли б нижчий квінтиль даних. Між верхнім і нижнім квінтилями було б три квінтилі. Хоча середнє значення всіх цін на акції, як правило, падає між другим і четвертим квінтилями, що є середньою точкою даних, відхилення на верхньому або нижньому кінці даних можуть збільшити або зменшити середнє значення. Як результат, варто враховувати розподіл точок даних – і враховуючи будь-які значні викиди – при спробі зрозуміти дані та середні значення.

Поширене використання квінтилів

Політики посилаються на квінтилі, щоб проілюструвати необхідність змін у політиці. Наприклад, політик, який відстоює економічну справедливість, може розділити населення на квінтилі, щоб продемонструвати, як топ-20% дохідників контролюють те, що, на його думку, несправедливо велика частка багатства. На іншому кінці спектру, політик, який закликає припинити прогресивне оподаткування, може скористатися квінтилями, щоб аргументувати те, що верхні 20% мають занадто велику частку податкового тягаря.

У “Кривій дзвоника”, суперечливій книзі 1994 року про коефіцієнт інтелекту (IQ), автори використовують квінтили у всьому тексті, щоб проілюструвати свої дослідження, показуючи, що IQ сильно корелює з позитивними результатами в житті.

Альтернативи квінтилю

Для певних груп населення використання інших методів дослідження способу розподілу даних має більше сенсу, ніж використання квінтилів. Для менших наборів даних використання квартилів або тертилів допомагає запобігти надмірному розповсюдженню даних. Порівняння середнього або середнього значення набору даних до його медіани або точки відсічення, де дані поділяються на два квантилі, виявляє, чи дані розподіляються рівномірно, чи вони перекошені вгору чи внизу. Середнє значення, яке значно перевищує медіану, вказує, що дані дуже важкі, тоді як нижнє середнє означає протилежне.