Стратифікована випадкова вибірка

Що таке стратифікована випадкова вибірка?

Стратифікована випадкова вибірка – це метод вибірки, який передбачає поділ сукупності на менші підгрупи, відомі як страти. При стратифікованій випадковій вибірці або стратифікації страти формуються на основі спільних ознак чи характеристик членів, таких як дохід або рівень освіти.

Стратифікована випадкова вибірка також називається пропорційною випадковою вибіркою або квотною випадковою вибіркою.

Ключові винос

  • Стратифікована випадкова вибірка дозволяє дослідникам отримати сукупність вибірки, яка найкраще відображає всю досліджувану сукупність.
  • Стратифікована випадкова вибірка передбачає поділ всієї сукупності на однорідні групи, які називаються стратами.
  • Стратифікована випадкова вибірка відрізняється від простої випадкової вибірки, яка передбачає випадковий відбір даних із цілої сукупності, тому кожна можлива вибірка має однакову ймовірність.

Як працює стратифікована випадкова вибірка

Завершуючи аналіз або дослідження групи об’єктів зі схожими характеристиками, дослідник може виявити, що чисельність популяції занадто велика, щоб її можна було завершити. Для економії часу та грошей аналітик може застосувати більш здійсненний підхід, вибравши невелику групу серед населення. Малу групу називають обсягом вибірки, що є підмножиною сукупності, яка використовується для представлення всієї сукупності. Вибірка може бути вибрана з сукупності кількома способами, одним із яких є стратифікований метод випадкової вибірки.

Стратифікована випадкова вибірка передбачає поділ всієї сукупності на однорідні групи, що називаються шарами (множина для прошарку). Потім з кожного шару відбираються випадкові зразки. Наприклад, розглянемо академічного дослідника, який хотів би знати кількість студентів МВА у 2007 році, які отримали пропозицію про роботу протягом трьох місяців після закінчення навчання.

Незабаром він виявить, що за рік було майже 200 000 випускників MBA. Він може вирішити простої випадкової вибірки з 50000 випускників та запустити опитування. А ще краще, він міг розділити популяцію на прошарки та взяти випадкову вибірку з прошарків. Для цього він створив групи населення на основі статі, вікового діапазону, раси, країни громадянства та кар’єри. Випадкова вибірка з кожного прошарку береться у кількості, пропорційному розміру прошарку в порівнянні з сукупністю. Потім ці підмножини шарів об’єднуються, утворюючи випадкову вибірку.

[Важливо: Стратифікована вибірка використовується для виділення відмінностей між групами в популяції, на відміну від простої випадкової вибірки, яка розглядає всіх представників популяції як рівних, з однаковою ймовірністю взяти вибірку.]

Приклад стратифікованої випадкової вибірки

Припустимо, що дослідницька група хоче визначити середній бал студентів коледжів США. Дослідницька група відчуває труднощі зі збором даних від усіх 21 мільйонів студентів коледжів; він вирішує взяти випадкову вибірку населення, використовуючи 4000 студентів.

Тепер припустимо, що команда вивчає різні атрибути учасників вибірки і задається питанням, чи є якісь відмінності в середніх балах та спеціальностях студентів. Припустимо, виявиться, що 560 студентів – англійські, 1135 – природничі, 800 – інформатичні, 1090 – інженерні та 415 – математичні. Команда хоче використовувати пропорційну стратифіковану випадкову вибірку, де прошарок вибірки пропорційний випадковій вибірці в сукупності.

Припустимо, команда досліджує  демографічні  показники студентів коледжів у США і знаходить відсоток того, на що студенти навчаються: 12% – англійська, 28% – наукові, 24% – інформаційні, 21% – технічні та 15% спеціальність математика. Таким чином, у процесі стратифікованого випадкового відбору проб створюються п’ять шарів.

Потім команда повинна підтвердити, що прошарок населення пропорційний прошарку у вибірці; однак вони виявляють, що пропорції не рівні. Потім команді потрібно зробити повторну вибірку з 4000 студентів серед населення та випадковим чином відібрати 480 англійської мови, 1120 наукових, 960 інформатичних, 840 технічних та 600 математичних студентів.

З ними вона має пропорційну стратифіковану випадкову вибірку студентів коледжів, що забезпечує кращу представленість студентів спеціальностей коледжів у США. Потім дослідники можуть виділити конкретний прошарок, спостерігати за різними дослідженнями студентів коледжів США та спостерігати за різними середніми балами.

Прості випадкові проти стратифікованих випадкових зразків

Прості випадкові вибірки  та стратифіковані випадкові вибірки є інструментами статистичного вимірювання. Проста випадкова вибірка використовується для представлення всієї сукупності даних. Стратифікована випадкова вибірка ділить сукупність на менші групи або шари на основі спільних характеристик.

Проста випадкова вибірка часто використовується, коли існує дуже мало інформації про сукупність даних, коли сукупність даних має занадто багато відмінностей для розподілу на різні підмножини або коли серед сукупності даних є лише одна чітка характеристика.

Наприклад, цукеркова компанія може захотіти вивчити купівельні звички своїх покупців, щоб визначити майбутнє своєї товарної лінійки. Якщо є 10 000 клієнтів, він може обрати 100 із них як випадкову вибірку. Потім він може застосувати те, що знайде від цих 100 клієнтів, до решти своєї бази. На відміну від стратифікації, він відбиратиме 100 членів суто випадковим чином, не враховуючи їхніх індивідуальних особливостей.

Пропорційна та непропорційна стратифікація

Стратифікована випадкова вибірка забезпечує, щоб кожна підгрупа даної сукупності була адекватно представлена ​​в межах усієї вибіркової сукупності наукового дослідження. Стратифікація може бути пропорційною або непропорційною. При пропорційному стратифікованому методі розмір вибірки кожного прошарку пропорційний розміру популяції прошарку.

Наприклад, якщо дослідник хотів взяти вибірку з 50 000 випускників з використанням вікового діапазону, пропорційна стратифікована випадкова вибірка буде отримана за такою формулою: (розмір вибірки / розмір популяції) x розмір страти. У таблиці нижче передбачається чисельність населення 180 000 випускників МВА на рік.

Розмір вибірки страт для випускників МВА у віковому діапазоні від 24 до 28 років розраховується як (50 000/180 000) x 90 000 = 25 000. Той самий метод застосовується для інших вікових груп. Тепер, коли розмір вибірки шарів відомий, дослідник може виконати просту випадкову вибірку в кожному шарі, щоб відібрати учасників опитування. Іншими словами, 25 000 випускників з вікової групи 24-28 будуть обрані випадковим чином із усього населення, 16 667 випускників вікового віку 29-33 років будуть обрані серед населення випадковим чином тощо.

У непропорційно багатошаровій вибірці розмір кожного шару не пропорційний його розміру в популяції. Дослідник може вирішити взяти вибірку для 1/2 випускників у віковій групі 34-37 та 1/3 випускників у віковій групі 29-33 років.

Важливо зазначити, що одна людина не може вписатися в кілька шарів. Кожна сутність повинна вміщуватися лише в одному прошарку. Наявність накладених підгруп означає, що деякі особи матимуть більші шанси бути обраними для опитування, що повністю заперечує концепцію стратифікованої вибірки як типу імовірнісної вибірки.

Короткий огляд

Менеджери портфелів можуть використовувати стратифіковану випадкову вибірку для створення портфелів шляхом тиражування індексу, такого як індекс облігацій.

Переваги багатошарової випадкової вибірки

Основною перевагою стратифікованої випадкової вибірки є те, що вона враховує ключові характеристики сукупності у вибірці. Подібно до середньозваженого середнього, цей метод відбору проб створює характеристики у вибірці, пропорційні загальній сукупності. Стратифікована випадкова вибірка добре працює для груп з різними ознаками, але в іншому випадку неефективна, якщо підгрупи не вдається сформувати.

Стратифікація дає меншу похибку в оцінці та більшу точність, ніж простий метод випадкової вибірки. Чим більші відмінності між шарами, тим більший приріст точності.

Недоліки багатошарової випадкової вибірки

На жаль, цей метод дослідження не може бути використаний у кожному дослідженні. Недоліком методу є те, що для його правильного використання повинно бути виконано кілька умов. Дослідники повинні ідентифікувати кожного члена популяції, яка вивчається, і класифікувати кожного з них на одну, і лише одну субпопуляцію. Як результат, стратифікована випадкова вибірка є невигідною, коли дослідники не можуть впевнено класифікувати кожного члена популяції в підгрупу. Крім того, знайти вичерпний і остаточний список цілої  сукупності  може бути складним завданням.

Перекриття може бути проблемою, якщо є теми, які потрапляють у кілька підгруп. Коли проводиться проста довільна вибірка, швидше за все буде обрано тих, хто перебуває в декількох підгрупах. Результатом може бути викривлення або неточне відображення населення.

Наведені вище приклади полегшують: студенти, аспіранти, чоловіки та жінки – це чітко визначені групи. Однак в інших ситуаціях це може бути набагато складніше. Уявіть, що вони включають такі характеристики, як раса, етнічна приналежність чи релігія. Процес сортування ускладнюється, що робить стратифіковану випадкову вибірку неефективним і менш ніж ідеальним методом.