Систематична вибірка проти кластерної вибірки: у чому різниця?

29.04.2021

Систематична вибірка проти кластерної вибірки: огляд

Систематична вибірка та кластерна вибірка – це два різні типи статистичних вимірів, що використовуються дослідниками, аналітиками та маркетологами для вивчення зразків сукупності.

Спосіб систематичного та кластерного відбору зразків витягує точки вибірки з сукупності різний. Хоча систематична вибірка використовує фіксовані інтервали між більшою сукупністю для створення вибірки, кластерна вибірка розбиває популяцію на різні кластери.

Систематична вибірка вибирає випадкову вихідну точку з сукупності, а потім відбирають вибірку з регулярних фіксованих інтервалів сукупності залежно від її розміру.Кластерна вибірка ділить сукупність на кластери, а потім бере просту випадкову вибірку з кожного кластера.1 У цій статті ми розглянемо відмінності обох типів відбору проб, їх переваги та недоліки, коли найкраще використовувати одне над іншим, а також приклади кожного.

Ключові винос

Систематична вибірка та кластерна вибірка – це як статистичні показники, що використовуються дослідниками, аналітиками та маркетологами для вивчення зразків сукупності.
Систематична вибірка передбачає вибір фіксованих інтервалів між більшою сукупністю для створення вибірки.
Кластерна вибірка поділяє сукупність на групи, а потім бере випадкову вибірку з кожного кластера.
Як систематична вибірка, так і кластерна вибірка є формами випадкової вибірки, відомою як імовірнісна вибірка, яка відрізняється від неімовірнісної.
Систематична вибірка та кластерна вибірка мають свої переваги та недоліки, але обидві можуть бути економічними за часом та затратами.

Систематична вибірка

Систематична вибірка – це метод вибірки випадкових ймовірностей. Це один з найпопулярніших і найпоширеніших методів, що застосовується дослідниками та аналітиками. Цей метод передбачає відбір зразків із більшої групи. Хоча початкова точка може бути випадковою, вибірка передбачає використання фіксованих інтервалів між кожним членом.

Ось як це працює. Спочатку дослідник вибирає вихідну точку серед більшої сукупності. Зазвичай це у формі цілого числа, яке має бути меншим за кількість предметів у більшій сукупності. Потім аналітик вибирає інтервал між кожним членом; це суттєва різниця між кожним членом. Ось гіпотетичний приклад. Скажімо, в дослідженні проживає 100 людей. Дослідник починає з людини з 10-го місця. Потім вони вирішують обрати кожну сьому людину після цього. Це означає, що під час вибірки обираються люди з таких місць: 10, 17, 24, 31, 38, 45 тощо.

Переваги та недоліки систематичного відбору проб

Цей тип статистичної вибірки досить простий, тому дослідники, як правило, надають перевагу.Це також дуже корисно для певних цілей у фінансах.Ті, хто використовує цей метод, припускають, що результати представляють більшість нормальних популяцій.Цей процес також гарантує рівномірну вибірку для всієї сукупності. Однак із цим видом вибірки можуть бути проблеми. Наприклад, ризик маніпулювання даними може бути більшим, оскільки ті, хто використовує цей метод, можуть вибирати теми та інтервали на основі бажаного результату.

Систематична вибірка проста у проведенні та зрозуміла. Статистики, які можуть мати обмеження в бюджеті чи часі, вважають, що використання систематизованої вибірки є вигідним для створення, порівняння та розуміння їх зразків. Крім того, систематичне відбір проб забезпечує підвищений ступінь контролю у порівнянні з іншими методологіями відбору проб через його процес.

Систематична вибірка також припиняє кластеризований відбір, коли випадково відібрані вибірки в сукупності неприродно розташовуються між собою. Випадкові вибірки, на відміну від систематичних, здатні усунути це явище лише шляхом проведення численних опитувань або збільшення кількості вибірки; обидва з них можуть бути трудомісткими та дорогими. Систематичне відбір проб також має фактор низького ризику, оскільки існує невелика ймовірність того, що дані можуть бути забруднені.

Незважаючи на безліч переваг, систематичне відбір проб має і недоліки. Основним обмеженням систематичної вибірки є необхідність чисельності популяції. Без конкретної кількості учасників популяції систематичне відбір проб не працює добре. Наприклад, якщо статистик хотів би вивчити вік бездомних людей у певному регіоні, але не може точно визначити, скільки є бездомних людей, тоді у них не буде чисельності населення чи вихідної точки.

Іншим недоліком є те, що населення повинно мати природну кількість випадковості. Якщо цього не відбувається, ризик вибору подібних екземплярів збільшується, перешкоджаючи меті вибірки.

Приклад систематичного відбору проб

Метою систематичного відбору зразків є отримання неупередженої вибірки. Метод досягнення цього полягає у присвоєнні числа кожному учаснику сукупності, а потім виборі того самого призначеного інтервалу в сукупності для створення вибірки.

Наприклад, ви можете вибрати кожного 5-го учасника або кожного 20-го учасника, але ви повинні вибрати того самого для кожної сукупності. Процес вибору цього n-го числа полягає у систематичній вибірці.

Наприклад, компанія, що виробляє зубну пасту, створює новий аромат зубної пасти і хотіла б протестувати її на вибірці, перш ніж продавати її населенню. Тест полягає у визначенні того, чи новий аромат добре сприймається зразком. Компанія об’єднує населення в 50 чоловік і вирішує використовувати систематичну вибірку, щоб створити вибірку з 10 людей, думку яких щодо зубної пасти вони будуть враховувати.

По-перше, команда маркетингу призначає номер кожному учаснику сукупності. У цьому випадку у групі населення 50, тому він присвоює кожному учаснику число в діапазоні від одного до 50. Далі він повинен визначити обсяг вибірки, яку він бажає мати, і визначив обсяг вибірки 10. Отже, 50/10 = 5. П’ять буде його цифрою вибірки; це означає, що він відбере кожного п’ятого учасника в сукупності для отримання вибірки. Це зазначено у таблиці нижче, де кожен п’ятий учасник виділений жирним шрифтом та вибраний для вибірки.

Кластерна вибірка

Кластерна вибірка – це інший тип випадкових статистичних показників. Цей метод застосовується, коли в більшій сукупності є різні підмножини груп. Ці групи відомі як кластери. Кластерна вибірка зазвичай використовується маркетинговими групами та професіоналами.

Короткий огляд

При спробі вивчити демографічні показники міста, міста чи району найкраще використовувати кластерну вибірку через велику чисельність населення.

Кластерна вибірка – це двоетапна процедура. По-перше, відбирається вся популяція, яка розділяється на різні кластери. Потім з цих підгруп вибираються випадкові вибірки. Наприклад, досліднику може бути важко побудувати все населення покупців продуктового магазину для співбесіди. Однак вони можуть створити випадкову підмножину магазинів; це являє собою перший крок у процесі. Другий крок – опитування випадкової вибірки покупців цих магазинів.

Види кластерної вибірки

Існує два типи кластерної вибірки: одноступінчаста кластерна та двоступенева кластерна.

Одноетапна вибірка кластерів включає вибір випадкової вибірки кластерів та збір даних від кожного окремого суб’єкта в межах цього кластера. Двоступенева кластерна вибірка передбачає випадковий вибір декількох кластерів та випадковий вибір певних предметів у межах кожного кластеру для формування остаточної вибірки. Двоступеневу вибірку можна розглядати як підмножину одноетапної вибірки: вибірка певних елементів із створених кластерів.

Переваги та недоліки кластерної вибірки

Цей метод вибірки може бути використаний, коли складно скласти список всієї сукупності, як продемонстровано у прикладі вище.Це простий ручний процес, який дозволяє заощадити час і гроші.

Насправді використання кластерної вибірки може бути досить дешевим у порівнянні з іншими методами. Це пояснюється тим, що, як правило, пов’язаних витрат і витрат менше, оскільки вибірка кластерів вимагає випадкового вибору вибраних кластерів, а не оцінки цілих сукупностей. Цей самий процес також дозволяє збільшити обсяг вибірки. Оскільки статистик вибирає лише серед вибраної групи кластерів, вони можуть збільшити кількість суб’єктів для вибірки з цього кластеру.

Основним недоліком кластерної вибірки є те, що з нею пов’язана більша помилка вибірки, що робить її менш точною, ніж інші методи вибірки. Це пов’язано з тим, що суб’єкти всередині кластеру, як правило, мають подібні характеристики, а це означає, що вибірка кластерів не включає різноманітні демографічні показники сукупності. Це часто призводить до надмірної або недостатньої представленості в кластері, і, отже, може бути упередженою вибіркою.

Приклад кластерної вибірки

Наприклад, скажімо, проводиться академічне дослідження, щоб визначити, скільки співробітників інвестиційних банків мають MBA, а серед цих MBA – скільки шкіл Ліги Плюща. Статистику буде важко звернутися до кожного інвестиційного банку та запитати кожного працівника про його освіту. Для досягнення мети статистик може застосувати кластерну вибірку.

Першим кроком було б формування кластеру інвестиційних банків. Замість того, щоб вивчати кожен інвестиційний банк, статистик може вибрати вивчення трійки найбільших інвестиційних банків на основі доходів, формуючи перший кластер. Звідти, замість опитування кожного працівника у всіх трьох інвестиційних банках, статистик міг би сформувати інший кластер, який би включав працівників лише певних підрозділів, наприклад, з продажу та торгівлі або злиття та поглинання.

Цей метод дозволяє статистику звузити обсяг вибірки, роблячи її більш ефективною та економічно вигідною, але все ж маючи достатньо різноманітну вибірку для оцінки шуканої інформації.

Особливі міркування

Хоча як систематична вибірка, так і кластерна вибірка є формами випадкової вибірки, вони отримують обсяг вибірки абсолютно різними способами. Систематична вибірка вибирає вибірку на основі фіксованих інтервалів у популяції, тоді як кластерна вибірка створює кластер із сукупності.

Кластерна вибірка краще підходить, коли в межах певної сукупності є різні підмножини, тоді як систематична вибірка краще застосовується, коли відомий весь перелік чи кількість сукупності. Проте обидва вони ділять сукупність на менші одиниці для вибірки.

Для систематичного відбору проб важливо переконатись, що в групі немає шаблонів, інакше ви ризикуєте вибрати подібні предмети, не представляючи загальної сукупності. Для вибірки кластерів важливо переконатися, що кожен кластер має властивості, подібні до цілої вибірки.

Поширені запитання щодо кластерної вибірки

Що означає кластерна вибірка?

Кластерна вибірка – це форма випадкової вибірки, яка розділяє сукупність на кластери для створення вибірки. Подальші кластери також можна створити з початкових кластерів, щоб звузити вибірку.

Чому б ви використовували кластерну вибірку?

Кластерну вибірку найкраще використовувати для вивчення великої, розподіленої популяції, де прагнення взяти інтерв’ю у кожного суб’єкта було б дорогим, трудомістким і, можливо, неможливим. Кластерна вибірка дозволяє створювати кластери, які представляють меншу кількість представників оцінюваної сукупності, що мають подібні характеристики.

Як працює кластерна вибірка?

Кластерна вибірка просто передбачає розподіл досліджуваної сукупності на менші групи. Ці підгрупи можуть бути вивчені або надалі випадковим чином розділені на інші підгрупи.

Яка різниця між кластерною вибіркою та стратифікованою вибіркою?

Основна різниця між кластерною вибіркою та стратифікованою вибіркою полягає в тому, що кластери, створені в кластерній вибірці, неоднорідні, тоді як групи для стратифікованої вибірки є однорідними.

Суть

Для статистиків, які прагнуть вивчити інформацію в групах, доступні різні методи вибірки. Оскільки групи чи популяції, як правило, великі, дуже важко отримати дані від кожного окремого суб’єкта. Щоб подолати цю проблему, статистики використовують вибірку, створюючи менші групи, які мають бути представниками більшої сукупності.

Важливим аспектом створення цих менших вибірок є забезпечення їх відбору навмання та справжнього представлення більшої сукупності. Систематична вибірка та кластерна вибірка – це два методи, які статистики можуть використовувати для вивчення популяцій.

Обидві форми є випадковою вибіркою, яка може бути економічною за часом та витратами, розділяючи популяції на менші групи для полегшення аналізу. Систематична вибірка працює найкраще, коли відома вся сукупність, тоді як кластерна вибірка працює найкраще, коли всю сукупність важко оцінити.