Помилка вибірки

Що таке помилка вибірки?

Помилка вибірки – це статистична помилка, яка виникає, коли аналітик не відбирає вибірку, яка представляє всю сукупність даних, а результати, знайдені у вибірці, не представляють результатів, які можна було б отримати від усієї сукупності. Вибірка – це аналіз, проведений шляхом відбору кількості спостережень із більшої сукупності, і вибір може спричинити як помилки вибірки, так і помилки, що не стосуються вибірки.

Ключові винос

  • Помилка вибірки – це статистична помилка, яка виникає, коли аналітик не відбирає вибірку, яка представляє всю сукупність даних.
  • Результати, знайдені у вибірці, таким чином не представляють результатів, які можна було б отримати від усієї сукупності.
  • Похибка вибірки може бути зменшена шляхом рандомізації відбору вибірки та / або збільшення кількості спостережень.

Розуміння помилок вибірки

Помилка вибірки – це відхилення значення вибірки від справжнього значення сукупності через те, що вибірка не репрезентативна для сукупності або певним чином упереджена. Навіть рандомізовані вибірки матимуть певну помилку вибірки, оскільки це лише наближення сукупності, з якої вона взята.

Помилки вибірки можна усунути, якщо збільшити обсяг вибірки, а також забезпечивши, щоб вибірка адекватно представляла всю сукупність. Припустимо, наприклад, що компанія XYZ надає послугу на основі передплати, яка дозволяє споживачам платити щомісячну плату за трансляцію відео та інших програм через Інтернет.

Фірма хоче провести опитування власників будинків, які щотижня дивляться щонайменше 10 годин програмування через Інтернет і платять за існуючу послугу потокового відео. XYZ хоче визначити, який відсоток населення зацікавлений у послузі підписки за нижчими цінами. Якщо XYZ не ретельно продумує процес вибірки, може виникнути кілька типів помилок вибірки.

Приклади помилок вибірки

Помилка специфікації сукупності означає, що XYZ не розуміє конкретних типів споживачів, яких слід включити до вибірки. Наприклад, якщо XYZ створює популяцію людей у ​​віці від 15 до 25 років, багато з цих споживачів не приймають рішення про придбання послуги потокового відео, оскільки вони не працюють повний робочий день. З іншого боку, якщо XYZ зібрав вибірку працюючих дорослих, які приймають рішення про покупку, споживачі цієї групи можуть не дивитись 10 годин відеопрограмування на тиждень.

Помилка відбору також спричиняє спотворення результатів вибірки, і загальним прикладом є опитування, яке покладається лише на невелику частину людей, які негайно реагують. Якщо XYZ докладе зусиль для спостереження за споживачами, які спочатку не реагують, результати опитування можуть змінитися. Крім того, якщо XYZ виключає споживачів, які не реагують відразу, результати вибірки можуть не відображати переваги всієї сукупності.

Розрахунок факторів на помилки без вибірки

XYZ також хоче уникнути помилок без вибірки, які спричинені людською помилкою, наприклад, помилкою, допущеною в процесі опитування. Якщо одна група споживачів переглядає лише п’ять годин відеопрограмування на тиждень і включається в опитування, це рішення є помилкою без вибірки. Задавання упереджених питань – це ще один тип помилок.