Розподіл вибірки

Що таке розподіл вибірки?

Розподіл вибірки – це розподіл ймовірностей статистичних даних, отриманих із більшої кількості вибірок, відібраних з конкретної сукупності. Розподіл вибірки для даної сукупності – це розподіл частот ряду різних результатів, які можуть мати місце для статистики сукупності.

У  статистиці сукупність – це весь пул, з якого  береться статистична  вибірка. Населення може стосуватися цілої групи людей, предметів, подій, відвідувань лікарні або вимірювань. Таким чином, можна сказати, що популяція є сукупним спостереженням за предметами, згрупованими за спільною ознакою.

Короткий огляд

  • Розподіл вибірки – це статистика, яка отримується шляхом багаторазового відбору з більшої сукупності.
  • Він описує цілий ряд можливих результатів статистичних показників, таких як середнє значення або режим якоїсь змінної, оскільки вона справді існує сукупністю.
  • Більшість даних, проаналізованих дослідниками, фактично беруться із зразків, а не з популяцій.

Розуміння розподілу вибірки

Багато даних, зібраних і використовуваних академіками, статистиками, дослідниками, маркетологами, аналітиками тощо, насправді є вибірками, а не сукупностями. Вибірка – це підмножина сукупності. Наприклад, медичний дослідник, який хотів порівняти середню вагу всіх немовлят, народжених у Північній Америці з 1995 по 2005 рік, з тими, хто народився в Південній Америці за той самий проміжок часу, не може за розумний проміжок часу отримати дані для всієї популяції понад мільйон пологів, які відбулися за десятирічний термін. Натомість він використовуватиме лише вагу, скажімо, 100 немовлят на кожному континенті, щоб зробити висновок. Вага 200 немовлят, що використовуються, є вибіркою, а середня вага, що розраховується, є середнім значенням вибірки.

Тепер припустимо, що замість того, щоб взяти лише одну пробу із 100 ваг новонароджених з кожного континенту, медичний дослідник бере повторні випадкові вибірки із загальної сукупності та обчислює середнє значення вибірки для кожної групи зразків. Отже, для Північної Америки він збирає дані для 100 ваг новонароджених, зафіксованих у США, Канаді та Мексиці, наступним чином: чотири 100 зразків з окремих лікарень США, п’ять 70 проб з Канади та три 150 записів з Мексики, загалом з 1200 ваг новонароджених дітей, згрупованих у 12 наборів. Він також збирає вибіркові дані про 100 ваг народження з кожної з 12 країн Південної Америки.

Короткий огляд

Кожен зразок має своє власне середнє значення вибірки, і розподіл вибіркового засобу відомий як розподіл вибірки.

Середня вага, обчислена для кожного набору зразків, є розподілом вибірки середнього значення. Не тільки середнє значення можна розрахувати за зразком. Інші статистичні дані, такі як стандартне відхилення, дисперсія, пропорція та діапазон, можуть бути розраховані на основі даних вибірки. Стандартне відхилення та дисперсія вимірюють мінливість розподілу вибірки.

Кількість спостережень у сукупності, кількість спостережень у вибірці та процедура, використовувана для складання наборів вибірки, визначають мінливість розподілу вибірки. Стандартне відхилення розподілу вибірки називається стандартною помилкою. Хоча середнє значення розподілу вибірки дорівнює середньому показнику сукупності, стандартна похибка залежить від стандартного відхилення сукупності, розміру сукупності та розміру вибірки.

Знання того, наскільки розподілені середні значення кожного з наборів вибірки, знаходяться між собою та середнім значенням сукупності, дасть ознаку того, наскільки середнє значення вибірки наближається до середнього значення сукупності. Стандартна помилка розподілу вибірки зменшується із збільшенням обсягу вибірки.

Особливі міркування

Сукупність чи один вибірковий набір чисел матиме нормальний розподіл. Однак, оскільки розподіл вибірки включає декілька наборів спостережень, він не обов’язково матиме вигнуту форму дзвоника.

За нашим прикладом середня вага населення немовлят у Північній Америці та в Південній Америці має нормальний розподіл, оскільки деякі діти будуть мати нижчу вагу (нижче середньої) або надлишкову вагу (вище середньої), причому більшість немовлят будуть в середньому (приблизно середньої ). Якщо середня вага новонароджених у Північній Америці становить сім фунтів, середня вага вибірки в кожному з 12 наборів вибіркових спостережень, зареєстрованих для Північної Америки, також буде близько семи фунтів.

Однак, якщо побудувати графік кожного із середніх показників, розрахованих у кожній з 1200 груп зразків, отримана фігура може призвести до рівномірного розподілу, але важко з певністю передбачити, якою виявиться фактична форма. Чим більше зразків використовує дослідник із популяції понад мільйон вагових цифр, тим більше графік почне формувати нормальний розподіл.