Скільки відсотків населення потрібно у представницькій вибірці?

Технічно репрезентативна вибірка вимагає лише того відсотка статистичної сукупності, який необхідний для якомога точнішого відтворення якості або характеристики, що вивчається або аналізується. Наприклад, серед населення 1000, яке складається з 600 чоловіків та 400 жінок, що використовуються в аналізі тенденцій купівлі за статтю, репрезентативна вибірка може складатися лише з п’яти членів, трьох чоловіків та двох жінок, або 0,5 відсотка населення. Однак, хоча ця вибірка номінально репрезентативна для більшої сукупності, вона, ймовірно, призведе до високого ступеня помилки вибірки при висновках щодо більшої сукупності, оскільки вона настільки мала.

Помилка вибірки є неминучим наслідком використання зразків для аналізу більшої групи. Отримання даних з них – це процес, який за своєю суттю є обмеженим і неповним. Але оскільки це так часто необхідно з огляду на обмежену доступність ресурсів, економічні аналітики використовують методи, які можуть зменшити помилку вибірки до статистично незначного рівня. Хоча репрезентативна вибірка є одним із найефективніших методів, що використовується для зменшення помилок, часто недостатньо зробити це достатньо самостійно.

Однією із стратегій, яка використовується в поєднанні з репрезентативною вибіркою, є переконання, що вибірка є достатньо великою, щоб оптимально зменшити помилку. І хоча, як правило, чим більша підгрупа, тим більше ймовірність зменшення помилки, в певний момент зменшення стає настільки мінімальним, що не виправдовує додаткових витрат, необхідних для збільшення вибірки.

Подібно як використання технічно репрезентативної, але крихітної вибірки недостатньо для зменшення помилки вибірки самостійно, простий вибір великої групи без урахування представництва може призвести до ще більш хибних результатів, ніж використання невеликої репрезентативної вибірки. Повертаючись до наведеного вище прикладу, група з 600 чоловіків є статистично марною самостійно при аналізі гендерних відмінностей у тенденціях купівлі.

Дивно, але частка вибірки має дуже мало спільного з помилкою результатів, коли використовується випадкова вибірка. Основним фактором, що визначає помилку, є абсолютний обсяг вибірки, а не обсяг вибірки щодо обсягу сукупності.