Упередження відбору зразків
Що таке упередження відбору вибірки?
Упередження відбору вибірки – це тип упередженості, спричинений вибором невипадкових даних для статистичного аналізу. Упередження існує через недолік у процесі відбору вибірки, коли підмножина даних систематично виключається через певний атрибут. Виключення підмножини може вплинути на статистичну значимість тесту і може змістити оцінки параметрів статистичної моделі.
Розуміння упередженості відбору зразків
Упередження щодо виживання – це поширений тип упередженості відбору вибірки. Наприклад, при повторному тестуванні інвестиційної стратегії на великій групі акцій може бути зручним пошук цінних паперів, що мають дані за весь вибірковий період. Якщо ми збиралися перевірити стратегію на основі даних про запаси на 15 років, ми могли б схильні шукати запаси, які мають повну інформацію за весь 15-річний період. Однак усунення акцій, які зупинили торгівлю або незабаром залишили ринок, може спричинити упередження у нашій вибірці даних. Оскільки ми включаємо лише акції, що проіснували 15-річний період, наші кінцеві результати були б недосконалими, оскільки вони діяли досить добре, щоб вижити на ринку.
Індекси ефективності хедж-фондів є одним із прикладів упередженого відбору вибірки, що підлягає упередженню щодо виживання. Оскільки хедж-фонди, які не виживають, перестають звітувати про свою діяльність агрегаторам індексів, результуючі індекси природно схиляються до фондів та стратегій, які залишаються, отже, “виживають”. Це може бути проблемою і з популярними послугами звітування взаємних фондів.
Аналітики можуть пристосуватись до врахування цих упереджень, але можуть впровадити нові упередження в процесі.