Нульова гіпотеза

28.04.2021

Що таке нульова гіпотеза?

Нульова гіпотеза – це тип гіпотези, що використовується в статистиці, який передбачає відсутність різниці між певними характеристиками сукупності (або процесом генерування даних).

Наприклад, азартний гравець може бути зацікавлений у тому, чи чесна азартна гра. Якщо це справедливо, то очікуваний прибуток за гру складає 0 для обох гравців. Якщо гра нечесна, то очікуваний прибуток для одного гравця є позитивним, а для іншого – негативним. Щоб перевірити, чи гра є чесною, гравець збирає дані про прибутки з багатьох повторень гри, обчислює середній заробіток за цими даними, а потім перевіряє нульову гіпотезу про те, що очікуваний прибуток не відрізняється від нуля.

Якщо середній заробіток на вибіркових даних достатньо далекий від нуля, тоді гравець відкине нульову гіпотезу і зробить висновок про альтернативну гіпотезу, а саме: очікуваний прибуток за гру відрізняється від нуля. Якщо середній заробіток на вибіркових даних близько нуля, азартний гравець не відкине нульової гіпотези, роблячи натомість висновок, що різниця між середнім значенням даних та 0 пояснюється лише випадково.

Ключові винос

Нульова гіпотеза – це тип гіпотези, що використовується в статистиці, який передбачає відсутність різниці між певними характеристиками сукупності чи процесом генерування даних.
Альтернативна гіпотеза передбачає наявність різниці.
Перевірка гіпотез забезпечує метод відхилення нульової гіпотези в межах певного рівня впевненості. (Однак нульові гіпотези неможливо довести.)

Як працює нульова гіпотеза

Нульова гіпотеза, також відома як здогадка, передбачає, що будь-яка різниця між обраними характеристиками, які ви бачите в наборі даних, обумовлена випадковістю. Наприклад, якщо очікуваний заробіток на азартній грі дійсно дорівнює 0, то будь-яка різниця між середнім заробітком у даних та 0 зумовлена випадковістю.

Статистичні гіпотези перевіряються за допомогою чотирьохетапного процесу. Перший крок полягає в тому, щоб аналітик сформулював дві гіпотези, щоб лише одна могла бути правильною. Наступним кроком є складання плану аналізу, який визначає спосіб оцінки даних. Третім кроком є виконання плану та фізичний аналіз вибіркових даних. Четвертим і останнім етапом є аналіз результатів і або відхилення нульової гіпотези, або твердження, що спостережувані відмінності можна пояснити лише випадково.

Аналітики прагнуть відхилити нульову гіпотезу, оскільки це робить вагомий висновок. Для цього потрібні вагомі докази у вигляді спостережуваної різниці, яка є занадто великою, щоб пояснити її лише випадково. Неможливість відхилити нульову гіпотезу – що результати можна пояснити лише випадково – є слабким висновком, оскільки дозволяє, що інші фактори, крім випадковості, можуть діяти, але можуть бути недостатньо сильними, щоб їх можна було виявити за допомогою використовуваного статистичного тесту.

Важливо

Аналітики прагнуть відкинути нульову гіпотезу, щоб виключити випадковість лише як пояснення цікавих явищ.

Приклади нульової гіпотези

Ось простий приклад. Директор школи стверджує, що учні її школи на іспитах оцінюють в середньому 7 з 10. Нульовою гіпотезою є те, що середнє населення становить 7,0. Щоб перевірити цю нульову гіпотезу, ми реєструємо оцінки приблизно 30 учнів (вибірка) від усієї кількості учнів школи (скажімо 300) і обчислюємо середнє значення цієї вибірки.

Потім ми можемо порівняти (розраховане) середнє значення вибірки із (передбачуваним) середнім показником сукупності 7,0 і спробувати відхилити нульову гіпотезу. (Нульову гіпотезу тут – середнє значення сукупності становить 7,0 – неможливо довести за допомогою вибіркових даних; її можна лише відхилити.)

Візьмемо інший приклад: річна прибутковість певного пайового фонду, як стверджується, становить 8%. Припустимо, що взаємний фонд існує вже 20 років. Нульовою гіпотезою є те, що середній прибуток становить 8% для пайового фонду. Ми беремо випадкову вибірку річних прибутків взаємного фонду, скажімо, за п’ять років (зразок) і обчислюємо середнє значення вибірки. Потім ми порівнюємо (розраховане) середнє значення вибірки із (заявленим) середнім показником сукупності (8%), щоб перевірити нульову гіпотезу.

Для наведених вище прикладів нульовими гіпотезами є:

Приклад А: Студенти в школі на іспитах оцінюють в середньому 7 з 10.
Приклад Б: Середня річна прибутковість пайового фонду становить 8% річних.

Для цілей визначення, чи відхиляти нульову гіпотезу, нульова гіпотеза (скорочено H 0 ), як аргумент, вважається істинною. Тоді ймовірний діапазон можливих значень підрахованої статистики (наприклад, середній бал на 30 тестах студентів) визначається за цією презумпцією (наприклад, діапазон правдоподібних середніх значень може коливатися від 6,2 до 7,8, якщо середнє населення становить 7,0). Тоді, якщо середнє значення вибірки виходить за межі цього діапазону, нульова гіпотеза відхиляється. В іншому випадку кажуть, що різниця «пояснюється лише випадком», перебуваючи в межах, що визначаються лише випадково.

Важливим моментом є той факт, що ми перевіряємо нульову гіпотезу, оскільки існує елемент сумнівів щодо її справедливості. Яка б інформація, яка суперечить заявленій нульовій гіпотезі, фіксується в альтернативній гіпотезі (H 1 ). Для наведених прикладів альтернативною гіпотезою буде:

Учні оцінюють середнє значення, яке не дорівнює 7.
Середня річна прибутковість пайового фонду не дорівнює 8% річних.

Іншими словами, альтернативна гіпотеза є прямим протиріччям нульової гіпотези.

Перевірка гіпотез для інвестицій

Як приклад, пов’язаний з фінансовими ринками, припустимо, що Аліса бачить, що її інвестиційна стратегія приносить вищу середню віддачу, ніж просто купівля та утримання акцій. Нульова гіпотеза стверджує, що між двома середніми показниками прибутковості немає різниці, і Аліса схильна вірити цьому, поки не зможе зробити висновок про суперечливі результати.

Спростування нульової гіпотези зажадало б показу статистичної значущості, яку можна знайти за допомогою різноманітних тестів. Альтернативна гіпотеза стверджує, що інвестиційна стратегія має вищу середню прибутковість, ніж традиційна стратегія купівлі та утримання.

Одним із інструментів, який можна використовувати для визначення статистичної значущості результатів, є р-значення. Значення р представляє ймовірність того, що різниця, така велика чи більша, ніж спостережувана різниця між двома середніми прибутками, може відбутися виключно випадково.

Значення р, яке менше або дорівнює 0,05, часто використовується, щоб вказати, чи є докази проти нульової гіпотези. Якщо Аліса проводить один із цих тестів, наприклад, тест із використанням звичайної моделі, що призводить до значної різниці між її поверненнями та поверненнями придбання та утримування (значення р менше або дорівнює 0,05), вона може тоді відхилити нульову гіпотезу та зробити висновок про альтернативну гіпотезу.