Р-значення

28.04.2021

Що таке Р-значення?

У статистиці р-значення – це ймовірність отримання результатів, принаймні настільки ж екстремальних, як спостережувані результати тесту статистичної гіпотези, припускаючи, що нульова гіпотеза є правильною. Значення p використовується як альтернатива пунктам відхилення для забезпечення найменшого рівня значущості, при якому нульова гіпотеза буде відхилена. Менше значення р означає, що є вагоміші докази на користь альтернативної гіпотези.

Ключові винос

Значення р – це міра ймовірності того, що спостережувана різниця могла статися лише випадково.
Чим нижче значення р, тим більша статистична значимість спостережуваної різниці.
Значення P можна використовувати як альтернативу або на додаток до попередньо вибраних рівнів довіри для перевірки гіпотез.

Як обчислюється значення P?

Значення P зазвичай знаходять за допомогою таблиць p-значень або електронних таблиць / статистичного програмного забезпечення. Ці розрахунки базуються на передбачуваному або відомому розподілі ймовірностей конкретної статистики, що перевіряється. Значення P обчислюються на основі відхилення між спостережуваною величиною та вибраним контрольним значенням, враховуючи розподіл ймовірності статистики, з більшою різницею між двома значеннями, що відповідають нижчому значенню p.

Математично значення p обчислюється за допомогою інтегрального обчислення площі під кривою розподілу ймовірностей для всіх значень статистичних даних, які знаходяться щонайменше на відстані від еталонного значення, ніж спостережуване значення, відносно загальної площі під кривою розподілу ймовірностей. У двох словах, чим більша різниця між двома спостережуваними значеннями, тим менша ймовірність того, що різниця обумовлена простим випадковим випадком, і це відображається меншим значенням р.

P-значення підходу до перевірки гіпотез

Підхід p-значення до перевірки гіпотез використовує обчислену ймовірність, щоб визначити, чи є докази відхилення нульової гіпотези. Нульова гіпотеза, також відома як здогадка, є початковим твердженням про сукупність (або процес формування даних). Альтернативна гіпотеза стверджує, чи відрізняється параметр популяції від значення параметра популяції, викладеного в гіпотезі.

На практиці рівень значущості зазначається заздалегідь, щоб визначити, наскільки мало значення p, щоб відхилити нульову гіпотезу. Оскільки різні дослідники використовують різні рівні значущості при дослідженні питання, читачеві іноді можуть бути важко порівнювати результати двох різних тестів. Значення P забезпечують вирішення цієї проблеми.

Наприклад, припустимо, що дослідження, що порівнює прибутки від двох конкретних активів, проводили різні дослідники, які використовували однакові дані, але різні рівні значущості. Дослідники можуть дійти протилежних висновків щодо того, чи відрізняються активи. Якщо один дослідник використовував рівень довіри 90%, а інший вимагав рівня довіри 95%, щоб відкинути нульову гіпотезу, і р-значення спостеріганої різниці між двома поверненнями становило 0,08 (що відповідає рівню довіри 92%), тоді перший дослідник виявив би, що два активи мають статистично значущу різницю, тоді як другий не виявив статистично значущої різниці між прибутковістю.

Щоб уникнути цієї проблеми, дослідники можуть повідомити про р-значення тесту гіпотези та дозволити читачеві самостійно інтерпретувати статистичну значимість . Це називається підходом р-значення до перевірки гіпотез. Незалежний спостерігач міг би відзначити значення р і самостійно вирішити, чи представляє це статистично значущу різницю чи ні.

Реальний приклад значення P

Припустимо, що інвестор стверджує, що ефективність їх інвестиційного портфеля еквівалентна діяльності індексу Standard & Poor’s (S&P) 500. Щоб визначити це, інвестор проводить двосторонній тест. Нульова гіпотеза стверджує, що прибутковість портфеля еквівалентна прибутковості S&P 500 протягом певного періоду, тоді як альтернативна гіпотеза стверджує, що дохідність портфеля та S&P 500 не є рівноцінними. (Якби інвестор провів однобічний тест, альтернативна гіпотеза стверджувала б, що дохідність портфеля або менша, або більша, ніж дохідність S&P 500).

Тест гіпотези значення P не обов’язково використовує заздалегідь вибраний рівень довіри, при якому інвестор повинен скинути нульову гіпотезу про рівноцінність прибутковості. Натомість він надає показник кількості свідчень для відхилення нульової гіпотези. Чим менше значення р, тим більше доказів проти нульової гіпотези. Таким чином, якщо інвестор виявить, що значення р дорівнює 0,001, є вагомі докази проти нульової гіпотези, і інвестор може впевнено зробити висновок про прибутковість портфеля, а прибутковість S&P 500 не є рівноцінною.

Хоча це не забезпечує точного порогового значення щодо того, коли інвестор повинен прийняти або відхилити нульову гіпотезу, він має ще одну дуже практичну перевагу. Тестування гіпотези значення P пропонує прямий спосіб порівняння відносної впевненості, яку може мати інвестор при виборі з-поміж різних типів інвестицій або портфелів, порівняно з еталоном, таким як S&P 500.

Наприклад, для двох портфелів, A та B, ефективність яких відрізняється від S&P 500 зі значеннями p 0,10 та 0,01 відповідно, інвестор може бути набагато впевненішим, що портфель B з нижчим значенням p фактично буде демонструвати стабільно результати.