Статистичне значення

Що таке статистичне значення?

Статистична значимість стосується твердження, що результат даних, отриманих в результаті тестування чи експериментування, швидше за все, не відбудеться випадково чи випадково, а навпаки, його можна віднести до певної причини. Наявність статистичної значущості є важливою для навчальних дисциплін або практиків, які значною мірою покладаються на аналіз даних та досліджень, таких як економіка, фінанси, інвестиції, медицина, фізика та біологія.

Статистичне значення можна вважати сильним або слабким. При аналізі набору даних та проведенні необхідних тестів, щоб визначити, чи впливає одна чи кілька змінних на результат, сильна статистична значимість допомагає підтвердити той факт, що результати є реальними, а не зумовленими удачею чи випадковістю. Простіше кажучи, якщо значення р мало, то результат вважається більш надійним.

Проблеми виникають при тестах статистичної значущості, оскільки дослідники, як правило, працюють із зразками більших популяцій, а не самими популяціями. Як результат, вибірки повинні бути репрезентативними для сукупності, тому дані, що містяться у вибірці, не повинні жодним чином бути упередженими. У більшості наук, включаючи економіку, статистична значимість є важливою, якщо претензія може бути висунута на рівні 95% (а іноді і 99%).

Розуміння статистичної значущості

Розрахунок статистичної значущості (тестування значимості) піддається певній мірі помилок. Дослідник повинен заздалегідь визначити ймовірність помилки вибірки, яка існує в будь-якому тесті, який не включає всю сукупність.

Обсяг вибірки є важливою складовою статистичної значущості, оскільки більші вибірки менш схильні до випадків. Тільки випадкові репрезентативні вибірки слід використовувати для тестування значущості. Рівень, на якому можна визнати, чи подія є статистично значущим, відомий як рівень значущості.

Дослідники використовують статистичну статистику, відому як р-значення, для визначення статистичної значущості: якщо р-значення опускається нижче рівня значущості, то результат є статистично значущим. Значення p – це функція середніх значень та стандартних відхилень вибірки даних.

Значення р вказує на ймовірність, за якої відбувся даний статистичний результат, припускаючи, що за результат відповідає лише випадковість. Якщо ця ймовірність мала, то дослідник може сміливо керувати нашим шансом як причина. Значення р повинно падати нижче рівня значущості, щоб результати принаймні вважалися статистично значущими.

Протилежність рівню значущості, розрахованого як 1 мінус рівень значущості, є рівнем довіри. Це вказує на ступінь впевненості у тому, що статистичний результат не відбувся випадково або з помилкою вибірки. Звичайний рівень довіри в багатьох статистичних тестах становить 95 відсотків, що призводить до звичного рівня значущості або р-значення 5 відсотків.

Ключові винос

  • Статистична значимість стосується твердження, що результат, отриманий в результаті тестування чи експериментування, імовірно, може бути віднесений до певної причини.
  • Якщо статистика має високе значення, то вона вважається більш надійною.
  • Розрахунок статистичної значущості має певний ступінь помилки. 
  • Статистичне значення може бути витлумачено неправильно, коли дослідники не обережно використовують мову, повідомляючи про свої результати. 
  • Залежно від досліджень, що проводяться, застосовується кілька типів тестів на значимість

Особливі міркування

Статистична значимість не завжди вказує на практичну значимість, тобто результати не можуть бути застосовані до реальних ділових ситуацій. Крім того, статистичну значимість можна неправильно інтерпретувати, коли дослідники не обережно використовують мову, повідомляючи про свої результати. Оскільки статистично значущий результат не означає, що він не є  випадковим, просто ймовірність його випадкового значно зменшується.

Те, що два ряди даних мають сильну кореляцію між собою, не означає причинності. Наприклад, кількість фільмів, в яких актор Ніколяс Кейдж зіграв у певному році, дуже сильно корелює з кількістю випадкових потопань у басейнах. Але ця кореляція є помилковою, оскільки немає жодного теоретичного причинно-наслідкового твердження, яке можна зробити.

Ще однією проблемою, яка може виникнути зі статистичною значимістю, є те, що минулі дані, і результати цих даних, незалежно від того, чи є вони статистично значущими, можуть не відображати поточні або майбутні умови. При інвестуванні це може проявлятися в моделі ціноутворення, яка руйнується під час фінансової кризи, оскільки кореляції змінюються, а змінні не взаємодіють, як зазвичай. Статистичне значення також може допомогти інвестору зрозуміти, чи одна модель ціноутворення активів краща за іншу.

Види тестів статистичної значущості

Залежно від досліджень, що проводяться, застосовується кілька типів тестів на значимість. Наприклад, тести можуть застосовуватися для однієї, двох або більше вибірки даних різного розміру для середніх значень, дисперсій, пропорцій, парних чи непарних даних або різного розподілу даних.

Нульова гіпотеза

Усі ці фактори мають так звані нульові гіпотези, і важливість часто є метою перевірки гіпотез у статистиці. Найбільш поширеною нульовою гіпотезою є те, що параметр, про який йде мова, дорівнює нулю (зазвичай це вказує на те, що змінна має нульовий вплив на результат, що цікавить). Якщо ви можете відхилити нульову гіпотезу з достовірністю 95 відсотків або краще, дослідники можуть посилатися на статистичну значимість. Нульові гіпотези також можна перевірити на рівність (а не рівну нулю) ефекту для двох або більше альтернативних методів лікування – наприклад, між лікарським засобом та плацебо в клінічному випробуванні.

Відмова від нульової гіпотези, навіть якщо дуже високий ступінь статистичної значущості ніколи не може чогось довести, може лише додати підтвердження існуючій гіпотезі. З іншого боку, неприйняття нульової гіпотези часто є підставою для відхилення гіпотези.

Тест статистичної значущості поділяє більшу частину тієї ж математики, що і обчислення довірчого інтервалу. У звичайних ситуаціях спосіб інтерпретувати статистичну значимість полягає в тому, що відповідний 95-відсотковий довірчий інтервал не містить значення нуль. Навіть якщо змінна виявляється статистично значущою, вона все одно має сенс у реальному світі.

Крім того, ефект може бути статистично значущим, але мати лише дуже незначний вплив. Наприклад, це може бути дуже малоймовірним через випадковість того, що компанії, які використовують двошаровий туалетний папір у своїх ванних кімнатах, мають більш продуктивних працівників, але поліпшення абсолютної продуктивності кожного працівника, ймовірно, буде незначним.