Ступені свободи

Що таке ступені свободи?

Ступінь свободи відноситься до максимальної кількості логічно незалежних значень, які є значеннями, які можуть вільно змінюватися, у вибірці даних.

Ключові винос

  • Ступінь свободи відноситься до максимальної кількості логічно незалежних значень, які є значеннями, які можуть вільно змінюватися, у вибірці даних.
  • Ступінь свободи зазвичай обговорюється стосовно різних форм перевірки гіпотез у статистиці, таких як Квадрат Хі.
  • Обчислення ступенів свободи є ключовим при спробі зрозуміти важливість статистики Хі-Квадрат та обґрунтованість нульової гіпотези.

Розуміння ступенів свободи

Найпростіший спосіб концептуально зрозуміти Ступінь Свободи на прикладі:

  • Розглянемо вибірку даних, що складається для простоти з п’яти цілих додатних чисел. Значеннями може бути будь-яке число без відомих зв’язків між ними. Цей зразок даних теоретично мав би п’ять ступенів свободи.
  • Чотири числа у вибірці мають значення {3, 8, 5 та 4}, а середнє значення для всієї вибірки даних виявляється 6.
  • Це повинно означати, що п’яте число має бути 10. Це не може бути нічим іншим. Він не має свободи змінюватись.
  • Отже, градуси свободи для цієї вибірки даних дорівнюють 4.

Формула для ступенів свободи дорівнює розміру вибірки даних мінус один:

Ступені свободи зазвичай обговорюються стосовно різних форм перевірки гіпотез у статистиці, таких як Квадрат Хі. Дуже важливо розрахувати ступінь свободи, намагаючись зрозуміти важливість статистики Хі-Квадрат та обґрунтованість нульової гіпотези.

Тести на хі-квадрат

Існує два різні типи тестів Chi-Square : тест незалежності, який задає питання взаємозв’язку, наприклад, “Чи існує взаємозв’язок між статтю та балами SAT?”; і тест на придатність, який запитує щось на кшталт “Якщо монету підкинуть 100 разів, чи підніметься вона 50 разів, а хвости 50 разів?”

Для цих тестів використовуються ступені свободи, щоб визначити, чи можна відхилити певну нульову гіпотезу на основі загальної кількості змінних та вибірки в експерименті. Наприклад, при розгляді студентів та виборі курсу обсяг вибірки в 30 або 40 студентів, ймовірно, недостатньо великий для отримання значних даних. Отримання однакових або подібних результатів дослідження з використанням вибірки 400 або 500 студентів є більш справедливим.

Історія ступенів свободи

Найбільш рання і основна концепція ступенів свободи була зафіксована на початку 1800-х років, переплітаючись у працях математика і астронома Карла Фрідріха Гаусса. Сучасне використання та розуміння цього терміну було викладено спочатку англійською статистикою Вільямом Сілі Госсетом у його статті “Можлива помилка підлого”, опублікованій у “Біометріці” в 1908 році під псевдонімом, щоб зберегти свою анонімність.

У своїх працях Госсет спеціально не використовував термін “Ступінь свободи”. Однак він дав пояснення цієї концепції впродовж усієї розробки того, що врешті-решт стане відомим як Т-розподіл Стьюдента. Фактичний термін не став популярним до 1922 року. Англійський біолог і статистик Рональд Фішер почав використовувати термін “Ступінь свободи”, коли почав публікувати звіти та дані про свою роботу з розробки хі-квадратів.