Ступені свободи
Що таке ступені свободи?
Ступінь свободи відноситься до максимальної кількості логічно незалежних значень, які є значеннями, які можуть вільно змінюватися, у вибірці даних.
Ключові винос
- Ступінь свободи відноситься до максимальної кількості логічно незалежних значень, які є значеннями, які можуть вільно змінюватися, у вибірці даних.
- Ступінь свободи зазвичай обговорюється стосовно різних форм перевірки гіпотез у статистиці, таких як Квадрат Хі.
- Обчислення ступенів свободи є ключовим при спробі зрозуміти важливість статистики Хі-Квадрат та обґрунтованість нульової гіпотези.
Розуміння ступенів свободи
Найпростіший спосіб концептуально зрозуміти Ступінь Свободи на прикладі:
- Розглянемо вибірку даних, що складається для простоти з п’яти цілих додатних чисел. Значеннями може бути будь-яке число без відомих зв’язків між ними. Цей зразок даних теоретично мав би п’ять ступенів свободи.
- Чотири числа у вибірці мають значення {3, 8, 5 та 4}, а середнє значення для всієї вибірки даних виявляється 6.
- Це повинно означати, що п’яте число має бути 10. Це не може бути нічим іншим. Він не має свободи змінюватись.
- Отже, градуси свободи для цієї вибірки даних дорівнюють 4.
Формула для ступенів свободи дорівнює розміру вибірки даних мінус один:
Ступені свободи зазвичай обговорюються стосовно різних форм перевірки гіпотез у статистиці, таких як Квадрат Хі. Дуже важливо розрахувати ступінь свободи, намагаючись зрозуміти важливість статистики Хі-Квадрат та обґрунтованість нульової гіпотези.
Тести на хі-квадрат
Існує два різні типи тестів Chi-Square : тест незалежності, який задає питання взаємозв’язку, наприклад, “Чи існує взаємозв’язок між статтю та балами SAT?”; і тест на придатність, який запитує щось на кшталт “Якщо монету підкинуть 100 разів, чи підніметься вона 50 разів, а хвости 50 разів?”
Для цих тестів використовуються ступені свободи, щоб визначити, чи можна відхилити певну нульову гіпотезу на основі загальної кількості змінних та вибірки в експерименті. Наприклад, при розгляді студентів та виборі курсу обсяг вибірки в 30 або 40 студентів, ймовірно, недостатньо великий для отримання значних даних. Отримання однакових або подібних результатів дослідження з використанням вибірки 400 або 500 студентів є більш справедливим.
Історія ступенів свободи
Найбільш рання і основна концепція ступенів свободи була зафіксована на початку 1800-х років, переплітаючись у працях математика і астронома Карла Фрідріха Гаусса. Сучасне використання та розуміння цього терміну було викладено спочатку англійською статистикою Вільямом Сілі Госсетом у його статті “Можлива помилка підлого”, опублікованій у “Біометріці” в 1908 році під псевдонімом, щоб зберегти свою анонімність.
У своїх працях Госсет спеціально не використовував термін “Ступінь свободи”. Однак він дав пояснення цієї концепції впродовж усієї розробки того, що врешті-решт стане відомим як Т-розподіл Стьюдента. Фактичний термін не став популярним до 1922 року. Англійський біолог і статистик Рональд Фішер почав використовувати термін “Ступінь свободи”, коли почав публікувати звіти та дані про свою роботу з розробки хі-квадратів.