Аналіз дисперсії (ANOVA)
Що таке аналіз дисперсії (ANOVA)?
Дисперсійний аналіз (ANOVA) – це інструмент аналізу, що використовується в статистиці, який розділяє спостережувану сукупну мінливість, виявлену всередині набору даних, на дві частини: систематичні фактори та випадкові фактори. Систематичні фактори мають статистичний вплив на даний набір даних, тоді як випадкові фактори – ні. Аналітики використовують тест ANOVA, щоб визначити вплив незалежних змінних на залежну змінну в регресійному дослідженні.
Методи t- та z-тестів, розроблені в 20 столітті, використовувались для статистичного аналізу до 1918 р., Коли Рональд Фішер створив метод дисперсійного аналізу.1 ANOVA також називають дисперсійним аналізом Фішера, і це продовження t- та z-тестів.Цей термін став відомим у 1925 р. Після появи у книзі Фішера “Статистичні методи для дослідників”. Її застосовували в експериментальній психології, а згодом розширили до предметів, які були більш складними.
Формула для ANOVA така:
Що виявляє аналіз дисперсії?
Тест ANOVA – це початковий етап аналізу факторів, що впливають на даний набір даних. Після закінчення тесту аналітик проводить додаткове тестування на методичні фактори, які помітно сприяють невідповідності набору даних. Аналітик використовує результати тесту ANOVA у f-тесті для формування додаткових даних, які узгоджуються із запропонованими моделями регресії.
Тест ANOVA дозволяє порівняти більше двох груп одночасно, щоб визначити, чи існує між ними зв’язок. Результат формули ANOVA, статистика F (також звана коефіцієнтом F), дозволяє проводити аналіз декількох груп даних, щоб визначити мінливість між зразками та всередині зразків.
Якщо реальної різниці між тестованими групами не існує, що називається нульовою гіпотезою, результат статистики F-коефіцієнта ANOVA буде близький до 1. Розподіл усіх можливих значень статистики F є F-розподілом. Це насправді група функцій розподілу з двома характерними числами, які називаються чисельником ступенів свободи та знаменником ступенів свободи.
Ключові винос
- Дисперсійний аналіз, або ANOVA, є статистичним методом, який розділяє дані спостереженої дисперсії на різні компоненти для використання для додаткових тестів.
- Односторонній ANOVA використовується для трьох або більше груп даних для отримання інформації про взаємозв’язок між залежними та незалежними змінними.
- Якщо між групами не існує справжньої дисперсії, коефіцієнт F ANOVA повинен дорівнювати близько 1.
Приклад використання ANOVA
Наприклад, дослідник може перевірити студентів з декількох коледжів, щоб перевірити, чи студенти одного з коледжів постійно перевершують студентів інших коледжів. У бізнес-додатку дослідник досліджень та розробок може протестувати два різні процеси створення продукту, щоб переконатись, чи один процес кращий за інший з точки зору економічної ефективності.
Тип використовуваного тесту ANOVA залежить від ряду факторів. Він застосовується, коли дані мають бути експериментальними. Аналіз дисперсії застосовується, якщо немає доступу до статистичного програмного забезпечення, що призводить до обчислення ANOVA вручну. Він простий у використанні та найкраще підходить для невеликих зразків. У багатьох експериментальних конструкціях розміри зразків повинні бути однаковими для різних комбінацій рівня фактора.
ANOVA корисний для тестування трьох або більше змінних. Це схоже на багаторазові двовибіркові t-тести. Однак це призводить до меншої кількості помилок типу I і підходить для цілого ряду проблем. ANOVA групує відмінності шляхом порівняння засобів кожної групи та включає розподіл дисперсії у різні джерела. Він використовується з випробовуваними, тестовими групами, між групами та всередині груп.
Одностороння ANOVA проти двосторонньої ANOVA
Існує два основних типи ANOVA: односторонній (або односпрямований) і двосторонній. Існують також варіації ANOVA. Наприклад, MANOVA (багатовимірна ANOVA) відрізняється від ANOVA тим, що перша перевіряє одночасно декілька залежних змінних, тоді як друга оцінює лише одну залежну змінну за раз. Односторонній або двосторонній відноситься до кількості незалежних змінних у вашому аналізі дисперсійного тесту. Одностороння ANOVA оцінює вплив єдиного фактора на єдину змінну відповіді. Він визначає, чи всі зразки однакові. Одностороння ANOVA використовується для визначення того, чи є статистично значущі відмінності між засобами трьох або більше незалежних (не пов’язаних) груп.
Двостороння ANOVA є продовженням односторонньої ANOVA. В односторонньому режимі у вас є одна незалежна змінна, що впливає на залежну змінну. У двосторонньому ANOVA є два незалежних. Наприклад, двостороння ANOVA дозволяє компанії порівнювати продуктивність праці на основі двох незалежних змінних, таких як заробітна плата та набір навичок. Він використовується для спостереження взаємодії між двома факторами та тестування дії двох факторів одночасно.