Фактор дисперсії інфляції (VIF)

Що таке фактор дисперсії інфляції (VIF)?

Фактор дисперсії інфляції (VIF) – це міра величини  мультиколінеарності  у наборі множинних   змінних регресії. Математично, VIF для змінної моделі регресії дорівнює відношенню загальної дисперсії моделі   до дисперсії моделі, яка включає лише ту єдину незалежну змінну. Цей коефіцієнт розраховується для кожної незалежної змінної. Високий рівень VIF вказує на те, що пов’язана незалежна змінна є сильно колінеарною з іншими змінними в моделі.

Ключові винос

  • Фактор дисперсійної інфляції (VIF) забезпечує міру мультиколінеарності між незалежними змінними в моделі множинної регресії.
  • Виявлення мультиколінеарності є важливим, оскільки, хоча мультиколінеарність не зменшує пояснювальну силу моделі, вона зменшує статистичну значимість незалежних змінних. 
  • Великий дисперсійний коефіцієнт інфляції (VIF) щодо незалежної змінної вказує на дуже колінеарний зв’язок з іншими змінними, які слід враховувати або коригувати в структурі моделі та відборі незалежних змінних.

Розуміння фактора дисперсії інфляції (VIF)

Фактор дисперсії інфляції – це інструмент, який допомагає визначити ступінь мультиколінеарності. Множинна регресія застосовується, коли людина хоче перевірити вплив багатьох змінних на конкретний результат. Залежна змінна – це результат, на який впливають незалежні змінні – вхідні дані в модель. Мультиколінеарність існує, коли існує лінійна залежність або кореляція між однією або кількома незалежними змінними або вхідними даними.

Мультиколінеарність створює проблему багаторазової регресії, оскільки всі вхідні дані впливають один на одного. Отже, вони насправді не незалежні, і важко перевірити, наскільки комбінація незалежних змінних впливає на залежну змінну, або результат, в рамках регресійної моделі. У статистичному плані модель множинної регресії, де існує висока мультиколінеарність, ускладнить оцінку взаємозв’язку між кожною з незалежних змінних та залежною змінною. Невеликі зміни в даних, що використовуються, або в структурі модельного рівняння можуть спричинити великі та нестабільні зміни в розрахункових коефіцієнтах незалежних змінних.

Щоб переконатися, що модель правильно вказана та працює належним чином, існують тести, які можна запустити на мультиколінеарність. Коефіцієнт дисперсії інфляції є одним із таких вимірювальних інструментів. Використання факторів дисперсії інфляції допомагає визначити серйозність будь-яких питань мультиколінеарності, щоб модель могла бути скоригована. Коефіцієнт інфляції дисперсії вимірює, наскільки на поведінку (дисперсію) незалежної змінної впливає або завищує її взаємодія / кореляція з іншими незалежними змінними. Фактори дисперсії інфляції дозволяють швидко виміряти, наскільки змінна вносить свій внесок у стандартну помилку в регресії. Коли існують значні проблеми мультиколінеарності, коефіцієнт інфляції дисперсії буде дуже великим для відповідних змінних. Після ідентифікації цих змінних можна використовувати кілька підходів для усунення або поєднання колінеарних змінних, вирішуючи проблему мультиколінеарності.

Особливі міркування

Мультиколінеарність

Хоча мультиколінеарність не зменшує загальну прогнозовану силу моделі, вона може давати оцінки коефіцієнтів регресії, які не є статистично значущими. У певному сенсі це можна сприймати як своєрідний подвійний підрахунок у моделі. Коли дві або більше незалежних змінних тісно пов’язані або вимірюють майже одне і те ж, тоді основний ефект, який вони вимірюють, враховується двічі (або більше) для змінних. Стає важко або неможливо сказати, яка змінна насправді впливає на незалежну змінну. Це проблема, оскільки метою багатьох економетричних моделей є перевірка саме такого роду статистичних взаємозв’язків між незалежними змінними та залежними змінними.

Наприклад, припустимо, що економіст хоче перевірити, чи існує статистично значуща залежність між рівнем безробіття (незалежна змінна) та рівнем інфляції (залежна змінна). Включаючи додаткові незалежні змінні, які пов’язані з рівнем безробіття, такі нові початкові заяви про безробіття, швидше за все, можуть внести мультиколінеарність у модель. Загальна модель може демонструвати сильну, статистично достатню пояснювальну силу, але не зможе визначити, чи є ефект в основному наслідком рівня безробіття або нових початкових заяв про безробіття. Це те, що виявив би VIF, і запропонував би, можливо, викинути з моделі одну зі змінних або знайти якийсь спосіб їх консолідації, щоб зафіксувати їх спільний ефект, залежно від того, яка конкретна гіпотеза зацікавлена ​​в тестуванні дослідника.