Множинна лінійна регресія (MLR)

Що таке множинна лінійна регресія (MLR)?

Множинна лінійна регресія (MLR), також відома просто як множинна регресія, є статистичним методом, який використовує кілька пояснювальних змінних для прогнозування результату змінної відповіді. Метою множинної лінійної регресії (MLR) є моделювання лінійного співвідношення між пояснювальними (незалежними) змінними та змінною реакції (залежною).

По суті, множинна регресія – це розширення звичайної регресії найменших квадратів (OLS), оскільки вона включає більше однієї пояснювальної змінної.

Ключові винос

  • Множинна лінійна регресія (MLR), також відома просто як множинна регресія, є статистичним методом, який використовує кілька пояснювальних змінних для прогнозування результату змінної відповіді.
  • Множинна регресія – це продовження лінійної (OLS) регресії, що використовує лише одну пояснювальну змінну.
  • MLR широко використовується в економетриці та фінансових висновках.

Формула та обчислення множинної лінійної регресії

Що може сказати вам множинна лінійна регресія

Проста лінійна регресія – це функція, яка дозволяє аналітику або статистику робити прогнози щодо однієї змінної на основі відомостей про іншу змінну. Лінійну регресію можна використовувати лише тоді, коли одна має дві безперервні змінні – незалежну змінну та залежну змінну. Незалежна змінна – це параметр, який використовується для обчислення залежної змінної або результату. Модель множинної регресії поширюється на кілька пояснювальних змінних.

Модель множинної регресії базується на таких припущеннях:

  • Між залежними змінними та незалежними змінними існує лінійна залежність
  • Незалежні змінні не надто корелюють між собою
  • y i спостереження відбираються незалежно та випадково серед сукупності
  • Залишки слід розподіляти, як правило, із середнім значенням 0 та дисперсією σ

Коефіцієнт детермінації (R-квадрат) являє собою статистичний показник, який використовується для вимірювання, скільки варіації в результатах можна пояснити зміною незалежних змінних. R 2 завжди збільшується, оскільки до моделі MLR додається більше предикторів, навіть незважаючи на те, що предиктори можуть не мати відношення до змінної результату.

Таким чином, R2 сам по собі не може бути використаний для ідентифікації, які предиктори слід включати в модель, а які слід виключити. R2 може бути лише від 0 до 1, де 0 вказує на те, що результат не може бути передбачений жодною з незалежних змінних, а 1 вказує на те, що результат можна передбачити без помилок з незалежних змінних.

При інтерпретації результатів множинної регресії бета-коефіцієнти є дійсними, утримуючи всі інші змінні постійними (“всі інші рівні”).Результат багаторазової регресії може відображатися горизонтально як рівняння або вертикально у вигляді таблиці.

Приклад використання множинної лінійної регресії

Як приклад, аналітик може знати, як рух ринку впливає на ціну ExxonMobil (XOM). У цьому випадку їх лінійне рівняння матиме значення індексу S&P 500 як незалежну змінну або провісник, а ціна XOM як залежну змінну.

Насправді існує безліч факторів, які передбачають результат події. Наприклад, рух цін ExxonMobil залежить не лише від ефективності загального ринку. Інші прогнози, такі як ціна на нафту, процентні ставки та рух цін на ф’ючерси на нафту, можуть вплинути на ціну XOM та ціни на акції інших нафтових компаній. Щоб зрозуміти взаємозв’язок, в якому присутня більше двох змінних, використовується множинна лінійна регресія.

Множинна лінійна регресія (MLR) використовується для визначення математичного співвідношення між низкою випадкових величин.Іншими словами, MLR досліджує, як кілька незалежних змінних пов’язані з однією залежною змінною.Після того, як кожен із незалежних факторів був визначений для прогнозування залежної змінної, інформація про множинні змінні може бути використана для створення точного прогнозування рівня впливу, який вони мають на змінну результату.Модель створює взаємозв’язок у вигляді прямої лінії (лінійної), яка найкраще апроксимує всі окремі точки даних.

Посилаючись на рівняння MLR вище, у нашому прикладі:

  • y i = залежна змінна – ціна XOM
  • x i1 = процентні ставки
  • x i2 = ціна нафти
  • x i3 = значення індексу S&P 500
  • x i4 = ціна ф’ючерсів на нафту
  • B 0 = y-перехоплення в нульовий момент часу
  • B 1 = коефіцієнт регресії, що вимірює одиничну зміну залежної змінної при зміні x i1 – зміна ціни XOM при зміні процентних ставок
  • B 2 = значення коефіцієнта, що вимірює одиничну зміну залежної змінної при зміні x i2 – зміна ціни XOM при зміні цін на нафту

Оцінки найменших квадратів, B 0, B 1, B 2 … B p, зазвичай обчислюються статистичним програмним забезпеченням. У регресійну модель можна включити стільки змінних, в яких кожна незалежна змінна диференціюється числом – 1,2, 3, 4… с. Модель множинної регресії дозволяє аналітику прогнозувати результат на основі інформації, що надається за кількома пояснювальними змінними.

Проте модель не завжди є абсолютно точною, оскільки кожна точка даних може дещо відрізнятися від результату, передбаченого моделлю. Залишкова вартість Е, яка є різницею між фактичним результатом та прогнозованим результатом, включається в модель для врахування таких незначних коливань.

Припускаючи, що ми запускаємо нашу модель регресії цін XOM через програмне забезпечення для обчислення статистики, яке повертає такий результат:

Аналітик може інтерпретувати цей результат як такий, що якщо інші змінні будуть постійними, ціна XOM зросте на 7,8%, якщо ціна нафти на ринках зросте на 1%. Модель також показує, що ціна XOM знизиться на 1,5% після підвищення процентних ставок на 1%. R 2 вказує на те, що 86,5% змін у ціні акцій Exxon Mobil можна пояснити зміною процентної ставки, ціни на нафту, ф’ючерсів на нафту та індексу S&P 500.

Різниця між лінійною та множинною регресіями

Регресія звичайних лінійних квадратів (OLS) порівнює реакцію залежної змінної з урахуванням зміни деяких пояснювальних змінних. Однак рідко коли залежну змінну пояснюють лише однією змінною. У цьому випадку аналітик використовує багаторазову регресію, яка намагається пояснити залежну змінну, використовуючи більше однієї незалежної змінної. Множинні регресії можуть бути лінійними та нелінійними.

Множинні регресії базуються на припущенні, що існує лінійна залежність між залежними та незалежними змінними. Він також не передбачає значної кореляції між незалежними змінними.

Питання що часто задаються

Що робить багаторазову регресію “множинною”?

Множинна регресія враховує вплив кількох пояснювальних змінних на якийсь результат, що цікавить. Він оцінює відносний ефект цих пояснювальних або незалежних змінних на залежну змінну при утриманні всіх інших змінних у моделі постійною.

Чому слід використовувати множину регресію над простою регресією OLS?

Рідко яка залежна змінна пояснюється лише однією змінною. У таких випадках аналітик використовує багаторазову регресію, яка намагається пояснити залежну змінну, використовуючи більше однієї незалежної змінної. Однак модель передбачає, що між незалежними змінними не існує суттєвих кореляцій.

Чи можу я зробити багаторазову регресію вручну?

Можливо, ні. Моделі множинної регресії складні і стають тим більше, коли в модель входить більше змінних або коли обсяг даних для аналізу зростає. Для запуску багаторазової регресії вам, швидше за все, доведеться використовувати спеціалізоване статистичне програмне забезпечення або функції в бізнес-програмах, таких як Excel.

Що означає багаторазова регресія бути «лінійною»?

При багаторазовій лінійній регресії модель обчислює лінію, яка найкраще підходить, що мінімізує дисперсії кожної з включених змінних, оскільки вона стосується залежної змінної. Оскільки вона відповідає лінії, це лінійна модель. Існують також моделі нелінійної регресії, що включають безліч змінних, такі як логістична регресія, квадратична регресія та пробіт-моделі.

Як застосовуються моделі множинної регресії у фінансах?

Будь-яка економетрична модель, яка розглядає більше однієї змінної, може бути множинною регресією. Наприклад, факторні моделі порівнюють два або більше факторів для аналізу взаємозв’язку між змінними та результатом роботи. Модель Fama та French Three-Factor Mod – це така модель, яка розширює модель ціноутворення на капітал (CAPM), додаючи фактори ризику розміру та вартості до фактору ринкового ризику в CAPM (який сам є моделлю регресії). Включаючи ці два додаткові фактори, модель пристосовується до цієї випереджаючої тенденції, що, як вважають, робить її кращим інструментом для оцінки діяльності менеджера.