Залишкова сума квадратів (RSS)

Що таке залишкова сума квадратів (RSS)?

Залишкова сума квадратів (RSS) – це статистичний прийом, що використовується для вимірювання величини дисперсії в наборі даних, що не пояснюється самою моделлю регресії. Натомість він оцінює дисперсію залишків або термін помилки.

Лінійна регресія – це вимірювання, яке допомагає визначити міцність взаємозв’язку між залежною змінною та одним або кількома іншими факторами, відомими як незалежні або пояснювальні змінні.

Ключові винос

  • Залишкова сума квадратів (RSS) вимірює рівень дисперсії в терміні похибки або залишках регресійної моделі.
  • В ідеалі сума квадратних залишків має бути меншим або меншим значенням, ніж сума квадратів з входів регресійної моделі.
  • RSS використовується фінансовими аналітиками для оцінки обґрунтованості їх економетричних моделей.

Формула для RSS є

ESS =

n
i = 1 (
y i
f (
x i ))
2

де:

  • y i = i- е значення змінної, яку слід передбачити
  • f (x i ) = передбачуване значення y i
  • n = верхня межа підсумовування
  • y i = i- е значення змінної, яку слід передбачити
  • f (x i ) = передбачуване значення y i
  • n = верхня межа підсумовування

Розуміння залишкової суми квадратів (RSS)

Загалом сума квадратів є статистичним методом, що використовується при регресійному аналізі для визначення розпорошення точок даних. При  регресійному аналізі мета полягає у визначенні того, наскільки ряд даних може бути пристосований до функції, яка може допомогти пояснити, як був сформований ряд даних. Сума квадратів використовується як математичний спосіб знайти функцію, яка найкраще відповідає  (найменшою мірою  ) серед даних.

RSS вимірює кількість помилок, що залишаються між функцією регресії та набором даних після запуску моделі. Менша залишкова сума квадратів представляє функцію регресії.

RSS – також відомий як сума квадратних залишків – по суті визначає, наскільки добре модель регресії пояснює або представляє дані в моделі.

RSS проти RSE

Залишкова стандартна помилка * RSE) – це ще один статистичний термін, що використовується для опису різниці у  стандартних відхиленнях  спостережуваних значень від передбачуваних значень, як показано точками в  придатності, який можна використовувати для аналізу того, наскільки набір точок даних відповідає фактичній моделі.

RSE обчислюється шляхом ділення RSS на кількість спостережень у вибірці менше 2, а потім береться квадратний корінь: RSE = [RSS / (n-2)] 1/2

RSS, фінанси та економетрика

Фінансові ринки дедалі більше стають кількісно керованими; як такий, у пошуках межі багато інвесторів використовують передові статистичні методи для допомоги у прийнятті рішень. Великі дані, машинне навчання та програми штучного інтелекту додатково вимагають використання статистичних властивостей для керівництва сучасними інвестиційними стратегіями. Залишкова сума квадратів – або статистика RSS – одна з багатьох статистичних властивостей, що переживають ренесанс.

Статистичні моделі використовуються інвесторами та менеджерами портфелів для відстеження ціни інвестиції та використання цих даних для прогнозування майбутніх рухів. Дослідження, яке називається регресійним аналізом, може включати аналіз взаємозв’язку руху цін між товаром та запасами компаній, що займаються виробництвом товару.

Будь-яка модель може мати відхилення між передбачуваними значеннями та фактичними результатами. Хоча дисперсії можна пояснити регресійним аналізом, залишкова сума квадратів представляє дисперсії або помилки, які не пояснюються.

Оскільки функція регресії може бути достатньо складною, щоб тісно відповідати практично будь-якому набору даних, необхідне подальше дослідження, щоб визначити, чи є функція регресії насправді корисною для пояснення дисперсії набору даних. Однак, як правило, менша або нижча величина залишкової суми квадратів є ідеальною для будь-якої моделі, оскільки це означає, що в наборі даних менша різниця. Іншими словами, чим менша сума квадратних залишків, тим краща модель регресії при поясненні даних.