Залишкове стандартне відхилення

Що таке залишкове стандартне відхилення?

Залишкове стандартне відхилення – це статистичний термін, що використовується для опису різниці у стандартних відхиленнях спостережуваних значень від передбачуваних значень, як показано точками в регресійному аналізі.

Регресійний аналіз – метод, який використовується в статистиці, щоб показати взаємозв’язок між двома різними змінними та описати, наскільки добре ви можете передбачити поведінку однієї змінної з поведінки іншої.

Залишкове стандартне відхилення також називають стандартним відхиленням точок навколо встановленої лінії або стандартною похибкою оцінки.

Ключові винос

  • Залишкове стандартне відхилення – це стандартне відхилення залишкових значень або різниця між набором спостережуваних та передбачуваних значень.
  • Стандартне відхилення залишків обчислює, наскільки точки даних розповсюджуються навколо лінії регресії.
  • Результат використовується для вимірювання похибки передбачуваності лінії регресії.
  • Чим менше залишкове стандартне відхилення порівняно із стандартним відхиленням вибірки, тим більш прогнозованою або корисною є модель.

Розуміння залишкових стандартних відхилень

Залишкове середньоквадратичне відхилення – це показник придатності, який можна використовувати для аналізу того, наскільки набір точок даних відповідає фактичній моделі. Наприклад, в умовах бізнесу, після проведення регресійного аналізу кількох точок даних про витрати з часом, залишкове стандартне відхилення може надати власнику бізнесу інформацію про різницю між фактичними витратами та прогнозованими витратами, а також уявлення про те, скільки прогнозованих Витрати можуть відрізнятися від середнього значення даних про історичні витрати.

Формула залишкового стандартного відхилення

Як розрахувати залишкове стандартне відхилення

Для обчислення залишкового стандартного відхилення спочатку потрібно обчислити різницю між передбаченими значеннями та фактичними значеннями, сформованими навколо встановленої лінії. Ця різниця відома як залишкова вартість або, просто, залишки або відстань між відомими точками даних та тими точками даних, передбаченими моделлю.

Для обчислення залишкового середньоквадратичного відхилення підключіть залишки до рівняння залишкового середньоквадратичного відхилення, щоб вирішити формулу.

Приклад залишкового стандартного відхилення 

Почніть з обчислення залишкових значень. Наприклад, припускаючи, що у вас є набір з чотирьох спостережуваних значень для безіменного експерименту, таблиця нижче показує значення y, які спостерігаються та реєструються для заданих значень x:

Якщо лінійне рівняння або нахил лінії, передбачені даними в моделі, подано як y est = 1x + 2, де y est = передбачуване значення y, можна знайти залишок для кожного спостереження.

Залишок дорівнює (y – y est ), отже, для першого набору фактичне значення y дорівнює 1, а передбачуване значення y est, задане рівнянням, y est = 1 (1) + 2 = 3. Залишкове значення таким чином становить 1 – 3 = -2, від’ємне залишкове значення.

Для другого набору точок даних x та y передбачуване значення y, коли x дорівнює 2 і y дорівнює 4, можна обчислити як 1 (2) + 2 = 4.

У цьому випадку фактичне та передбачуване значення однакові, тому залишкова величина буде нульовою. Ви використовували б той самий процес для отримання прогнозованих значень для y у двох інших наборах даних.

Після того, як ви розрахували залишки для всіх точок, використовуючи таблицю або графік, використовуйте формулу залишкового стандартного відхилення.

Розширюючи таблицю вище, ви обчислюєте залишкове стандартне відхилення:

Зверніть увагу, що сума квадратів залишків = 6, що представляє чисельник рівняння залишкового стандартного відхилення.

Для нижньої частини або знаменника рівняння залишкового стандартного відхилення n = кількість точок даних, яка в цьому випадку дорівнює 4. Обчислити знаменник рівняння як:

  • (Кількість залишків – 2) = (4 – 2) = 2

Нарешті, обчисліть квадратний корінь з результатів:

  • Залишкове стандартне відхилення:  √ (6/2) = √3 ≈ 1.732

Величина типового залишку може дати вам уявлення про загальну близькість ваших оцінок. Чим менше залишкове середньоквадратичне відхилення, тим ближче відповідність оцінки реальним даним. Фактично, чим менше залишкове стандартне відхилення порівняно із стандартним відхиленням вибірки, тим більш прогнозованою або корисною є модель.

Залишкове стандартне відхилення можна розрахувати, коли проведено регресійний аналіз, а також дисперсійний аналіз (ANOVA). При визначенні межі кількісного визначення (LoQ) допускається використання залишкового стандартного відхилення замість стандартного відхилення.