Зворотна кореляція

Що таке зворотна кореляція?

Зворотна кореляція, також відома як негативна кореляція, є протилежним відношенням між двома змінними, таким чином, коли значення однієї змінної є високим, тоді значення іншої змінної, ймовірно, є низьким.

Наприклад, зі змінними A і B, оскільки A має високе значення, B має низьке значення, а оскільки A має низьке значення, B має високе значення. У статистичній термінології зворотна кореляція часто позначається коефіцієнтом кореляції “r”, що має значення від -1 до 0, при цьому r = -1 вказує на досконалу зворотну кореляцію.

Ключові винос

  • Зворотна (або негативна) кореляція – це коли дві змінні у наборі даних пов’язані так, що коли одна висока, інша низька.
  • Незважаючи на те, що дві змінні можуть мати сильну негативну кореляцію, це не обов’язково означає, що поведінка однієї має якийсь причинний вплив на іншу.
  • Зв’язок між двома змінними може змінюватися з часом і також може мати періоди позитивної кореляції.

Графік зворотної кореляції

Два набори точок даних можна нанести на графік на осі x та y для перевірки кореляції. Це називається діаграмою розсіювання, і вона представляє візуальний спосіб перевірити позитивну чи негативну кореляцію. Графік нижче ілюструє сильну зворотну кореляцію між двома наборами точок даних, нанесених на графік.

Приклад обчислення зворотної кореляції

Кореляцію можна розрахувати між змінними в наборі даних, щоб отримати чисельний результат, найпоширеніший з яких відомий як r Пірсона. Коли r менше 0, це вказує на зворотну кореляцію. Ось арифметичний приклад обчислення г Пірсона, з результатом, який показує зворотну кореляцію між двома змінними.

Припустимо, аналітику потрібно обчислити ступінь кореляції між X та Y у наступному наборі даних із сімома спостереженнями за двома змінними:

  • X: 55, 37, 100, 40, 23, 66, 88
  • Y: 91, 60, 70, 83, 75, 76, 30

Для пошуку кореляції передбачено три етапи. Спочатку складіть всі значення X, щоб знайти SUM (X), складіть всі значення Y, щоб знайти SUM (Y), і помножте кожне значення X на відповідне йому значення Y і підсумуйте їх, щоб знайти SUM (X, Y):

SUM(Y)=91+60+70+83+75+76+30=485\ begin {align} \ text {SUM} (Y) & = 91 + 60 + 70 + 83 + 75 + 76 + 30 \\ & = 485 \\ \ end {align}СУМА (Y)U=91+60+70+83+75+76+30=485U

Наступним кроком є ​​взяти кожне значення X, вирівняти його в квадрат і підсумувати всі ці значення, щоб знайти SUM (x 2 ). Те саме потрібно зробити для значень Y:

SUM(X2)=(552)+(372)+(1002)+…+(882)=28,623\ text {SUM} (X ^ 2) = (55 ^ 2) + (37 ^ 2) + (100 ^ 2) + \ dotso + (88 ^ 2) = 28,623СУМА (X2)=(552)+(372)+(1002)+…+(882)=28,623

Відзначаючи там сім спостережень, п, наступна формула може бути використана, щоб знайти коефіцієнт кореляції, г:

р=[п