Що таке зворотна кореляція?
Зворотна кореляція, також відома як негативна кореляція, є протилежним співвідношенням між двома змінними, таким чином, що вони рухаються в протилежних напрямках. Наприклад, зі змінними A і B, як A збільшується, B зменшується, а зі зменшенням A збільшується і B. У статистичній термінології зворотна кореляція позначається коефіцієнтом кореляції "r", що має значення між -1 і 0, при цьому r = -1 вказує на ідеальну обернену кореляцію.
Ключові вивезення
- Навіть незважаючи на те, що два набори даних можуть мати сильну негативну кореляцію, це не означає, що поведінка однієї впливає на причинно-наслідковий зв’язок з іншою. Зв'язок між двома змінними може змінюватися з часом і може мати періоди позитивної кореляції як добре.
Графічна обернена кореляція
Два набори точок даних можуть бути побудовані на графіку на осі x та y, щоб перевірити на кореляцію. Це називається діаграмою розсіювання, і вона представляє візуальний спосіб перевірити наявність позитивної чи негативної кореляції. Наведений нижче графік ілюструє сильну негативну кореляцію між двома наборами точок даних, побудованими на графіку.
Діаграма розсіювання Інвестопедія
Приклад обчислення зворотної кореляції
Кореляція може бути обчислена між двома наборами даних для отримання чисельного результату. Отримана статистика використовується прогнозовано для оцінки таких показників, як переваги зменшення ризику диверсифікації портфеля та інших важливих даних. Наведений нижче приклад показує, як обчислити статистику.
Припустимо, аналітику потрібно обчислити ступінь кореляції між наступними двома наборами даних:
- X: 55, 37, 100, 40, 23, 66, 88Y: 91, 60, 70, 83, 75, 76, 30
У пошуку кореляції є три кроки. Спочатку складіть усі значення X, щоб знайти SUM (X), складіть всі значення Y, щоб знайти SUM (Y), і помножте кожне значення X на відповідне значення Y та підсумовуйте їх, щоб знайти SUM (X, Y):
Сігналы абмеркавання SUM (X) = 55 + 37 + 100 + 40 + 23 + 66 + 88 = 409
Сігналы абмеркавання SUM (Y) = 91 + 60 + 70 + 83 + 75 + 76 + 30 = 485
Сігналы абмеркавання SUM (X, Y) = (55 × 91) + (37 × 60) +… + (88x × 30) = 26 926
Наступним кроком є взяття кожного значення X, квадрат його та підсумовування всіх цих значень, щоб знайти SUM (x 2). Те саме необхідно зробити для значень Y:
Сігналы абмеркавання SUM (X2) = (552) + (372) + (1002) +… + (882) = 28, 623
Сігналы абмеркавання SUM (Y2) = (912) + (602) + (702) +… + (302) = 35, 971
Зазначивши, що існує сім спостережень, n, для знаходження коефіцієнта кореляції можна використовувати наступну формулу, r:
Сігналы абмеркавання r = ×
У цьому прикладі кореляція:
- Сігналы абмеркавання r = ((7 × 28 623−4092) × (7 × 35 971−4852)) (7 × 26 926− (409 × 485)) r = 9, 883 ÷ 23, 414 r = −0, 42
Два набори даних мають зворотну кореляцію -0, 42.
Що вам говорить обернена кореляція?
Зворотна кореляція говорить вам про те, що коли одна змінна піднімається, інша падає. На фінансових ринках найкращим прикладом зворотного співвідношення є, мабуть, той, що долар США та золото. Оскільки долар США подешевшає до основних валют, золото, як правило, сприймається, і як оцінює долар, золото знижується в ціні.
Потрібно пам’ятати про два моменти щодо негативного співвідношення. По-перше, наявність негативної кореляції або позитивної кореляції з цього приводу не обов'язково означає причинно-наслідковий зв’язок. По-друге, зв’язок між двома змінними не є статичним і коливається з часом, а значить, змінні можуть відображати зворотну кореляцію протягом одних періодів і позитивну кореляцію під час інших.
Обмеження використання зворотної кореляції
Кореляційний аналіз може виявити корисну інформацію про взаємозв'язок між двома змінними, наприклад, про те, як ринки акцій та облігацій часто рухаються в протилежних напрямках. Однак аналіз не враховує повноцінних випадків або незвичну поведінку кількох точок даних у межах заданого набору точок даних, що може перекривити результати.
Крім того, коли дві змінні показують негативну кореляцію, може бути кілька інших змінних, які, хоча і не включені в дослідження кореляції, фактично впливають на цю змінну. Незважаючи на те, що дві змінні мають дуже сильну зворотну кореляцію, цей результат ніколи не передбачає причинно-наслідкового зв’язку між ними. Нарешті, використання результатів кореляційного аналізу для екстраполяції того ж висновку на нові дані несе високий ступінь ризику.
