Що таке мультиколінеарність?
Мультиколінеарність - це виникнення високих взаємозв'язків серед незалежних змінних у моделі множинної регресії. Мультиколінеарність може призвести до перекручених чи оманливих результатів, коли дослідник чи аналітик намагається визначити, наскільки вдало кожна незалежна змінна може бути найбільш ефективно використана для прогнозування чи розуміння залежної змінної в статистичній моделі. Загалом, мультиколінеарність може призвести до більш широких інтервалів довіри та менш надійних значень ймовірності для незалежних змінних. Тобто, статистичні умовиводи з моделі з мультиколінеарністю можуть бути недостовірними.
Розуміння мультиколінеарності
Аналітики статистики використовують кілька моделей регресії для прогнозування значення зазначеної залежної змінної на основі значень двох або більше незалежних змінних. Залежну змінну іноді називають змінною результату, цілі або критерієм. Прикладом є багатоваріантна регресійна модель, яка намагається передбачити прибутковість акцій на основі таких позицій, як коефіцієнт ціни до прибутку, ринкова капіталізація, минула ефективність чи інші дані. Фондовіддача є залежною змінною, і різні біти фінансових даних є незалежними змінними.
Ключові вивезення
- Мультиколінеарність - це статистичне поняття, де незалежні змінні в моделі співвідносяться. Мультиколінеарність незалежних змінних призведе до менш надійних статистичних висновків. Краще використовувати незалежні змінні, які не співвідносяться або повторюються при побудові декількох моделей регресії, які використовують дві або більше змінних..
Мультиколінеарність в моделі множинної регресії вказує на те, що колінеарні незалежні змінні певним чином пов'язані, хоча відносини можуть бути, а можуть і не бути випадковими. Наприклад, минулі показники можуть бути пов’язані з ринковою капіталізацією, оскільки акції, які успішно працювали в минулому, матимуть зростаючі ринкові цінності. Іншими словами, мультиколінеарність може існувати, коли дві незалежні змінні сильно корелюються. Це також може статися, якщо незалежна змінна обчислюється з інших змінних у наборі даних або якщо дві незалежні змінні забезпечують подібні та повторювані результати.
Один з найпоширеніших способів усунення проблеми мультиколінеарності - спочатку ідентифікувати колінеарні незалежні змінні, а потім видалити всі, крім однієї. Також можна усунути мультиколінеарність, поєднавши дві або більше колінеарних змінних в одну змінну. Потім може бути проведений статистичний аналіз для вивчення зв'язку між вказаною залежною змінною та лише однією незалежною змінною.
Приклад мультиколінеарності
Для інвестицій мультиколінеарність - це звичайне врахування при проведенні технічного аналізу для прогнозування можливих майбутніх рухів цін цінних паперів, таких як акція чи товарне майбутнє. Аналітики ринку хочуть уникати використання технічних показників, які є колінеарними, оскільки вони базуються на дуже подібних або пов'язаних з ними даних; вони схильні виявляти подібні прогнози щодо залежної змінної руху цін. Натомість аналіз ринку повинен базуватися на помітно різних незалежних змінних, щоб забезпечити аналіз ринку з різних незалежних аналітичних точок зору.
Зазначений технічний аналітик Джон Боллінгер, творець індикатора "Боллінгер Бандс", зазначає, що "кардинальне правило для успішного використання технічного аналізу вимагає уникати мультиколінеарності серед показників".
Для вирішення проблеми аналітики уникають використання двох або більше технічних показників одного типу. Натомість вони аналізують захист, використовуючи один тип індикатора, наприклад індикатор імпульсу, а потім роблять окремий аналіз, використовуючи інший тип індикатора, наприклад індикатор тренда.
Прикладом потенційної проблеми мультиколінеарності є проведення технічного аналізу лише з використанням декількох подібних показників, таких як стохастика, індекс відносної міцності (RSI) та Вільямс% R, які є всіма показниками імпульсу, які покладаються на аналогічні входи і, ймовірно, можуть виробляти подібні результати. У цьому випадку краще зняти всі, крім одного з індикаторів, або знайти спосіб об'єднати декілька з них лише в один індикатор, при цьому додайте також індикатор тренду, який, швидше за все, сильно не співвідноситься з індикатором імпульсу.
