Що таке варіаційний коефіцієнт інфляції?
Варіаційний коефіцієнт інфляції варіантної інфляції (VIF) - це міра величини мультиколінеарності в наборі множинних змінних регресії. Математично VIF для змінної моделі регресії дорівнює відношенню загальної дисперсії моделі до дисперсії моделі, що включає лише ту єдину незалежну змінну. Це співвідношення обчислюється для кожної незалежної змінної. Високий VIF вказує на те, що асоційована незалежна змінна є високо колінеарною з іншими змінними в моделі.
Ключові вивезення
- Коефіцієнт дисперсії дисперсії (VIF) забезпечує міру мультиколінеарності між незалежними змінними в моделі множинної регресії. Виявлення мультиколінеарності важливо, оскільки, хоча він не зменшує пояснювальну силу моделі, він зменшує статистичну значимість незалежних змінних. Великий VIF на незалежній змінній вказує на дуже колінеарний зв’язок з іншими змінними, які слід враховувати або коригувати в структурі моделі та підборі незалежних змінних.
Розуміння коефіцієнта інфляції варіації
Множинна регресія застосовується тоді, коли людина хоче перевірити вплив декількох змінних на певний результат. Залежна змінна - результат, на який діють незалежні змінні, які є вхідними даними в модель. Мультиколінеарність існує, коли існує одна лінійна залежність або кореляція між однією або кількома незалежними змінними або входами. Мультиколінеарність створює проблему при множинній регресії, оскільки оскільки вхідні матеріали впливають один на одного, вони насправді не є незалежними, і важко перевірити, наскільки комбінація незалежних змінних впливає на залежну змінну чи результат в рамках регресійної моделі. У статистичному плані модель множинної регресії, де існує висока мультиколінеарність, ускладнить оцінку взаємозв'язку між кожною з незалежних змінних та залежною змінною. Невеликі зміни в використаних даних або в структурі модельного рівняння можуть призвести до великих і помилкових змін оцінюваних коефіцієнтів на незалежних змінних.
Щоб переконатися, що модель правильно вказана та функціонує правильно, існують тести, які можна запустити для мультиколінеарності. Варіант коефіцієнта інфляції є одним із таких засобів вимірювання. Використання дисперсійних коефіцієнтів інфляції допомагає визначити серйозність будь-яких питань, що стосуються мультиколінеарності, щоб модель могла бути коригувана. Варіаційний коефіцієнт інфляції визначає, наскільки на поведінку (дисперсію) незалежної змінної впливає чи завищується її взаємодія / кореляція з іншими незалежними змінними. Варіаційні коефіцієнти інфляції дозволяють швидко оцінити, наскільки величина сприяє стандартній помилці регресії. Коли існують значні питання мультиколінеарності, коефіцієнт дисперсії дисперсії буде дуже великим для змінних. Після виявлення цих змінних можна використовувати кілька підходів для усунення або комбінування колінеарних змінних, вирішуючи питання мультиколінеарності.
Хоча мультиколінеарність не зменшує загальну прогнозовану здатність моделі, вона може давати оцінки коефіцієнтів регресії, які не є статистично значущими. У певному сенсі це можна розглядати як своєрідний подвійний підрахунок у моделі. Коли дві або більше незалежних змінних тісно пов'язані або вимірюють майже одне і те ж, то базовий ефект, який вони вимірюють, враховується вдвічі (або більше) по змінних, і важко або неможливо сказати, яка змінна насправді впливає на незалежна змінна. Це проблема, тому що метою багатьох економетричних моделей є перевірка саме такого роду статистичного зв'язку між незалежними змінними та залежною змінною.
Наприклад, якщо економіст хоче перевірити, чи існує статистично значуща залежність між рівнем безробіття (як незалежної змінної) та рівнем інфляції (як залежною змінною). Включаючи додаткові незалежні змінні, пов'язані зі рівнем безробіття, такі нові початкові претензії щодо безробіття, ймовірно, внесуть мультиколінеарність у модель. Загальна модель може виявляти сильну, статистично достатню пояснювальну силу, але не зможе визначити, чи є наслідком наслідків в основному рівень безробіття або нові початкові претензії безробітних. Ось що б виявив VIF, і він запропонував би, можливо, виключити одну із змінних із моделі або знайти якийсь спосіб їх закріплення для фіксації їх спільного ефекту, залежно від того, яку конкретну гіпотезу дослідник зацікавив у тестуванні.
