Що таке поетапна регресія?
Регресійний аналіз - це широко застосовуваний статистичний підхід, який спрямований на виявлення зв’язків між змінними. Ідея полягає в об'єднанні релевантних даних для прийняття більш обґрунтованих рішень і є звичайною практикою в інвестуванні. Поетапна регресія - це покрокова ітеративна побудова регресійної моделі, яка передбачає автоматичний вибір незалежних змінних. Наявність пакетів статистичних програм робить можливим поступовий регрес навіть у моделях із сотнями змінних.
Типи ступінчастої регресії
Основна мета поетапної регресії - через серію тестів (F-тести, t-тести) знайти набір незалежних змінних, які суттєво впливають на залежну змінну. Це робиться за допомогою комп'ютерів за допомогою ітерації, яка є процесом досягнення результатів чи рішень шляхом повторних раундів або циклів аналізу. Проведення тестів автоматично за допомогою статистичних програмних програм має перевагу в економії часу для людини.
Ключові вивезення
- Регресійний аналіз - це статистичний підхід, який прагне зрозуміти та виміряти зв’язки між незалежними та залежними змінними. Поступова регресія - це метод, який вивчає статистичну значимість кожної незалежної змінної в межах моделі. Підхід до вибору вперед додає змінну, а потім перевіряє статистичну значимість. Метод зворотного усунення починається з моделі, завантаженої безліччю змінних, а потім видаляє одну змінну для перевірки її важливості відносно загальних результатів. Поступова регресія має багато критиків, оскільки саме такий підхід вписує дані в модель для досягнення бажаного результату.
Поетапна регресія може бути досягнута або шляхом випробування однієї незалежної змінної одночасно та включення її до регресійної моделі, якщо вона є статистично значущою, або шляхом включення в модель усіх потенційних незалежних змінних та усунення тих, які не є статистично значущими. Деякі використовують комбінацію обох методів, і тому існує три підходи до поетапної регресії:
- Вибір вперед починається без змінних в моделі, тестує кожну змінну, як вона додається до моделі, потім зберігає ті, які вважаються найбільш статистично значущими - повторюючи процес, поки результати не стануть оптимальними. Усунення вперед починається з набору незалежних змінних, видаляючи по черзі, потім перевіряємо, чи видалена змінна є статистично значущою. Двонаправлене усунення - це комбінація перших двох методів, які тестують, які змінні слід включати чи виключати.
Прикладом поетапної регресії за допомогою методу усунення відсталого може бути спроба зрозуміти споживання енергії на заводі з використанням таких змінних, як час роботи обладнання, вік обладнання, розмір персоналу, температура поза і час року. Модель включає всі змінні - потім кожну видаляється по одній, щоб визначити, що є найменш статистично значущим. Зрештою, модель може показати, що час року та температури є найбільш значущими, можливо, це дозволяє припустити, що пікове споживання енергії на заводі - це коли використання кондиціонера є найвищим.
Обмеження поетапної регресії
Регресійний аналіз, як лінійний, так і багатоваріантний, сьогодні широко використовується в інвестиційному світі. Ідея часто полягає в тому, щоб знайти закономірності, які існували в минулому, які також можуть повторитися в майбутньому. Проста лінійна регресія, наприклад, може розглянути співвідношення ціни і прибутку та фондовіддачу протягом багатьох років, щоб визначити, чи акції з низьким співвідношенням P / E (незалежна змінна) пропонують більш високу віддачу (залежна змінна). Проблема такого підходу полягає в тому, що кон'юнктура ринку часто змінюється, і відносини, які мали місце в минулому, не обов'язково мають відношення до теперішнього чи майбутнього.
Тим часом процес поступової регресії має багато критиків, і навіть є заклики взагалі припинити використання методу. Статистики відзначають декілька недоліків підходу, включаючи неправильні результати, властиву упередженість самого процесу та необхідність значних обчислювальних можливостей для розробки складних моделей регресії за допомогою ітерації.
