Що таке аналіз варіації (ANOVA)?
Аналіз дисперсії (ANOVA) - це інструмент аналізу, використовуваний у статистиці, який розбиває спостережувану сукупну мінливість, виявлену всередині набору даних, на дві частини: систематичні фактори та випадкові фактори. Систематичні фактори статистично впливають на даний набір даних, тоді як випадкові фактори не роблять. Аналітики використовують тест ANOVA для визначення впливу незалежних змінних на залежну змінну в регресійному дослідженні.
Методи t- і z-тесту, розроблені в 20 столітті, використовувались для статистичного аналізу до 1918 року, коли Рональд Фішер створив метод дисперсії. ANOVA також називають дисперсійним аналізом Фішера, і це розширення t- і z-тестів. Цей термін став відомим у 1925 році, з'явившись у книзі Фішера "Статистичні методи для дослідників". Він був використаний в експериментальній психології і згодом розширився на більш складні предмети.
Формула для ANOVA така:
Сігналы абмеркавання F = MSEMST, де: F = коефіцієнт ANOVAMST = середня сума квадратів за рахунок обробкиMSE = середня сума квадратів через помилку
Що виявляє аналіз варіації?
Тест ANOVA - це початковий етап аналізу факторів, які впливають на певний набір даних. Після завершення тестування аналітик проводить додаткове тестування на методичні фактори, які помітно сприяють невідповідності набору даних. Аналітик використовує результати тесту ANOVA у f-тесті для отримання додаткових даних, які співпадають із запропонованими моделями регресії.
Тест ANOVA дозволяє порівняти більше двох груп одночасно, щоб визначити, чи існує зв’язок між ними. Результат формули ANOVA, статистика F (також її називають співвідношенням F), дозволяє проводити аналіз декількох груп даних, щоб визначити мінливість між вибірками та всередині зразків.
Якщо між тестованими групами не існує реальної різниці, що називається нульовою гіпотезою, результат статистики F-відношення ANOVA буде близьким до 1. Коливання в її вибірці, ймовірно, будуть супроводжувати розподіл Фішера F. Це фактично група функцій розподілу з двома характерними числами, які називаються ступенем свободи чисельника та знаменниками - ступенями свободи.
Ключові вивезення
- Аналіз дисперсії або ANOVA - це статистичний метод, який розділяє спостережувані дані про дисперсію на різні компоненти, які використовуються для додаткових тестів. Односторонній ANOVA використовується для трьох або більше груп даних, щоб отримати інформацію про зв’язок між залежним і Незалежні змінні. Якщо між групами не існує справжньої дисперсії, F-коефіцієнт ANOVA повинен дорівнювати близькому 1.
Приклад використання ANOVA
Наприклад, дослідник може тестувати студентів з кількох коледжів, щоб побачити, чи студенти одного з коледжів постійно перевершують студентів з інших коледжів. У бізнес-додатку дослідник НДДКР може перевірити два різні процеси створення продукту, щоб побачити, чи є один процес кращим за інший з точки зору економічності.
Тип використовуваного тесту ANOVA залежить від ряду факторів. Він застосовується, коли дані потребують експериментального характеру. Аналіз дисперсії застосовується, якщо немає доступу до статистичного програмного забезпечення, що призводить до обчислення ANOVA вручну. Він простий у використанні та найкраще підходить для невеликих зразків. Для багатьох експериментальних конструкцій розміри вибірки повинні бути однаковими для різних комбінацій рівнів факторів.
ANOVA корисний для тестування трьох або більше змінних. Він схожий на багаторазові двопробні t-тести. Однак це призводить до менших помилок типу I і підходить для цілого ряду питань. ANOVA групує відмінності, порівнюючи засоби кожної групи та включає розповсюдження дисперсії на різноманітні джерела. Він використовується з предметами, тестовими групами, між групами та всередині груп.
Одностороння ANOVA проти двосторонньої ANOVA
Існує два типи ANOVA: одностороння (або однонаправлена) та двостороння. Одностороння або двостороння означає кількість незалежних змінних у вашому аналізі дисперсійного тесту. Одностороння ANOVA оцінює вплив єдиного фактора на змінну єдиної відповіді. Він визначає, чи всі зразки однакові. Односторонній ANOVA використовується для визначення, чи є якісь статистично значущі відмінності між засобами трьох або більше незалежних (неспоріднених) груп.
Двостороння ANOVA - це розширення однобічної ANOVA. При односторонній формі ви маєте одну незалежну змінну, яка впливає на залежну змінну. З двостороннім ANOVA є два незалежних. Наприклад, двостороння ANOVA дозволяє компанії порівнювати продуктивність праці на основі двох незалежних змінних, таких як зарплата та набір кваліфікації. Він використовується для спостереження взаємодії двох факторів і перевірки дії двох факторів одночасно.
