Що таке помилкова кореляція
У статистиці фальшива кореляція або хибність посилається на зв'язок між двома змінними, що виявляється причинним, але не є. Хибні стосунки часто мають вигляд однієї змінної, що впливає на іншу. Ця хибна кореляція часто викликається третім фактором, який не виявляється під час експертизи, який іноді називають заплутаним фактором.
Ключові вивезення
- Грізна кореляція або хибність - це коли два фактори виявляються випадково пов'язаними, але не є. Поява причинно-наслідкових зв’язків часто пояснюється подібним рухом на графіку, який виявляється випадковим або спричиненим третім "заплутаним" фактором. часто може бути викликано невеликими розмірами вибірки або довільними кінцевими точками.
Як працює згубна кореляція
Коли дві випадкові величини уважно відслідковують одна одну на графіку, легко підозрювати кореляцію або взаємозв'язок двох факторів, коли зміна впливає на іншу. Відкидаючи іншу тему «причинно-наслідкової зв’язки», це спостереження може змусити читача діаграми вважати, що рух змінної A пов'язаний з рухом у змінній B або навпаки. але іноді, при більш детальному статистичному дослідженні, вирівняні рухи збігаються або викликаються третім фактором, який впливає на перші два. Це хибна кореляція. Дослідження, проведені з невеликими розмірами вибірки або довільними кінцевими точками, - це особливості, сприйнятливі до помилковості.
Приклад хибних співвідношень
Виявити цікаві кореляції не надто складно. Хоча багато хто виявиться хибним. Для чоловічого виду на Уолл-стріті два популярні хибні кореляції стосуються жінок та спорту. Починаючи з 1920-х років, є теорія довжини спідниці, яка стверджує, що довжина спідниці та напрямок фондового ринку співвідносяться. Якщо довжина спідниці довга, це означає, що фондовий ринок знижується; якщо вони короткі, ринок йде вгору. Приблизно в кінці січня говорять про так званий показник Super Bowl, який говорить про те, що перемога команди AFC, ймовірно, означає, що фондовий ринок знизиться в наступному році, тоді як перемога команди NFC передвіщає зростання ринок. Починаючи з 1966 року показник має точність 80%. Це весела розмова, але, мабуть, не те, що серйозний фінансовий радник рекомендував би як інвестиційну стратегію для клієнтів.
Ось ще кілька прикладів поширених хибних кореляцій:
- Утопчення піднімаються, коли ростуть продажі морозива. Може здатися, що збільшення продажів морозива спричиняє більше утоплення, але насправді зростання тепла може призвести до того, що більше людей плаватиме, а також купувати більше морозива. Коефіцієнт вбивств в США з 2006-2011 рр. Знизився на такий же рівень, як Microsoft Internet Explorer Використання. Керівники, які говорять, будь ласка, і дякують вам частіше насолоджуються кращими результатами роботи. Люди, які носять екіпіровку команди Oakland Raiders, більше схильні вчиняти злочини.
Як виявити хибні кореляції
Статистики та інші вчені, які аналізують дані, повинні постійно шукати помилкові стосунки. Існують численні методи, якими вони користуються, зокрема:
- Забезпечення належного репрезентативного зразка. Отримання належного розміру вибірки. Обережно ставлячись до довільних кінцевих точок. Контролюючи якомога більше зовнішніх змінних. Використовуючи нульову гіпотезу та перевіряючи наявність сильного p-значення.
