Що таке зневага розміром вибірки?
Нехтування розміром вибірки - це когнітивний ухил, який добре вивчили Амос Тверський та Даніель Канеман. Це відбувається, коли користувачі статистичної інформації роблять помилкові висновки, не враховуючи розмір вибірки цих даних.
Основна причина нехтування розміром вибірки - це те, що люди часто не розуміють, що високий рівень дисперсії частіше виникає у невеликих пробах. Тому важливо визначити, чи достатньо великий розмір вибірки, який використовується для отримання даної статистики, дозволяє зробити важливі висновки.
Знання, коли розмір вибірки є достатньо великим, може бути складним завданням для тих, хто недостатньо розуміє статистичні методи.
Ключові вивезення
- Нехтування розміром вибірки - це когнітивний ухил, який вивчали Амос Тверський та Даніель Канеман. Він складається з помилкових висновків зі статистичної інформації через те, що не враховували наслідки розміру вибірки. розміри вибірки пов'язані з більш мінливими статистичними результатами, і навпаки.
Розуміння нехтування розміром вибірки
Якщо розмір вибірки занадто малий, точних та достовірних висновків не можна робити. У контексті фінансів це може ввести в оману інвесторів різними способами.
Наприклад, інвестор може побачити новий інвестиційний фонд, похвалившись тим, що він створив 15% річних доходів з моменту його створення. Інвестор може стрімко включити, що цей фонд є їх путівкою до швидкого створення багатства. Однак цей висновок може бути небезпечним помилковим, якщо фонд не інвестує дуже довго. У такому випадку результати можуть бути наслідком короткострокових аномалій і мало стосуватися фактичної методології інвестування фонду.
Нехтування розміром вибірки часто плутають із знехтуванням базової швидкості, що є окремим когнітивним ухилом. Хоча зневага розміру вибірки посилається на неврахування ролі розмірів вибірки для визначення достовірності статистичних тверджень, зневага до базової ставки стосується тенденції людей нехтувати наявними знаннями про явище при оцінці нової інформації.
Приклад реального світу Нехтування розміром вибірки
Щоб краще зрозуміти нехтування розміром вибірки, розглянемо наступний приклад, який взятий з досліджень Амоса Тверського та Даніеля Канемана:
Людині пропонується взяти зразки з п’яти куль і виявить, що чотири червоні, а одна - зелені.
Людина черпає із зразка 20 кульок і виявляє, що 12 червоні, а вісім - зелені.
Який зразок дає кращі докази того, що кульки переважно червоні?
Більшість людей кажуть, що перший, менший зразок дає набагато більш сильні докази, оскільки відношення червоного до зеленого набагато вище, ніж для більшого зразка. Однак насправді вищий коефіцієнт переважає менший розмір вибірки. Вибірка 20 фактично дає набагато більш сильні докази.
Ще один приклад Амоса Тверського та Даніеля Канемана:
Місто обслуговують дві лікарні. У більшій лікарні щодня народжується в середньому 45 немовлят, а в меншій лікарні щодня народжується близько 15 немовлят. Хоча 50% усіх дітей - хлопчики, точний відсоток коливається з дня на день.
Протягом року кожна лікарня реєструвала дні, коли понад 60% немовлят були хлопчиками. Яка лікарня зафіксувала більше таких днів?
На запитання цього питання 22% респондентів відповіли, що більша лікарня повідомить більше таких днів, тоді як 56% відповіли, що результати будуть однакові для обох лікарень. Насправді правильна відповідь полягає в тому, що менша лікарня зафіксувала б більше таких днів, оскільки її менший розмір призведе до більшої мінливості.
Як ми вже відзначали раніше, корінь нехтування розміром вибірки полягає в тому, що люди часто не розуміють, що високий рівень дисперсії частіше виникає у невеликих пробах. Вкладення коштів, це дійсно може бути дуже дорогим.
