Що таке непараметрична статистика?
Непараметрична статистика стосується статистичного методу, в якому дані не потрібні для нормального розподілу. Непараметрична статистика використовує дані, які часто є порядковими, це означає, що вона не покладається на числа, а на ранжирування чи порядок сортування. Наприклад, опитування, що передає переваги споживачів у межах від подібних до неприязних, вважатиметься порядковими даними.
Непараметрична статистика включає непараметричну описову статистику, статистичні моделі, умовиводи та статистичні тести. Структура моделі непараметричних моделей не задається апріорі, а натомість визначається з даних. Термін непараметричний не означає, що в таких моделях повністю відсутні параметри, а швидше, що кількість і характер параметрів є гнучкими і не зафіксовані заздалегідь. Гістограма - приклад непараметричної оцінки розподілу ймовірностей.
Розуміння непараметричної статистики
У статистиці параметрична статистика включає такі параметри, як середнє значення, медіана, стандартне відхилення, дисперсія тощо. Ця форма статистики використовує спостережувані дані для оцінки параметрів розподілу. У параметричній статистиці дані передбачають, що вони відповідають нормальному розподілу з невідомими параметрами μ (середня сукупність) та σ 2 (дисперсія сукупності), які потім оцінюються за допомогою середньої вибірки та дисперсії вибірки.
Непараметрична статистика не передбачає припущення щодо розміру вибірки або чи є спостережувані дані кількісними.
Непараметрична статистика не передбачає, що дані беруться з нормального розподілу. Натомість форма розподілу оцінюється за цією формою статистичного вимірювання. Хоча існує багато ситуацій, в яких можна припустити нормальний розподіл, є також деякі сценарії, в яких неможливо визначити, чи буде нормально поширюватися дані.
Приклади непараметричної статистики
У першому прикладі розглянемо дослідника, який бажає оцінити кількість немовлят, народжених із карими очима, може вирішити взяти зразок у 150 000 немовлят та провести аналіз набору даних. Вимірювання, яке вони отримують, буде використано для оцінки всієї популяції немовлят із карими очима, народжених наступного року.
Для другого прикладу розглянемо іншого дослідника, який хоче знати, чи пов’язано рано чи пізно лягати спати до того, як часто хворіє людина. Якщо припустити, що вибірку відбирають випадково з популяції, розподіл частоти хвороби за розміром вибірки можна вважати нормальним. Однак експеримент, що вимірює стійкість людського організму до штаму бактерій, не може вважати нормальним розподілом.
Це відбувається тому, що випадково вибрані вибіркові дані можуть бути стійкими до деформації. З іншого боку, якщо дослідник враховує такі фактори, як генетичний склад та етнічна приналежність, він може виявити, що розмір вибірки, обраний з використанням цих характеристик, може не бути стійким до деформації. Отже, не можна припустити нормального розподілу.
Цей метод корисний, коли дані не мають чіткої чисельної інтерпретації та найкраще використовувати їх із даними, які мають ранжирування. Наприклад, тест оцінювання особистості може мати рейтинг своїх показників, встановлених як сильно не погоджуючись, не згоден, байдужий, згоден і сильно погоджуючись. У цьому випадку слід застосовувати непараметричні методи.
Спеціальні міркування
Непараметрична статистика отримала високу оцінку завдяки простоті їх використання. У міру зменшення потреби в параметрах дані стають більш застосовними для більшої різноманітності тестів. Цей тип статистики може бути використаний без середнього, розміру вибірки, стандартного відхилення або оцінки будь-яких інших пов'язаних параметрів, коли жодна з цієї інформації недоступна.
Оскільки непараметрична статистика робить менше припущень щодо вибіркових даних, її застосування є ширшим за обсягом, ніж параметрична статистика. У випадках, коли параметричне тестування є більш доцільним, непараметричні методи будуть менш ефективними. Це тому, що результати, отримані з непараметричної статистики, мають менший ступінь достовірності, ніж якби результати були отримані за допомогою параметричної статистики.
Ключові вивезення
- Непараметрична статистика проста у використанні, але не забезпечує точної точності інших статистичних моделей. Цей тип аналізу найкраще підходить при розгляді порядку впорядкування, де навіть якщо числові дані змінюються, результати, ймовірно, залишаться однаковими.
