Що таке тест з двома хвостами?
У статистиці двосхилий тест - це метод, при якому критична область розподілу є двосторонньою і перевіряє, чи є вибірка більшою чи меншою за певний діапазон значень. Він використовується в тестуванні нульової гіпотези та тестуванні на статистичну значимість. Якщо зразок, що тестується, потрапляє в будь-яку з критичних областей, замість нульової гіпотези приймається альтернативна гіпотеза. Тест з двома хвостами отримав свою назву від тестування області під обома хвостами нормального розподілу, хоча тест може бути використаний і в інших не нормальних розподілах.
Ключові вивезення
- У статистиці двосхилий тест - це метод, в якому критична область розподілу є двосторонньою та перевіряє, чи є вибірка більшою чи меншою за певний діапазон значень. Вона використовується в тестуванні та тестуванні нульової гіпотези. для статистичної значущості. Якщо вибірка, що тестується, потрапляє в будь-яку з критичних областей, альтернативна гіпотеза приймається замість нульової гіпотези. Згідно з умовами, для визначення значущості на рівні 5% застосовується двосхилий тест, що означає кожну сторону розподіл скорочується на 2, 5%.
Будьте уважні, якщо статистичний тест є одно- або двосхилим, оскільки це сильно вплине на інтерпретацію моделі.
Двуххвостий тест на значимість. Інвестопедія
Як працює тест з двома хвостами
Основним поняттям інфекційної статистики є тестування гіпотез, яке проводиться для визначення того, чи є твердження правдивим чи ні, з урахуванням параметру сукупності. Тестування, яке запрограмоване, щоб показати, чи є середнє значення для вибірки значно та значно менше, ніж середнє значення сукупності, іменується двосхилим тестом.
Тест з двома хвостами призначений для вивчення обох сторін визначеного діапазону даних, визначеного відповідним розподілом ймовірностей. Розподіл ймовірностей повинен представляти ймовірність конкретного результату на основі заздалегідь визначених стандартів. Для цього потрібно встановити межу, що позначає найвищі (або верхні) та найнижчі (або нижчі) прийняті значення змінних, що входять до діапазону. Будь-яка точка даних, що існує вище верхньої межі або нижче нижньої межі, вважається поза діапазоном прийняття та в області, що називається діапазоном відхилення.
Не існує властивого стандарту щодо кількості точок даних, які повинні існувати в межах прийняття. У випадках, коли потрібна точність, наприклад, при створенні фармацевтичних препаратів, може бути встановлена швидкість відхилення 0, 001% або менше. У випадках, коли точність є менш критичною, наприклад, кількість харчових продуктів у мішечку, може бути доцільним показник відхилення в 5%.
Приклад двосхилого тесту
Як гіпотетичний приклад, уявіть, що новий біржовий брокер (XYZ) стверджує, що його плата за брокерські послуги нижче, ніж у поточного біржового брокера (ABC). Дані, отримані від незалежної дослідницької фірми, вказують на те, що середнє та стандартне відхилення всіх клієнтів брокера ABC становлять 18 та 6 доларів США відповідно.
Відбирається зразок 100 клієнтів ABC, а посередницькі збори розраховуються за новими тарифами брокера XYZ. Якщо середнє значення вибірки становить 18, 75 дол. США, а стандартне відхилення вибірки - 6 доларів США, чи можна зробити якийсь висновок про різницю середнього рахунку в брокерській діяльності між ABC та брокером XYZ?
- H 0: Нульова гіпотеза: середнє = 18H 1: Альтернативна гіпотеза: середнє <> 18 (Це те, що ми хочемо довести.) Область відхилення: Z <= - Z 2, 5 і Z> = Z 2, 5 (за умови 5% рівня значущості, розділити по 2, 5 на обидві сторони). Z = (середнє значення вибірки - середнє) / (std-dev / sqrt (кількість зразків)) = (18, 75 - 18) / (6 / (sqrt (100)) = 1, 25
Це обчислене значення Z падає між двома межами, визначеними: - Z 2, 5 = -1, 96 і Z 2, 5 = 1, 96.
Звідси випливає висновок, що недостатньо доказів для висновку про різницю між тарифами вашого існуючого брокера та нового брокера. Альтернативно, p-значення = P (Z <-1, 25) + P (Z> 1, 25) = 2 * 0, 1056 = 0, 2112 = 21, 12%, що більше 0, 05 або 5%, призводить до того ж висновку.
Особливі міркування: Випадкова вибірка
Тест з двома хвостами також може бути використаний практично під час певної виробничої діяльності на фірмі, наприклад, при виробництві та упаковці цукерок на певному підприємстві. Якщо виробнича установа позначає 50 цукерок на мішок як свою мету, при прийнятному розподілі від 45 до 55 цукерок, будь-який мішок, знайдений із кількістю нижче 45 або вище 55, вважається в межах відхилення.
Щоб підтвердити, що механізми упаковки правильно відкалібровані, щоб відповідати очікуваному виходу, для підтвердження точності може бути взята випадкова вибірка. Щоб механізми упаковки вважалися точними, бажано в середньому 50 цукерок на пакетик з відповідним розподілом. Крім того, кількість мішків, які потрапляють у діапазон відхилення, повинна потрапляти в межу розподілу ймовірностей, що вважається прийнятною як рівень помилки.
Якщо виявлено неприйнятний коефіцієнт відхилення або середнє відхилення занадто далеко від бажаного середнього, для виправлення помилки можуть знадобитися коригування об'єкта чи відповідного обладнання. Регулярне використання двосторонніх методів тестування може допомогти забезпечити тривалість виробництва в межах довгострокової перспективи.
Тест з двома хвостами на один хвіст
Коли тест гіпотези встановлюється, щоб показати, що середнє значення вибірки було б вище або нижче, ніж середнє значення сукупності, це називається однобічним тестом. Односхилий тест отримав свою назву від тестування площі під одним із хвостів (сторін) нормального розподілу. Використовуючи односхилий тест, аналітик тестує можливість співвідношення в одному напрямку, що цікавить, і повністю не враховує можливості відносин в іншому напрямку.
Якщо зразок, що тестується, потрапляє в однобічну критичну область, замість нульової гіпотези буде прийнята альтернативна гіпотеза. Односхилий тест також відомий як гіпотеза спрямованості або тест на спрямованість.
