Зміст
- Що таке Т-тест?
- Пояснення Т-тесту
- Неоднозначні результати тесту
- Припущення Т-тесту
- Розрахунок Т-тестів
- Корельований (або парний) Т-тест
- Т-тест на рівну варіативність (у сукупності)
- Т-тест на нерівну варіативність
- Визначення, який Т-тест використовувати
- Приклад тесту нерівномірних варіацій
Що таке Т-тест?
Т-тест - це тип інфекційної статистики, який використовується для визначення, чи є значна різниця між засобами двох груп, яка може бути пов'язана за певними ознаками. Він використовується в основному тоді, коли набори даних, як набір даних, записаних як результат відгортання монети 100 разів, слідкують за звичайним розповсюдженням і можуть мати невідомі відхилення. Т-тест використовується як інструмент тестування гіпотез, який дозволяє перевірити припущення, застосовне до сукупності.
Т-тест розглядає t-статистику, значення розподілу t і ступеня свободи для визначення ймовірності різниці між двома наборами даних. Для проведення тесту з трьома або більше змінними необхідно використовувати аналіз дисперсії.
Т-тест
Пояснення Т-тесту
По суті, t-тест дозволяє нам порівнювати середні значення двох наборів даних і визначати, чи походять вони з однієї сукупності. У наведених вище прикладах, якби ми брали вибірку учнів з класу А та іншої вибірки учнів з класу В, ми не очікували б, що вони матимуть однакові середні та стандартні відхилення. Аналогічно, зразки, взяті з контрольної групи, що приймали плацебо, і відібрані з групи, призначеної препаратом, повинні мати дещо інше середнє та стандартне відхилення.
Математично t-тест бере вибірку з кожного з двох наборів і встановлює постановку задачі, приймаючи нульову гіпотезу про те, що два засоби рівні. На основі застосовних формул певні значення обчислюються та порівнюються зі стандартними значеннями, і припущена нульова гіпотеза приймається або відхиляється відповідно.
Якщо нульова гіпотеза може бути відхилена, це вказує на те, що читання даних є сильним і не випадковим. Т-тест - лише один із багатьох тестів, які використовуються для цієї мети. Статистики повинні додатково використовувати тести, окрім t-тесту, щоб вивчити більше змінних та тести з більшими розмірами вибірки. Для великого розміру вибірки статистики використовують z-тест. Інші варіанти тестування включають тест чи-квадрат і f-тест.
Існує три типи t-тестів, і вони класифікуються як залежні та незалежні t-тести.
Ключові вивезення
- Т-тест - це тип інфекційної статистики, що використовується для визначення, чи є значна різниця між засобами двох груп, яка може бути пов'язана за певними ознаками. Т-тест - один з багатьох тестів, що використовуються з метою перевірки гіпотез в статистиці. Для розрахунку t-тесту потрібно три ключових значення даних. Вони включають різницю між середніми значеннями кожного набору даних (називають середньою різницею), стандартним відхиленням кожної групи та кількістю значень даних кожної групи. Існує кілька різних типів t-тесту, які можна виконати залежно про дані та тип необхідного аналізу.
Неоднозначні результати тесту
Подумайте, що виробник ліків хоче протестувати щойно винайдене ліки. Дотримується стандартної процедури випробування препарату на одній групі пацієнтів та надання плацебо іншій групі, що називається контрольною групою. Плацебо, що надається контрольній групі, є речовиною, що не передбачає терапевтичної цінності, і служить орієнтиром для вимірювання того, як реагує інша група, на яку вводиться фактичний препарат.
Після випробування препаратами члени контрольної групи, що годували плацебо, повідомили про збільшення середньої тривалості життя на три роки, тоді як члени групи, яким призначають новий препарат, повідомляють про збільшення середньої тривалості життя на чотири роки. Миттєве спостереження може свідчити про те, що препарат справді працює, оскільки результати краще для групи, яка вживає препарат. Однак можливо також, що спостереження може бути наслідком випадкового виникнення, особливо дивного удачі. Т-тест корисний для висновку, чи результати справді правильні та застосовні для всієї сукупності.
У школі 100 учнів класу А набрали в середньому 85% при стандартному відхиленні 3%. Ще 100 учнів, що належать до класу В, набрали в середньому 87% при стандартному відхиленні 4%. Незважаючи на те, що середнє значення класу В краще, ніж у класу А, можливо, невірно перейти до висновку, що загальна ефективність учнів класу В краща, ніж у учнів класу А. Це тому, що поряд з мається на увазі, стандартне відхилення класу В також вище, ніж у класу А. Це вказує на те, що їхні крайні відсотки на нижній та вищій стороні були набагато більш розкиданими порівняно з показниками класу А. Т-тест може допомогти визначити який клас пішов краще.
Припущення Т-тесту
- Перше припущення, зроблене щодо t-випробувань, стосується шкали вимірювання. Припущення для t-тесту полягає в тому, що масштаб вимірювань, застосований до зібраних даних, слід за суцільною або порядковою шкалою, такою як бали для тесту на IQ. Друге припущення зроблено для простого випадкового зразка, що дані зібрані з репрезентативної, випадково вибраної частини всієї сукупності. Третім припущенням є дані, коли їх накреслюють, призводить до нормального розподілу, використовується дзвіноподібна крива розподілу. Четверте припущення - досить великий розмір вибірки. Більший розмір вибірки означає, що розподіл результатів повинен наближатись до звичайної дзвіноподібної кривої. Остаточним припущенням є однорідність дисперсії. Однорідна або однакова дисперсія існує, коли стандартні відхилення зразків приблизно рівні.
Розрахунок Т-тестів
Для розрахунку t-тесту потрібно три ключових значення даних. Вони включають різницю між середніми значеннями кожного набору даних (називають середньою різницею), стандартним відхиленням кожної групи та кількістю значень даних кожної групи.
Результат t-тесту виробляє значення t. Це обчислене t-значення потім порівнюється зі значенням, отриманим з таблиці критичного значення (називається Таблицею розподілу T). Це порівняння допомагає визначити, наскільки ймовірна різниця між засобами, що сталася випадково, чи чи справді набори даних мають внутрішні відмінності. Т-тест задає питання, чи є різниця між групами справжньою різницею у дослідженні, чи це, ймовірно, безглузда статистична різниця.
Таблиці розподілу T
Таблиця розподілу Т доступна у форматі з одним хвостиком та двома хвостами. Перший використовується для оцінки випадків, які мають фіксовану величину або діапазон з чітким напрямком (позитивним чи негативним). Наприклад, яка ймовірність того, що значення виходу залишатиметься нижче -3, або отримує більше семи під час прокатки пари кісток? Останній використовується для аналізу, пов'язаного з діапазоном, наприклад, запитання, чи не відповідають координати між -2 і +2.
Розрахунки можна проводити за допомогою стандартних програмних програм, які підтримують необхідні статистичні функції, наприклад, такі, що знаходяться в MS Excel.
T-цінності та ступені свободи
Тест t дає два значення як t-значення та ступінь свободи. Значення t - це відношення різниці між середнім значенням двох наборів вибірки та різницею, що існує в наборах вибірки. Незважаючи на те, що значення чисельника (різниця між середнім значенням двох вибіркових наборів) є простим для обчислення, знаменник (різниця, що існує у наборах вибірки) може стати трохи складнішим залежно від типу значень даних. Знаменник співвідношення - це вимірювання дисперсії або мінливості. Більш високі значення t-значення, які також називаються t-оцінками, свідчать про існування великої різниці між двома наборами вибірки. Чим менше значення t, тим більше подібності між двома наборами вибірки.
- Великий t-бал вказує на те, що групи різні. Маленький t-оцінка вказує на те, що групи схожі.
Ступені свободи стосуються цінностей у дослідженні, які мають свободу змінюватись і є важливими для оцінки важливості та обгрунтованості нульової гіпотези. Обчислення цих значень зазвичай залежить від кількості записів даних, наявних у наборі вибірки.
Корельований (або парний) Т-тест
Корельований t-тест проводиться, коли зразки, як правило, складаються із зіставлених пар подібних одиниць або коли є випадки повторних заходів. Наприклад, можуть бути випадки того, що одні й ті ж пацієнти повторно обстежуються - до та після того, як вони отримували певне лікування. У таких випадках кожного пацієнта використовують як контрольний зразок проти себе.
Цей метод також застосовується у випадках, коли зразки пов'язані певним чином або мають відповідні характеристики, як порівняльний аналіз, що включає дітей, батьків або братів і сестер. Корельовані або парні t-тести залежать від типу, оскільки вони включають випадки, коли два набори зразків пов'язані.
Формула для обчислення t-значення та ступенів свободи для парного t-тесту:
- Середнє значення1 і середнє значення2 - середні значення кожного з наборів вибірки, тоді як var1 і var2 являють собою дисперсію кожного з наборів вибірки.
Решта двох типів належать до незалежних t-тестів. Зразки цих типів вибираються незалежно один від одного, тобто набір даних у двох групах не відноситься до однакових значень. Вони включають такі випадки, як група з 100 пацієнтів, розділених на два групи по 50 пацієнтів. Одна з груп стає контрольною і отримує плацебо, а інша отримує призначене лікування. Це складає дві незалежні вибіркові групи, які не мають між собою пар.
Т-тест на рівну варіативність (або в сукупності)
T-тест на рівну дисперсію використовується, коли кількість вибірок у кожній групі однакова або дисперсія двох наборів даних однакова. Для розрахунку t-значення та ступенів свободи для t-тесту з рівномірною дисперсією використовується наступна формула:
Сігналы абмеркавання T-значення = n1 + n2−2 (n1−1) × var12 + (n2−1) × var22 × n11 + n21 середнє1 - середнє значення2, де: середнє значення1 і середнє значення2 = Середні значення рівня вибірки1 і var2 = Варіантність кожного набору вибіркиn1 і n2 = Кількість записів у кожному наборі вибірки
і, Сігналы абмеркавання Ступені свободи = n1 + n2−2 десь: n1 і n2 = Кількість записів у кожному наборі вибірки
Т-тест на нерівну варіативність
Т-тест на неоднакову дисперсію застосовується, коли кількість вибірок у кожній групі різна, а дисперсія двох наборів даних також різна. Цей тест називають також тестом Велча. Наступна формула використовується для обчислення t-значення та ступенів свободи для t-тесту неоднакової дисперсії:
Сігналы абмеркавання T-значення = n1var12 + n2var22 середнє1 - середнє2, де: середнє значення1 і середнє значення 2 = середні значення для наборів вибіркиvar1 і var2 = Варіантність кожного набору вибіркиn1 і n2 = Кількість записів у кожному наборі вибірки
і, Сігналы абмеркавання Ступені свободи = n1−1 (n1var12) 2 + n2−1 (n2var22) 2 (n1var12 + n2var22) 2 де: var1 і var2 = Варіант кожного з набору вибірки n1 і n2 = Число записів у кожному наборі зразків
Визначення правильного використання Т-тесту
Наступна блок-схема може бути використана для визначення того, який т-тест слід використовувати на основі характеристик наборів зразків. Ключові елементи, які слід враховувати, включають, чи схожі записи зразків, кількість записів даних у кожному наборі вибірки та дисперсія кожного набору вибірки.
Зображення Джулі Банг © Інвестопедія 2019
Приклад тесту нерівномірних варіацій
Припустимо, що ми проводимо діагональне вимірювання картин, отриманих в художній галереї. Одна група зразків включає 10 картин, а інша включає 20 картин. Набори даних із відповідними середніми та дисперсійними значеннями є такими:
Набір 1 | Набір 2 | |
19.7 | 28.3 | |
20.4 | 26.7 | |
19.6 | 20.1 | |
17.8 | 23.3 | |
18.5 | 25.2 | |
18.9 | 22.1 | |
18.3 | 17.7 | |
18.9 | 27.6 | |
19.5 | 20.6 | |
21, 95 | 13.7 | |
23.2 | ||
17.5 | ||
20.6 | ||
18 | ||
23.9 | ||
21.6 | ||
24.3 | ||
20.4 | ||
23.9 | ||
13.3 | ||
Середній | 19.4 | 21.6 |
Варіантність | 1.4 | 17.1 |
Незважаючи на те, що середнє значення набору 2 вище, ніж у множини 1, ми не можемо зробити висновок, що всі картини мають середню довжину близько 21, 6 одиниць, оскільки дисперсія множини 2 значно вище, ніж у набору 1. Це випадково чи дійсно існують відмінності у цілій популяції всіх картин, отриманих в картинній галереї? Ми встановлюємо проблему, приймаючи нульову гіпотезу про те, що середнє значення є однаковою між двома наборами вибірки та проводимо t-тест, щоб підтвердити, чи гіпотеза справджується.
Оскільки кількість записів даних різна (n1 = 10 і n2 = 20), а дисперсія також відрізняється, t-значення та ступінь свободи обчислюються для вищенаведеного набору даних, використовуючи формулу, згадану в T-тесті нерівної варіації. розділ.
Значення t становить -2, 24787. Оскільки знак мінус можна ігнорувати при порівнянні двох t-значень, обчислене значення становить 2, 224787.
Ступінь значення свободи становить 24, 38 і знижується до 24, завдяки визначенню формули, що вимагає округлення значення до найменшого можливого цілого значення.
Щоразу, коли передбачається нормальний розподіл, можна вказати рівень ймовірності (рівень альфа, рівень значущості, р ) як критерій прийняття. У більшості випадків можна припустити значення 5%.
Використовуючи ступінь значення свободи як 24 та 5% рівень значущості, погляд на таблицю розподілу t-значень дає значення 2, 064. Порівнюючи це значення з обчисленим значенням 2, 224 вказує на те, що обчислене t-значення більше, ніж табличне значення, при рівні значущості 5%. Тому безпечно відкинути нульову гіпотезу про відсутність різниці між засобами. Сукупність населення має внутрішні відмінності, і вони не випадкові.
Порівняйте інвестиційні рахунки × Пропозиції, що відображаються в цій таблиці, є партнерствами, від яких Інвестопедія отримує компенсацію. Опис постачальникаПов'язані умови
Як працює аналіз варіації (ANOVA) Аналіз дисперсії (ANOVA) - це інструмент статистичного аналізу, який розділяє загальну мінливість, виявлену в наборі даних, на два компоненти: випадкові та систематичні фактори. більше Визначення Z-тесту З-тест - це статистичний тест, який використовується для визначення того, чи відрізняються два засоби популяції, коли відомі дисперсії та великий розмір вибірки. більше Визначення ступенів свободи Ступінь свободи відноситься до максимальної кількості логічно незалежних значень, що є значеннями, які мають свободу змінюватись у вибірці даних. докладніше Розуміння розподілу T Розподіл AT - це тип функції ймовірності, який підходить для оцінки параметрів сукупності для невеликих розмірів вибірки або невідомих дисперсій. докладніше Які заходи напіввідхилення Напіввідхилення - це метод оцінки нижчих середніх коливань прибутковості інвестицій. Він використовується як альтернатива стандартному відхиленню. більше Тест Бонферроні Тест Бонферроні - це тест множинних порівнянь, який використовується у статистичному аналізі. більше Партнерські посиланняПов'язані статті
Економіка
Які припущення робляться при проведенні t-тесту?
Управління ризиками
Використання історичної мінливості для оцінки майбутнього ризику
Фондова торгова стратегія та освіта
Як використовувати Excel для імітації цін на акції
Фінансові коефіцієнти
Як обчислити IRR в Excel?
Математика та статистика
Що таке відносна стандартна помилка
Фінансові коефіцієнти
Яка формула для обчислення чистої теперішньої вартості (NPV) в Excel?
