Т-тест

29.04.2021

Що таке Т-тест?

T-тест – це тип інференціальної статистики, який використовується для визначення, чи існує суттєва різниця між засобами двох груп, які можуть бути пов’язані за певними ознаками. Він в основному використовується, коли набори даних, як набір даних, записаний як результат перегортання монети 100 разів, слідують за нормальним розподілом і можуть мати невідомі дисперсії. T-тест використовується як інструмент перевірки гіпотез, що дозволяє перевірити припущення, застосовне до сукупності.

T-тест розглядає статистику t, значення розподілу t та ступені свободи для визначення статистичної значущості. Для проведення тесту з трьома або більше способами необхідно використовувати дисперсійний аналіз.

Ключові винос

T-тест – це тип інференціальної статистики, який використовується для визначення, чи існує суттєва різниця між засобами двох груп, які можуть бути пов’язані за певними ознаками.
T-тест – один із багатьох тестів, що використовуються з метою перевірки гіпотез у статистиці.
Для розрахунку t-критерію потрібно три ключових значення даних. Вони включають різницю між середніми значеннями з кожного набору даних (що називається середньою різницею), стандартним відхиленням кожної групи та кількістю значень даних кожної групи.
Існує кілька різних типів t-тесту, які можна виконати залежно від даних та типу аналізу, що вимагається.

Пояснення Т-тесту

По суті, t-тест дозволяє нам порівняти середні значення двох наборів даних та визначити, чи походять вони з однієї сукупності. У наведених вище прикладах, якби ми взяли вибірку учнів із класу A та іншу вибірку учнів класу B, ми б не очікували, що вони матимуть абсолютно однакове середнє значення та стандартне відхилення. Подібним чином, зразки, відібрані у контрольної групи, яка отримувала плацебо, та у зразків, взятих із групи, призначеної препаратом, повинні мати дещо інше середнє значення та стандартне відхилення.

Математично, t-тест бере вибірку з кожного з двох наборів і встановлює постановку задачі, припускаючи нульову гіпотезу про рівність цих двох засобів. На основі застосовних формул певні значення обчислюються та порівнюються зі стандартними значеннями, і передбачувана нульова гіпотеза приймається або відхиляється відповідно.

Якщо нульова гіпотеза може бути відхилена, це свідчить про те, що зчитування даних є сильним і, можливо, не випадковим. T-тест – це лише один із багатьох тестів, що використовуються для цієї мети. Статистики повинні додатково використовувати тести, крім t-тесту, для вивчення більшої кількості змінних та тестів із більшими розмірами вибірки. Для великого обсягу вибірки статистики використовують z-тест. Інші варіанти тестування включають тест хі-квадрат та f-тест.

Існує три типи t-тестів, і вони класифікуються як залежні та незалежні t-тести.

Неоднозначні результати тесту

Вважайте, що виробник ліків хоче протестувати нещодавно винайдений препарат. Це дотримується стандартної процедури випробування препарату на одній групі пацієнтів і надання плацебо іншій групі, яка називається контрольною групою. Плацебо, дане контрольній групі, є речовиною, що не має терапевтичного значення, і служить еталоном для вимірювання реакції іншої групи, якій дано дійсний препарат.

Після випробування наркотиків члени контрольної групи, яка отримувала плацебо, повідомили про збільшення середньої тривалості життя на три роки, тоді як члени групи, яким призначили новий препарат, повідомили про збільшення середньої тривалості життя на чотири роки. Миттєве спостереження може свідчити про те, що препарат справді діє, оскільки результати кращі для групи, яка використовує препарат. Однак також можливо, що спостереження може бути спричинене випадковою подією, особливо дивовижною удачею. T-тест корисний для висновку, чи результати насправді правильні та застосовні до всієї сукупності.

У школі 100 учнів класу А набрали в середньому 85% зі стандартним відхиленням 3%. Ще 100 учнів, які належать до класу B, набрали в середньому 87% зі стандартним відхиленням 4%. Хоча середнє значення класу B є кращим, ніж середнє класу A, може бути неправильним робити висновок, що загальна успішність учнів класу B є кращою, ніж успішність учнів класу A. в тестах в обох класах, тому різниця може бути обумовлена лише випадковістю. T-тест може допомогти визначити, чи пройшов один клас краще за інший.

Припущення T-тесту

Перше припущення щодо t-тестів стосується масштабу вимірювання. Припущення для t-тесту полягає в тому, що шкала вимірювань, застосована до зібраних даних, відповідає безперервній або порядковій шкалі, наприклад, балам для тесту IQ.
Друге припущення – це прості випадкові вибірки, що дані збираються з репрезентативної, довільно вибраної частини загальної сукупності.
Третім припущенням є те, що дані, будуючи графік, призводять до нормального розподілу, кривої розподілу у формі дзвоника.
Остаточним припущенням є однорідність дисперсії. Однорідна або рівна дисперсія існує, коли стандартні відхилення зразків приблизно рівні.

Розрахунок Т-тестів

Для розрахунку t-критерію потрібно три ключових значення даних. Вони включають різницю між середніми значеннями з кожного набору даних (що називається середньою різницею), стандартним відхиленням кожної групи та кількістю значень даних кожної групи.

Результат t-тесту дає значення t. Потім це розраховане значення t порівнюється зі значенням, отриманим з таблиці критичних значень (так звана таблиця розподілу Т ). Це порівняння допомагає визначити вплив випадковості на різницю і чи не відрізняється вона за межами цього шансу. T-тест задає питання, чи представляє різниця між групами справжню різницю в дослідженні, чи це, можливо, безглузда випадкова різниця.

Таблиці розподілу Т

Таблиця розподілу Т доступна у форматах з одним та двома хвостами. Перший використовується для оцінки випадків, які мають фіксовану величину або діапазон з чітким напрямком (позитивним чи негативним). Наприклад, яка ймовірність вихідного значення залишається нижче -3 або отримує більше семи при киданні пари кубиків? Останній використовується для аналізу зв’язку з діапазоном, наприклад для запитання, чи не падають координати від -2 до +2.

Обчислення можна виконувати за допомогою стандартних програмних програм, що підтримують необхідні статистичні функції, як-от ті, що містяться в MS Excel.

Значення Т і ступені свободи

Результатом t-тесту є два значення: t-значення та ступінь свободи. Значення t – це відношення різниці між середнім значенням двох наборів вибірки та варіацією, яка існує в межах наборів вибірки. Хоча значення чисельника (різниця між середнім значенням двох наборів вибірки) є простим для обчислення, знаменник (варіація, яка існує в наборах вибірки) може дещо ускладнитися залежно від типу задіяних значень даних. Знаменник коефіцієнта – це вимірювання дисперсії або мінливості. Більш високі значення t-значення, також звані t-оцінкою, вказують на те, що існує велика різниця між двома наборами вибірки. Чим менше значення t, тим більше подібності існує між двома наборами вибірки.

Великий t-бал вказує на те, що групи різні.
Невеликий t-бал вказує на схожість груп.

Ступінь свободи відноситься до значень у дослідженні, яке має свободу змінюватись і є важливим для оцінки важливості та обгрунтованості нульової гіпотези. Обчислення цих значень зазвичай залежить від кількості записів даних, доступних у наборі зразків.

Корельований (або парний) T-тест

Корельований t-тест проводиться, коли зразки, як правило, складаються з відповідних пар подібних одиниць, або коли є випадки повторних вимірювань. Наприклад, можуть бути випадки, коли одні й ті ж пацієнти повторно тестуються – до і після отримання певного лікування. У таких випадках кожен пацієнт використовується як контрольний зразок проти себе.

Цей метод також застосовується до випадків, коли зразки якимось чином пов’язані або мають відповідні характеристики, наприклад, порівняльний аналіз за участю дітей, батьків чи братів і сестер. Корельовані або парні t-тести є залежним типом, оскільки вони включають випадки, коли два набори зразків пов’язані.

Формула для обчислення значення t і ступенів свободи для парного t-тесту має вигляд:

Решта два типи належать до незалежних t-тестів. Вибірки цих типів вибираються незалежно одна від одної, тобто набори даних у двох групах не посилаються на однакові значення. Вони включають такі випадки, як група з 100 пацієнтів, розділена на дві групи по 50 пацієнтів кожна. Одна з груп стає контрольною і отримує плацебо, тоді як інша група отримує призначене лікування. Це складає дві незалежні вибіркові групи, які не є парними між собою.

Т-тест з рівною дисперсією (або об’єднаний)

T-тест рівної дисперсії використовується, коли кількість зразків у кожній групі однакова, або дисперсія двох наборів даних однакова. Наступна формула використовується для обчислення величини t та ступенів свободи для t-критерію однакової дисперсії:

Т-валуе=мeaп1-мeaп2(п1-1)