Межі трьох сигм

Що таке межа трьох сигм?

Межі трьох сигм – це статистичний розрахунок, коли дані знаходяться в межах трьох стандартних відхилень від середнього. У бізнес-додатках трисигма відноситься до процесів, які працюють ефективно та виробляють предмети найвищої якості.

Межі у три сигми використовуються для встановлення верхньої та нижньої меж контролю в статистичних діаграмах контролю якості. Діаграми контролю використовуються для встановлення меж виробничого або бізнес-процесу, що перебуває у стані статистичного контролю.

Основні винос:

  • Межі трьох сигм (межі 3 сигми) – це статистичний розрахунок, який посилається на дані в межах трьох стандартних відхилень від середнього.
  • Межі у три сигми використовуються для встановлення верхньої та нижньої меж контролю в статистичних діаграмах контролю якості.
  • На кривій дзвона дані, які лежать вище середнього та за лінією трьох сигм, становлять менше 1% усіх точок даних.

Розуміння меж трьох сигм

Діаграми контролю також відомі як схеми Шевхарта, названі на честь Вальтера А. Шевхарта, американського фізика, інженера та статистика (1891–1967).  Контрольні схеми базуються на теорії, згідно з якою навіть у ідеально спроектованих процесах властива певна мінливість вимірювань на виході.

Діаграми контролю визначають, чи є в процесі контрольована чи неконтрольована варіація. Зазначається, що зміни якості процесу через випадкові причини контролюють; неконтрольовані процеси включають як випадкові, так і особливі причини змін. Контрольні схеми призначені для визначення наявності особливих причин.

Для вимірювання варіацій статистики та аналітики використовують метрику, відому як стандартне відхилення, також звану сигмою. Сигма – це статистичне вимірювання мінливості, яке показує, наскільки існує відхилення від статистичного середнього.

Короткий огляд

Sigma вимірює, наскільки відхилені спостережувані дані від середнього або середнього; інвестори використовують стандартне відхилення для оцінки очікуваної волатильності, яка відома як історична волатильність.

Щоб зрозуміти це вимірювання, розглянемо нормальну криву дзвона, яка має нормальний розподіл. Чим далі праворуч або ліворуч на кривій дзвоника записується точка даних, тим вище або нижче, відповідно, дані перевищують середнє значення. З іншої точки зору, низькі значення вказують на те, що точки даних наближаються до середнього; високі значення вказують на те, що дані широко поширені і не близькі до середніх.

Приклад розрахунку межі трьох сигм

Давайте розглянемо виробничу фірму, яка проводить серію з 10 тестів, щоб визначити, чи є різниця у якості її продукції. Точки даних для 10 тестів – 8,4, 8,5, 9,1, 9,3, 9,4, 9,5, 9,7, 9,7, 9,9 та 9,9.

  1. Спочатку обчисліть середнє значення спостережуваних даних. (8,4 + 8,5 + 9,1 + 9,3 + 9,4 + 9,5 + 9,7 + 9,7 + 9,9 + 9,9) / 10, що дорівнює 93,4 / 10 = 9,34.
  2. По-друге, обчисліть дисперсію набору. Дисперсія – це розподіл між точками даних і обчислюється як сума квадратів різниці між кожною точкою даних та середнім значенням, поділена на кількість спостережень. Перший квадрат різниці буде обчислюватися як (8,4 – 9,34) 2 = 0,8836, другий квадрат різниці буде (8,5 – 9,34) 2 = 0,7056, третій квадрат може бути обчислений як (9,1 – 9,34) 2 = 0,0576, і так далі. Сума різних квадратів усіх 10 точок даних становить 2,564. Тому дисперсія становить 2,564 / 10 = 0,2564.
  3. По-третє, обчисліть стандартне відхилення, яке просто є квадратним коренем дисперсії. Отже, стандартне відхилення = √0,2564 = 0,5064.
  4. По-четверте, обчисліть трисигму, що на три стандартні відхилення перевищує середнє значення. У числовому форматі це (3 x 0,5064) + 9,34 = 10,9. Оскільки жодна з даних не знаходиться на такому високому рівні, виробничий процес тестування ще не досяг рівня якості з трьох сигм.

Особливі міркування

Термін “трисигма” вказує на три стандартні відхилення. Шевхарт встановив три межі стандартного відхилення (3-сигма) як раціональний та економічний орієнтир мінімальних економічних втрат. Межі трьох сигм встановлюють діапазон для параметра процесу на рівні 0,27% контрольних меж. Межі контролю в три сигми використовуються для перевірки даних із процесу та чи перебуває він у межах статистичного контролю. Це робиться шляхом перевірки, чи не перебувають точки даних у межах трьох стандартних відхилень від середнього. Верхня межа контролю (UCL) встановлюється на рівні трьох сигм вище середнього значення, а нижня межа контролю (LCL) встановлюється на рівні трьох сигм нижче середнього.

Оскільки близько 99,73% контрольованого процесу відбуватиметься в межах плюс-мінус три сигми, дані процесу повинні наближати загальний розподіл навколо середнього значення та в межах заздалегідь визначених меж. На кривій дзвона дані, які лежать вище середнього та за лінією трьох сигм, становлять менше 1% усіх точок даних.