Визначене середнє значення

Що таке Winsorized Mean?

Вінзоризоване середнє – це метод усереднення, який спочатку замінює найменші та найбільші значення найближчими до них спостереженнями. Це робиться для обмеження впливу викидів або ненормальних екстремальних значень або викидів на розрахунок. Після заміни значень формула середнього арифметичного потім використовується для обчислення середньовибраного середнього значення.

ключові винос

  • Винзоризоване середнє – це метод усереднення, який передбачає заміну найменших і найбільших значень набору даних найближчими до них спостереженнями.
  • Це пом’якшує наслідки викидів, замінюючи їх менш екстремальними значеннями.
  • Винзоризоване середнє значення – це не те саме, що обрізане середнє значення, яке передбачає видалення точок даних на відміну від їх заміни, хоча результати двох, як правило, близькі.

Формула середнього значення винзору

Винзоровані засоби виражаються двома способами. Визначене середнім значенням “k n ” відноситься до заміни “k” найменшого та найбільшого спостереження, де “k” – ціле число. Винзоризоване середнє значення “X%” передбачає заміну заданого відсотка значень з обох кінців даних.

Винзоризоване середнє значення досягається заміною найменших і найбільших точок даних, потім підсумовуванням усіх точок даних і діленням суми на загальну кількість точок даних.

Що означає підказка Winsorized?

Винзоризоване середнє менш чутливе до викидів, оскільки воно може замінити їх менш екстремальними значеннями. Тобто він менш сприйнятливий до відхилень від середнього арифметичного. Однак, якщо розподіл має жирові хвости, ефект від усунення найвищих і найнижчих значень у розподілі матиме незначний вплив через високий ступінь мінливості показників розподілу.

Приклад використання Вінзорізованого середнього

Давайте обчислимо винзоризоване середнє для наступного набору даних: 1, 5, 7, 8, 9, 10, 34. У цьому прикладі ми припускаємо, що середнє значення винзорізації знаходиться в першому порядку, в якому ми замінюємо найменші та найбільші значення на їх найближчі спостереження.

Тепер набір даних виглядає таким чином: 5, 5, 7, 8, 9, 10, 10. Беручи середнє арифметичне для нового набору, отримуємо середньовибране значення 7,7 або (5 + 5 + 7 + 8 + 9 + 10 + 10) ділиться на 7. Зверніть увагу, що середнє арифметичне має бути вище – 10,6. Винзоризоване середнє значення ефективно зменшує вплив значення 34 як викид.

Або розгляньте 20% винзоризованого середнього значення, яке бере 10% верхнього та нижнього 10% і замінює їх наступним найближчим значенням. Ми переглянемо наступний набір даних: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. найменші та найбільші точки даних – 10% з 20 точок даних – будуть замінені наступним найближчим значенням. Таким чином, новий набір даних такий: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61. Середнє значення за винзору дорівнює 33,9, або загальна кількість даних (678), поділена на загальну кількість точок даних (20).

Вінзоризоване середнє проти обрізаного середнього

Винзоризоване середнє включає в себе зміну точок даних, тоді як обрізане середнє означає видалення точок даних. Загальноприйнятим є те, що винзоризоване середнє та обрізане середнє мають бути близькими або часом дорівнювати за значенням одне одному.

Обмеження винзорованого середнього значення

Одним з основних недоліків винзорованих засобів є те, що вони, природно, вносять деяку упередженість у набір даних. За рахунок зменшення впливу вибіжних показників аналіз модифікується для кращого аналізу, але також вилучає інформацію про базові дані.