Таблиця нормального розподілу

Що таке нормальний розподіл?

Нормальний розподіл формула заснована на двох простих parameters- середнього і стандартного відхилення -Який кількісної характеристики даного набору даних. Хоча середнє значення вказує на “центральне” або середнє значення всього набору даних, стандартне відхилення вказує на “розподіл” або зміну точок даних навколо цього середнього значення.

Приклад

Розглянемо наступні 2 набори даних:

  1. Набір даних 1 = {10, 10, 10, 10, 10, 10, 10, 10, 10, 10}
  2. Набір даних 2 = {6, 8, 10, 12, 14, 14, 12, 10, 8, 6}

Для набору даних1 середнє = 10 і стандартне відхилення (stddev) = 0

Для набору даних2 середнє = 10 і стандартне відхилення (stddev) = 2,83

Давайте побудуємо ці значення для DataSet1:

Аналогічно для DataSet2:

Червона горизонтальна лінія на обох згаданих графіках вказує на “середнє” або середнє значення кожного набору даних (10 в обох випадках). Рожеві стрілки на другому графіку вказують на розповсюдження або відхилення значень даних від середнього значення. Це представлено значенням стандартного відхилення 2,83 у випадку DataSet2. Оскільки DataSet1 має всі значення однакові (як 10 по кожному) і не має змін, значення stddev дорівнює нулю, а отже, жодні рожеві стрілки не застосовуються.

Значення stddev має кілька важливих та корисних характеристик, які надзвичайно допомагають при аналізі даних. Для нормального розподілу значення даних симетрично розподіляються по обидві сторони від середнього. Для будь-якого нормально розподіленого набору даних, побудова графіку з stddev на горизонтальній осі та без. значень даних по вертикальній осі, отримано наступний графік.

Властивості нормального розподілу

  1. Нормальна крива симетрична щодо середнього;
  2. Середнє значення знаходиться посередині і ділить область на дві половини;
  3. Загальна площа під кривою дорівнює 1 для середнього = 0 і stdev = 1;
  4. Розподіл повністю описується середнім значенням і stddev

Як видно з наведеного графіку, stddev представляє наступне:

  • 68,3%  значень даних знаходяться в межах 1 стандартного відхилення середнього значення (від -1 до +1)
  • 95,4%  значень даних знаходяться в межах  2 стандартних відхилень  середнього значення (від -2 до +2)
  • 99,7%  значень даних знаходяться в межах  3 стандартних відхилень  середнього значення (від -3 до +3)

Площа під кривою у формі дзвона, коли вимірюється, вказує на бажану ймовірність даного діапазону:

  • менше X: – наприклад, ймовірність значення даних менше 70
  • перевищує X – наприклад, ймовірність того, що значення даних перевищують 95
  • між X 1 і X 2  – наприклад, ймовірність значень даних між 65 і 85

де X – ціннісне значення (приклади нижче).

Побудова та обчислення площі не завжди зручно, оскільки різні набори даних матимуть різні середні та stddev значення. Для полегшення єдиного стандартного методу для простих розрахунків та застосовності до реальних проблем було введено стандартне перетворення на Z-значення, які складають частину таблиці нормального розподілу.

Z = (X – середнє) / stddev, де X – випадкова величина.

По суті, це перетворення змушує середнє значення та значення stddev стандартизувати відповідно до 0 та 1, що дозволяє використовувати стандартний набір значень Z (із таблиці нормального розподілу ) для легких розрахунків. Знімок стандартної таблиці значень z, що містить значення ймовірності, виглядає наступним чином:

Щоб знайти ймовірність, пов’язану зі значенням z 0,239865, спочатку округніть її до 2 знаків після коми (тобто 0,24). Потім перевірте перші 2 значущі цифри (0,2) у рядках та найменш значущу цифру (залишилося 0,04) у стовпці. Це призведе до значення 0,09483.

Повну таблицю нормального розподілу з точністю до 5 знаків після коми для значень ймовірності (у тому числі для негативних значень) можна знайти тут.

Давайте подивимось кілька прикладів із реального життя. Висота особин у великій групі відповідає нормальній схемі розподілу. Припустимо, що ми маємо набір із 100 особин, висота яких реєструється, а середнє значення та stddev обчислюються відповідно до 66 та 6 дюймів.

Ось кілька зразків запитань, на які можна легко відповісти за допомогою таблиці z-value:

  • Яка ймовірність того, що людина в групі має 70 дюймів і менше?

Питання полягає в тому, щоб знайти сукупне значення P (X <= 70), тобто у всьому наборі даних 100, скільки значень буде між 0 і 70.

Спочатку перетворимо значення X на 70 в еквівалентне значення Z.

Z = (X – середнє) / stddev = (70-66) / 6 = 4/6 = 0,66667 = 0,67 (округлити до 2 знаків після коми)

Тепер нам потрібно знайти P (Z <= 0,67) = 0, 24857 (з таблиці z вище)

тобто існує 24,857% ймовірності того, що особа в групі буде менше або дорівнює 70 дюймів.

Але тримайся – вищезазначене є неповним. Пам’ятайте, ми шукаємо ймовірність усіх можливих висот до 70, тобто від 0 до 70. Вищезазначене просто надає вам частку від середнього до бажаного значення (тобто від 66 до 70). Нам потрібно включити другу половину – від 0 до 66 – щоб отримати правильну відповідь.

Оскільки від 0 до 66 представляє половину порції (тобто одну середню до середньої величини), її ймовірність становить просто 0,5.

Звідси правильна ймовірність того, що людина має 70 дюймів або менше = 0,24857 + 0,5 = 0,74857 = 74,857%

Графічно (шляхом обчислення площі) це дві підсумовані області, що представляють рішення:

  • Яка ймовірність того, що людина має 75 дюймів і вище?

тобто знайти додатковий кумулятивний  P (X> = 75).

Z = (X – середнє) / stddev = (75-66) / 6 = 9/6 = 1,5

P (Z> = 1,5) = 1- P (Z <= 1,5) = 1 – (0,5 + 0,43319) = 0,06681 = 6,681%

  • Яка ймовірність того, що людина знаходиться між 52 дюймами та 67 дюймами?

Знайдіть P (52 <= X <= 67).

P (52 <= X <= 67) = P [(52-66) / 6 <= Z <= (67-66) / 6] = P (-2,33 <= Z <= 0,17)

= P (Z <= 0,17) –P (Z <= -0,233) = (0,5 + 0,56749) – (.40905) =

Ця нормальна таблиця розподілу (і значення z) зазвичай знаходить застосування для будь-яких розрахунків ймовірності щодо очікуваних змін ціни на фондовому ринку акцій та індексів. Вони використовуються в торгівлі на основі діапазону, ідентифікації висхідного або низхідного тренду, рівнів технічних показників, заснованих на нормальних концепціях розподілу середнього та стандартного відхилення.