Описова статистика

Що таке описова статистика?

Дескриптивна статистика це короткі описові коефіцієнти, що узагальнюють заданий набір даних, який може бути або представленням всієї сукупності, або вибіркою сукупності. Описова статистика розбита на міри центральної тенденції та міри мінливості (поширення). Міри центральної тенденції включають середнє значення, медіану та моду, в той час як мінливість варіабельності включають середньоквадратичне ексцентричність та перекос.

Ключові винос

  • Описова статистика узагальнює або описує характеристики набору даних.
  • Описова статистика складається з двох основних категорій заходів: мір центральної тенденції та мір мінливості (або поширення).
  • Міри центральної тенденції описують центр набору даних.
  • Міри мінливості або поширення описують розподіл даних у межах набору.

Розуміння описової статистики

Описова статистика, коротше кажучи, допомагає описати та зрозуміти особливості конкретного набору даних, даючи короткі резюме про вибірку та виміри даних. Найвизнанішими типами описової статистики є показники центру: середнє значення, медіана та режим, які використовуються майже на всіх рівнях математики та статистики. Середнє значення, або середнє значення, обчислюється шляхом додавання всіх цифр у наборі даних, а потім ділення на кількість цифр у наборі. Наприклад, сума наступного набору даних дорівнює 20: (2, 3, 4, 5, 6). Середнє значення – 4 (20/5). Режим набору даних – це значення, яке з’являється найчастіше, а медіана – це цифра, розташована посередині набору даних. Це цифра, що відокремлює вищі показники від нижчих цифр у наборі даних. Однак існують менш поширені типи описової статистики, які все ще дуже важливі.

Люди використовують описову статистику, щоб перепрофілювати важко зрозумілі кількісні уявлення для великого набору даних в описи розміру укусу. Наприклад, середній бал студента (GPA) дає гарне розуміння описової статистики. Ідея середнього балу полягає в тому, що для отримання загального розуміння загальної академічної успішності студента він бере бали даних з широкого спектра іспитів, класів та оцінок, а також їх усереднює. Особистий середній бал студента відображає їх середню успішність.

Заходи описової статистики

Усі описові статистичні дані є або мірами центральної тенденції, або мірами мінливості, також відомими як міри дисперсії. Міри центральної тенденції фокусуються на середніх чи середніх значеннях наборів даних, тоді як міри мінливості фокусуються на розпорошенні даних. Ці два виміри використовують графіки, таблиці та загальні обговорення, щоб допомогти людям зрозуміти значення аналізованих даних.

Міри центральної тенденції описують центральну позицію розподілу для набору даних. Людина аналізує частоту кожної точки даних у розподілі та описує її, використовуючи середнє значення, медіану або режим, що вимірює найпоширеніші закономірності аналізованого набору даних.

Міри мінливості або міри розповсюдження допомагають проаналізувати розподіл розподілу для набору даних. Наприклад, хоча показники центральної тенденції можуть дати людині середнє значення набору даних, воно не описує, як дані розподіляються в межах набору. Отже, хоча середнє значення даних може становити 65 із 100, все одно можуть бути точки даних як на 1, так і на 100. Міри мінливості допомагають повідомляти це, описуючи форму та розповсюдження набору даних. Діапазон, квартилі, абсолютне відхилення та дисперсія – все це приклади мір мінливості.

Розглянемо наступний набір даних: 5, 19, 24, 62, 91, 100. Діапазон цього набору даних становить 95, який обчислюється шляхом віднімання найменшого числа (5) у наборі даних від найвищого (100).

Питання що часто задаються

Навіщо нам потрібна статистика, яка просто описує дані?

Описова статистика використовується для опису або узагальнення характеристик вибірки або набору даних, таких як середнє значення середньої величини, стандартне відхилення або частота. Довідкова статистика. Цей тип статистики може допомогти нам зрозуміти сукупні властивості елементів вибірки даних. Ці міри можуть дати нам уявлення про розподіл ймовірностей  або загальну “форму” даних, які можна зобразити на діаграмі, такі як гістограма або крапкова діаграма. Знання вибіркового середнього значення, дисперсії та розподілу змінної може допомогти нам зрозуміти навколишній світ.

Що означають середнє та стандартне відхилення?

Це дві часто використовувані описові статистичні дані. Середнє значення – це середній рівень, який спостерігається в деяких фрагментах даних, тоді як стандартне відхилення описує дисперсію або те, як розподілені дані, що спостерігаються у цій змінній, розподіляються навколо середнього значення.

Чи можна використовувати описову статистику для висновку чи прогнозування?

Ні. Хоча ці описи корисні для розуміння атрибутів даних, умовні статистичні методи – окрема галузь статистики – потрібні, щоб зрозуміти, як змінні взаємодіють між собою в наборі даних.