Зберігання даних

Що таке зберігання даних?

Зберігання даних – це електронне зберігання великої кількості інформації бізнесом чи організацією. Зберігання даних – це життєво важлива складова бізнес-аналітики, яка використовує аналітичні прийоми для ділових даних.

Концепція зберігання даних була введена в 1988 році дослідниками IBM Баррі Девліном та Полом Мерфі. Потреба у зберіганні даних розвивалася в міру ускладнення комп’ютерних систем та обробки все більших обсягів даних. Ключовою книгою про зберігання даних є “побудова сховища даних” WH Inmon, яка була вперше опублікована в 1990 році і з тих пір перевидавалася кілька разів.

Як працює зберігання даних

Зберігання даних використовується для забезпечення кращого розуміння результатів діяльності компанії шляхом порівняння даних, консолідованих з різних різнорідних джерел. Сховище даних призначене для запуску запитів та аналізу історичних даних, отриманих з транзакційних джерел.

Після того, як дані включені в склад, вони не змінюються і не можуть бути змінені, оскільки сховище даних запускає аналітику щодо подій, які вже відбулися, зосереджуючись на змінах даних із часом. Дані, що зберігаються у складі, повинні зберігатися безпечним, надійним, простим способом отримання та управлінням.

Існують певні кроки для створення сховища даних. Першим кроком є ​​вилучення даних, який передбачає збір великих обсягів даних з кількох точок джерела. Після того, як дані скомпільовані, вони проходять очищення даних, процес їх розчісування для виявлення помилок та виправлення або виключення виявлених помилок.

Далі очищені дані перетворюються з формату бази даних у формат складу. Після того, як вони зберігаються на складі, дані проходять сортування, консолідацію, узагальнення тощо, щоб вони були більш скоординованими та простішими у використанні. З часом у склад додається більше даних, оскільки оновляються різні джерела даних.

Ключові винос

  • Зберігання даних – це електронне зберігання великої кількості інформації бізнесом чи організацією.
  • Склад даних призначений для запуску запитів та аналізу історичних даних, отриманих з транзакційних джерел, для цілей бізнес-аналітики та аналізу даних.
  • Зберігання даних використовується для забезпечення кращого розуміння результатів діяльності компанії шляхом порівняння даних, консолідованих з різних різнорідних джерел.

Особливі міркування: видобуток даних

Підприємства можуть зберігати дані для використання в розвідці та видобутку даних, шукаючи моделі інформації, які допоможуть їм покращити свої бізнес-процеси. Хороша система зберігання даних може також спростити доступ різних даних підрозділів компанії до даних один одного.

Наприклад, сховище даних може дозволити компанії легко оцінити дані команди продажів і допомогти прийняти рішення про те, як покращити продажі або впорядкувати відділ. Бізнес може зосередитись на звичках витрат своїх клієнтів, щоб краще позиціонувати свою продукцію та збільшувати продажі.

Зберігаючи дані, компанія може збирати історичні дані про витрати своїх клієнтів за минуле – скажімо, 20 років – і проводити аналітику на цих даних. Отримана інформація може надати розуміння уподобань своїх споживачів; час доби, місяця або року з більшими продажами; або найвищий витрата клієнта за рік.

Ефективне зберігання та управління даними – це також те, що робить можливим такі процеси, як ініціювання бронювання подорожей та використання автоматизованих касових автоматів.

Процес видобутку даних складається з п’яти етапів:

  1. Організації збирають дані та завантажують їх у свої сховища даних.
  2. Потім вони зберігають дані та керують ними на власних серверах або в хмарі.
  3. Бізнес-аналітики, управлінські групи та фахівці з інформаційних технологій отримують доступ до даних та визначають, як вони хочуть їх організувати.
  4. Потім прикладне програмне забезпечення сортує дані на основі результатів користувача
  5. Кінцевий користувач, нарешті, представляє дані у форматі, яким легко поділитися, наприклад, графіку або таблиці.

Складання даних проти баз даних

Сховище даних – це не обов’язково те саме поняття, що і стандартна база даних. База даних – це транзакційна система, яка налаштована для моніторингу та оновлення даних у режимі реального часу, щоб мати доступні лише найсвіжіші дані. Сховище даних запрограмоване для агрегування структурованих даних протягом певного періоду часу. Наприклад, у базі даних може бути лише остання адреса клієнта, тоді як у сховищі даних можуть бути всі адреси, які клієнт проживав протягом останніх 10 років.