Що таке зберігання даних?
Складування даних - це електронне зберігання великого обсягу інформації бізнесом чи організацією. Зберігання даних є найважливішим компонентом бізнес-аналітики, яка використовує аналітичні прийоми для бізнес-даних.
Концепція зберігання даних була введена в 1988 році дослідниками IBM Баррі Девліном та Полом Мерфі. Необхідність зберігання даних розвивалася в міру того, як комп'ютерні системи стали більш складними та обробляли все більші обсяги даних. Ключовою книгою щодо зберігання даних є "Вбудований сховище даних" У.Інмона, який вперше був опублікований у 1990 році і з тих пір перевидавався кілька разів.
Як працює зберігання даних
Складування даних використовується для більш глибокого розуміння результатів діяльності компанії шляхом порівняння даних, консолідованих з декількох неоднорідних джерел. Склад даних призначений для запуску запитів та аналізу історичних даних, отриманих з транзакційних джерел.
Після того, як дані були включені у склад, вони не змінюються і не можуть бути змінені, оскільки сховище даних виконує аналітику подій, які вже відбулися, зосереджуючись на зміні даних у часі. Дані, що зберігаються, повинні зберігатися таким чином, що є надійним, надійним, легким для отримання та зручним керуванням.
Для створення сховища даних вживаються певні кроки. Перший крок - це вилучення даних, що включає збір великої кількості даних з декількох точок джерела. Після того, як дані були зібрані, він проходить очищення даних, процес перебирання даних для помилок та виправлення або виключення будь-яких знайдених помилок.
Потім очищені дані перетворюються з формату бази даних у складський формат. Коли вони зберігаються на складі, дані проходять сортування, консолідацію, узагальнення тощо, щоб вони були більш узгодженими та легшими у використанні. З часом на склад додається більше даних, оскільки оновлюються численні джерела даних.
Ключові вивезення
- Складування даних - це електронне зберігання великого обсягу інформації бізнесом або організацією. Склад даних призначений для запуску запитів та аналізу історичних даних, отриманих з транзакційних джерел для цілей бізнес-розвідки та обміну даними. Складування даних використовується для забезпечення більшої кількості розуміння результатів діяльності компанії шляхом порівняння даних, консолідованих з декількох неоднорідних джерел.
Особливі міркування: обмін даними
Підприємства можуть зберігати дані для використання в розвідці та видобутку даних, шукаючи шаблони інформації, які допоможуть їм покращити бізнес-процеси. Хороша система зберігання даних також може полегшити доступ до даних один одному для різних відділів компанії.
Наприклад, сховище даних може дозволити компанії легко оцінювати дані торгової групи та допомагати приймати рішення щодо покращення продажів або впорядкування відділу. Бізнес може вирішити зосередитись на споживчих звичаях своїх клієнтів, щоб краще позиціонувати свою продукцію та збільшити продажі.
За допомогою зберігання даних компанія може зібрати історичні дані про витрати своїх клієнтів за минулі, скажімо, 20 років, та провести аналітику цих даних. Отримана інформація могла б дати уявлення про переваги своїх споживачів; час доби, місяця чи року з більшими продажами; або найвищий споживач за рік.
Ефективне зберігання та управління даними - це також те, що робить можливими такі процеси, як ініціювання бронювання подорожей та використання автоматизованих автоматів.
Процес передачі даних розбивається на п’ять етапів:
- Організації збирають дані та завантажують їх у свої сховища даних. Потім вони зберігають та керують даними на власних серверах або у хмарі. Аналітики бізнесу, управлінські команди та фахівці з інформаційних технологій отримують доступ до даних та визначають, як вони хочуть їх упорядкувати. Потім програмне програмне забезпечення сортує дані на основі результатів користувача. Кінцевий користувач, нарешті, представляє дані у простому для обміну форматі, наприклад, графік або таблиця.
Склад даних проти баз даних
Сховище даних - це не обов'язково те саме поняття, що і стандартна база даних. База даних - це транзакційна система, яка встановлюється для моніторингу та оновлення даних у режимі реального часу, щоб мати лише найсвіжіші дані. Склад даних запрограмований для агрегації структурованих даних протягом певного періоду часу. Наприклад, база даних може мати лише останню адресу клієнта, тоді як у сховищі даних можуть бути всі адреси, за якими проживав клієнт протягом останніх 10 років.
