Храни́лище да́нных (англ. Data Warehouse) — предметно-ориентированная информационная база данных, специально разработанная и предназначенная для подготовки отчётов и бизнес-анализа с целью поддержки принятия решений в организации.
Любая передача внутри хранилищ данных — ETL (аббревиатура от Extract, Transform, Load).
В основу такой модели закладывается четкое разделение данных на измерения (Dimension) и факты (Fact).
Факт — строка в таблице, которая является точечным событием (нет продолжительности)
Факт (fact) — это набор связанных элементов данных, содержащих метрики и описательные данные. Каждый фактобычно представляет элемент данных, численно описывающий деятельность организации, бизнес-операцию или событие, которое может быть использовано для анализа деятельности организации или бизнес-процессов. В ХД факты сохраняются в базовых таблицах реляционной БД. Например, стоимость товара, количество единиц товара и т.д.
Факт — транзакционное событие → у него есть много измерений
Измерение (dimension) — это интерпретация факта с некоторой точки зрения в реальном мире. Измерения, подобно атрибутам, содержат текстовые значения, которые сильно связаны по смыслу между собой.
Измерения задаются перечислением своих элементов (members). Элемент измерения (dimensional member) — уникальное имя или идентификатор (лингвистическая переменная), используемая для определения позиции элемента. Например, измерение " Время " может содержать следующие элементы: "все месяцы", "кварталы", "годы".
Измерение — мера события (справочник) → могут иметь под собой точечные события
Три типа модели данных:
На данный момент для разработки хранилища данных используются 2 известных архитектурных стиля: архитектура Inmon и архитектура Kimball. Ральф Кимбалл и Билл Инмон предлагают разные подходы к проектированию. Основным различием является способ моделирования структуры данных, их загрузки и хранения.