Illustration pour le terme Data Warehouse

Data Warehouse

Catégorie : Architecture & Infrastructures

Définition

Un Data Warehouse, ou entrepôt de données, est une base de données centralisée, spécialement conçue pour stocker, organiser et analyser des données historiques provenant de plusieurs sources.

Contrairement aux bases de données transactionnelles (CRM, ERP…), le Data Warehouse est optimisé pour l’analyse, pas pour la saisie. Il contient des données :

  • nettoyées et structurées
  • historisées (données dans le temps)
  • agrégées ou détaillées, selon les besoins
  • modélisées (ex : schémas en étoile ou en flocon)

Il sert de référence unique et fiable pour les tableaux de bord, rapports métiers ou analyses avancées.


Exemple d’usage ou de contexte

Une entreprise veut analyser ses ventes en croisant les données :

  • de son site e-commerce (commandes)
  • de son CRM (clientèle)
  • de son ERP (stocks et livraisons)

Ces données sont extraites, nettoyées, enrichies, puis chargées dans un Data Warehouse où elles sont historisées par jour.
Les équipes peuvent ensuite construire des dashboards Power BI pour suivre les KPIs comme le panier moyen, le délai moyen de livraison, ou la fidélité client.


Structure typique

  • Tables de faits : contiennent les mesures chiffrées (ventes, nombre de clics…)
  • Tables de dimensions : donnent du contexte aux faits (temps, produit, client…)

Modélisation classique : schéma en étoile, flocon, ou vault


Comparaison avec d’autres concepts

ÉlémentData WarehouseData Lake
Type de donnéesStructuréesStructurées + non structurées
ModélisationAvant le stockage
(schema-on-write)
Après usage
(schema-on-read)
ObjectifReporting fiable & rapideExploration libre, data science
Coût du stockageMoyen à élevéFaible
Public principalDécideurs, analystes, finance…Data scientists, développeurs

Outils & solutions associés

  • Cloud : Snowflake, Google BigQuery, Amazon Redshift, Azure Synapse
  • On-premise : Teradata, Oracle, SQL Server (Data Warehouse Edition)
  • ETL/ELT associés : Talend, dbt, Fivetran, Azure Data Factory
  • Visualisation connectée : Power BI, Tableau, Looker

🧠 À retenir

Le Data Warehouse est le cœur analytique de l’entreprise : une base fiable, structurée, rapide, conçue pour prendre des décisions basées sur des données solides.