Illustration pour le terme Datamesh

Data Mesh

Catégorie : Stratégie & Métier

Définition

Le Data Mesh est une approche décentralisée de l’architecture data, qui vise à résoudre les problèmes de scalabilité, de lenteur et de centralisation rencontrés par les plateformes de données traditionnelles.

Au lieu de tout regrouper dans un unique entrepôt centralisé (data lake ou data warehouse), le Data Mesh repose sur l’idée que chaque domaine métier devient responsable de ses propres données et les gère comme un produit.


Les 4 principes fondamentaux du Data Mesh

  1. Domain Ownership
    → Chaque équipe métier gère ses propres données : elle en est responsable du début à la fin.
  2. Data as a Product
    → Les données sont traitées comme un produit consommable (avec documentation, qualité, SLA…).
  3. Self-service Infrastructure
    → Une plateforme technologique fournit des outils mutualisés pour que les équipes publient et accèdent aux données facilement (ETL, catalogues, API…).
  4. Federated Governance
    → Une gouvernance commune mais décentralisée, avec des standards partagés entre les domaines.

Exemple d’usage ou de contexte

Dans une grande entreprise multinationale :

  • Le service RH gère et expose ses propres données “employés”
  • Le service logistique gère ses données “livraisons”
  • Le marketing produit ses données “campagnes”

Chaque équipe publie ses propres jeux de données avec une documentation claire, des règles de qualité, et les met à disposition dans un catalogue partagé. Les analystes peuvent ensuite combiner ces données sans attendre un projet centralisé de la DSI.


Pourquoi le Data Mesh a émergé ?

Problème rencontré avec l’approche classiqueRéponse du Data Mesh
Goulots d’étranglement côté IT / DSIDécentralisation de la production de data
Mauvaise connaissance métier des équipes DataResponsabilité rendue aux métiers
Plateformes coûteuses et rigidesScalabilité distribuée

Technologies & pratiques associées

  • Plateformes : Snowflake, Databricks, AWS Lake Formation, DataHub
  • Catalogue de données : Collibra, Alation, Microsoft Purview
  • Orchestration : dbt, Apache Airflow, Fivetran
  • Culture organisationnelle : Product thinking, Data as a Product

🧠 À retenir

Le Data Mesh est à la donnée ce que les microservices sont au développement logiciel :
une philosophie de distribution et d’autonomie, fondée sur la collaboration et la responsabilisation.