Glossaire
Data mesh
Le Data mesh est une approche décentralisée et fédérée de la gestion des données qui permet le partage et la démocratisation des données dans toute l'organisation.
Qu’est-ce que le Data mesh ?
Le concept de Data mesh désigne une architecture de données d’entreprise basée sur une approche distribuée et décentralisée de la gestion et du partage des données.
Il est conçu pour accroître l’utilisation des données dans l’ensemble de l’organisation, permettant aux entreprises de s’axer sur les données en accélérant la mise à l’échelle, le partage et la création de services data. Le Data mesh soutient donc des stratégies visant à assurer la démocratisation des données.
Le concept a été initialement proposé par Zhamak Dehghani du cabinet de conseil Thoughtworks en 2019, et a depuis été développé et adopté par plusieurs organisations.
Contrairement aux architectures de données précédentes, le Data mesh se focalise sur l’organisation elle-même, plutôt que sur la technologie. Il cherche à décentraliser les responsabilités liées aux données en les imputant à ceux qui en sont les plus proches. Une gouvernance commune est bien sûr conservée à l’échelon de toute l’entreprise et sur des normes de métadonnées pour garantir l’interopérabilité. L’architecture est mise en œuvre par une infrastructure de données partagée en libre-service.
Il s’agit essentiellement d’un modèle fédéré, un peu comme les États-Unis d’Amérique, avec un gouvernement central partiel, le pouvoir et la responsabilité étant néanmoins détenus par ceux qui sont les plus proches des citoyens : les États.
Quels sont les principes du Data mesh ?
Contrairement aux data warehouse ou data lakehouse, le Data mesh n’est pas un outil ou une technologie spécifique. Il s’agit plutôt d’un ensemble de principes qui définissent la manière dont les entreprises gouvernent, travaillent et partagent les données au sein de l’organisation.
Il repose sur quatre principes clés :
- Propriété des données : plutôt qu’une équipe centrale, les données appartiennent à ceux qui en sont les plus proches, comme ceux qui les créent. Les responsables sont chargés de s’assurer que les données sont disponibles, fiables, sécurisées, interopérables et compréhensibles par tous.
- Les données en tant que produit : pour être partageables, les données sont pensées sous formes de produit et permettent donc de résoudre les problèmes.
- Plateforme de données libre-service : les données doivent être accessibles à tous via le libre-service, afin qu’elles puissent être consultées facilement sans nécessiter de support supplémentaire.
- Gouvernance informatique fédérée : les normes de gouvernance des données et de métadonnées sont convenues et gérées de manière centralisée pour garantir l’interopérabilité, la cohérence et la sécurité.
Quels sont les avantages du Data mesh ?
Les organisations veulent pouvoir partager des données en interne pour améliorer la prise de décision, accroître la transparence et stimuler l’innovation. C’est ce que permet le Data mesh grâce à :
- Un accès plus rapide à des produits de données compréhensibles par l’ensemble de l’entreprise
- Un développement plus simple et plus rapide des services data grâce à des équipes indépendantes et responsables de leurs propres données
- Une plus grande réutilisabilité avec des équipes qui partagent des processus et apprennent les unes des autres, obtenant des résultats plus rapides avec moins de ressources.
- Un langage et un vocabulaire communs autour des données qui sont partagés par l’ensemble de l’entreprise, garantissant une cohérence et une compréhension commune.
- Une gouvernance centralisée qui garantit des normes communes en matière de sécurité et de métadonnées, ce qui signifie que les besoins de conformité réglementaire sont satisfaits.
- Une plus grande flexibilité en matière d’outils car les équipes peuvent utiliser l’outil le mieux adapté à leurs besoins, ce qui leur donne de l’indépendance et augmente leur adhésion au programme.
- Des équipes responsabilisées et considérées comme des experts du domaine, leur expertise étant valorisée, stimulant davantage l’engagement et maximisant l’utilisation des ressources.
En quoi le Data mesh diffère-t-il des autres méthodologies de gestion des données ?
Il existe deux principales différences entre le Data mesh et les autres méthodologies de gestion des données :
- Les données ne sont pas centralisées (comme dans un data lake). Les propriétaires des données sont répartis dans toute l’organisation, soutenus par une gouvernance centralisée.
- Le Data mesh n’est pas une technologie spécifique puisque tous les outils existants sont compatibles avec le maillage de données. Cela signifie que les entreprises peuvent commencer par leur stratégie et leurs objectifs, puis déployer les bons outils pour répondre à leurs besoins. Cela évite le risque que des projets échouent, prennent trop de temps à être mis en œuvre ou ne produisent pas suffisamment de résultats.
Comment adopter le Data mesh ?
Contrairement aux projets de données traditionnels, le Data mesh repose moins sur la technologie et davantage sur la mise en œuvre d’une approche axée sur les données dans toute l’organisation. Cela peut conduire à trois défis principaux :
- Construire une culture des données commune en éliminant les silos et en procédant à une gestion approfondie du changement dans l’ensemble de l’organisation. Cela demande un investissement en temps et en ressources.
- Instaurer des règles communes concernant la gouvernance des données dans tous les départements. Cela nécessite un engagement et une adhésion de toutes les équipes.
- Adopter une approche stratégique qui identifie les problèmes à résoudre en premier, plutôt que de simplement adopter une technologie.
En savoir plus
Accès aux données
Quelles sont les différences entre un business glossary, un data dictionary et un data catalog ?
Les organisations font face à une explosion sans précédent des volumes de données. Éparpillées sous divers formats, ces informations s’avèrent difficiles à organiser, analyser et valoriser. Pourtant, la data devient plus que jamais le socle des décisions éclairées et de l'innovation.
Accès aux données
Comment éliminer les silos organisationnels et réussir votre projet data
Les silos organisationnels sont un véritable frein au partage des données et à la collaboration, augmentant les risques tout en limitant l’efficacité et l’innovation. Comment les supprimer pour favoriser une circulation fluide des données au sein de l’entreprise ?
Tendances
Les 5 principaux défis rencontrés par les Chief Data Officers
Toute entreprise ayant pour ambition de devenir data-centric a besoin d’un Chief Data Officer dont le rôle est de garantir à chaque utilisateur un accès immédiat aux informations dont il a besoin. Découvrez les défis auxquels il est confronté, et quelles sont les stratégies et technologies à adopter pour les surmonter.