Qu’est-ce que le Data Mesh et comment peut-il accélérer la démocratisation des données ?
Le Data Mesh, ou maillage de données, est une approche permettant de construire une architecture de données qui favorise leur partage et leur réutilisation. Pour en savoir plus sur les bénéfices de l’approche Data Mesh pour démocratiser les données, nous avons interrogé David Thoumas, CTO et co-fondateur d'Opendatasoft.
L’approche Data Mesh et l’architecture qu’elle sous-tend favorise la réutilisation des données dans toute l’organisation. Premièrement défini par Zhamak Dehghani, de Thoughtworks, en 2019, cette approche privilégie un traitement distribué et décentralisé des données qui accélère le partage et la création de services data.
Compte tenu de l’intérêt croissant que suscite le terme “Data Mesh”, nous avons interrogé David Thoumas, CTO et co-fondateur d’Opendatasoft, sur les bénéfices d’une telle approche pour démocratiser les données.
Qu'est-ce que le Data Mesh et quels problèmes résout-il ?
Le Data Mesh ne désigne pas les outils utilisés, ni une technologie ou une architecture spécifique. Il concerne plutôt les choix pris en matière de gouvernance, de gestion et de partage des données au sein de votre organisation.
Contrairement aux architectures de données présentes actuellement dans les organisations, l’approche Data Mesh s’adapte à tout type de structure avec pour objectif d’avoir une circulation des données fluide et raisonnée. Cette approche permet de décentraliser les responsabilités liées aux données en les imputant à ceux qui en sont les plus proches. Le tout cadré par une stratégie de gouvernance à l’échelle de l’organisation et basée sur des normes de métadonnées pour garantir l’interopérabilité et sur une infrastructure de données partagée en libre-service.
En d’autres termes, l’approche Data Mesh peut être vue comme un modèle fédéré, à l’image des États-Unis d’Amérique : avec un gouvernement central partiel, le pouvoir et la responsabilité restant toutefois détenus par les États, qui sont au plus proches des citoyens.
Pourquoi adopter le Data Mesh ?
L’approche Data Mesh fournit une structure et des directives qui vous permettent de gérer les données d’une façon optimisée :
- Des services data articulés par sous-domaines et détenus par des équipes pluridisciplinaires indépendantes qui font intervenir à la fois des spécialistes et les propriétaires des données
- Une gouvernance centralisée garantissant l’interopérabilité, la cohérence et la sécurité
- Une infrastructure de données commune chargée d’héberger, d’enrichir et de partager les données
Data Mesh : quelles différences avec les autres méthodologies de données ?
Jusqu’à présent, on observe que la pratique générale est de centraliser l’ensemble des données dans des outils experts : data lake, data warehouse, etc. À l’usage, on observe pourtant que ces investissements ne permettent pas de réellement démocratiser les données puisqu’elles restent entre les mains des experts.
Au contraire, l’approche Data Mesh est compatible avec tous types de solutions, et donc avec celles qui correspondent aux besoins de votre organisation. Il est, par exemple, tout à fait possible d’utiliser un data lake et d’adopter une approche Data Mesh. L’objectif est de définir d’abord les problèmes à résoudre et non de donner la priorité à la technologie. Vous choisissez ainsi des outils parfaitement adaptés aux problématiques de chaque département dans votre organisation. Cette approche à l’avantage majeur de réduire le risque d’échec des projets, dû à une mise en œuvre trop longue ou des résultats insuffisants.
Quels sont les avantages du Data Mesh ?
Quel que soit le secteur d’activité, le but de toute organisation est de mieux exploiter ses données pour gagner en efficacité, en transparence et pour générer de nouveaux revenus ou améliorer son attractivité. C’est la raison pour laquelle les entreprises sont de plus en plus nombreuses à lancer des portails internes en libre-service pour partager des données avec les employés ou qu’elles créent des services data destinés à être partagés avec leurs écosystèmes.
Le Data Mesh apporte de nombreux avantages :
- Une innovation accrue grâce à cette approche qui donne les moyens aux collaborateurs de développer des services data rapidement pour une réutilisation en interne et/ou en externe.
- Une meilleure efficacité en interne grâce à la suppression du passage obligé par une équipe de données centrale et une meilleure allocation des ressources et des compétences au sein des équipes.
- Une meilleure communication sur la gestion des données dans toute l’entreprise, grâce à un vocabulaire et un langage partagés.
- Une plus grande facilité à engager les équipes qui peuvent utiliser l’outil qu’elles souhaitent ou qui correspond le mieux à leurs besoins. Les besoins étant définis plus précisément, cela réduit également les coûts des outils en termes de licences et de formation.
- Une meilleure collaboration grâce à une responsabilisation de toutes les équipes sur les sujets data et des objectifs communs.
Quels sont les challenges pour adopter une approche Data Mesh ?
L’adoption de l’approche Data Mesh est une transformation en soi et est un projet à mener sur le long terme. Comme tout projet d’évolution, il nécessite un investissement important en moyens humains et en temps. Vous devez avoir mis en place les ressources nécessaires pour travailler à la création d’une culture des données, axée sur les règles de gouvernance, de compétence et de qualité. Des connaissances et un alignement entre les différents services sont nécessaires pour que l’approche Data Mesh apporte des bénéfices, le but étant de décloisonner les silos pour encourager la réutilisation des données.
Quelle est la compatibilité entre Opendatasoft et une approche Data Mesh ?
Chez Opendatasoft, nous croyons à la démocratisation des données. Tout le monde doit pouvoir utiliser une information data-driven fondée sur les faits pour se développer et améliorer son quotidien personnel et professionnel. Cette approche coïncide étroitement avec la vision qui sous-tend le concept du Data Mesh.
Comme je l’ai expliqué, il ne suffit pas de choisir une technologie ou des outils spécifiques pour s’inscrire dans une démarche Data Mesh. Cependant, de nombreuses fonctionnalités offertes par notre plate-forme d’expérience data simplifient l’adoption d’une telle démarche :
- Si les données sont stockées dans plusieurs systèmes différents au sein de l’organisation, il est nécessaire de disposer d’un outil capable de connecter toutes ces solutions entre elles et de s’y intégrer en toute transparence. Opendatasoft propose plus de 80 connecteurs pour intégrer tous vos outils.
- Notre plateforme permet de gagner en autonomie très rapidement sur la gestion des données et la création de service data. C’est donc un outil indispensable pour toutes les équipes non spécialistes qui ont des données à exploiter.
- Nous avons des fonctionnalités de gouvernance intégrées qui renforcent la qualité, la gestion des utilisateurs et la sécurité dans toute l’organisation.
- La plate-forme est conçue pour faciliter la création et le partage de produits de données. Nos fonctionnalités de gestion des droits permettent le partage avec d’autres équipes ainsi qu’à l’extérieur de votre organisation, grâce au contrôle des accès aux données.
- Notre vision repose sur le même concept de gestion fédérée des données que le Data Mesh. Vous pouvez allouer aux unités commerciales leur propre domaine grâce à notre fonctionnalité d’espace de travail, mais elles restent régies par la même licence. Les propriétaires de données peuvent facilement partager tout ou partie des produits de données entre les domaines.
Par ailleurs, notre accompagnement chez Opendatasoft consiste à comprendre les problèmes de nos clients, puis à trouver des solutions grâce aux données pour les résoudre.
En résumé, il est vraiment encourageant d’observer la dynamique croissante impulsée par le Data Mesh. Cette approche montre que le partage des données est vital, mais que le succès ne se limite pas à la technologie. Il est nécessaire d’adopter une approche hybride et agile associant une gouvernance centralisée et un ownership et une responsabilité décentralisée des données. Cette approche permet d’accélérer la création de valeur associée à votre patrimoine de données.
Les organisations font face à une explosion sans précédent des volumes de données. Éparpillées sous divers formats, ces informations s’avèrent difficiles à organiser, analyser et valoriser. Pourtant, la data devient plus que jamais le socle des décisions éclairées et de l'innovation.
Les silos organisationnels sont un véritable frein au partage des données et à la collaboration, augmentant les risques tout en limitant l’efficacité et l’innovation. Comment les supprimer pour favoriser une circulation fluide des données au sein de l’entreprise ?
Toute entreprise ayant pour ambition de devenir data-centric a besoin d’un Chief Data Officer dont le rôle est de garantir à chaque utilisateur un accès immédiat aux informations dont il a besoin. Découvrez les défis auxquels il est confronté, et quelles sont les stratégies et technologies à adopter pour les surmonter.