5 conseils pour déployer une approche data mesh dans votre organisation
Ces dernières années, l’approche data mesh rencontre un véritable succès auprès des organisations. Quelles sont les bonnes pratiques pour déployer l’approche data mesh au sein de votre organisation ?
Ces dernières années, l’approche data mesh rencontre un véritable succès auprès des organisations. Et pour cause, cette approche permet d’optimiser la valeur des données en favorisant le partage et la réutilisation.
Toutefois, les structures existantes dans les organisations sont très éloignées de ces modèles et les données sont encore silotées dans les différents départements. Quelles sont les bonnes pratiques pour déployer l’approche data mesh au sein de votre organisation ?
Data mesh, c’est quoi ?
Avant de déployer une approche data mesh au sein de votre organisation, il convient d’en comprendre la définition. En effet, ce n’est ni un produit, ni une architecture, ni une technologie spécifique. C’est une approche, liée à la gouvernance et à la gestion des données, qui permet d’optimiser la valeur des données en favorisant le partage et la réutilisation.
Ce concept a été défini pour la première fois par Zhamak Dehghani en 2019. Après seulement quelques années, l’approche data mesh apparaît comme l’une des meilleures solutions pour avoir une circulation fluide et raisonnée des données, le tout de manière sécurisée.
Habituellement stockées dans des data lakes ou des data fabrics au sein des organisations, les données ne sont pas pleinement valorisées pour créer des usages et de la valeur. L’approche data mesh s’adapte à tout type de structure et permet de responsabiliser ceux qui sont au plus proche de la donnée, tout en gardant une gouvernance commune garantissant l’interopérabilité, la cohérence et la sécurité.
Quels sont les grands principes du data mesh ?
Afin de favoriser le partage et la réutilisation des données, l’approche data mesh se fonde sur 4 grands principes.
La propriété des données
L’approche data mesh a pour but d’organiser les données par domaine d’activité spécifique. Ainsi, même si des data lakes sont utilisés, la donnée est disponible sur des sous-domaines dédiés pour chaque département et sont gérés par les métiers avec l’appui d’experts data.
Cela permet à chaque équipe de définir la manière dont les données sont stockées et analysées, en fonction de leurs besoins spécifiques. L’avantage est double :
- Les parties prenantes sont responsabilisées quant à l’exploitation des données ;
- Les informations sont plus accessibles et compréhensibles par les principaux intéressés.
Les données en tant que produit
À travers l’approche mesh, les données ne sont plus seulement des informations isolées, ou les composantes d’un produit numérique plus global, mais deviennent des services à part entière. C’est le modèle “Data as a product” (DaaP).
Les “data products” se différencient de simples données car :
- ils sont disponibles sur des sous-domaines dédiés, réunis dans un portail de données interne en libre service pour pouvoir y accéder rapidement,
- des règles communes de gouvernance y sont associées,
- des dispositifs de diffusion spécifiques sont proposés (API, connecteurs aux applications métier ou outils de data analyse).
La plateforme de données en libre-service
Avec l’approche data mesh, l’objectif est de mettre les données à disposition « en libre service ». Cela signifie que les collaborateurs n’ont plus besoin de passer par des intermédiaires (data experts) pour obtenir les informations qu’ils souhaitent. À travers un portail interne en self-service, ils peuvent mesurer et analyser les données en temps réel afin de travailler de manière plus agile et de gagner en efficacité.
Grâce à ce point unique pour centraliser les données, il est plus simple de gérer les différentes autorisations d’accès et de garantir une circulation fluide et sécurisée de la donnée.
La gouvernance fédérée
L’implémentation d’une approche data mesh, reposant sur la décentralisation, présente un risque : la création de silos de données, incapables de fonctionner ensemble.
Pour éviter cette situation, il est primordial d’instaurer des règles de gouvernance partagées. Des connaissances et un alignement entre les différents services sont nécessaires pour que les données soient toujours à jour, traitées de manière cohérente et qu’elles puissent être réutilisées en toutes circonstances.
Cela permet ainsi de garantir l’interopérabilité des données, leur cohérence et leur sécurité, tout en laissant une certaine flexibilité aux différents départements.
Quels sont les avantages de l’approche data mesh ?
L’efficacité des équipes
L’implémentation d’une approche data mesh permet d’améliorer l’efficacité à plusieurs niveaux :
- La rapidité : comme les protocoles d’accès de la donnée sont raccourcis, les décisions sont prises plus rapidement.
- L’allocation des ressources : les compétences des équipes sont utilisées pour apporter un maximum de valeur à l’entreprise.
- La réduction des risques : une mise en œuvre trop longue peut provoquer l’échec d’un projet. Ce risque est réduit avec l’approche data mesh.
- La collaboration : celle-ci est favorisée grâce à la mise en place d’un langage partagé. Ce faisant, les projets avancent beaucoup plus rapidement.
La qualité des données
L’objectif de l’approche data mesh est de démocratiser la donnée à l’ensemble de l’organisation. Pour cela, la priorité est laissée à la donnée, et non à la technologie qui la sous-tend. Comme les données sont considérées comme des produits à part entière (et non plus comme de simples outils), les départements s’engagent davantage à améliorer leur qualité et leur fiabilité. C’est d’ailleurs cette approche Data as a Product, avec la notion de responsabilité, qui permet de mettre en place une véritable gouvernance des données.
La création de valeur
L’approche data mesh se concentre sur la création de valeur à partir des données. Ainsi, seules les données à forte valeur ajoutée sont utilisées pour créer des produits data qui ont de l’impact pour les collaborateurs.
La responsabilisation des équipes
À travers le déploiement d’une plateforme libre service, les collaborateurs peuvent mener leurs propres analyses (sans passer par des experts datas). En effet, chaque sous-domaine est conçu pour répondre au plus près des besoins des experts-métiers. Ainsi, le traitement et l’analyse des données sont adaptés aux spécificités de chaque département.
Tout cela participe à renforcer l’engagement et l’implication des équipes dans les différents projets data. Et ce, quelle que soit leur spécialité (RH, marketing, finance, R&D, …).
La flexibilité
Si la gouvernance fédérée implique de définir des règles communes à l’ensemble de l’organisation, chacun reste libre de définir ses propres normes en fonction de ses besoins en interne (sécurité renforcée, partage de données à travers des API, …). Cette flexibilité permet à chacun de travailler sans trop de contraintes.
L’adaptation
Contrairement à certaines architectures de données, l’approche data mesh s’adapte à tous types d’entreprise, quel que soit leur budget, leur taille ou leur secteur d’activité.
Par ailleurs, les organisations qui utilisent des outils centralisés (comme des data lake ou des data warehouse) peuvent aussi développer une approche data mesh. Dans le même esprit, chaque département peut utiliser des outils adaptés à ses problématiques, sans pour autant que cela n’empêche de déployer une approche data mesh.
Comment déployer une approche data mesh dans votre organisation ?
Adopter la bonne organisation
Pour développer une organisation orientée data mesh, il est indispensable d’avoir des responsables de la données dans chaque département, ainsi que des spécialistes data en support.
La plupart des organisations matures sur les sujets data optent pour une organisation hybride, avec des responsables data intégrés dans différents services, et une équipe centrale, qui définit une stratégie data globale et accompagne les métiers sur les aspects techniques de leurs projets.
Diffuser une culture de la donnée en interne
Le data mesh n’est pas qu’un simple projet, c’est un engagement long terme qui détermine la manière dont votre organisation gère les données. Cela implique de modifier le comportement des collaborateurs, de mettre en place des règles de gouvernance, de développer de nouvelles compétences et parfois d’utiliser de nouveaux outils.
Or, toutes les organisations ne sont pas prêtes à déployer une telle approche data mesh. Avant cela, elle doit avoir une vision spécifique relative au traitement et à l’analyse de données, mais aussi s’engager à investir et à développer de nouveaux usages créateurs de valeur. Si ce n’est pas encore le cas, il convient de préparer progressivement cette transformation de la culture d’entreprise.
Définir une gouvernance de données orientée data mesh
L’approche data mesh repose avant tout sur la politique de data gouvernance qui est établie. La réussite de la mise en place de cette démarche repose en effet sur la création de normes partagées. Par exemples grâce à :
- Des métadonnées : avec des normes centralisées pour en simplifier la compréhension à l’échelle de l’organisation.
- Une marketplace de données interne : pour faciliter l’accès aux données par tous.
- Un plan de supervision : notamment en matière de sécurité, qualité et confidentialité des données.
Utiliser les bons outils
Si l’approche data mesh peut s’adapter dans n’importe quel environnement ou architecture (datalake, lakehouse, data warehouse, etc), certains outils facilitent sa mise en œuvre. C’est notamment le cas de la plateforme Opendatasoft qui vous permet de créer votre marketplace de données interne grâce à de nombreuses fonctionnalités :
- Plus de 80 connecteurs pour intégrer tous vos outils et automatiser la connexion à vos sources de données
- La création de sous-domaines, reliés à un domaine parent, pour créer des produits data et les partager facilement dans l’organisation
- Des fonctionnalités de gouvernance intégrées pour renforcer la qualité et la sécurité des données dans toute l’organisation
- La gestion des droits permettant le partage avec d’autres équipes ainsi qu’à l’extérieur de votre organisation
Notre vision repose sur le même concept de gestion fédérée des données que le data mesh pour permettre à toutes les équipes non-spécialistes d’exploiter leurs données. Avec notre plateforme vous pouvez gagner en autonomie très rapidement sur la création de services data.
Implémenter la data mesh en plusieurs étapes
Le déploiement de l’approche data mesh nécessite de transformer l’organisation en profondeur. Il faut cependant commencer par des petits projets, puis les étendre au fur et à mesure. Par exemple, vous pouvez commencer par un seul département : celui pour qui l’approche data mesh présente le plus d’intérêt. À ce stade, vous pourrez explorer ce qui fonctionne et ce qui ne fonctionne pas. Et lorsque l’approche data mesh y sera bien implémentée, vous pourrez l’étendre aux autres départements. La demande vient d’ailleurs souvent des collaborateurs qui constatent les bénéfices qu’en retirent leurs collègues.
Le Data Mesh, ou maillage de données, est une approche permettant de construire une architecture de données qui favorise leur partage et leur réutilisation. Pour en savoir plus sur les bénéfices de l’approche Data Mesh pour démocratiser les données, nous avons interrogé David Thoumas, CTO et co-fondateur d'Opendatasoft.
Des données toujours plus nombreuses, une complexité croissante, des budgets contraints : voici quelques-unes des problématiques auxquelles les CDO doivent aujourd’hui faire face. Découvrez les tendances et défis auxquels sont confrontés les CDO, et comment garantir le ROI de vos projets data, selon le cabinet Gartner.
Le DAMA-Data Management Body of Knowledge (DAMA-DMBOK) est un ouvrage de référence qui décrit le cadre, des principes et du vocabulaire essentiels à une gestion des données efficace. Dans cet article, découvrez ses grands principes et comment il peut accompagner les CDO dans l’élaboration et la mise en œuvre de leur stratégie.