Transformer votre catalogue data en un portail de données interne et créer de la valeur
La création d’un portail de données est la clé pour exploiter les données et faciliter leur réutilisation au-delà des cercles d'experts dans les organisations. Découvrez les limites des solutions de “data catalog” et les solutions existantes pour créer de la valeur à partir de vos données.
Alors que les volumes de données produites par les organisations ne cessent de croître, le catalogue de données apparaît comme une nécessité car il permet de documenter et d’organiser son patrimoine de données. Mais cette solution à elle-seule ne permet pas de démocratiser les usages et créer de la valeur.
La création d’un portail de données est la clé pour exploiter les données et faciliter leur réutilisation au-delà des cercles d’experts dans les organisations. Découvrez les limites des solutions de “data catalog” et les solutions existantes pour créer de la valeur à partir de vos données.
Le data catalog, l’inventaire de vos données
Face à l’augmentation des quantités de datas, les data analysts et data scientists ont recours à des outils pour trier les données et les documenter. C’est le rôle du catalogue de données. Cet inventaire organisé permet de faciliter les processus de collecte, de mise en qualité, d’enrichissement et d’analyse.
Qu’est-ce qu’un catalogue de données ?
Le data catalog se présente comme un inventaire répertoriant toutes les données d’une organisation. Au-delà de regrouper les datas en seul lieu, le catalogue contient des métadonnées qui permettent aux utilisateurs de savoir si les informations disponibles sont pertinentes ou non au regard de leurs problématiques.
Pourquoi utiliser un data catalog ?
La mise en place d’un catalogue de données confère aux organisations une multitude de bénéfices. À savoir :
- La documentation : toutes les données sont répertoriées à un seul et même endroit, ce qui centralise l’information sur leur existence.
- La recherche : grâce à des fonctionnalités de filtre, de tri ou de recherche, les utilisateurs peuvent facilement identifier les informations pertinentes.
- Le gain de temps : comme les données sont plus faciles à trouver, les équipes techniques gagnent un temps précieux pour l’utilisation et l’exploitation des données.
Les limites du catalogue de données
Si l’implémentation des catalogues de données est absolument nécessaire aux organisations, elle présente plusieurs limites.
Une solution complexe réservée aux experts
La majorité des catalogues de données disponibles sur le marché sont des solutions relativement complexes et codifiées. Pour utiliser ces outils, il convient donc de disposer de compétences spécifiques, à la fois lors de l’implémentation, mais aussi pour rechercher des données.
Or, pour apporter de la réelle valeur ajoutée à l’organisation, toutes les parties prenantes doivent pouvoir accéder facilement aux données : les collaborateurs du département RH, marketing, finance et pas seulement les experts data qui disposent de connaissances techniques avancées.
Des usages restreints
Au-delà d’un manque de simplicité, ce sont les usages mêmes du catalogue de données qui semblent limités. La plupart du temps, ces outils se présentent comme une sorte de catalogue de métadonnées permettant de faciliter l’identification des données.
Mais là encore, pour créer de nouveaux services et optimiser la prise de décisions, il ne suffit pas d’identifier les données. Il faut pouvoir les rendre facilement accessibles, compréhensibles, réutilisables et les mettre à disposition de tous en self service.
Du catalogue data au portail de données interne
Si le catalogue de données est plus que nécessaire dans le cadre du développement d’une stratégie data, il se révèle insuffisant à lui seul pour développer des usages générateurs de valeur.
Pour démocratiser les données dans vos écosystèmes, les données doivent être :
- mises en qualité, enrichies et formatées : les données doivent être nettoyées avant d’être rendues accessibles à tous sur une plateforme data afin de créer un climat de confiance vis-à-vis du partage des données dans votre organisation.
- accessibles par toutes les parties prenantes de votre choix via un point d’accès unique. Grâce à des fonctionnalités de recherche et de filtrage, les utilisateurs n’ayant pas d’expertise technique doivent pouvoir retrouver des données « prêtes à l’emploi » en quelques clics.
- présentées dans des formats adaptés à votre audience : data visualisations, dashboards, graphiques, format brut, etc. Les données doivent également être interopérables avec les outils métiers des collaborateurs de l’organisation.
- documentées grâce aux métadonnées (DCAT, DCAT-AP, INSPIRE) pour pouvoir être comprises par tous et réutilisées en toute confiance.
- disponibles dans des formats encourageant leur réutilisation. Soit via des options d’export (Excel, CSV, APIs et sous forme de données SIG, telles que GPX pour la cartographie des smartphones).
Portail data : inspirez-vous des expériences de nos clients pour créer de nouveaux usages
Métropole de Rouen Normandie : du catalogue de données géographiques au portail open data
La métropole de Rouen Normandie a souhaité adopter un catalogue data pour gérer ses données géographiques en 2017. Un répertoire de données existait déjà mais il n’était pas mis à jour, ce qui rendait l’accès aux données relativement complexe.
Pour aller plus loin dans le partage des données, l’implémentation d’une démarche open data s’est très vite imposée. Elle répond à deux objectifs principaux :
- Décloisonner les directions et automatiser les processus grâce à des connecteurs, des web services, et du moissonnage. L’idée est de rendre la publication la plus fluide possible pour les producteurs de données et de renforcer les processus de gouvernance.
- Animer la démarche open data sur le territoire grâce à un point d’entrée unique vers les données de la métropole. Cela répond à un objectif de transparence de l’action publique et de renforcement de la participation citoyenne. Cela permet également de favoriser la réutilisation des données et l’innovation : en améliorant la connaissance du patrimoine de données, il est plus facile de réutiliser les informations disponibles. Et donc d’innover.
Schneider Electric : créer de nouveaux usages à partir des données de l’entreprise
La stack technologique de Schneider Electric est composée de nombreux outils dédiés à la gestion des données, notamment des catalogues. Mais ces derniers ne permettaient pas à l’organisation de réellement démocratiser la donnée et de les valoriser.
Les équipes de Schneider Electric ont donc eu recours à Opendatasoft pour mettre en place un portail interne accessible par toute l’entreprise : la Data Library. Grâce à cette librairie interne, les data scientists peuvent se concentrer sur l’analyse des données plutôt que sur leur préparation et leur traitement. Les collaborateurs ont désormais accès à une série de dashboards customisables et peuvent partager les datasets en interne.
Mais ce n’est pas le seul bénéfice de l’utilisation d’Opendatasoft. En effet, Schneider Electric a également pu créer une plateforme pour monétiser ses données auprès de partenaires : « Schneider Electric Exchange ». Un usage qu’il aurait été impossible à réaliser avec un simple catalogue.
Les catalogues de données sont des outils indispensables pour faire l’inventaire de vos données et soutenir votre politique de gouvernance. Mais ils ne permettent pas de rendre la donnée facilement accessible et consommable en interne par le plus grand nombre pour accélérer les usages et libérer leur valeur potentielle. La création d’un portail de données est la clé pour exploiter toute la valeur des données et contribuer à démocratiser leurs usages au service d’organisations véritablement data-centric.
Face à l’explosion des volumes de données, la question de leur usage à l’échelle est devenue centrale. Les organisations cherchent désormais des solutions capables de transformer leur patrimoine informationnel en un puissant moteur de performance au service des métiers.
Les organisations produisent aujourd'hui une grande quantité d'actifs de données à travers leurs opérations et services. Exploiter ces données de manière efficace implique de savoir quelles sont les données disponibles et où elles se situent. Pour cela, les entreprises utilisent des catalogues de données centralisés. Cet article explique en quoi consistent ces catalogues et quels sont leurs bénéfices pour les entreprises.