Analysez l’usage de vos données avec la nouvelle fonctionnalité de data lineage d’Opendatasoft

Opendatasoft lance une fonctionnalité de lignage de données unique sur le marché ! Centrée sur les usages, cette fonctionnalité permet de décrypter comment sont utilisées les données et d'améliorer le pilotage des portails data.
Les organisations de tous les secteurs sont engagées dans des démarches de démocratisation de leurs données via la mise en place de portail data en interne pour les collaborateurs et partenaires, ou pour le grand public via l’open data. Ces initiatives mènent à la création de nouveaux usages et services qui génèrent de la valeur pour tous.
Pourtant, il n’existe pas d’outils sur le marché permettant d’analyser automatiquement ces usages pour rendre compte de la valeur générée ou garantir la maintenance des données.
C’est pourquoi Opendatasoft lance une fonctionnalité de lignage de données unique sur le marché (ou data lineage en anglais). Centrée sur les usages, cette fonctionnalité permet de décrypter comment sont utilisées les données et d’améliorer le pilotage des portails data ! Apprenez-en plus dans cet article.
Lignage de données d’Opendatasoft : une fonctionnalité unique sur le marché
Les équipes produit et techniques d’Opendatasoft développent constamment de nouvelles fonctionnalités pour encourager la démocratisation des données et accompagner nos clients dans leurs démarches.
Le lignage de données d’Opendatasoft à été créé pour répondre aux besoins de nos clients qui n’avaient jusqu’à présent aucune solution pour automatiser l’analyse de l’usage de leurs données.
Composée d’une cartographie détaillée et d’un dashboard synthétique, cette nouvelle fonctionnalité vous permet de suivre et analyser de nombreux indicateurs pour en savoir plus sur les réutilisations de vos données.
Ainsi vous trouverez les réponses aux questions clés pour accélérer en matière de valorisation des données :
- Un dataset est réutilisé par beaucoup d’acteurs : faut-il publier davantage de données ? faut-il être plus régulier sur ses mises à jour ?
- Un jeu de données est inexploité ou peu utilisé : faut-il envisager de le supprimer pour nettoyer la base ? faut-il mener plus d’actions pour le mettre en avant et le faire connaître ?
- Il y a des relations invalides sur mon portail : puis-je mener des actions correctives pour améliorer la qualité de mon portail ?
- J’ai un portail en open data : quelle est la part des acteurs internes qui consomment des données ? la part des données externes sur votre portail ?
Découvrez le data lineage d’Opendatasoft en vidéo :
Une cartographie pour comprendre le parcours de vos données
Accessible depuis le back-office de votre portail data, la cartographie détaillée de notre fonctionnalité de data lineage vous permet d’analyser le parcours de vos données. Elle modélise la trajectoire d’un dataset de son point d’origine à son point de destination.
Vous pouvez également accéder à des informations sur la provenance des données et les différentes réutilisations :
- Origine des données et statut (valide ou invalide)
- Relation entre les datasets (fédération ou jointure)
- Objet utilisé (pages, datasets, cartes, processeur géographique, etc.)
- Modification des données et traitements
Un tableau de bord pour piloter l’usage de vos données
Les administrateurs du portail data ont également accès à un tableau de bord complet de l’usage des données. Il fournit des informations clés pour analyser instantanément l’usage des données et piloter la dynamique de votre portail.
Vous avez ainsi accès en un clic à des indicateurs tels que :
- les relations directes ou invalides entre les jeux de données. Vous pouvez alors identifier les datasets à forte valeur ajoutée et ceux à modifier ou supprimer.
- la quantité de données réutilisées par des acteurs de l’écosystème. Opendatasoft et les formats les plus plébiscités (cartes, pages, dataset, etc). Vous êtes ainsi en mesure de mieux comprendre les besoins de vos utilisateurs.
- la part des données externes réutilisées sur votre portail.
Data lineage avec Opendatasoft : les retours d’expérience de nos clients
Co-construite avec nos clients, notre nouvelle fonctionnalité de data lineage est déjà très appréciée et permet de créer de la valeur pour les acteurs de l’écosystème Opendatasoft.
Démontrez la valeur de votre portail data
La cartographie et le dashboard de notre fonctionnalité de data lineage permettent d’offrir différents niveaux d’information sur l’utilisation des données. Cela vous aide à démontrer l’impact et le retour sur investissement de votre portail data auprès de vos différentes parties prenantes.
Pour les producteurs, l’un des problèmes rencontrés est de comprendre ce que les utilisateurs font avec les données. Opendatasoft facilite déjà la réutilisation des données et cette nouvelle fonctionnalité fournit un aperçu supplémentaire des cartes et des graphiques que les utilisateurs ont construits tout en préservant leur anonymat, et dont nous n'aurions pas eu connaissance. Cela ajoute à la valeur des données ouvertes.
Du point de vue commercial, la fonctionnalité de lignage des données fournit des informations essentielles pour démontrer la valeur de notre portail et du partage des données en montrant facilement comment elles sont réutilisées. D'un point de vue technique, il s'agit d'un ajout important qui permet de mettre en place des processus de gouvernance des données plus robustes.
Améliorez la maintenance de votre portail data
La documentation automatisée de vos flux de données réduit les charges de travail et augmente la productivité de vos équipes. Grâce à la cartographie en temps réel des transformations de données de la source à la réutilisation, vous pouvez identifier les jeux de données à maintenir, supprimer ou modifier.
La fonctionnalité de lignage de données améliore considérablement le suivi et la gestion de notre portail de données interne. Intuitive et facile à prendre en main, elle nous permet d’identifier rapidement les modifications subies par les jeux de données, leurs répercussions, et nous fait ainsi gagner un temps précieux. Très satisfaits de cette nouveauté dans la plateforme, nous avons déjà hâte de découvrir ses prochaines évolutions !
La fonctionnalité lineage est une avancée utile pour la gestion de notre portail de données. Elle nous permet en effet de nous repérer plus facilement grâce à une meilleure analyse des liens qui existent entre les différents datasets, ou entre les jeux de données et les pages. Notre portail est en pleine expansion et est administré par plusieurs personnes. Cette fonctionnalité est donc indispensable pour maîtriser la structure des liens entre les différents éléments de notre portail.
Renforcez votre stratégie de partage de données
Le lignage de données vous permet de construire plus sereinement votre feuille de route open data sur la base des insights récoltés sur les usages de vos données. Vous apprenez à mieux connaître les besoins de vos utilisateurs et pouvez adapter vos actions en fonction de cette analyse. Profitez également de nouvelles opportunités data au sein de l’écosystème Opendatasoft grâce à la dynamique communautaire.
L'utilisation de la fonctionnalité de lignage de données permet de visualiser facilement les relations entre les différentes parties prenantes. Dans un contexte de portail en open data, elle est particulièrement utile pour encourager les rencontres, les échanges et les collaborations avec d’autres acteurs de l'écosystème Opendatasoft. Elle élève au niveau supérieur la démarche open data, en lui apportant plus de sens. Elle encourage la création d’opportunités pour la SNCF et d’externalités positives dans l’écosystème.
Nous utilisons cette fonctionnalité pour visualiser simplement les jointures opérées lors de la phase préparatoire d’un jeu, mais aussi et surtout pour identifier les réutilisations impactées par l'évolution d’un de nos jeux de données afin d’orienter notre stratégie et notre feuille de route.
Vous voulez en savoir plus sur notre fonctionnalité de data lineage ? Bénéficiez des avantages qu’elle offre dès maintenant en contactant l’un de nos experts !

Les organisations n’ont jamais autant misé sur la donnée. Elle est partout : au cœur des stratégies, des innovations technologiques et des décisions business ou sociétales. Pourtant, entre ambition affichée et réalité terrain, un décalage persiste.