Glossaire
Data lineage
Le data lineage (lignage de données) désigne la capacité à analyser le cycle de vie des données, de leur collecte à leur réutilisation, afin d’en garantir la qualité et d’en monitorer les usages.
Qu’est-ce que le data lineage ?
Le data lineage (ou lignage de données) fournit une image complète de l’origine des données, de la manière dont elles ont été modifiées, traitées ou enrichies, de l’endroit où elles ont été utilisées et de leurs réutilisations futures.
C’est un processus indispensable qui permet de retracer les données en amont et en aval jusqu’à leur source d’origine pour garantir la qualité, la bonne gouvernance et la conformité réglementaire.
Les termes traçabilité des données et lignage des données sont souvent utilisés de manière interchangeable car il n’y a pas de réelle différence entre eux. Ils décrivent tous deux le même processus de compréhension du cycle de vie des données et d’offre d’une visibilité complète sur celui-ci.
Un troisième terme – provenance des données – fait référence à l’origine des données, c’est-à-dire comment et où elles ont été créées.
Le lignage des données peut être divisé en deux domaines :
- Lignage fonctionnel : il fournit une vue simplifiée de l’origine des données et des modifications qui leur ont été appliquées. L’objectif de cette approche est de pouvoir garantir que les données utilisées sont de qualité et traitées en toute conformité. Cette vision offre les éléments nécessaires pour appuyer une prise de décision par exemple.
- Lignage technique : c’est une vue plus approfondie de la façon dont les données se déplacent et se transforment entre les différents systèmes d’information. Bien que trop complexe pour les utilisateurs professionnels, cette approche est nécessaire pour instaurer une stratégie de gouvernance des données et identifier rapidement les erreurs à corriger.
Pourquoi le data lineage est-il important ?
Le data lineage permet aux organisations de bénéficier de divers avantages :
- Garantir la qualité des données utilisées pour les opérations commerciales et la prise de décision. Avec le recours à des outils d’automatisation et de l’IA, la traçabilité devient encore plus indispensable pour s’assurer que les données sont conformes.
- Renforcer la stratégie de gouvernance des données grâce à une vision globale des usages.
- Monitorer et analyser les réutilisations des données à l’extérieur de l’organisation
- Corriger les erreurs en mettant en évidence les problèmes susceptibles d’avoir un impact sur l’utilisation et le flux des données.
- Gérer les migrations techniques, comme vers le cloud, en modélisant les flux de données et l’impact de tout changement de technologie/système sur les solutions en aval.
Quels sont les enjeux du lignage de données ?
Les organisations génèrent d’énormes quantités de données et y ajoutent de plus en plus d’informations provenant de partenaires et de leurs écosystèmes plus larges. Pour parvenir à mettre en place une stratégie de lignage des données, les organisations doivent être vigilantes à plusieurs éléments :
- Le volume : le nombre de jeux de données qu’une organisation doit gérer augmente de manière exponentielle et tous doivent être entièrement traçables tout au long de leur cycle de vie.
- La rapidité : les données se déplacent désormais à une vitesse beaucoup plus grande au sein des organisations. Alors que par le passé, les rapports hebdomadaires ou mensuels étaient la norme, les utilisateurs ont désormais besoin d’accéder à des données fiables en temps réel.
- La conformité : les régulateurs (et les consommateurs) s’attachent de plus en plus à garantir que les informations, en particulier les données à caractère personnel, soient utilisées et protégées de manière à respecter des réglementations telles que l’ACCP et le RGPD. Cela ajoute un niveau supplémentaire de complexité à la traçabilité pour fournir, le cas échéant, une piste d’audit aux autorités de régulation.
- Collaboration : pour pouvoir monitorer les usages en dehors de l’organisation, il est important d’instaurer des liens de coopération entre les différents acteurs afin qu’ils acceptent de signaler leur réutilisation.
En savoir plus
Actualités
Analysez l’usage de vos données avec la nouvelle fonctionnalité de data lineage d’Opendatasoft
Opendatasoft lance une fonctionnalité de lignage de données unique sur le marché ! Centrée sur les usages, cette fonctionnalité permet de décrypter comment sont utilisées les données et d'améliorer le pilotage des portails data.
Data intelligence et reporting
Comprendre et accélérer l'utilisation des données grâce au data lineage : cas d’usage
Découvrez comment nos clients utilisent la fonction de lignage des données d'Opendatasoft pour analyser la performance de leurs portails et améliorer continuellement l'expérience qu'ils offrent à leurs utilisateurs.
Tendances
Les bénéfices du data lineage (lignage de données) pour votre stratégie de gouvernance
En aidant les entreprises à analyser les usages de la donnée, le data lineage participe directement à renforcer la stratégie de gouvernance des organisations. Découvrez tous les bénéfices du data lineage pour votre stratégie de gouvernance.