Glossaire
Data product
Un data product (ou produit de données) est un produit construit autour de données, contenant tout ce qui est nécessaire pour accomplir une tâche ou un objectif spécifique en utilisant ces données sous-jacentes.
Qu’est-ce qu’un data product ?
Essentiellement, un data product est un produit construit autour de données, contenant tout ce dont quelqu’un a besoin pour accomplir une tâche ou un objectif spécifique en utilisant ces données sous-jacentes.
Un data product est un produit construit autour des données, contenant tout ce dont quelqu’un a besoin pour accomplir une tâche spécifique ou un objectif en utilisant ces données sous-jacentes.
Dans son livre « Data Jujitsu: L’Art de Transformer les Données en Produit », DJ Patil, ancien scientifique en chef des données des États-Unis, l’a défini comme « un produit qui facilite un objectif final grâce à l’utilisation de données ».
Les produits de données peuvent être regroupés en trois types principaux :
- Ceux qui produisent des données en tant que service, comme un tableau de bord interactif, un ticker boursier ou une application météo sur votre téléphone.
- Ceux qui améliorent les produits existants avec des données, comme une voiture autonome ou une montre intelligente/vêtements intelligents.
- Ceux qui analysent les données et les utilisent pour créer des connaissances, comme Google Analytics ou les moteurs de recommandation.
La différence clé entre un data product et des données brutes est l’utilisabilité – il devrait pouvoir être utilisé par un non-spécialiste sans compétences en données ou connaissance des données brutes spécifiques qu’il contient pour atteindre un objectif spécifique. Il peut être utilisé de manière autonome, plutôt que comme un sous-ensemble d’un autre programme ou produit.
Un data product contient donc :
- Les ensembles de données brutes
- Des métadonnées pour fournir contexte, gouvernance et documentation
- Une interface simple permettant d’accéder et d’utiliser le data product
- Du code pour gérer le pipeline de données, le contrôle d’accès et la conformité
- Infrastructure pour héberger le produit et exécuter le code
- Plutôt que d’exécuter des projets individuels pour utiliser et réutiliser des données, l’adoption d’une stratégie de produit de données crée une approche plus standardisée et efficace qui ne réinvente pas la roue pour chaque projet.
Comment un data product se rapporte-t-il à un data mesh ?
Les data product sont l’une des quatre piliers fondamentaux du data mesh, permettant la consommation réussie de données distribuées à travers une organisation.
En fait, Gartner décrit le data mesh comme une architecture créée avec « l’objectif spécifique de construire des data products axés sur les affaires ».
Cependant, les produits de données peuvent être développés et déployés sans nécessiter une implémentation ou une architecture de data mesh.
Quels sont les avantages de l’adoption des data products ?
Les produits de données offrent d’importants avantages aux organisations et aux utilisateurs de données :
- Ils sont plus rapides à développer que les approches basées sur des projets, car ils réutilisent l’infrastructure, les méthodes et le travail précédent.
- Ils sont plus efficaces à développer, à exécuter et à maintenir, offrant des économies d’échelle.
- Ils permettent aux organisations de mieux répondre aux besoins des utilisateurs/entreprises, en résolvant des problèmes spécifiques grâce à l’utilisation de données.
- Ils permettent aux organisations de créer de nouvelles sources de revenus en fournissant des produits de données aux côtés des produits et services existants.
- Ils démocratisent l’utilisation des données, en facilitant l’utilisation des données par des non-spécialistes pour résoudre leurs problèmes commerciaux spécifiques. Cela aide à construire une organisation axée sur les données qui prend de meilleures décisions plus transparentes et plus rapides, et qui peut automatiser et numériser les opérations.
- Ils intègrent des fonctionnalités de sécurité et de contrôle d’accès en standard, réduisant les risques et assurant la conformité.
Selon Accenture, « les data products offrent généralement un ROI bien supérieur et un coût par utilisation inférieur aux projets de données, car ils évoluent pour soutenir plusieurs résultats au fil du temps ».
Comment créez-vous des data products ?
Pour que les data products réussissent, ils doivent suivre un processus similaire à la création de tout nouveau produit – physique ou virtuel :
- Nommer un propriétaire de data products, responsable du développement et de l’utilisation continue du produit
- Définir le besoin en parlant aux utilisateurs et en écoutant leurs besoins
- Utiliser ces exigences pour développer et tester un prototype, itérer avec les utilisateurs finaux jusqu’à ce qu’il réponde à leurs besoins
- Créer et documenter le data product complet, en veillant à ce qu’il soit indépendant et contienne tout ce qui est nécessaire à son fonctionnement et à sa maintenance
- Déployer le data product, le partager avec les utilisateurs
- Surveiller l’utilisation et améliorer le produit en réponse aux commentaires et aux développements externes
Quels sont les défis à la création de data products ?
Comme pour toute transition vers une organisation plus axée sur les données, le processus de création de data products exige que les entreprises surmontent des obstacles culturels, organisationnels et techniques.
- Culture des données : L’entreprise et ses employés doivent être ouverts et réceptifs à l’utilisation des données dans leur vie professionnelle, avec une culture de données ouverte en place.
- Qualité des données : Les données doivent être disponibles, de haute qualité et dignes de confiance, plutôt que piégées dans des silos départementaux ou fragmentées dans différentes sources à travers l’organisation.
- Compétences et approches : L’organisation doit disposer des compétences nécessaires pour créer et exécuter des data products, y compris des employés ayant la compréhension et l’expertise pour agir en tant que gestionnaires de data products. Le passage du développement basé sur des projets au développement basé sur des produits nécessite de nouvelles compétences et méthodes de travail.
- Concentration sur les besoins : Les data products doivent être construits sur les besoins spécifiques des clients de données (qu’ils soient des employés internes ou externes à l’organisation), nécessitant une collaboration étroite avec ces audiences.
- Prioritisation : Il doit exister une feuille de route claire pour la création de data products, en priorisant les produits les plus critiques pour offrir une stratégie efficace et un ROI clair.
En savoir plus