L’utilisation de données externes : un levier indispensable pour générer tout le potentiel de valeur de vos données
Les bénéfices de la valorisation des données sont bien identifiés, pourtant les processus d’enrichissement des données sont encore largement à développer. Apprenez-en plus sur cette étape indispensable pour fournir des données complètes et de qualité, et ainsi générer des insights créateurs de valeur !
Les organisations de tous les secteurs collectent de nombreuses données et mettent en place des portails data pour créer un point d’accès unique, en faciliter la recherche et les valoriser. Les bénéfices de la valorisation des données sont bien identifiés, pourtant les processus d’enrichissement des données sont encore largement à développer.
En effet, il s’agit d’une étape indispensable pour fournir des données complètes et de qualité, et ainsi générer des insights créateurs de valeur !
Retrouvez les exemples d’utilisation de données externes chez nos clients :
Dans quels cas recourir à l’utilisation de données externes ?
Ces dernières années, les organisations ont déployé de nombreux efforts pour mieux analyser, exploiter et valoriser leurs données.
En revanche, ces données ne sont pas suffisantes pour pouvoir être exploitées et analysées :
- soit car il manque des informations pour contextualiser ses données : par exemple un dataset réunissant une liste d’entreprises peut être enrichi avec des informations légales et financières (numéro de SIRENE, adresse, chiffre d’affaires, etc.),
- soit car les données ne peuvent pas être exploitées sous forme de data visualisation. Les données doivent alors être enrichies avec des référentiels géographiques.
- soit car les données n’existent pas au sein de l’organisation
Quelles sont les sources externes utiles pour enrichir vos données ?
Aussi appelées données tierces (ou “3rd party”), les données externes offrent une quantité d’informations à forte valeur ajoutée. Elles peuvent provenir de différentes sources :
- Les données de partenaires ;
- Les données open data ;
- Les données climatiques ;
- Les données social media (avis clients sur un produit par exemple) ;
- Les données achetées auprès de spécialistes, souvent spécialisés dans secteur ou une catégorie de données ;
- Les données d’entreprises privées ; etc.
On peut citer quelques bases de données parmi les plus connues :
- La base Sirene qui fournit des données d’identité des entreprises et des établissements.
- La base de données du BODACC (Bulletin officiel des annonces civiles et commerciales) qui met à disposition les données produites par la direction de l’information légale et administrative (DILA).
- La base de données d’INFOGREFFE pour l’accès aux données comptables et financières des entreprises
- Les bases de données de l’INPI relative aux données légales provenant du RNCS (Greffe des tribunaux de commerce)
- Le fichier des parcelles des personnes morales (MAJIC)
Les bénéfices de l’enrichissement avec des données externes
Si les data 3rd party participent à l’enrichissement des données, force est de constater que trop peu d’entreprises les exploitent pleinement. En effet, 92 % des experts d’analytics estiment que leur organisation n’utilise pas suffisamment les données externes. Pourtant cette pratique confère de nombreux avantages aux acteurs qui l’utilisent.
Développez une prise de décision éclairée
Pour avoir une connaissance approfondie de leur secteur, les organisations doivent prendre en compte un ensemble de facteurs extérieurs relatifs aux données produites. C’est justement possible grâce à l’utilisation des données tierces.
Qu’il s’agisse d’ajouter des informations pour aller plus loin dans l’analyse ou alimenter des modèles prédictifs, ou de s’appuyer sur des référentiels de données pour créer des data visualisations, les données externes permettent d’avoir une vision complète des enjeux de l’organisation et du secteur et de produire des insights plus riches. La connaissance ainsi générée permet de prendre de meilleures décisions, à la fois pour limiter les risques et pour saisir de nouvelles opportunités. L’utilisation de données externes peut ainsi constituer un avantage considérable sur les concurrents qui ne s’appuient que sur leurs propres données.
Améliorez votre connaissance client
Grâce aux données externes, les organisations peuvent récupérer une multitude de données utiles pour mieux comprendre leur cible. Qui est-elle ? Quelles sont ses problématiques ? Ses besoins ? Ses préférences de communication ? etc.
En répondant à toutes ces questions, vous pourrez adapter votre offre, mais aussi lancer des campagnes marketing beaucoup plus personnalisées. Au-delà des attentes de votre cible actuelle, les données externes peuvent également vous éclairer sur l’évolution des comportements des consommateurs. Cela vous permet ainsi d’anticiper les tendances.
Créez de nouveaux services grâce aux données externes
Dans certains cas, l’utilisation de données externes permet de donner vie à de nouveaux services data impossibles à mettre en place sur la seule base des données produites en interne.
À ce stade, les données externes peuvent permettre de compléter vos données pour créer des visualisations spécifiques, ou pour offrir une analyse de votre secteur plus approfondie.
Comment exploiter les données externes ?
1. Identifier vos besoins pour définir des cas d’usage
Les organisations disposent déjà d’une grande quantité de données. Avant d’en intégrer de nouvelles provenant de sources externes, il faut savoir si elles répondent à un réel besoin.
Commencez par imaginer des cas d’usage en fonction des besoins exprimés au sein de votre organisation : cela vous permettra d’anticiper les actions à mettre en place et de fixer des objectifs et des résultats à obtenir.
Opendatasoft propose à ses clients des jeux de données préparés et packagés, par secteur et en fonction des cas d’usages observés chez ses clients. Ces datasets prêts à l’usage vous permettront d’enrichir vos données pour répondre à vos besoins et aux enjeux de votre secteur.
2. Identifier les bonnes sources de données
Parmi la quantité de données disponibles, il peut être difficile de sélectionner les datasets fiables et à forte valeur ajoutée pour son activité. Par ailleurs, plusieurs acteurs peuvent proposer un même jeu de données. Il faut donc s’appuyer sur des partenaires de confiance pour identifier la source de données la plus fiable à utiliser.
Opendatasoft vous accompagne sur les différentes étapes du sourcing de données. Notre expertise au contact de nos clients de tous les secteurs depuis plus de 10 ans nous permet d’identifier rapidement les datasets utiles pour vos activités.
De nombreuses organisations ont fait le choix de nous faire confiance pour sourcer leurs données externes. Nos équipes réalisent en effet un travail conséquent sur de nombreux jeux de données publics afin d’offrir des sources de qualité en temps réel aux utilisateurs de l’écosystème Opendatasoft.
3. Standardiser et entretenir les sources de données externes
Les données externes, notamment en open data, ne sont pas toujours de qualité suffisante. Les schémas de données proposés par les producteurs ne permettent pas toujours de les exploiter simplement.
D’autre part, la structure et la qualité d’un jeu de données peuvent être amenées à évoluer au fil des mises à jour, ce qui nécessite un contrôle régulier et dans certains cas, un retraitement des données pour correspondre à vos usages.
Opendatasoft vous permet de nettoyer et corriger les données très simplement grâce à plus de 50 processeurs. Il est également possible de sélectionner une partie des données ou de modifier les colonnes du dataset.
Centraliser vos données en un portail unique
Une fois que toutes les données externes ont été sélectionnées, il est important de les centraliser en un point unique pour avoir une vue exhaustive des données disponibles. Dans le cadre de projet d’enrichissement de données, on observe souvent la création de doublons ou de datasets inutiles car il n’existe pas de lieu unique pour réunir les sources de données.
Opendatasoft vous permet de créer votre portail de données très rapidement et sans expertise technique. Vous pouvez ainsi réunir vos données et permettre à toutes les équipes de créer et diffuser rapidement des expériences data sur le digital pour nourrir leurs écosystèmes internes et/ou externes.
Facilitez la réutilisation de vos données
Pour continuer le cercle vertueux du partage de la donnée, il est indispensable de mettre en place des bonnes pratiques pour que les utilisateurs de votre portail ou services data réutilisent les données. Qu’il s’agisse des métadonnées pour avoir plus d’informations sur la production des données, ou d’options de téléchargement ou de réutilisation en temps réel avec les APIs.
Avec la plateforme Opendatasoft, vous pouvez compléter les métadonnées de vos datasets sur plusieurs modèles standard (INSPIRE, DCAT, etc.) et générer des APIs pour chaque jeu de données de votre portail.
Exemples d’utilisation de sources externes chez nos clients
ICF Habitat enrichit ses données pour offrir à ses collaborateurs des services utiles
ICF Habitat, filiale immobilière du Groupe SNCF, en activité depuis presque 100 ans, gère un patrimoine de 95 000 logements. L’entreprise a créé un portail de données pour mettre à disposition des collaborateurs en interne de nombreux dashboards et data visualisations afin de soutenir les missions du Groupe :
- L’étude du potentiel de développement et le plan d’action qui permettent de visualiser les territoires d’opportunités identifiées pour développer les activités du Groupe (visibles sous forme de cartes ou de tableaux).
- Des analyses thématiques : sur les opérations passées et à venir, sur les propriétaires foncier en France, les gammes de familles ou encore des vues comparatives sur les actions stratégiques.
- Le dashboard du tissu des bailleurs sociaux : véritable outil d’aide à la décision, ce dashboard permet aux collaborateurs d’ICF Habitat de consulter l’état du parc de logement social en France, tous bailleurs confondus.
- La carte des corrélations entre le développement des logements et des réseaux ferrés qui permet aux collaborateurs d’analyser la situation et de prendre de meilleures décisions.
- Un dashboard à destination des fournisseurs pour développer l’attractivité d’ICF Habitat auprès de ces derniers.
Pour créer ces différents dashboards, les équipes d’ICF Habitat réutilise plusieurs données externes en provenance du Data hub : la base SIRENE V3 consolidée, la base officielle des codes postaux, le fichier des parcelles des personnes morales (MAJIC), les communes et arrondissements municipaux et même les résultats des élections municipales de 2020.
L’ajout de données géographiques issues du Data hub permet aux équipes de passer
moins de temps à viabiliser géographiquement les données. Cela permet aussi de faciliter la création de cartes, notamment grâce à la possibilité de créer des points par rapport à des adresses.
Lamie mutuelle propose aux délégataires et collaborateurs une vue 360 ° des adhérents grâce aux sources externes de données
Créée il y a plus de 70 ans, Lamie mutuelle est spécialiste de l’assurance santé et prévoyance. Pour exploiter toute la valeur issue des données des adhérents, Lamie mutuelle a souhaité que l’ensemble des données de ses délégataires soient réutilisables et exploitables.
L’organisation a ainsi mis en place un hub de données pour alimenter plusieurs dashboards décisionnels, des fiches 360°, un CRM et des Apps client de type espace adhérent.
Le recours aux sources externes a été indispensable pour pouvoir créer ces différents supports :
- la base SIRENE V3 consolidée pour compléter les fiches “entreprises” de ses adhérents
- la classification commune des actes médicaux (CCAM)
- la liste des personnes décédées en France depuis 1970.
Grâce à ces croisements de données externes, Lamie mutuelle est en mesure de créer des fiches clients avec de nombreuses informations qui ne sont produites ni par l’organisation ni par les délégataires. Il s’agit donc d’une plus value de taille pour améliorer la connaissance client en interne.
La Caisse des dépôts utilise des données externes pour améliorer les missions des agents
Dans le cadre de ses missions, la Caisse des Dépôts collecte, produit et maintient un grand nombre de données d’intérêt général (logement, politiques sociales, investissements et territoire, activités financières, etc.) mais aussi sur ses domaines de compétence (plan de relance, logement social, grand âge et retraite, formation professionnelle, etc).
L’organisation publie des données en open data sur son portail grand public, mais aussi en interne pour améliorer les missions des agents.
Plusieurs données externes sont ainsi réutilisées :
- Des datasets de données publiques indispensables aux missions quotidiennes des agents (ex : données INSEE)
- Des données de références géographiques pour créer des cartes et obtenir les listes des communes.
- Des données pour enrichir les datasets sur les communes à la demande du métier : population, commune littoral, commune participant à un programme soutenu par la Caisse des Dépôts, datasets diagnostic local sur le grand âge. Pour cela l’organisation à recours à des données INSEE, DREES, etc.
- Les données relatives aux marchés publics et aux professions juridiques pour alimenter une veille automatisée et réaliser des analyses approfondies sur le sujet.
La Caisse des dépôts permet ainsi à tous les collaborateurs d’accéder à des données utiles pour réaliser leurs missions. Actuellement une centaine de datasets très variés vient enrichir la connaissance des collaborateurs et soutenir les prises de décisions.
Vous l’aurez compris : exploiter les données externes est un prérequis indispensable pour valoriser vos données et leur donner plus de profondeur. Mais pour que cela ne soit pas une difficulté supplémentaire, il est important de s’appuyer sur un partenaire de confiance.
Comment maximiser la contribution des données à la croissance de votre organisation ? Un objectif ambitieux, partagé par de nombreux leaders data et qui sera au cœur de leurs enjeux 2025. Les data marketplaces émergent comme des solutions incontournables, succédant aux classiques data catalogs. Dans un monde toujours plus digitalisé, où le volume de données des organisations explose, la clé réside dans la capacité des leaders data à créer un accès facilité aux données pour tous les métiers pour générer de la valeur. Pourquoi les data marketplaces s’imposent-elles comme l’outil décisif pour franchir cette dernière étape ? Décryptage dans cet article.
Qu’est-ce que la qualité des données et pourquoi est-elle importante ? Découvrez en quoi elle constitue un levier essentiel pour instaurer la confiance et favoriser l’adoption des données, ainsi que les processus et les outils indispensables pour garantir des données fiables dans toute votre organisation.
Le DAMA-Data Management Body of Knowledge (DAMA-DMBOK) est un ouvrage de référence qui décrit le cadre, des principes et du vocabulaire essentiels à une gestion des données efficace. Dans cet article, découvrez ses grands principes et comment il peut accompagner les CDO dans l’élaboration et la mise en œuvre de leur stratégie.