Donner accès à vos assets data pour créer de la valeur à grande échelle
Quelles sont les motivations des organisations pour engager un projet de portail de données ? Comment mettent-elles en œuvre des portails de données ? Quels sont les bénéfices attendus et les fonctionnalités clés d’un portail de données ?
Depuis 12 ans, Opendatasoft accompagne de grandes organisations publiques et privées en France et à l’international à démocratiser la consommation de leurs données par le plus grand nombre. Nous les aidons à créer de la valeur à l’échelle de leur organisation et de leur marché grâce à notre solution de portail de données.
Nous observons que le rôle des données au sein des organisations et de la société est en train de changer fondamentalement. De nouvelles exigences émergent autour de la consommation des données qui, elles-mêmes, dans le contexte de la poursuite de la digitalisation de nos économies, sont quotidiennement produites en masse. Les responsables data au sein des organisations doivent trouver des solutions pour répondre aux nouveaux besoins d’accès à ces données des collaborateurs, des partenaires, mais aussi des clients et des citoyens.
Quelles sont les motivations des organisations pour engager un projet de portail de données ? Comment mettent-elles en œuvre des portails de données ? Quels sont les bénéfices attendus et les fonctionnalités clés d’un portail de données ?
Des stratégies data pour créer de la valeur à l’échelle
Nous avons publié en janvier dernier une étude réalisée par l’institut indépendant Odoxa auprès de 500 leaders de grandes organisations afin de savoir comment la question de la donnée, et du data management en particulier, s’inscrivait dans leur stratégie.
Sans surprise, 85 % de ces leaders ont considéré le data management comme une de leurs priorités pour créer de la valeur à l’échelle dans leur organisation. Les décideurs sont conscients qu’il ne s’agit pas d’une refondation des outils de data management mais d’un projet de transformation globale.
Cette prise de conscience bien établie s’explique simplement. En effet, aujourd’hui, les bénéfices à la mise en place d’une stratégie de valorisation des données sont clairement identifiés : augmentation de l’efficacité et diminution des coûts, augmentation des revenus et, gestion des risques et amélioration des relations avec ses parties prenantes.
La mise en place de solution de data management est ainsi devenue essentielle pour pouvoir saisir les opportunités de création de valeur du fait de l’augmentation exponentielle de ces volumes de données.
Enfin, les usages liés aux données ne cessent d’évoluer avec une demande croissante dans les organisations d’analytics et informations à haute valeur ajoutée.
Les décideurs sont conscients de l’enjeu stratégique autour de la donnée ce qui les pousse à s’engager dans une démarche de démocratisation des données.
Quel est le niveau de maturité des organisations ?
Toujours selon notre étude annuelle, on constate que seulement 21 % des organisations sont véritablement “data-centric”, c’est-à-dire des organisations avec une culture de la donnée forte, mais aussi des ressources de gouvernance data et des outils adaptés. Elles concentrent l’engagement des CEO et des COMEX, une stratégie data définie, une feuille de route claire, des budgets associés et une culture data diffusée à l’échelle de l’organisation.
Puis viennent 33 % d’organisations « conventionnelles », que l’on retrouve plus fortement dans le secteur privé et dans les organisations de 5000 salariés et plus. Des fonctions dédiées à la donnée et des formations pour les collaborateurs ont été mises en place. En revanche, elles ont encore des réticences sur le partage à tous des données utiles.
Les organisations « à la croisée des chemins » sont à hauteur de 24 %. Elles sont plus nombreuses dans le secteur public et dans les grandes entreprises n’étant pas “digital native”. Les prises de décision restent encore très verticales et les profils nécessaires pour partager les données n’ont pas été formés ou recrutés.
Et enfin, 22 % des organisations sont « non-engagées ». C’est le cas dans le secteur de la santé et de l’action sociale ou dans les entreprises de 50 à 249 salariés. Ces organisations n’utilisent pas les données comme un axe de développement prioritaire.
Enfin, notre étude met en avant des freins à la transformation data à l’échelle avec en première position le problème de l’accès aux données. Les décideurs évoquent également des difficultés à diffuser une culture data en interne et à instaurer une stratégie de gouvernance efficace. Ces points faibles constituent des freins à la scalabilité et l’industrialisation des cas d’usage data ainsi qu’à la création de valeur attendue.
Alors pour lever ces freins, quel peut-être le rôle du Chief Data Officer ou des personnes responsables de la donnée au niveau corporate dans les organisations ?
L’accès aux assets data : clé de voûte de la création de valeur à l’échelle
L’accès aux données est au cœur de la réussite d’une stratégie data centrée sur la création de valeur à l’échelle. Il doit être à la fois simple, sécurisé et industrialisé. C’est-à-dire qu’il doit concerner tout le monde et impliquer des data assets et données de toutes natures. Ces trois piliers constituent un levier d’accélération de la gouvernance, de la qualité et de la démocratisation de la data pour permettre aux organisations de passer à l’échelle.
Par “asset data”, on entend une donnée sur laquelle on a opéré une transformation qui la rend exploitable et réutilisable par un métier. Une donnée brute, issue par exemple d’un progiciel de type ERP, n’est pas un asset data en elle-même. En revanche, dès que cette donnée est préparée, décrite et mise dans un format standard qui la rend réutilisable par tous, elle devient un actif data. Cela peut aller d’un fichier CSV à une API standard ou mise en scène grâce à une visualisation, voire un algorithme ou un ensemble de schémas de métadonnées qui permettent la réutilisation des données par le plus grand nombre.
Le portail de données est une solution de data management qui vient apporter de la valeur aux solutions de création de données (data lake, data warehouse), aux outils d’intégration, de virtualisation, de traitement de données, ou aux solutions qui permettent de tirer parti de manière analytique des données (outil de BI et data science). Le portail de données permet d’unifier la recherche, l’exploration et la réutilisation de tous les assets data créés avec ces différents outils. Il va alors rendre possible la consommation de l’ensemble des ressources gérées par ces solutions de data management.
Industrialiser et démocratiser l’accès aux data assets : le portail data, levier opérationnel
Le “dernier kilomètre de la donnée” est trop souvent négligé par les organisations. La mise en place d’un guichet unique et sécurisé pour découvrir et utiliser rapidement tous les actifs data de l’organisation est pourtant essentiel. Il permet à tous de rechercher, parcourir et réutiliser facilement des données fiables afin de créer de la valeur.
Opendatasoft est une solution de portail de données qui permet de rendre les assets data accessibles, dans la mesure du possible, à l’échelle de l’organisation. Pour les CDO, CIO ou responsable de données, le portail data est un atout clé. Sous la forme d’un guichet unique ambitieux, ou “one-stop-shop”, il permet d’accéder en self-service aux assets data pour un maximum de parties prenantes, que ce soit en interne ou avec ses partenaires externes, privés ou publics.
Au niveau de la technologie, on va retrouver plusieurs fonctionnalités. À la fois pour permettre une meilleure administration du portail pour les responsables de données, mais aussi pour permettre de créer des expériences accessibles et offrir un parcours fluide aux utilisateurs du portail.
On va naturellement avoir des fonctionnalités liées à la connectivité et à l’interopérabilité avec tout l’écosystème technologique de l’organisation. On pense aussi aux fonctionnalités de préparation, de gestion des métadonnées qui peuvent se faire dans la solution ou en récupérant des informations auprès des outils de Data Catalogue par exemple. Le multilinguisme est évidemment une fonction de portail assez classique mais nécessaire dans le monde de la data. La possibilité de créer des workspaces est également un point différenciant de notre solution de data portal. Cela permet aux organisations d’avoir des “sous-portails” afin de créer des espaces cohérents pour chaque métier, tout en accédant exactement à la même solution et aux mêmes data que les autres. On est vraiment sur des logiques de consommer de la donnée sans la modifier à la source, en “read only”. Il n’y a rien de tel que de pouvoir proposer à l’ensemble des utilisateurs d’interagir avec la donnée et de découvrir de nouvelles sources sans pour autant en modifier la source. Toutes ces fonctionnalités montrent qu’une solution de data portal s’apparente aux CMS et est vraiment centrée sur la capacité à pouvoir créer un environnement autour de la donnée, en expliquant la démarche, en proposant des ressources académiques de type tutoriels ou autres, etc.
Les fonctionnalités de partage sont également essentielles, que ce soit sous forme d’APIs ou de téléchargements ou de réutilisations. C’est un aspect crucial pour permettre de créer de la valeur. Et donc la gestion fine des droits et des ressources doit pouvoir être faite grâce au portail afin de garantir la sécurité et la confidentialité des données.
Enfin, pour avoir une bonne stratégie de diffusion et de développement des usages des données, il va falloir, au fil de l’eau, analyser comment ces dernières sont utilisées. Quel est le niveau d’utilisation des données ? Quels sont les éléments les plus populaires d’un portail data ? Pourquoi et comment sont consommés les actifs de données ? Notre fonctionnalité de lignage des données centrée sur l’usage permet de répondre à toutes ces questions en proposant une analyse fine des mouvements de données et de leur réutilisation.
Le data portal s’adresse donc directement aux data owners qui souhaitent mettre en scène les données pour qu’elles soient plus simples à comprendre, à découvrir, à explorer, et à consommer. Les fonctionnalités d’expérience, de recherche et de navigation sont également indispensables pour permettre aux utilisateurs du portail de trouver et interagir rapidement avec les données dont ils ont besoin.
Une technologie robuste au service des usages
Toutes ces fonctionnalités doivent s’appuyer sur un socle technologique qui permet le passage à l’échelle. Notamment grâce au multi-cloud qui permet de gérer de grands volumes de données, de forts trafic sur les portails et donc une intensité de consommation des assets data. L’aspect multi-cloud permet aussi de répondre à des besoins de performance pour proposer un accès aux données sur tous les continents et, dans certains cas, de répondre à des problématiques de souveraineté.
La solution doit également être sécurisée pour que tout le monde puisse ensuite gérer et consommer des données au quotidien sans risque. Cela implique notamment des fonctionnalités de gestion des droits d’accès aux données. C’est aussi la capacité d’isoler le stockage ou la description des données quand on est dans des environnements plus sensibles.
Et enfin la plateforme doit permettre aux administrateurs et responsables des données de proposer des expériences data plus fluides pour tous, quelles que soient leurs compétences techniques. Et plus particulièrement des expériences de type “marketplace”. Puisque la donnée est désormais considérée comme un produit que l’on doit pouvoir consommer simplement, le parcours inspiré des marketplace e-commerce reste la manière la plus simple d’interagir avec de tels assets. Les utilisateurs doivent retrouver des fonctionnalités similaires à ce qu’ils connaissent, comme le parcours de recherche grâce à des filtres, menus contextuels ou barre de recherche pour accéder à tous les actifs de données de l’organisation, quel que soit leur emplacement.
Offrir une telle expérience permet de faire tomber les freins à l’utilisation des données et de créer un cadre de confiance. À partir du moment où on a un environnement cohérent, avec des fonctionnalités extrêmement simples jusqu’aux plus avancées, on peut sereinement découvrir et interagir avec les données. Cela va concourir à développer la culture data dans les organisations et à soutenir les démarches stratégiques et sur le long terme.
Trois grandes typologie de portail de données pour tous les cas d’usage
De nombreuses organisations en France et dans le monde utilisent Opendatasoft pour créer et maintenir leurs portails data. On observe trois grandes typologies de portails qui viennent répondre à des besoins divers et variés.
Premièrement, le portail interne qui peut prendre la forme de plateforme de données en self-service, de data marketplace, de data hub ou qui viennent alimenter des applications et services spécifiques. Ces portails permettent aux organisations de réduire les coûts, de digitaliser et d’optimiser les opérations, d’augmenter et de créer de nouvelles sources de revenus et de gérer les risques et les crises.
L’un de nos clients emblématique, la Caisse des Dépôts, a lancé son portail “Data en partage” (au même moment que l’ouverture de son portail open data) pour rendre la donnée accessible à grande échelle et diffuser une culture data dans l’organisation. Les collaborateurs peuvent y trouver des données d’intérêt général et des datasets sur les domaines de compétences de l’organisation (logement social, programmes d’investissement, le CPF, la retraite, etc). La mise en place de ce portail a été un levier d’efficacité opérationnelle pour la Caisse des Dépôts. Il est aujourd’hui accessible aux 6 000 collaborateurs qui bénéficient de datasets enrichis en fonction de leurs besoins et de veilles automatisées sur les textes publiés quotidiennement. Le portail open data compte 70 datasets avec 2.2 million d’enregistrements depuis l’ouverture du portail. Cela représente plus de 4.3 millions appels APIs sur les 12 derniers mois.
On retrouve également des portails data dédiés aux partenaires ou clients. Ils permettent aux organisations d’augmenter et de générer de nouvelles sources de revenus, et de créer de l’innovation dans leur écosystème. Il peut s’agir d’espace de confiance accessible par les partenaires, de marketplace pour commercialiser les données ou de portails créés sur mesure pour des clients.
Birdz by Veolia propose à 3 300 villes clientes des dashboards pour suivre leurs équipements IoT. Ils ont accès à un outil de pilotage complet grâce à des dashboards et data visualisations interactives conçue avec Opendatasoft pour transformer les données issues de ces capteurs IoT de ses utilisateurs en insights concrets. Grâce à la mise en place de ces dashboards sur mesure, Birdz by Veolia propose une offre innovante et qui se distingue de celle de la concurrence. La commercialisation des données sous forme de « Dashboard as a Service » a pu être mise en place très rapidement et déployée à grande échelle, puisque l’organisation gère plus de 3 500 objets connectés.
Enfin, on retrouve les portails open data, qui permettent aux organisations de gérer les risques et les crises et d’améliorer la relation avec les citoyens et consommateurs. Des ministères comme des collectivités, des acteurs de l’énergie ou encore des entreprises privées ouvrent leurs données via ce type de portails qui permettent de les mettre en scène sous forme de dashboard ou d’observatoire.
Depuis 2014 le groupe SNCF adopte une approche data-centric pour rendre la donnée accessible à grande échelle avec un portail open data, qui concerne les données ouvertes de la holding et de ses 3 filiales (voyageurs, réseau et gare & connexions). Le portail est connecté au système d’information de l’organisation qui comprend une grande diversité de sources de données (des entrepôts FTP aux outils de stockage, etc.). La SNCF a ouvert son portail open data de façon pionnière en 2014, alors que l’obligation réglementaire est arrivée en 2016.. Le portail permet également une meilleure gestion de la feuille de route data car les administrateurs du portail sont capables de savoir quelles sont les données les plus plébiscitées et quel type d’usage et de réutilisation sont les plus populaires.
Opendatasoft a acquis un savoir-faire unique en matière de création de portails data et de mise à disposition de la donnée à grande échelle. Nous opérons aujourd’hui plus de 3000 portails auprès de 350 clients dans 25 pays et sur tous les continents, à la fois dans des grandes entreprises que dans des organisations publiques locales ou des grandes administrations. Vous souhaitez lancer votre portail de données ? Contactez l’un de nos experts !
Les gouvernements partagent-ils efficacement leurs données avec les citoyens et les entreprises ? Le dernier rapport sur la maturité des données ouvertes évalue les progrès en Europe et souligne l’importance de mesurer l’impact et d’améliorer les portails de données.
Comment l'IA générative peut-elle aider les Chief Data Officers et autres responsables data à optimiser leurs processus ? En nous basant sur la dernière étude de Gartner, nous abordons dans cet article de blog les atouts de l’IA intégrée au stack de gestion des données.
Dans un monde de plus en plus orienté vers les données, comprendre et différencier les notions de données (data), métadonnées (metadata), actif de données et data products (produits de données) est devenu indispensable pour maximiser leur potentiel. Ces concepts interdépendants, bien que distincts, jouent chacun un rôle clé dans la transformation digitale des organisations et leur capacité à faciliter le partage et la consommation de données à l’échelle.