Language

[Product Talk] Aider les métiers à consommer les données : data marketplace ou data catalog ?

Je m'inscris
Produit

Comment l’IA transforme notre solution de portail de données et les projets data de nos clients

Opendatasoft accélère depuis plusieurs mois pour transformer sa solution de portail de données grâce à l’IA et permet déjà à ses clients de gagner du temps et de réduire le risque d’erreur sur de nombreuses tâches. Découvrez comment !

Brand content manager, Opendatasoft
Voir tous ses articles

L’Intelligence artificielle (IA) s’impose déjà depuis plusieurs années et les usages se sont fortement accélérés en 2024 avec l’apparition de nouvelles applications et technologies fondées sur des modèles d’IA. 

Dans le domaine du data management, qui comprend de nombreuses tâches fastidieuses et chronophage, l’IA vient également révolutionner les technologies.  

Opendatasoft accélère depuis plusieurs mois pour transformer sa solution de portail de données grâce à l’IA et permet déjà à ses clients de gagner du temps et de réduire le risque d’erreur sur de nombreuses tâches. Découvrez comment ! 

Copy to clipboard

Nos équipes s’engagent à accélérer les démarches de valorisation et de démocratisation des données de nos clients grâce aux nouvelles opportunités offertes par l’IA.

Un moteur de recherche intelligent fondé sur l’IA

Depuis décembre 2023, les portails Opendatasoft sont équipés d’une recherche sémantique qui va au-delà des correspondances littérales pour comprendre le sens des termes et leur contexte. 

Le nouveau moteur de recherche présent sur les portails de nos clients permet de proposer des suggestions de résultats en temps réel et d’accéder à : 

  • des datasets correspondant au thème recherché, 
  • des actifs data correspondant au thème recherché,  
  • des actifs data qui comprennent le mot clé recherché ou un mot clé similaire.

Cette nouvelle méthode de recherche propose  des résultats plus pertinents et s’exécute très rapidement. La découverte des données est ainsi fortement améliorée et l’expérience utilisateur plus fluide et plus performante. Pour les administrateurs de portail, cela signifie également une maintenance facilitée car il n’est plus nécessaire d’ajouter une liste exhaustive de mots clés dans les métadonnées : l’IA se charge de tout.

Des recommandations de jeux de données similaires

Afin d’améliorer la découvrabilité des données et de fluidifier l’expérience sur les portails data de nos clients, nous proposons également une fonctionnalité de recommandation automatique de données similaires fondée sur l’IA. 

L’ensemble des jeux de données les plus pertinents sont ainsi affichés sur les fiches des actifs data consultés par les utilisateurs. 

Cette approche vise à simplifier l’expérience de découverte des données pour tous les utilisateur·ices, en s’inspirant des meilleures pratiques des marketplaces e-commerce. Elle s’inscrit parfaitement dans la vision d’Opendatasoft de rendre l’accès et l’utilisation des données aussi simples et intuitifs que possible pour un large public de l’expert data au novice. Chaque utilisateur peut ainsi naviguer facilement à travers les quantités et la variété des actifs de données disponibles sur les portails.

Copy to clipboard

Notre choix de migrer vers la recherche sémantique découle d’une volonté d’améliorer l’expérience utilisateur au sein de nos portails de données. La recherche constitue un pilier essentiel de cette expérience, permettant aux utilisateurs de découvrir les données qui les intéressent. Avec la recherche lexicale, les utilisateurs sont souvent bloqués s’ils ne saisissent pas exactement ce qu’ils recherchent. En revanche, la recherche sémantique offre une flexibilité plus grande, en générant des résultats pertinents même pour des requêtes approximatives ou dans une langue étrangère au portail.

L'approche vectorielle (ou sémantique) élimine la frustration potentielle des utilisateurs et améliore significativement leur expérience de recherche. La question ne s'est plus vraiment posée lorsque nous avons évalué et comparé plusieurs modèles d'IA, parmi lesquels le meilleur offrait un gain de pertinence de 64 % par rapport à un moteur de recherche lexical.
Damien Garaud
Backend Software Engineer - Opendatasoft

Les différentes étapes franchies pour améliorer la pertinence du moteur de recherche fondé sur l’IA

Notre parcours d’intégration de l’IA dans le moteur de recherche de notre solution a été itératif. Il a débuté avec une approche vectorielle, qui permettait de gérer des requêtes approximatives comportant des fautes d’orthographe ou des synonymes, avec une pertinence des résultats pouvant être variable. Nous avons ensuite adopté une approche hybride, combinant les méthodes lexicale et vectorielle, et classant les résultats par similarité sémantique et popularité, améliorant ainsi leur pertinence. Enfin, nous sommes revenus à une approche uniquement vectorielle, que nous avons enrichie d’un algorithme de pertinence afin de ne présenter que les résultats les plus pertinents et de ne rien afficher en cas de résultats insuffisants. Cette dernière amélioration permet de garantir une qualité optimale de résultats fournis, tout en tenant compte de l’approximation ou de l’imprécision des requêtes utilisateurs.

Fruit de nos recherches, cet algorithme unique et innovant représente une méthode efficace pour identifier le meilleur ratio entre le nombre de résultats à suggérer et la pertinence des résultats suggérés. Notre cheminement de l’approche vectorielle vers une approche hybride, puis finalement un retour à une recherche sémantique, désormais soutenue par ce nouvel algorithme reflète une évolution continue, où nous ré-évaluons nos choix précédents tout en les enrichissant de nouvelles connaissances. À la manière d’une démarche scientifique, où l'exploration continue et l'intégration de nouvelles données sont essentielles pour parvenir à des solutions toujours plus efficaces.
Damien Garaud
Backend Software Engineer - Opendatasoft

Des résultats prometteurs

Pour mesurer la réussite de ce modèle, nous nous basons toujours sur un indice de pertinence compris entre 0 et 1. Les résultats sont très prometteurs, puisque cet indice est passé de 0,52 à 0,87 en seulement quelques mois en testant ces différentes approches ! 

L’indice de pertinence, bien que crucial, n’est pas le seul facteur que nous devons prendre en compte pour assurer la qualité du moteur de recherche. En tant qu’éditeur de solution, nous sommes confrontés à la nécessité de concilier les divers besoins de nos clients, propres à chaque portail. 

Nous sommes constamment en quête d'un équilibre délicat entre la maximisation du nombre de résultats pertinents et la minimisation des résultats moins adaptés. Certains clients privilégient la quantité de résultats pertinents, tandis que d'autres accordent plus d'importance à la réduction des résultats peu satisfaisants. Notre défi est de trouver le juste milieu pour offrir une expérience satisfaisante à l'ensemble de nos utilisateurs, en tirant parti du meilleur des deux mondes.
Damien Garaud
Backend Software Engineer - Opendatasoft
Copy to clipboard

Nos clients bêta-testeurs ont joué un rôle central dans l’amélioration continue de notre moteur de recherche. Leurs retours tout au long du processus de développement ainsi que notre apprentissage continu des mécanismes d’IA ont permis de façonner un outil de recherche plus centré sur leurs besoins et ceux de leurs utilisateurs :

Le nouveau moteur de recherche fondé sur l’IA facilite grandement l'accès et la découverte des données. Il suggère des données pertinentes même avec des mots-clés approximatifs, réduisant ainsi le risque de passer à côté des données recherchées. Il enrichit également l'expérience utilisateur en mettant en avant des données dignes d’intérêt mais non directement recherchées, créant ainsi un effet de sérendipité. Cette innovation a un impact sur la qualité de nos métadonnées : essentielles à son bon fonctionnement, cela nous encourage à redoubler de vigilance dans leur bonne complétion. En tant que bêta-testeurs, nous avons trouvé cette expérience enrichissante grâce à l'ouverture et à l'écoute attentive des équipes d'Opendatasoft à nos suggestions. Nous restons très intéressés pour suivre son évolution, explorer les prochaines fonctionnalités d'IA de la solution, et recueillir les avis de nos utilisateurs pour mieux comprendre comment ces innovations les aident à trouver des données sur le portail.
Camille Liégeois
Responsable des projets Open data & Ville Numérique, Issy les Moulineaux

Copy to clipboard

Les équipes produit d’Opendatasoft ne s’arrêtent pas là ! De nouvelles fonctionnalités fondées sur l’IA sont en cours de développement ou de test chez nos clients et verront bientôt le jour ! 

Explorer les données avec l’IA

Prochainement, les utilisateurs de portails de données pourront s’appuyer sur l’Intelligence artificielle pour explorer les données. En questionnant un assistant virtuel en langage naturel, ils pourront recevoir des réponses instantanées sous divers formats de visualisation, tels que des cartes, des chiffres ou des graphiques.

 

Construire des pages avec l’IA

Les administrateurs de portail pourront également bientôt utiliser l’IA pour créer et intégrer des pages complètes sur leur portail. Que ce soit pour générer des visualisations dynamiques, construire des pages et agencer les éléments, un assistant virtuel répondra à toutes leurs demandes ! 

Si vous voulez en savoir plus sur les innovations IA qui viendront prochainement enrichir la solution Opendatasoft, contactez l’un de nos experts !

Articles sur le même thème : Fonctionnalités Portail de données
Contenus associés
Les 5 principaux défis rencontrés par les Chief Data Officers Tendances
Les 5 principaux défis rencontrés par les Chief Data Officers

Toute entreprise ayant pour ambition de devenir data-centric a besoin d’un Chief Data Officer dont le rôle est de garantir à chaque utilisateur un accès immédiat aux informations dont il a besoin. Découvrez les défis auxquels il est confronté, et quelles sont les stratégies et technologies à adopter pour les surmonter.

Tout ce qu’il faut savoir sur l’enrichissement des données Transformation numérique
Tout ce qu’il faut savoir sur l’enrichissement des données

L'enrichissement des données (ou data enrichment) est essentiel pour transformer vos données brutes en informations précieuses qui peuvent être facilement comprises et utilisées en interne et en externe. Notre blog explique comment mettre en œuvre avec succès l'enrichissement des données dans votre entreprise afin d'améliorer la qualité, la cohérence et la standardisation pour maximiser la valeur.

Portail de données : pourquoi acheter une solution SaaS plutôt que développer en interne (in-house) ? Tendances
Portail de données : pourquoi acheter une solution SaaS plutôt que développer en interne (in-house) ?

Déployer un portail de données centralisé vous semble à la portée de vos équipes ? Vous risquez de créer une solution inadaptée qui ne répond ni aux besoins des utilisateurs, ni à ceux de votre entreprise. Découvrez dans cet article de blog pourquoi le choix d’un fournisseur SaaS indépendant est la meilleure option, et les critères à rechercher chez un partenaire.