Comment l’IA transforme notre solution de portail de données et les projets data de nos clients
Opendatasoft accélère depuis plusieurs mois pour transformer sa solution de portail de données grâce à l’IA et permet déjà à ses clients de gagner du temps et de réduire le risque d’erreur sur de nombreuses tâches. Découvrez comment !
L’Intelligence artificielle (IA) s’impose déjà depuis plusieurs années et les usages se sont fortement accélérés en 2024 avec l’apparition de nouvelles applications et technologies fondées sur des modèles d’IA.
Dans le domaine du data management, qui comprend de nombreuses tâches fastidieuses et chronophage, l’IA vient également révolutionner les technologies.
Opendatasoft accélère depuis plusieurs mois pour transformer sa solution de portail de données grâce à l’IA et permet déjà à ses clients de gagner du temps et de réduire le risque d’erreur sur de nombreuses tâches. Découvrez comment !
Transformer l’expérience de recherche sur les portails de données grâce à l’IA
Nos équipes s’engagent à accélérer les démarches de valorisation et de démocratisation des données de nos clients grâce aux nouvelles opportunités offertes par l’IA.
Un moteur de recherche intelligent fondé sur l’IA
Depuis décembre 2023, les portails Opendatasoft sont équipés d’une recherche sémantique qui va au-delà des correspondances littérales pour comprendre le sens des termes et leur contexte.
Le nouveau moteur de recherche présent sur les portails de nos clients permet de proposer des suggestions de résultats en temps réel et d’accéder à :
- des datasets correspondant au thème recherché,
- des actifs data correspondant au thème recherché,
- des actifs data qui comprennent le mot clé recherché ou un mot clé similaire.
Cette nouvelle méthode de recherche propose des résultats plus pertinents et s’exécute très rapidement. La découverte des données est ainsi fortement améliorée et l’expérience utilisateur plus fluide et plus performante. Pour les administrateurs de portail, cela signifie également une maintenance facilitée car il n’est plus nécessaire d’ajouter une liste exhaustive de mots clés dans les métadonnées : l’IA se charge de tout.
Des recommandations de jeux de données similaires
Afin d’améliorer la découvrabilité des données et de fluidifier l’expérience sur les portails data de nos clients, nous proposons également une fonctionnalité de recommandation automatique de données similaires fondée sur l’IA.
L’ensemble des jeux de données les plus pertinents sont ainsi affichés sur les fiches des actifs data consultés par les utilisateurs.
Cette approche vise à simplifier l’expérience de découverte des données pour tous les utilisateur·ices, en s’inspirant des meilleures pratiques des marketplaces e-commerce. Elle s’inscrit parfaitement dans la vision d’Opendatasoft de rendre l’accès et l’utilisation des données aussi simples et intuitifs que possible pour un large public de l’expert data au novice. Chaque utilisateur peut ainsi naviguer facilement à travers les quantités et la variété des actifs de données disponibles sur les portails.
Un parcours d’innovation continu et unique dans le domaine des portails de données
Notre choix de migrer vers la recherche sémantique découle d’une volonté d’améliorer l’expérience utilisateur au sein de nos portails de données. La recherche constitue un pilier essentiel de cette expérience, permettant aux utilisateurs de découvrir les données qui les intéressent. Avec la recherche lexicale, les utilisateurs sont souvent bloqués s’ils ne saisissent pas exactement ce qu’ils recherchent. En revanche, la recherche sémantique offre une flexibilité plus grande, en générant des résultats pertinents même pour des requêtes approximatives ou dans une langue étrangère au portail.
Les différentes étapes franchies pour améliorer la pertinence du moteur de recherche fondé sur l’IA
Notre parcours d’intégration de l’IA dans le moteur de recherche de notre solution a été itératif. Il a débuté avec une approche vectorielle, qui permettait de gérer des requêtes approximatives comportant des fautes d’orthographe ou des synonymes, avec une pertinence des résultats pouvant être variable. Nous avons ensuite adopté une approche hybride, combinant les méthodes lexicale et vectorielle, et classant les résultats par similarité sémantique et popularité, améliorant ainsi leur pertinence. Enfin, nous sommes revenus à une approche uniquement vectorielle, que nous avons enrichie d’un algorithme de pertinence afin de ne présenter que les résultats les plus pertinents et de ne rien afficher en cas de résultats insuffisants. Cette dernière amélioration permet de garantir une qualité optimale de résultats fournis, tout en tenant compte de l’approximation ou de l’imprécision des requêtes utilisateurs.
Des résultats prometteurs
Pour mesurer la réussite de ce modèle, nous nous basons toujours sur un indice de pertinence compris entre 0 et 1. Les résultats sont très prometteurs, puisque cet indice est passé de 0,52 à 0,87 en seulement quelques mois en testant ces différentes approches !
L’indice de pertinence, bien que crucial, n’est pas le seul facteur que nous devons prendre en compte pour assurer la qualité du moteur de recherche. En tant qu’éditeur de solution, nous sommes confrontés à la nécessité de concilier les divers besoins de nos clients, propres à chaque portail.
Les clients d’Opendatasoft au coeur de l’innovation
Nos clients bêta-testeurs ont joué un rôle central dans l’amélioration continue de notre moteur de recherche. Leurs retours tout au long du processus de développement ainsi que notre apprentissage continu des mécanismes d’IA ont permis de façonner un outil de recherche plus centré sur leurs besoins et ceux de leurs utilisateurs :
Intelligence artificielle et portail de données : de nouvelles fonctionnalités à venir !
Les équipes produit d’Opendatasoft ne s’arrêtent pas là ! De nouvelles fonctionnalités fondées sur l’IA sont en cours de développement ou de test chez nos clients et verront bientôt le jour !
Explorer les données avec l’IA
Prochainement, les utilisateurs de portails de données pourront s’appuyer sur l’Intelligence artificielle pour explorer les données. En questionnant un assistant virtuel en langage naturel, ils pourront recevoir des réponses instantanées sous divers formats de visualisation, tels que des cartes, des chiffres ou des graphiques.
Construire des pages avec l’IA
Les administrateurs de portail pourront également bientôt utiliser l’IA pour créer et intégrer des pages complètes sur leur portail. Que ce soit pour générer des visualisations dynamiques, construire des pages et agencer les éléments, un assistant virtuel répondra à toutes leurs demandes !
Si vous voulez en savoir plus sur les innovations IA qui viendront prochainement enrichir la solution Opendatasoft, contactez l’un de nos experts !
Comment maximiser la contribution des données à la croissance de votre organisation ? Un objectif ambitieux, partagé par de nombreux leaders data et qui sera au cœur de leurs enjeux 2025. Les data marketplaces émergent comme des solutions incontournables, succédant aux classiques data catalogs. Dans un monde toujours plus digitalisé, où le volume de données des organisations explose, la clé réside dans la capacité des leaders data à créer un accès facilité aux données pour tous les métiers pour générer de la valeur. Pourquoi les data marketplaces s’imposent-elles comme l’outil décisif pour franchir cette dernière étape ? Décryptage dans cet article.
Qu’est-ce que la qualité des données et pourquoi est-elle importante ? Découvrez en quoi elle constitue un levier essentiel pour instaurer la confiance et favoriser l’adoption des données, ainsi que les processus et les outils indispensables pour garantir des données fiables dans toute votre organisation.
Le DAMA-Data Management Body of Knowledge (DAMA-DMBOK) est un ouvrage de référence qui décrit le cadre, des principes et du vocabulaire essentiels à une gestion des données efficace. Dans cet article, découvrez ses grands principes et comment il peut accompagner les CDO dans l’élaboration et la mise en œuvre de leur stratégie.