Language

[Replay] Aider les métiers à consommer les données : data marketplace ou data catalog ?

Voir le replay
Produit

Intégration des modèles LLM de Mistral AI pour une IA souveraine et une approche multi-modèles adaptée aux besoins de nos clients

Mistral AI

Pour répondre aux enjeux de souveraineté de nos clients et leur permettre de tirer parti des fonctionnalités optimisées par l'IA, notre solution de portail de données Opendatasoft s’appuie désormais sur l'IA générative de MistralAI, en complément de celle d'OpenAI déjà déployée en 2023. Notre approche “multi-modèles” présente de nombreuses vertus pour nos clients et leurs consommateurs data comme pour nos équipes R&D et notre innovation future.

Product Marketing Manager, Opendatasoft
Voir tous ses articles

L’intelligence artificielle répond à de nombreux besoins, et depuis l’enthousiasme suscité par ChatGPT en 2023, la plupart des organisations ont saisi l’opportunité de l’intégrer à leurs produits et services, si bien qu’il devient de plus en plus difficile de faire la distinction entre les véritables cas d’usage et les simples tendances passagères. Chez Opendatasoft, les équipes ont depuis longtemps exploré des applications concrètes de l’IA, traduites par des fonctionnalités rapidement adoptées par nos clients. Pour aller plus loin, Opendatasoft intègre aujourd’hui le modèle de LLM de MistralAI, un acteur européen de l’IA générative, permettant à une partie de nos clients, sensibles aux enjeux de souveraineté, d’en bénéficier également.

Copy to clipboard

L’intégration de l’IA ne se fait pas en un clin d’œil ; une stratégie efficace exige des choix réfléchis à chaque étape pour proposer des fonctionnalités pertinentes qui répondent aux enjeux de nos clients et apportent une réelle valeur ajoutée. Dans le cadre de sa stratégie d’IA, Opendatasoft a suivi trois étapes clés avant de déployer ses fonctionnalités :

 

  • Le choix des modèles : Opendatasoft a, dès le début de ses explorations dans le domaine de l’IA, décidé d’exploiter les modèles et les services proposés par des acteurs établis, en commençant avec les modèles disponibles et proposés par OpenAI. Cette stratégie lui a permis de concentrer ses efforts sur le développement de fonctionnalités, chacune reposant sur un modèle parfaitement adapté à son cas d’usage. Aujourd’hui, ces mêmes modèles proposés par MistralAI ont été intégrés dans la solution.

 

  • Le choix de l’hébergement et notamment pour répondre aux enjeux de souveraineté : une fois les modèles sélectionnés, se pose la question de leur hébergement. À nouveau, Opendatasoft a choisi de s’appuyer sur des infrastructures existantes, fournies par des partenaires tels qu’OpenAI et MistralAI, ce dernier offrant l’avantage d’héberger ses modèles en Europe. Ce choix repose sur une demande croissante de ses clients en matière de localisation et d’hébergement des modèles. Une problématique de taille, notamment pour les organisations de l’Union européenne, qui doivent répondre à des exigences de souveraineté, de compatibilité et de conformité RGPD.

 

  • Les méthodes d’interrogation des modèles pour optimiser la valeur de l’IA : en s’appuyant sur des modèles d’IA et des infrastructures d’hébergement existants, Opendatasoft a pu concentrer ses ressources et son expertise sur l’un des aspects clés de sa stratégie IA : l’optimisation des méthodes d’interrogation des modèles. Les équipes R&D d’Opendatasoft s’attachent à optimiser la façon d’interroger les modèles d’IA pour fournir le bon contexte et trouver un juste équilibre entre la quantité minimale d’informations transmises et la pertinence des résultats produits par l’IA. Ce processus d’optimisation transforme cette technologie en un puissant moteur d’innovation et de performance pour l’exploitation des données.
Copy to clipboard

Comprendre l'IA pour mieux l'exploiter et en tirer de la valeur ajoutée

Développer des outils intelligents basés sur l’IA nécessite une compréhension approfondie de leurs mécanismes. Conscientes de ces enjeux, les équipes d’Opendatasoft s’appuient sur des cas d’usage concrets pour offrir des solutions pertinentes qui soutiennent leur mission de démocratisation de l’accès aux données. Pour atteindre cet objectif, il est crucial que les modèles d’IA s’adaptent au contexte dans lequel ils sont utilisés. Dans le cas d’Opendatasoft, cela signifie que les requêtes formulées par les utilisateurs peuvent être enrichies d’éléments contextuels tels que des métadonnées ou des extraits de données. Ces éléments permettent d’exploiter l’IA de manière efficace et de révéler des insights précieux, transformant ainsi les données en atouts stratégiques pour les utilisateurs.

Identifier les différences entre les modèles d’IA pour mieux les adapter

L’intégration des modèles de Mistral AI a conduit les équipes R&D d’Opendatasoft à travailler sur une approche multi-modèles. Bien que les performances de ces modèles soient quasiment équivalentes, une différence majeure demeure : la manière dont un modèle répond, qui varie selon la formulation des questions. C’est ici que les équipes d’Opendatasoft jouent un rôle essentiel en interrogeant de manière pertinente les modèles, en tenant compte de leurs spécificités et du contexte d’utilisation. L’objectif ? Assurer que les utilisateurs obtiennent des résultats cohérents d’un modèle à l’autre lorsqu’ils interagissent avec l’IA.

Tester, itérer et diffuser la connaissance pour des modèles toujours plus performants

Pour garantir des fonctionnalités fiables, les équipes R&D d’Opendatasoft appliquent un principe fondamental : ne pas faire confiance aveuglément à l’IA. Elles interrogent les modèles en leur fournissant un maximum de contexte pour produire des résultats basés sur des informations réelles. Par exemple, pour réduire le risque d’hallucination (lorsqu’un modèle fournit une réponse incorrecte parce qu’il a reçu une question incohérente), nos équipes interrogent les modèles et leur apprennent à répondre par « non » lorsque la réponse n’est pas cohérente, plutôt que de donner une information erronée. Pour faciliter la diffusion de la connaissance en interne et permettre un suivi précis des apprentissages de l’IA, les résultats de centaines de tests sont centralisés et présentés dans des tableaux de bord internes, qui mettent en évidence des indicateurs clés tels que l’évolution des performances des requêtes, le temps de réponse et l’estimation des coûts.

Copy to clipboard

Depuis près d’un an, Opendatasoft offre à ses utilisateurs plusieurs fonctionnalités basées sur l’IA, intégrées à leurs portails de données, afin d’améliorer les performances et optimiser la consommation de leurs données :

  • Une recherche intelligente pour identifier toutes les données pertinentes : les portails d’Opendatasoft ont intégré une recherche sémantique basée sur un modèle vectoriel pour permettre d’améliorer la pertinence des résultats. Concrètement, ce moteur de recherche multilingue permet d’aller au-delà des recherches par mots-clés et des correspondances littérales, en prenant en compte le contexte ainsi que l’intention des utilisateurs, offrant ainsi des résultats rapides et pertinents. Une recherche qui ne laissera plus les utilisateurs passer à côté de données utiles pour leurs besoins.

AI search

 

  • Des recommandations de données similaires : inspirée de l’expérience e-commerce, Opendatasoft intègre une fonctionnalité qui aide les utilisateurs à découvrir des données pertinentes grâce à des recommandations de jeux de données similaires. Cette approche prolonge l’engagement des utilisateurs et enrichit leur expérience en augmentant le volume de données consultées sur le portail. En mettant en avant les actifs de données les plus pertinents, elle simplifie la navigation et permet un accès facile à une multitude d’informations complémentaires.

Donnée similaires

 

  • La création de visualisations de données pour donner vie aux données brutes : en intégrant cette fonctionnalité de génération de dataviz, Opendatasoft offre à ses utilisateurs la possibilité de créer et de réutiliser des cartes, tableaux ou encore graphiques en quelques clics seulement grâce à l’IA. Un outil innovant, interactif et pédagogique, qui permet aux utilisateurs de se familiariser avec l’IA tout en exploitant des données brutes de façon autonome !

Génération automatique de visualisations IA

Copy to clipboard

L’IA est une technologie puissante et en constante évolution au sein de notre écosystème numérique, que nous mettons à profit pour aider nos clients à relever efficacement leurs défis liés aux données. Voici un aperçu de nos ambitions avec l’IA pour enrichir notre solution :

 

  • Intégrer les modèles de nos clients : dans notre approche multi-modèles, nous souhaitons à terme permettre à nos clients de choisir parmi différents modèles d’IA et de faciliter l’intégration prochaine de leurs propres modèles, et envisageons même de leur proposer des outils que nos équipes utilisent en interne pour évaluer la qualité du contenu généré et identifier le modèle le plus pertinent.

 

  • Aider les utilisateurs à se servir de l’IA : nous travaillons également à fournir toutes les ressources nécessaires pour les aider à tirer pleinement parti des fonctionnalités existantes, car l’IA est comparable à un vélo électrique : elle offre une assistance précieuse, mais nécessite de savoir pédaler pour en tirer le plein potentiel. 

 

  • Proposer un chatbot : nous envisageons l’intégration d’un chatbot permettant à l’utilisateur final d’interagir avec l’ensemble des actifs de données du portail.

La liste des fonctionnalités applicables aux enjeux data est vaste, et les idées ne manquent pas : automatisation de tâches, préparation et mise en qualité de données, définition de chaînes de traitement, extraction de métadonnées, synthèse de documents… Une chose est certaine : pour Opendatasoft, l’utilisation de l’IA ne risque pas de s’arrêter là. 

Articles sur le même thème : Self-service data Data Intelligence
Contenus associés
Données, métadonnées, actifs de données, data products : comment différencier ces concepts clés ? Tendances
Données, métadonnées, actifs de données, data products : comment différencier ces concepts clés ?

Dans un monde de plus en plus orienté vers les données, comprendre et différencier les notions de données (data), métadonnées (metadata), actif de données et data products (produits de données) est devenu indispensable pour maximiser leur potentiel. Ces concepts interdépendants, bien que distincts, jouent chacun un rôle clé dans la transformation digitale des organisations et leur capacité à faciliter le partage et la consommation de données à l’échelle.

Tendances data 2025 par Gartner : focus sur les données en self-service Tendances
Tendances data 2025 par Gartner : focus sur les données en self-service

Des données toujours plus nombreuses, une complexité croissante, des budgets contraints : voici quelques-unes des problématiques auxquelles les CDO doivent aujourd’hui faire face. Découvrez les tendances et défis auxquels sont confrontés les CDO, et comment garantir le ROI de vos projets data, selon le cabinet Gartner.

Les 3 raisons pour lesquelles les data marketplaces sont la seule solution pour créer de la valeur Marketplace de données
Les 3 raisons pour lesquelles les data marketplaces sont la seule solution pour créer de la valeur

Comment maximiser la contribution des données à la croissance de votre organisation ? Un objectif ambitieux, partagé par de nombreux leaders data et qui sera au cœur de leurs enjeux 2025. Les data marketplaces émergent comme des solutions incontournables, succédant aux classiques data catalogs. Dans un monde toujours plus digitalisé, où le volume de données des organisations explose, la clé réside dans la capacité des leaders data à créer un accès facilité aux données pour tous les métiers pour générer de la valeur. Pourquoi les data marketplaces s’imposent-elles comme l’outil décisif pour franchir cette dernière étape ? Décryptage dans cet article.