L’IA générative au service du data management : les prévisions de Gartner
Comment l'IA générative peut-elle aider les Chief Data Officers et autres responsables data à optimiser leurs processus ? En nous basant sur la dernière étude de Gartner, nous abordons dans cet article de blog les atouts de l’IA intégrée au stack de gestion des données.
Le succès de l’IA repose sur des données fiables et qualitatives, à la fois pour entraîner des grands modèles de langage (LLM) mais aussi pour alimenter les applications d’IA générative (GenAI). L’IA peut également jouer un rôle clé dans la transformation des pratiques de gestion des données au sein des organisations, en améliorant la productivité, l’efficacité, la qualité et la manière dont les données sont utilisées – et par conséquent les solutions, les architectures, les modèles opérationnels, les compétences et les cas d’usage.
Comment les Chief Data Officers et responsables des données peuvent-ils dès aujourd’hui intégrer l’intelligence artificielle pour résoudre des problèmes rencontrés par leur organisation et démocratiser l’accès aux données, notamment grâce à une marketplace ? Découvrez dans cet article les principales conclusions de la dernière étude de Gartner.
Les 4 enjeux clés du data management pour 2025
Dans son rapport Predicts 2025: 4 Ways AI Will Disrupt Data Management Markets and Solutions, Gartner met en avant quatre axes permettant d’optimiser la gestion des données :
- La convergence, qui implique de réduire la complexité du stack technologique en rapprochant les outils et écosystèmes.
- La démocratisation, qui consiste à offrir à l’utilisateur final ce dont il a besoin à l’aide d’un accès simple et en self-service aux données.
- La gestion “augmentée”, qui nécessite d’améliorer la productivité des équipes data afin de leur permettre de gérer un volume croissant de données et de requêtes.
- L’optimisation des coûts, qui passe par une meilleure gestion des budgets et des dépenses technologiques, en particulier les solutions cloud.
Bien que ces pistes d’optimisation constituent des objectifs clés pour les responsables data et IT, leur mise en œuvre est rendue complexe par :
- Une pression croissante de la part des entreprises pour gérer et mettre à disposition toujours plus de données et de produits de données ;
- Des processus extrêmement manuels, avec des équipes majoritairement occupées à résoudre des problèmes et optimiser des flux au lieu de passer du temps sur des tâches stratégiques ;
- Une demande croissante de développement d’applications IA métier, sans ressources supplémentaires.
Mais si les nouveaux projets d’IA représentent une charge de travail supplémentaire, l’IA générative peut aussi transformer la gestion des données en intégrant directement la stack technologique. Gartner estime que « d’ici 2027, les assistants IA et les workflows optimisés par l’IA nativement présents dans les outils d’intégration de données réduiront les interventions manuelles de 60 % et permettront une gestion des données en self-service. »
L’impact de la GenAI sur les 4 enjeux du data management
Pour chacun des quatre thèmes évoqués ci-dessus, Gartner évoque les bénéfices de l’IA générative – que nous avons pu nous-mêmes observer en interne et auprès des clients qui utilisent notre marketplace de données.
Convergence (des outils et technologies)
Au cours des dix dernières années, le nombre et la diversité des outils technologiques ont considérablement augmenté, chacun répondant à des objectifs spécifiques. Les équipes data consacrent donc un temps précieux à intégrer ces solutions pour construire des pipelines de données de bout en bout et de garantir la bonne gouvernance des données – une situation qui est source de complexité, démultiplie la charge administrative et ralentit l’innovation. La solution ? Une approche « écosystème » où les outils fonctionnent ensemble de manière transparente, notamment grâce au partage des métadonnées, afin de garantir la qualité et la gouvernance des données. Des écosystèmes de données se développent donc aujourd’hui, à l’image de ceux créés par les fournisseurs de services cloud, qui facilitent l’intégration et réduisent les coûts de gestion. Dans le cadre de ces plateformes, la GenAI permet alors d’automatiser la convergence, tout en améliorant la qualité et la productivité.
Démocratisation du self-service
Près de la moitié des personnes interrogées dans le cadre de l’enquête Gartner 2024 Evolution of Data Management as a Dedicated Function ont cité la mise à disposition des données en self-service en tant qu’objectif d’investissement prioritaire. L’objectif est de répondre à un enjeu crucial qui est de valoriser les données en les partageant au sein de l’organisation et en externe sous la forme d’une marketplace et de produits de données. Cette nécessité croissante alourdit aujourd’hui la charge de travail des équipes chargées de rendre les données utilisables et compréhensibles par un public non-technique. Dans ce contexte, déployer l’IA générative via des LLM permet de combler le fossé entre les données et leur utilisation, en générant de manière automatique des visualisations, des tableaux de bord et autres graphiques sur la base des prompts utilisateurs. Ceux-ci sont plus simples à créer par des personnes non expertes, qu’il s’agisse de simples collaborateurs ou de membres de l’équipe data, et contribuent à démocratiser les données tout en réduisant la pression sur les équipes.
Augmentation des tâches d’ingénierie des données
Gérer la stack technologique et garantir la disponibilité des données mobilisent une part importante du temps et des ressources des équipes data. Ces tâches administratives empêchent les équipes de se concentrer sur des projets stratégiques et innovants à valeur ajoutée pour l’entreprise. Déployer l’IA générative offre la possibilité d’automatiser de nombreuses tâches, de réduire le besoin d’intervention manuelle et donc de gagner du temps. À titre d’exemple, incorporer la GenAI dans les outils de gestion des données permet aux analystes d’exécuter des requêtes et de transformer les données en utilisant le langage naturel, tandis que la gestion des métadonnées de bout en bout garantit la cohérence et la gouvernance des données. La GenAI peut également être utilisée directement par les ingénieurs data, qui peuvent l’interroger pour identifier les meilleures stratégies d’optimisation de leurs plateformes ou lui demander de générer du code à partir de leurs prompts.
Optimisation des coûts
Si le cloud a permis d’accélérer la vitesse de déploiement, de gagner en fiabilité et d’éliminer les infrastructures fixes, il nécessite toutefois une gestion rigoureuse pour rationaliser les coûts sur l’ensemble de la stack de data management. Pour relever ce défi, de nombreuses organisations adoptent déjà des outils et pratiques FinOps, et l’intégration de l’IA générative peut encore simplifier le processus. Plutôt que de devoir analyser manuellement les données pour identifier les économies possibles, les équipes data peuvent s’appuyer sur l’IA pour non seulement détecter des opportunités, mais aussi mettre en œuvre des stratégies d’optimisation automatisées. En tirant parti des capacités prédictives de l’IA, les organisations sont en mesure de mieux anticiper leurs dépenses futures et de s’assurer qu’elles sont parfaitement alignées sur leurs besoins.
Comment tirer parti de la GenAI dans la gestion des données
Pour aider les responsables des données à mettre en place et tirer profit de la GenAI, Gartner propose une checklist d’actions à réaliser :
- Étudier l’adoption d’écosystèmes de gestion des données qui rassemblent différents outils et fonctions afin de réduire la complexité de la stack technologique et les coûts de gestion associés. Ces services sont souvent proposés par des fournisseurs cloud, qui associent l’IA aux meilleures solutions du marché pour améliorer l’automatisation, la cohérence et la qualité.
- Évaluer l’utilisation d’outils de gestion des données augmentés par la GenAI afin de ne plus dépendre de compétences expertes pour créer, gérer, transformer et administrer les données.
- Veiller à investir dans la gestion des métadonnées afin de garantir la qualité des données dans l’ensemble de l’organisation, en amont de tout déploiement de LLM.
- Former les équipes data à l’utilisation du langage naturel pour comprendre et rationaliser les coûts du cloud.
- Étudier comment la GenAI peut permettre à des utilisateurs moins techniques de gérer et de consommer des données, en analysant son impact sur les compétences requises et sur votre structure organisationnelle.
- Étudier les technologies d’IA RAG (génération augmentée de récupération) et leur intérêt pour créer des applications métier basées sur la GenAI.
Le point de vue d’Opendatasoft
Chez Opendatasoft, nous nous engageons à démocratiser et valoriser les données en permettant aux organisations de les partager efficacement avec tous les utilisateurs concernés. L’IA occupe déjà une place centrale dans notre solution de marketplace de données, facilitant la consommation et le partage des données de trois façons :
- Une recherche vectorielle pilotée par l’IA, qui délivre des résultats plus précis et contextualisés, au lieu de se limiter à des mots-clés. Cela s’avère particulièrement utile pour les collaborateurs non experts, qui ne maîtrisent pas forcément la terminologie spécifique.
- Des recommandations intelligentes de jeux de données similaires, suggérant des sources ou produits complémentaires aux utilisateurs sur la base de leurs requêtes et de leurs usages.
- Des visualisations générées automatiquement par l’IA sur la base de prompts en langage naturel.
Ces fonctionnalités allègent considérablement la charge de travail des équipes data tout en garantissant à tous les utilisateurs un accès simplifié à l’information. Notre ambition est de poursuivre l’intégration de l’IA dans notre solution marketplace, ainsi que dans l’ensemble de nos pratiques. Vous souhaitez en savoir plus ? Contactez-nous pour programmer une démo de nos fonctions d’IA.
Pour répondre aux enjeux de souveraineté de nos clients et leur permettre de tirer parti des fonctionnalités optimisées par l'IA, notre solution de portail de données Opendatasoft s’appuie désormais sur l'IA générative de MistralAI, en complément de celle d'OpenAI déjà déployée en 2023. Notre approche “multi-modèles” présente de nombreuses vertus pour nos clients et leurs consommateurs data comme pour nos équipes R&D et notre innovation future.
Opendatasoft accélère depuis plusieurs mois pour transformer sa solution de portail de données grâce à l’IA et permet déjà à ses clients de gagner du temps et de réduire le risque d’erreur sur de nombreuses tâches. Découvrez comment !
Apprenez comment les portails de données renforcent l'efficacité des modèles d'IA en fournissant des données fiables, représentatives et sécurisées, essentielles pour une intelligence artificielle performante et éthique.