Language

[Replay] Aider les métiers à consommer les données : data marketplace ou data catalog ?

Voir le replay
Glossaire

Data Mart

Sous-ensemble d'un data warehouse, un datamart constitue un moyen de stocker des données axées sur un bureau, un département, un secteur d'activité ou un sujet particulier.

Qu’est-ce qu’un Data Mart ?

Sous-ensemble d’un data warehouse, un datamart constitue un moyen de stocker des données axées sur une activité, un département, un secteur d’activité (tel que la finance ou le marketing) ou un sujet particulier. Il permet à un groupe défini d’utilisateurs d’accéder rapidement à des données pertinentes, sans devoir chercher dans l’intégralité du data warehouse de l’entreprise.

Un datamart est structuré de la même manière qu’un data warehouse, à l’aide d’outils d’extraction, de transformation et de transmission de données (ETL) pour ajouter des données et des outils de business intelligence en vue d’analyser les informations. Les datamarts peuvent être :

  • dépendants, avec des données provenant uniquement d’un data warehouse central
  • indépendants, collectant directement les données auprès des sources
  • hybrides, collectant des informations à la fois à partir d’un data warehouse et de sources supplémentaires

En quoi un Data Mart est-il différent d’un data warehouse (Data Warehouse) ou d’un data lakehouse (Data Lake) ?

Un datamart est essentiellement une petite section d’un data warehouse, la principale différence étant la quantité (volume) et le type de données qu’il contient. Tandis qu’un data warehouse vise à centraliser toutes les données d’une entreprise dans plusieurs domaines au moyen d’un modèle structuré, un datamart se concentre sur un seul domaine (un département, par exemple). Les données proviennent d’un data warehouse central, du data lakehouse ou de sources supplémentaires. Cela signifie qu’il contient moins de données et qu’il est donc plus agile et plus performant lorsqu’il s’agit de traiter les requêtes des utilisateurs.

Un data lakehouse diffère d’un datamart de données et d’un data warehouse car il stocke les données de manière non structurée, sans les nettoyer ni les traiter. Un data lakehouse peut alimenter un data mart, ce dernier ajoute une structure aux données à mesure de leur importation.

Quels sont les avantages d’un Data Mart ?

Les datamarts constituent une alternative aux data warehouses, jugés complexes d’utilisation par les entreprises. Plus faciles à gérer, ils offrent aux utilisateurs un accès rapide aux données ciblées dont ils ont besoin pour faire leur travail.

Les datamarts présentent quatre avantages majeurs :

La création et la gestion d’un data mart est moins onéreuse

Comme ils sont plus petits et moins complexes qu’un data warehouse ou un data lakehouse, les datamarts sont plus faciles à créer et moins coûteux à construire et à gérer/maintenir.

Accès plus rapide à des utilisateurs spécifiques

Les datamarts contiennent moins d’informations, mais elles sont toutes pertinentes pour les utilisateurs. Il est donc plus facile et plus rapide pour les utilisateurs de trouver les données nécessaires, accélérant ainsi la création de rapports ou de tableaux de bord. L’accès aux données peut être accordé à un niveau d’utilisateur plus granulaire, ce qui améliore la gouvernance et la conformité des données.

Permet une meilleure prise de décision

Les datamarts permettent aux employés d’accéder facilement aux données nécessaires pour accomplir leur travail. Il en résulte une meilleure prise de décision fondée sur les données, créant ainsi un impact positif sur les revenus globaux. Ils agissent comme une source unique d’accès à des données fiables de référence pour le département ou la zone concerné(e).

Meilleure performance

Puisqu’ils contiennent moins de données (en moyenne jusqu’à 100 Go), les datamarts effectuent plus rapidement certaines actions, telles que l’exécution d’analyses, accélérant ainsi l’accès aux données. De même, la gestion et la modification des données se fait plus aisément, les process sont moins complexes.

Quels sont les défis posés par les Data Marts ?

S’ils présentent des avantages, les datamarts présentent également trois inconvénients en matière de gestion des données :

Les Data Marts nécessitent une modélisation et un nettoyage des données

Comme il s’agit essentiellement de versions plus petites d’un data warehouse, les datamarts partagent certains de leurs inconvénients. Ils nécessitent une modélisation et un nettoyage des données avant leur mise à disposition auprès des utilisateurs.

Les Data Marts ne fournissent pas une vue d’ensemble des données des organisations

Les données d’un data mart concernent une activité ou un service spécifique. Cela signifie que les utilisateurs ne peuvent pas accéder facilement aux données en dehors du datamart, bien que celles-ci soient stockées dans le data warehouse contenant toutes les données de l’organisation. Cela crée des silos de données potentiels au sein de l’organisation, entravant la démocratisation des données.

Risque d’incohérence des données

Les données de l’entreprise, telles que celles du data warehouse, peuvent être partagées et dupliquées dans plusieurs data marts, par exemple un data mart destiné aux ventes et un autre au marketing. Cela signifie que si des jeux de données sont modifiés, ces mises à jour risquent de ne pas être appliquées à l’ensemble des datamarts. Ceci entraîne des incohérences et augmente le temps et les coûts de gestion.

 

Découvrez dans notre Ebook comment partager vos données à travers un portail de données.

En savoir plus
Données, métadonnées, actifs de données, data products : comment différencier ces concepts clés ? Tendances
Données, métadonnées, actifs de données, data products : comment différencier ces concepts clés ?

Dans un monde de plus en plus orienté vers les données, comprendre et différencier les notions de données (data), métadonnées (metadata), actif de données et data products (produits de données) est devenu indispensable pour maximiser leur potentiel. Ces concepts interdépendants, bien que distincts, jouent chacun un rôle clé dans la transformation digitale des organisations et leur capacité à faciliter le partage et la consommation de données à l’échelle.

Tendances data 2025 par Gartner : focus sur les données en self-service Tendances
Tendances data 2025 par Gartner : focus sur les données en self-service

Des données toujours plus nombreuses, une complexité croissante, des budgets contraints : voici quelques-unes des problématiques auxquelles les CDO doivent aujourd’hui faire face. Découvrez les tendances et défis auxquels sont confrontés les CDO, et comment garantir le ROI de vos projets data, selon le cabinet Gartner.

Les 3 raisons pour lesquelles les data marketplaces sont la seule solution pour créer de la valeur Marketplace de données
Les 3 raisons pour lesquelles les data marketplaces sont la seule solution pour créer de la valeur

Comment maximiser la contribution des données à la croissance de votre organisation ? Un objectif ambitieux, partagé par de nombreux leaders data et qui sera au cœur de leurs enjeux 2025. Les data marketplaces émergent comme des solutions incontournables, succédant aux classiques data catalogs. Dans un monde toujours plus digitalisé, où le volume de données des organisations explose, la clé réside dans la capacité des leaders data à créer un accès facilité aux données pour tous les métiers pour générer de la valeur. Pourquoi les data marketplaces s’imposent-elles comme l’outil décisif pour franchir cette dernière étape ? Décryptage dans cet article.

Commencez à créer vos expériences data