Qu’est-ce que le Data hub d’Opendatasoft ?
Le Data hub d’Opendatasoft est une plateforme regroupant plus de 28 000 jeux de données publiés en open data par toutes les organisations et gouvernements engagés dans une démarche d'ouverture de leurs données. Le Data hub héberge également plus de 600 datasets de référence, entretenus et mis à jour par nos équipes.
Le Data hub d’Opendatasoft est une plateforme regroupant plus de 28 000 jeux de données publiés en open data par toutes les organisations et gouvernements engagés dans une démarche d’ouverture de leurs données. Le Data hub héberge également plus de 600 datasets de référence, entretenus et mis à jour par nos équipes.
En dehors de leur utilisation première, c’est-à-dire celle qui est faite par les producteurs, ces données peuvent être bénéfiques à de nombreux autres acteurs. C’est pourquoi nous les mettons à disposition sur une plateforme intuitive, simple d’accès et permettant d’encourager la réutilisation au service de nouveaux usages innovants.
Un catalogue de données accessibles à tous
Le catalogue du Data hub regroupe plus de 28 000 datasets et ne cesse de s’enrichir. Dès qu’une organisation ouvre des données de manière publique sur son portail, celles-ci viennent s’ajouter au catalogue du Data hub.
Les utilisateurs ont la possibilité de naviguer au sein du catalogue de données grâce à une barre de recherche et une série de filtres (langue, thème, producteur, mot clé, date de modification, type de data visualisation, etc.)
Pour chaque dataset présent sur la plateforme, les utilisateurs peuvent :
- Consulter les informations relatives au dataset : propriétaire, date de création/modification, nombre de téléchargement, etc.
- Accéder à différentes visualisations : cartes, tableaux ou graphiques.
- Réutiliser les données : via les APIs générées par Opendatasoft ou les différents types d’exports proposés (CSV, Json, Excel, GeoJson, Shapefile, KML, etc)
Les 600 datasets de référence d’Opendatasoft
Les 600 jeux de données de référence sont issus de producteurs de données officiels ou d’autorités compétentes. La cohérence et la structure des données sont vérifiées par nos équipes, puis elles sont contextualisées à l’aide de référentiels géographiques.
Ces données sont fondamentales : elles viennent contextualiser et enrichir les portails data de nos clients, directement ou indirectement :
- via des jointures en utilisant ces données administratives ou référentielles pour enrichir leurs datasets
- car ces données de référence contribuent au fonctionnement de certains processeurs d’enrichissement de la donnée inhérents à notre produit, à savoir les processeurs “jointure géographique” et “récupération des divisions administratives”.
Les données de référence sont organisées en différents packs thématiques : les référentiels géographiques, démographiques, économiques, liés au logement, liés au travail, etc.
Quels sont les jeux de données de référence favoris de nos utilisateurs ?
- Les données INSEE sur la population française et la base permanente des équipements (BPE)
- La base Sirene qui recense tous les établissements français ayant un SIRET, géocodée et enrichie de données juridiques et administratives
- Les données ARCEP sur les réseaux mobiles (2G, 3G, 4G et 5G) et sur le marché de la téléphonie mobile et de l’internet fixe
- Les données Sit@del sur les constructions de logements
- Les données relatives aux élus nationaux, répertoires des associations et aux différentes élections françaises via les données du ministère de l’Intérieur.
- Les référentiels géographiques qui permettent à nos clients de présenter leurs données sous forme de carte.
Des visualisations didactiques sont paramétrées sur la plupart des données de référence. Arrêtez-vous un instant pour explorer les données !
Des outils pour encourager l’exploration et la réutilisation des données
Les utilisateurs du Data hub d’Opendatasoft ont également accès à des outils leur permettant de manipuler les données du catalogue avec les onglets “Cartes” et “Analyse”.
En quelques clics, il est possible de sélectionner un ou plusieurs datasets pour créer une carte ou un graphique. Un code iFrame ou un URL est généré automatiquement pour pouvoir facilement partager la réalisation.
Qui peut utiliser le Data hub d’Opendatasoft ?
Tout le monde peut accéder au Data hub et réutiliser les données et outils mis à disposition. Les applications peuvent être multiples. Souvent, ces données permettent de réaliser des usages qu’il n’était pas possible de mettre en place auparavant. Par exemple, sans références géographiques il n’est pas possible de présenter vos données sous forme de carte.
Nos clients sont les premiers à réutiliser ces datasets grâce à une connexion très simple depuis notre plateforme et afin d’enrichir leurs expériences data.
Voici quelques exemples de réutilisation de nos clients :
Pour enrichir ses propres datasets, la Caisse des Dépôts mobilise les données publiques normalisées (base SIRENE, commande publique) et des référentiels géographiques (liste des communes et leurs contours) disponibles gratuitement sur le Data hub d’Opendatasoft.
Lamie mutuelle utilise les datasets disponibles sur le Data hub d’Opendatasoft pour enrichir les profils de ses adhérents et délégataires avec des données publiques. Par exemple, les équipes utilisent le dataset SIRENE V3 pour récupérer des données relatives aux clients “entreprise” : code postal, effectif, activité, etc. C’est donc une réelle plus value dans un contexte d’ouverture des données qui permet à l’organisation d’enrichir sa connaissance client avec des informations exhaustives et de qualité.
ICF Habitat, filiale immobilière du groupe SNCF, s’appuie sur les référentiels du Data hub pour consolider ses données en interne et créer des data visualisations sur mesure pour piloter son parc immobilier. Sans ces données, le groupe n’aurait pas pu réaliser des dashboards aussi précis ou encore des cartes interactives permettant de suivre le développement de l’activité.
Le Groupe BPCE utilise le Data Hub d’Opendatasoft comme source unique pour toutes les données publiques utilisées. Cela permet notamment de créer des data visualisations sous forme de carte pour consulter l’ensemble des agences présentes sur le territoire.
Vous voulez en savoir plus sur le Data hub d’Opendatasoft ? Contactez-nous !
Face à l’explosion des volumes de données, la question de leur usage à l’échelle est devenue centrale. Les organisations cherchent désormais des solutions capables de transformer leur patrimoine informationnel en un puissant moteur de performance au service des métiers.
Les organisations produisent aujourd'hui une grande quantité d'actifs de données à travers leurs opérations et services. Exploiter ces données de manière efficace implique de savoir quelles sont les données disponibles et où elles se situent. Pour cela, les entreprises utilisent des catalogues de données centralisés. Cet article explique en quoi consistent ces catalogues et quels sont leurs bénéfices pour les entreprises.