L’open data, ça sert à quoi ?
L'open data ne doit pas être une fin en soi. Cet article vous présente les principaux enjeux d'une approche open data pour votre organisation.
Voici les mots employés par Yann Caradec, l’un des principaux architectes de la démarche open data du Ministère de l’Enseignement supérieur et de la Recherche, lors d’une récente conférence sur l’ouverture des données, l’éducation et la culture. Ces mots n’ont pas été choisis au hasard et viennent rappeler que l’open data ne doit pas être une fin en soi.
Lorsqu’une organisation – qu’il s’agisse d’une collectivité, d’une ville, d’un ministère ou d’une entreprise – met ses données à disposition de tous, cela doit au contraire être un moyen d’encourager des transformations bénéfiques et durables. Ces transformations impactent non seulement l’organisation et ses agents (accélération de la marche vers plus de transparence, refondation du lien de confiance entre administrations et administrés, structuration de l’information à l’intérieur de l’organisation), mais aussi les citoyens et usagers en bout de chaîne (amélioration de l’offre de services publics, droit de regard sur la vie économique et publique, meilleur accès aux connaissances et aux biens culturels).
Ce sont quelques-uns des bénéfices de l’open data que nous allons ici explorer, exemples et cas d’usages à l’appui, pour rendre compte de l’intérêt réel d’une démarche open data.
Impulser la co-création de services profitables aux citoyens
La première raison d’être de l’ouverture des données est sans nul doute le bouillonnement créateur qu’elle est capable d’engager. Applications mobiles conçues pour l’optimisation des déplacements ou moteurs de recherche pensés pour répondre aux besoins des consommateurs en matière de sécurité sanitaires des aliments… de tels dispositifs s’appuient sur des données détenues et produites par les villes, les agents d’Etat ou les délégataires de services publics territoriaux. Ces organisations peuvent choisir de développer elles-mêmes des ressources basées sur les données ou décider de s’en remettre à l’intelligence collective pour co-produire, avec l’écosystème des développeurs et les citoyens, des services qui leur correspondront en tous points.
Les pré-requis aux réutilisations
Mais pour espérer voir les données qu’elles partagent être réutilisées et servir de ciment à l’échafaudage de nouveaux services, ces organisations doivent d’abord veiller à respecter quelques conditions incontournables :
- Privilégier la qualité par rapport à la quantité. Une démarche open data ne doit pas être une course vers la publication la plus massive possible de jeux de données. Bien au contraire. Un jeu de données propre, complet, historicisé et contextualisé grâce à des métadonnées bien renseignées aura bien plus d’opportunités de réutilisations qu’une kyrielle de jeux de données à trous.
- Ouvrir les données sous des formats standards. L’interopérabilité doit servir de boussole à toute initiative open data. Un réutilisateur de données ne pourra pas se contenter d’un fichier PDF ou d’un lien HTML et rebroussera chemin avant même d’avoir pris le temps d’examiner le contenu d’un jeu de données s’il sait qu’il ne pourra pas l’utiliser facilement. Place donc aux formats CSV, JSON, GeoJSON ou Shapefile, bien connus des développeurs.
- Choisir une licence open data permissive est un moyen sûr de rassurer les futurs réutilisateurs de données quant à leur marge de manoeuvre. La licence ouverte d’Etalab impose uniquement la mention de la paternité des données. Quant à la licence open database (ODbL), elle demande à ce que la source soit citée et que les travaux d’enrichissement des données soient partagés sous la même licence. Dans les deux cas, la réutilisation commerciale des données est autorisée, laissant ainsi l’opportunité à d’éventuels réutilisateurs de développer de nouveaux modèles économiques à partir des données ouvertes.
- Fournir des APIs reste la meilleure option pour alimenter une potentielle application. Intermédiaire entre le portail du producteur de données et l’application mobile, l’API va permettre au développeur de traduire sa requête en langage informatique pour que son application récupère automatiquement les données sans qu’il n’ait lui-même besoin d’intervenir durant le processus. Il pourra garder l’esprit tranquille, son application étant assurée de recevoir des données toujours à jour.
Transports : l’open data en mouvement
Le monde de la mobilité fait partie des très bons élèves en matière d’open data et trace résolument son sillon vers le temps réel.
Saemes, exploitant de nombreux parkings à Paris et en Ile-de-France a lancé son portail open data en mars 2016 et a depuis ajouté les places de stationnement disponibles en temps réel pour une vingtaine de parkings. Pour Alain Deves, directeur général de l’entreprise, l’objectif d’un tel projet est clair : faire en sorte que les données diffusées par Saemes soient intégrées dans des applications ouvertes recensant tous les parkings (tous exploitants confondus) pour permettre aux automobilistes de gagner du temps mais aussi, bien sûr, de les orienter vers les places de stationnement gérées par l’opérateur.
Les données ouvertes par Saemes sont notamment réutilisées dans l’application web et mobile J’accède qui permet d’identifier les lieux accessibles aux personnes à mobilité réduite. La carte de l’application récupère les données pertinentes directement via l’API du portail de Saemes.
Le jeu de données sur l’accessibilité des parking aux personnes à mobilité réduite génère une API utilisée par J’accède pour alimenter son application.
Le réseau STAR (Keolis), opérateur des transports en commun de la métropole de Rennes a choisi très tôt de faire confiance aux développeurs et aux usagers, et placé la relation avec ces deux communautés au coeur de sa démarche open data. L’opérateur a lancé son programme d’ouverture des données en 2010 en rendant accessibles sur une plateforme les données sur la disponibilité des vélos en libre-service. Plusieurs jeux de données sont ensuite venus en grossir les rangs, de la circulation des bus en temps réel aux prochains passages des métros à chaque arrêt. Le portail compte aujourd’hui 36 jeux de données exportables, visualisables sous forme de tableaux, cartes ou graphiques, et entièrement accessibles via des APIs normalisées.
Car entre temps, le réseau STAR a dû faire évoluer son portail pour répondre aux besoins de clarification des données émis par les usagers, ainsi qu’aux demandes de standardisation des formats de données et des APIs formulées par la communauté des développeurs rennais. « Réunir des techniciens et des non-techniciens autour d’un outil commun est indispensable pour continuer à faire progresser notre démarche open data et encourager la création de services pour les usagers » commente à ce titre Benjamin Bertelle, ingénieur études et développement chez Keolis Rennes.
Et l’opérateur a bien fait de prendre leurs requêtes en considération. Plusieurs applications et outils au service de la population et des travailleurs de la métropole ont en effet pu être développés ou améliorés. L’application Où est mon bus permet ainsi de repérer la position des bus STAR en temps réel tandis que l’application WeGo Rennes favorise l’intermodalité en permettant de consulter les horaires des bus et des métros, ainsi que la disponibilité des vélos. Plusieurs entreprises se sont également branchées au portail du réseau STAR pour afficher sur leurs écrans d’accueil les prochains départs des bus et ainsi faciliter les déplacements de leurs collaborateurs et clients.
Le jeu de données sur la circulation des bus en temps réel dans la métropole rennaise alimente l’application Où est mon bus
SNCF n’est pas en reste. Le groupe ferroviaire a publié début mai 2017 plus de 110 jeux de données sur son portail, portant son catalogue à près de 200 jeux de données. Tous sont exploitables dans de possibles applications et constituent une mine d’informations – pour beaucoup d’entre elles en temps réel – éminemment utiles pour les voyageurs. Carte de tous les points de vente SNCF, incidents de sécurité, signalement des dysfonctionnements en gare, objets trouvés ou disponibilités à 30 jours de places TGVmax ouvertes à la réservation… la mise à disposition d’une telle quantité de données essentielles pour mieux orienter et satisfaire les usagers des trains marque un tournant majeur pour l’information voyageur.
Contrôler son assiette
Le monde du transport n’est pas le seul à oeuvrer pour que de nouveaux services basés sur les données voient le jour. Début 2017, le Ministère de l’Agriculture a lancé Alim’ Confiance, une application permettant aux citoyens d’accéder aux résultats des contrôles d’hygiène effectués tout au long de la chaîne alimentaire (production, transformation et distribution).
Abattoirs, supermarchés, restaurants, boucheries ou encore boulangeries… tous les établissements impliqués dans l’offre d’aliments aux consommateurs sont concernés par cette démarche de transparence sanitaire. Les utilisateurs de l’application peuvent rechercher les établissements qui les intéressent par mots-clefs ou les identifier directement sur une carte interactive. Quatre niveaux d’hygiène sont renseignés : très satisfaisant, satisfaisant, à améliorer et à corriger de manière urgente.
Une telle initiative a le mérite de donner aux citoyens quelques cartes en main supplémentaires pour procéder à leur acte d’achat en connaissance de cause.
Agir pour la transparence de l’action publique
Au regard des multiples affaires qui affaiblissent considérablement le lien de confiance entre le monde politique et les citoyens, on pourrait se dire que le chemin vers la transparence de la vie publique et l’intégrité du pouvoir s’apparente à la quête du Saint-Graal. Un mythe donc. Si l’open data ne peut probablement pas grand chose en matière d’éthique individuelle, elle peut toutefois baliser le chemin pour rendre automatique l’accès aux informations relatives au fonctionnement de l’Etat et des collectivités.
Les exemples de Rennes (ville et métropole) et d’Issy-les-Moulineaux sont à ce titre éloquents. Au-delà de la simple mise à disposition de leur rapport financier, les deux localités ont choisi de transformer leurs données budgétaires en véritables outils permettant le contrôle de leurs actions par les citoyens.
La capitale bretonne et la commune des Hauts-de-Seine proposent toutes deux à leurs administrés un site entièrement dédié aux visualisations des données financières. Détail des recettes (dotations de l’Etat, cotisation foncière des entreprises, taxe sur l’enlèvement des ordures ménagères, etc.), répartition des dépenses selon les secteurs (culture, jeunesse, environnement, collecte des déchets, etc.), financement de projets concrets (rénovation d’une piscine, production de nouveaux logements, équipement numérique des écoles, etc.) : tout est renseigné et explicité pour que les citoyens contribuables soient éclairés du mieux qui soit sur l’état des finances de leur ville et sur l’utilisation de l’argent de leurs impôts.
Les données brutes sur le budget et les finances sont également disponibles sur le portail open data de Rennes Métropole et d’Issy-les-Moulineaux, laissant ainsi le choix aux citoyens de naviguer entre les chiffres selon leur degré de maîtrise comptable et mathématique.
Au Portugal, le Ministère de la Santé a fait le choix de lancer un site entièrement dédié à la transparence et l’intelligibilité des données de santé. Ouvert en février 2016, le portail a pour objectif de mieux informer les citoyens en rendant accessibles de nombreuses données sur les vaccins, les dons du sang ou les soins de santé primaires, mais aussi en affichant plus de transparence quant aux ressources financières et humaines dont disposent les entités médicales. L’initiative porte également en elle le souhait de pousser les établissements de santé à améliorer leur fonctionnement ainsi que l’efficacité et la qualité de leurs services.
Favoriser la démocratisation culturelle et la diffusion des connaissances
Diffuser la culture
L’open data est un formidable moyen de donner plus de visibilité à des oeuvres confidentielles ou méconnues du public, et du même coup aux artistes et institutions qui en ont la paternité ou la possession.
Le musée départemental Albert-Kahn possède une collection de plusieurs dizaines de milliers d’autochromes (photographies en couleurs sur plaque de verre) et de films en noir et blanc représentant la diversité des habitants du monde au début du XXe siècle. Méconnu des touristes et amateurs d’art, le musée installé à Boulogne-Billancourt a profité de l’ouverture du portail open data des Hauts-de-Seine pour mettre en lumière ces Archives de la Planète et porter à l’attention du public son travail de numérisation et de documentation effectué pendant près de dix ans.
La collection compte des photographies prises aux quatre coins du monde par les opérateurs envoyés par le banquier et philanthrope Albert Kahn entre 1909 et 1931. Pour aller un peu plus loin que la seule mise à disposition du fonds d’images, le musée a donc choisi de géolocaliser chacun des autochromes. L’exploration peut donc non seulement se faire en déroulant le fil des images mais aussi en cliquant sur telle ou telle zone géographique.
Plus de 44 000 visites ont été décomptées dans les quatre mois ayant suivi l’ouverture publique et gratuite de la collection (début juin 2016). Celle-ci a d’ailleurs pu bénéficier d’une attention toute particulière de la part des journalistes, surpris par un tel projet de partage des données culturelles. « Plus que la démarche open data en tant que telle, c’est la possibilité de découvrir en ligne une collection jusqu’alors très confidentielle qui a frappé les journalistes« explique Isabelle Peretti, attachée de conservation au musée Albert-Kahn. En période de non-couverture médiatique, les photographies sont explorées en ligne par une moyenne de 100 visiteurs par jour. « Grâce à l’open data, nous parvenons à toucher un public qui ne connaissait pas le musée mais qui potentiellement pourra venir sur place en découvrir les oeuvres » conclut Isabelle Peretti.
L’initiative du musée boulonnais a ouvert la voie à d’autres démarches du même acabit. Inspiré par la réussite du projet Albert-Kahn, le département des Hauts-de-Seine a ouvert une collection de cartes postales anciennes témoignant du passé de ses 36 communes. Le Ministère de la Culture et de la Communication est aussi de la partie. L’institution a publié sur son portail open data près de 40 000 images géolocalisées de monuments historiques et rendu public le fonds photographique de la guerre 14-18.
Aider les acteurs de la recherche
L’open data peut également s’inscrire comme un important vecteur de diffusion des connaissances en aidant chercheurs, étudiants et innovateurs à produire de la valeur scientifique à partir des données.
En mettant à disposition de tous les mesures générées par des capteurs installés sur la place de la Nation, la ville de Paris offre de nombreuses pistes d’étude sur l’occupation de l’espace urbain et sur la relation entre le trafic et les pollutions atmosphériques et sonores. Urbanistes et entrepreneurs de tous horizons peuvent ainsi s’appuyer sur des données qui évoluent en temps réel pour penser le réaménagement de la place et développer un modèle applicable à d’autres points de rencontre dans la ville pour améliorer significativement la qualité de vie de ses habitants.
Un autre exemple d’ouverture et de mise en intelligence des données nous est fourni par le portail du Centre de Recherche et d’Etudes sur le Pétrole du Roi Abdullah (Kapsarc), situé à Riyad en Arabie Saoudite. Plus de 850 jeux de données relatifs aux différentes sources d’énergie au Moyen-Orient, en Asie et en Afrique de l’Est y sont entièrement accessibles. Deux angles d’approche des données sont proposés par Kapsarc :
- l’exploration des données brutes par type de ressources (nucléaire, énergies renouvelables, gaz naturel, charbon, etc.), types d’usages (industrie, agriculture, transport et secteur résidentiel) ou par pays (Qatar, Chine, Ouganda, Koweït, etc.).
- la mise à disposition d’un tableau de bord mettant en lumière les chiffres-clefs sur la production ou la consommation des ressources selon leur type.
Le portail constitue ainsi un précieux gisement d’informations stratégiques pour analyser la part des différentes ressources dans le mix énergétique mondial, observer l’état des réserves de combustibles fossiles et en tirer toutes les conclusions nécessaires pour préparer le futur de l’énergie.
Open data peut aussi rimer avec croisement des compétences scientifiques. En France, le ministère de l’Enseignement supérieur et de la Recherche (MENESR) a fait de la mise en réseau des acteurs de l’innovation un moteur de son programme d’ouverture des données. En travaillant avec l’INPI (Institut National de la Propriété Intellectuelle), le ministère a notamment produit un Atlas des brevets permettant d’identifier tous les acteurs de la propriété intellectuelle en France. Principales intéressées, les collectivités territoriales ont ainsi la possibilité de connaître les grands domaines technologiques et le panel d’inventeurs et de déposants de brevets qui oeuvrent à l’excellence scientifique de leur territoire. Toutes les données brutes ayant servi à monter cet atlas sont par ailleurs disponibles sur le portail open data du ministère.
Parallèlement à ce projet, le MENESR a développé ScanR, un moteur de recherche visant à distinguer qui sont les laboratoires et les entreprises privées qui font avancer la recherche et l’innovation en France, et mettre en avant les relations que ces entités entretiennent les unes avec les autres. Le crowdsourcing et crowdfixing sont notamment utilisés pour faire gagner le moteur en précision.
Une opportunité pour mieux s’organiser en interne
Pour une administration, une collectivité ou une entreprise, prendre l’initiative d’ouvrir publiquement ses données, c’est l’opportunité d’entreprendre un travail essentiel de structuration de l’information en interne. C’est faire travailler ensemble des services qui n’avaient jamais collaboré avant afin de mettre la main sur des données qui auront une réelle utilité pour les citoyens. C’est aussi permettre à des agents de collectivités de produire du sens à partir de données qu’ils auraient en leur possession mais qu’ils ne sauraient pas nécessairement valoriser eux-mêmes, faute de compétences techniques.
Avant de lancer son portail open data, GRDF a préparé le terrain pour parvenir à sortir ses données des silos dans lesquelles elles étaient enfermées. En ouvrant une première plateforme pour faire circuler les informations en interne (d’une région à une autre, de la Direction des Systèmes d’Information aux divisions métiers), le distributeur de gaz a pu identifier les données-clefs qui auraient tout intérêt à être ouvertes publiquement.
Pour Emmanuel Weisenburger, responsable des outils d’aide à la décision au Ministère de l’Enseignement supérieur et de la Recherche, « l’open data est une opportunité pour mieux travailler et faire circuler l’information en interne ». L’équipe en charge de l’ouverture des données du ministère a mis en place un principe simple : proposer aux différents services détenteurs de données (souvent dormantes) de les aider à les structurer en échange de leur ouverture. L’open data sert donc aussi à stimuler la créations de services pour les services !
Les gouvernements partagent-ils efficacement leurs données avec les citoyens et les entreprises ? Le dernier rapport sur la maturité des données ouvertes évalue les progrès en Europe et souligne l’importance de mesurer l’impact et d’améliorer les portails de données.
Apprenez comment les portails de données renforcent l'efficacité des modèles d'IA en fournissant des données fiables, représentatives et sécurisées, essentielles pour une intelligence artificielle performante et éthique.