Les 5 leçons data tirées de la crise sanitaire
Les données sont rapidement devenues un pilier dans la lutte contre le virus. Alors que nous essayions collectivement d'aplatir la courbe, nous avons assisté au partage et à l'accès à de quantités incroyables de données. Des quantités tout aussi extraordinaires de tableaux de bord ont circulé dans le monde entier. C'est comme si un mouvement mondial de résistance avait débuté, avec les données comme arme principale contre la maladie.
Les données sont rapidement devenues un pilier dans la lutte contre le virus. Alors que nous essayions collectivement d’aplatir la courbe, nous avons assisté au partage et à l’accès à de quantités incroyables de données. Des quantités tout aussi extraordinaires de tableaux de bord ont circulé dans le monde entier. C’est comme si un mouvement mondial de résistance avait débuté, avec les données comme arme principale contre la maladie.
Huit mois après le premier cas de Covid-19, nous nous sommes penchés sur nos expériences d’aide aux institutions publiques pour la recherche, la gestion et le partage de données liées à la crise.
Partager des données en période de crise
Le partage des données a constitué une partie importante de la réponse à la crise de la Covid-19. Il est devenu évident que les gouvernements, les communautés scientifiques et la société civile avaient besoin d’outils axés sur les données pour pouvoir atteindre trois objectifs clés : intervention, réévaluation et récupération.
À chacun de ces objectifs correspondent des types de données différents :
- Pour aider la communauté scientifique à mettre au point des interventions efficaces, les recherches académiques peuvent être partagées en masse. C’est d’ailleurs la stratégie adoptée par le gouvernement américain avec la publication de 29 000 articles via le COVID-19 Open Research Dataset Challenge.;
- Pour permettre aux gouvernements d’identifier les tendances et de réévaluer les mesures de confinement, les opérateurs de télécommunication, comme SFR, et les géants de la technologie comme Google et Facebook ont publié les données de géolocalisation anonymisées de leurs utilisateurs.
- Afin d’aider les pays à récupérer et à relancer l’activité économique, les institutions publiques ont encouragé le tourisme local. La Région Ile-de-France a, par exemple, créé l’initiative « Mon été, ma région » dans ce but.
Grâce à sa solution de partage de données de pointe, Opendatasoft a fourni (pro bono) à ses clients et partenaires des outils et bonnes pratiques nécessaires pour atteindre ces trois objectifs. Sur ce site dédié, nous avons mis en valeur les initiatives de nos clients. Par exemple, certains ont partagé l’adresse des pharmacies ou supérettes ouvertes pendant la phase d’intervention, alors que d’autres ont diffusé des informations sur les aides économiques gouvernementales pendant la phase de récupération. De plus, pour appuyer constamment les mesures de réévaluation, notre équipe a créé et partagé avec sa communauté deux applications spéciales Covid-19 : un tableau de bord dédié aux principaux indicateurs sanitaires liés à la Covid-19 par pays et un autre modèle de tableau de bord pouvant être personnalisé afin de répondre aux besoins spécifiques de chaque région.
Travailler étroitement et rapidement avec les institutions publiques
En tant que membre de l’équipe CSM (Customer Success Managers), j’étais chargée d’aider les clients et partenaires à rassembler toutes les données pertinentes et à déployer leurs tableaux de bord. De la France au Mexique, en passant par l’Espagne, la Suisse et les États-Unis, j’ai ensuite eu la formidable opportunité de travailler en étroite collaboration avec des institutions publiques pour les aider à trouver des solutions rapides et responsables à cette crise. Des solutions qui se sont principalement traduites par le fait de fournir aux citoyens, industries et autorités publiques toutes les connaissances nécessaires pour agir.
Si le partage des données peut constituer une arme efficace pour les gouvernements et industries qui souhaitent prendre des mesures d’urgence face à une crise, il peut aussi être compromis si les données ne sont pas fiables. Une mauvaise qualité d’informations peut entraîner des angles morts et des partis pris à propos des données sanitaires partagées. Pendant cette crise, ces controverses ont été liées à l’insuffisance des tests, aux erreurs dans les rapports gouvernementaux ou au manque d’expertise appropriée lors de la publication des données, entre autres.
Par conséquent, comment les institutions gouvernementales peuvent-elles mieux se préparer à élaborer des réponses rapides et efficaces, basées sur des données, en cas de crise ? Quelles sont les conditions préalables et quels sont les défis communs que nous avons rencontrés en travaillant avec différentes régions du monde ?
Voici les 5 grandes leçons que nous avons tirées de cette expérience et qui soulignent les bonnes pratiques liées au partage de données
Leçon n°1 : Avoir une infrastructure solide
Lorsque vous partagez des données dans le contexte d’une crise sanitaire mondiale, il est évident que le trafic de votre site Web connaîtra un pic considérable. Avec des jeux de données mis à jour quotidiennement, parfois même plus de deux fois par jour, l’afflux d’appels d’API dans les portails Opendatasoft a parfois augmenté de plusieurs ordres de grandeur par rapport aux moyennes et aux pics précédents – certains portails ont atteint plus de 1000 fois leur trafic habituel !
Il est donc crucial de disposer d’une infrastructure solide, fiable et évolutive capable d’assumer cette surcharge. Chez Opendatasoft, nous sommes convaincus que les solutions basées sur le cloud (comme la nôtre ) sont la voie à suivre lorsque l’on recherche ces éléments.
Les solutions Cloud sont solides, car elles sont hautement disponibles et permettent une reprise d’activité facile en cas de panne. Un système de cache peut, par exemple, permettre à l’infrastructure du logiciel d’absorber facilement un pic de trafic en enregistrant les demandes similaires et en les reproduisant simplement lorsque de nouvelles se présentent. Lorsqu’elles sont bien choisies, les solutions Cloud peuvent également révéler de manière fiable un haut niveau de conformité réglementaire.
Dernier avantage, mais non des moindres, les solutions basées sur le Cloud garantissent une meilleure évolutivité que les solutions matérielles. La crise de la Covid-19 illustre l’avantage de l’utilisation du cloud, car il peut facilement augmenter sa capacité à absorber les pics de trafic intenses en quelques minutes. D’autre part, l’utilisation de matériel informatique nécessite l’achat et la mise en place de serveurs supplémentaires, ce qui peut prendre plusieurs semaines.
Leçon n°2 : Alimenter une culture axée sur les données
Depuis la manière dont les données sont collectées jusqu’à la façon dont elles sont traitées, puis publiquement diffusées, nombreuses sont les démarches et les acteurs impliqués qui peuvent nuire à leur qualité et ralentir la capacité de votre organisation à les partager.
Or, en temps de crise, la rapidité est primordiale. Imaginons que vous travailliez pour le compte d’une ville et que vous souhaitiez créer des tableaux de bord pour suivre l’évolution de la Covid-19. Où recueillir ces données ? À qui s’adresser et comment s’assurer que les informations que vous partagez sont fiables et respectent toutes les normes de confidentialité ?
En situation de crise, les organisations doivent être bien équipées pour faire face à de nouveaux défis en matière de données. Si une confiance réciproque a déjà été établie, les processus seront bien rodés et les ambassadeurs permettront au reste de l’organisation d’agir en toute fluidité.
La Junta Castilla y Leon, l’un de nos clients espagnols, en est un exemple à suivre. Quelques semaines seulement après le début de la pandémie en Espagne, la région avait déjà publié un tableau de bord sur lequel elle partageait les informations sanitaires en temps réel en open data. Elle l’a ensuite constamment mis à jour en ajoutant de nouvelles données et analyses au fil de l’évolution de la crise : le nombre de personnes sans emploi bénéficiant des aides du gouvernement, la capacité de la région à réaliser des tests, le nombre de patients déplacés vers d’autres régions, le personnel médical disponible et le pourcentage de personnes infectées par le virus, etc. Si vous avez quelques minutes à la fin de cet article, nous vous conseillons d’aller jeter un coup d’œil à leur tableau de bord. Il est vraiment remarquable !
Lorsque je leur ai demandé quels facteurs clés de leur réussite ils pouvaient partager avec leurs pairs, leur responsable de la transparence, Antonio Ibáñez Pascual, m’en a donné trois principaux :
- Créer rune culture axée sur les données tout en collaborant avec les parties prenantes internes et externes. À la Junta de Castilla y León, ce sont les cadres supérieurs qui en sont les moteurs. Avant la crise de la Covid-19, l’équipe chargée de la transparence avait déjà établi des relations solides et travaillé main dans la main avec le département de la santé de la région. Ils étaient familiarisés avec la manière dont les données sur la santé étaient collectées et savaient qui contacter et quelles démarches effectuer pour publier ces données sur leur portail.
- Être réactif aux retours de votre communauté d’utilisateurs. Tous les messages envoyés quotidiennement par les journalistes, chercheurs ou citoyens cherchant à s’informer sur les chiffres de la Covid-19 dans la région, ont été minutieusement lus. C’est ce qui les a aidé à améliorer la visualisation des données ou à chercher d’autres données susceptibles d’enrichir l’analyse.
- Être aussi bien préparé que possible. Grâce à ses solides relations avec les autres départements et à ses interactions avec la communauté, la Junta de Castilla y Leon a publié plus de 200 jeux de données depuis le lancement de leur portail avec Opendatasoft en 2019. Elle a créé plusieurs tableaux de bord semblables à celui-ci sur la consommation énergétique, ce qui a permis à ses équipes de réaliser la formation nécessaire et de collecter les informations requises pour déployer celui lié à la crise de la Covid-19 en un temps record.
Leçon n°3 : Ne pas considérer la qualité des données comme acquise
Un défi commun (mais pas nouveau) observé pendant la crise de la Covid-19 est le manque de qualité des données.
Lorsque les organisations partagent des données en vue d’appuyer les interventions d’urgence, la réévaluation et le développement des initiatives de récupération, elles doivent fournir des informations clés sur la manière dont ces données sont collectées, la fréquence de cette collecte et la source des données. En d’autres termes, elles doivent renseigner leurs métadonnées.
C’est un sujet qui nous tient particulièrement à cœur chez Opendatasoft, et sur lequel nous avons déjà publié plusieurs conseils et bonnes pratiques. Consultez notre dernier livre blanc sur les métadonnées ici.
Pourquoi les métadonnées sont-elles si importantes ? Pensez-y de cette façon : vous travaillez pour un conseil municipal et vous devez informer les fonctionnaires de l’état de santé de la population afin de les aider à réévaluer les mesures de quarantaine. Vous obtenez des données brutes partagées au niveau national, mais il n’y a aucune information sur leur date de modification ou leur fréquence de mise à jour. Vous disposez peut-être des chiffres d’aujourd’hui, mais si vous ne pouvez pas les certifier, les informations que vous partagez avec les agents publics ne seront pas pertinentes.
Les métadonnées sont synonymes de respect des normes. Qu’il s’agisse de normes encadrant les métadonnées, comme la DCAT pour l’Europe ou de méthodes et directives spécifiques sur la collecte et le partage de données, les normes permettent aux systèmes de devenir interopérables, d’échanger et d’interpréter les données partagées.
L’interopérabilité est fondamentale pour fournir aux experts des indicateurs cohérents qui leur permettront d’offrir des recommandations stratégiques à différents niveaux administratifs. Par exemple, l’une des étapes clé pour atteindre l’interopérabilité est la capacité à télécharger des données sous un format non propriétaire, avec une documentation claire.
Ces éléments exigent une coopération entre les entités qui collectent les données et celles qui les réutilisent. Notre client de la ville de Mexico, a réussi à améliorer considérablement la qualité de ses jeux de données suite à la création des normes de métadonnées de la ville. Elle a appliqué ces normes pendant la crise de la Covid-19 en demandant à notre équipe d’ajouter des métadonnées personnalisées à leur portail, comme la « source des données », et ont fourni à leurs utilisateurs un dictionnaire des données publiées.
Lors d’une récente discussion avec leur équipe d’innovation, Alejandra Gonzalez, chef de l’Open Government, a fait référence à Opendatasoft comme « un véritable bac à sable pour la création de la politique de gestion des données de la ville ». Elle a décrit la façon dont la publication des données sur leur portail open data les a aidé à interagir avec leur communauté d’utilisateurs et à comprendre leurs besoins pour favoriser la réutilisation des jeux de données. La plupart de ces utilisateurs étaient issus d’agences gouvernementales qui partageaient également les données avec l’équipe d’innovation et qui souhaitaient obtenir en retour des informations d’autres entités. Les normes de métadonnées ont ainsi donné naissance à un processus participatif qui a permis de définir la politique de gouvernance des données de la ville.
Leçon n°4 : Les tableaux de bord ne servent pas simplement à faire joli : contextualisez vos données !
Au fil de l’évolution de la crise, les tableaux de bord de contrôle sanitaire se sont multipliés. Chaque jour, le monde entier comptait le nombre de cas et de morts, de la même manière que nous comptions les médailles pendant les Jeux Olympiques. Mais si l’on examinait les données sanitaires sur la Covid-19 fournies par le Pérou ou l’Italie, sorties de leur contexte, elles étaient tout aussi comparables que des pommes et des oranges.
Par exemple, la fameuse « courbe » de chaque pays doit être remise dans son contexte en tenant compte des capacités de test et des critères de la réalisation des tests.
Alors que certains pays ou régions testaient les cas présentant des symptômes légers, d’autres comptabilisaient uniquement ceux qui avaient été hospitalisés. L’organisation Our World in Data a remarquablement bien mis en évidence cette nuance.
Comme on peut le voir sur le graphique ci-dessous, la courbe de chaque pays est adaptée avec des lignes de couleur qui montrent si les tests sont correctement réalisés ou non. Pour cela, on analyse le taux de cas positifs décelés dans chaque pays par rapport à un certain nombre de tests réalisés. Vous trouverez plus d’informations à propos de cette méthodologie ici.
Remettre les données dans leur contexte n’est pas seulement important pour les comparaisons à l’échelle internationale, mais aussi à l’échelle nationale. Les agrégations de données peuvent certes améliorer la fiabilité, mais éclipser en contrepartie les tendances à l’échelle locale. Il est donc essentiel de permettre aux analystes, gouvernements et organisations de la société civile de détecter comment les différentes zones géographiques et communautés sont affectées afin de prendre des mesures adaptées.
La ville de Newark, aux États-Unis, a appliqué cette bonne pratique en présentant des données agrégées à différents niveaux administratifs : État, “County”, Ville. En tant que partenaire pro bono durant cette période, son tableau de bord met en évidence les divergences entre les données liées à la Covid-19 en fonction de la répartition démographique et géographique de la population.
Leçon n°5 : Nous ne le répéterons jamais assez - Partager, c'est prendre soin des autres !
Notre dernière leçon confirme notre slogan : « Sharing is caring » (Partager, c’est prendre soin des autres). Bien que certaines des leçons abordées dans cet article aient mis en évidence les enjeux à venir, ce dernier point montre que nous sommes sur le bon chemin.
Vous vous souvenez de notre tableau de bord illustrant les indicateurs sanitaires clés de la Covid-19 par pays ? S’il a été créé, c’est grâce au formidable travail de notre équipe data, qui a collecté des données auprès de sources gouvernementales officielles, comme Santé Publique France, et les a partagées avec notre communauté à travers le réseau de données d’Opendatasoft. La plupart de nos clients, comme la région Centre-Val de Loire en France ou la ville de Bâle en Suisse, ont pu tenir les citoyens informés des indicateurs sanitaires liés à la Covid-19 grâce à leur travail. Cela a été rendu possible par les données partagées par les institutions de santé publique.
Cette première partie de la chaîne du partage de données montre le potentiel de cette pratique pour résoudre les problèmes publics. Si Santé Publique France n’avait pas fourni des informations fiables et à jour sur la pandémie de Covid-19, les citoyens et les autorités publiques auraient été tenues dans l’ignorance et n’auraient pas eu les bons outils pour lutter contre le virus.
Les initiatives descendantes n’ont pas été les seules à briller en terme de partage de données pendant cette crise. Les communautés locales ont joué un rôle important dans l’enrichissement des informations partagées avec le public. Parmi nos partenaires pro bono, nous avons travaillé avec l’ONG Cambridge Local First à Boston, Massachussets pour aider les habitants de la région à trouver les produits et services dont ils avaient besoin pendant la quarantaine. S’étant donné pour mission de soutenir, encourager et célébrer une « communauté économique locale », l’organisation a utilisé Opendatasoft pour récolter des données en crowdsourcing auprès des propriétaires d’entreprises locales et les ont diffusées de manière conviviale auprès des citoyens qui souhaitaient les consulter.
Bien que les leçons que nous avons mentionnées dans cet article ne soient pas nouvelles, elles ont mis en lumière les bonnes pratiques à encourager dans le cadre des prises de décision relatives aux données. De la robustesse des infrastructures au respect des normes, en passant par l’amélioration de la qualité des données, notre expérience au contact de nos clients et partenaires pendant la pandémie de Covid-19 nous a prouvé une chose : combinés, ces principes peuvent créer des gouvernements plus responsables et efficaces et encourager la collaboration ainsi que la collecte des données au sein des communautés afin de mieux s’attaquer aux problèmes publics.
La pandémie de Covid-19 nous a permis de constater à quel point la puissance du partage de données peut améliorer la résilience des sociétés. Les institutions publiques ont encore de nombreux enjeux à surmonter pour mettre en œuvre ces bonnes pratiques mais nous sommes optimistes. Cette crise nous a assurés du potentiel présenté par des données fiables et pertinentes, et les avantages qu’elles peuvent présenter pour nous tous.
Chez Opendatasoft, nous sommes fiers d’avoir pu accompagner nos clients pendant cette période difficile et nous continuerons à mettre notre logiciel et notre expertise à disposition à mesure que la situation évolue. En exclusivité, nous vous donnons un premier aperçu du nouveau projet qui vient de publier notre équipe de service client : directement sur ODS Academy, vous aurez maintenant accès à un jeu de données “Sources d’inspiration”. Celui-ci rassemble toutes les initiatives de nos clients en termes de partage de données. Notre objectif est d’inspirer constamment et de promouvoir les meilleurs cas d’utilisation de notre communauté d’utilisateurs, en fournissant des recommandations sur mesure en fonction de leurs besoins spécifiques. Car nous ne nous lasserons jamais de le dire : “sharing is indeed caring” (partager, c’est vraiment prendre soin des autres).
À bientôt pour de nouvelles dataventures !
L'année 2020 ne s'est pas déroulée exactement comme je l'avais imaginé. Si la pandémie n’avait pas eu lieu, je serais assise à mon bureau, au siège du Programme des Nations unies pour l'environnement à Nairobi, au Kenya, en train de rédiger des contenus pour les comptes des réseaux sociaux mondiaux du PNUE.