Tout ce que vous devez savoir sur l’économie des données
Quels sont les modèles, idées et architectures qui définiront l'économie de données de demain ? Cet article vous permet de découvrir les dernières tendances en matière de partage de données.
Lors de la première journée du sommet consacré à l’initiative Next Generation Internet, auquel j’ai participé le mois dernier (en ligne, bien sûr), le futur de l’économie de données s’est démarqué comme l’un des enjeux centraux à l’ordre du jour. Pourquoi est-ce important aujourd’hui ?
Entre 2011 et 2020, le volume mondial des données (qu’on appelle la datasphère) est passé de 1,8 à 59 zettaoctets (1 Zo = 1 milliard To). Il est prévu qu’en 2025, il atteigne le chiffre astronomique de 175 Zo. L’omniprésence croissante des mégadonnées a soulevé quelques préoccupations en matière de confidentialité des données, menant ainsi à l’introduction de lois en matière de protection des données dans le monde entier (le RGPD dans l’UE, la CCPA aux États-Unis, la loi sur la protection des renseignements personnels en Chine, la loi sur la protection des informations personnelles au Japon, etc.). Que signifie une telle dynamique ? Chercheurs, innovateurs et décideurs politiques sont désormais d’accord sur une réponse : notre économie de données nécessite de nouveaux systèmes de stockage, de gestion et de partage de données (personnelles).
Dans cet article, je vous parle des dernières avancées dans les débats sur l’économie de données, les modèles de gestion des données personnelles et les architectures des réseaux de partage de données.
Comprendre la nature des données
Comme cela arrive souvent dans le secteur du numérique, il n’existe pas de définition unanime de l’économie de données. Ma définition favorite demeure cependant celle de Jani Koskinen, chercheur à l’université de Turku (Finlande) : l’économie de données est un écosystème d’organisations pour lesquelles les données constituent la principale source ou le principal objet de leur activité. L’économie de données est également le nom donné à sa discipline associée. Et l’un des principaux défis dans ce secteur consiste en l’identification de la nature des données en tant qu’actif économique : comme l’a si bien décrit un célèbre journal, les données s’apparentent-elles plutôt au pétrole ou à la lumière du soleil ?
La nature même des données révolutionne la classification traditionnelle des biens privés, publics, communs ou de club. Les données sont en fait d’une nature unique, car elles peuvent être copiées, partagées et réutilisées à l’infini par différentes personnes, le tout sans en diminuer la qualité ou la quantité. Dans le même temps, certaines données sont strictement personnelles et confidentielles, et nous préférons qu’elles le restent. Les données peuvent être rendues accessibles à certains et non à d’autres à l’aide de méthodes comme le cryptage, mais elles peuvent également être rendues publiques sous forme de données ouvertes. Il apparaît donc que les différents types de données relèvent de différentes catégories.
Par ailleurs, les données étant en soi des informations, elles n’ont pas une valeur intrinsèque, car c’est leur (ré)utilisation qui détermine leur valeur : même si l’on souhaitait évaluer la valeur des données, leur prix serait forcément subjectif, car une même information peut avoir une valeur différente selon la personne. Dans le même temps, les données constituent une ressource économique précieuse, qui sous-tend les modèles économiques dans des secteurs aussi divers que sont l’agriculture, la gestion bancaire et la production industrielle. Comme cela a été évoqué dans une autre publication : les dernières tendances en matière de régulations open data, cette réalité a mené l’UE à concevoir des espaces de données, permettant aux entreprises de partager des données non personnelles entre elles et avec les gouvernements, afin de booster la croissance économique, l’interopérabilité et l’innovation. Mais qu’en est-il des données personnelles ?
Inventer de nouvelles méthodes de gestion des données personnelles
Les données personnelles sont aussi précieuses (si ce n’est plus) que les données non personnelles pour les institutions de recherche et les entreprises en vue de développer, d’améliorer et de proposer des services et solutions numériques, des réseaux sociaux aux diagnostics médicaux fondés sur l’intelligence artificielle. Dans le même temps, le caractère privé des données personnelles nécessite des protections particulières en vue de garantir le maintien de la vie privée. Afin de concilier exigences légales et besoins économiques, les données personnelles sont moins considérées comme des biens que comme des actifs sur lesquels nous exerçons des droits. Comment assurer la gestion de cette nouvelle catégorie d’actifs ? Voici trois pistes intéressantes.
La première option serait la mise en commun des données, un modèle grâce auquel les individus délèguent la gestion de leurs données personnelles à une coopérative à but non lucratif, dont les membres décident conjointement à quelles organisations partager les données, conformément à l’objectif social poursuivi. La coopérative suisse MIDATA en est un très bon exemple : elle collecte les données de santé que ses membres et titulaires de compte décident de partager, et donnent accès à ces informations aux start-ups, prestataires informatiques et centres de recherche proposant des services de santé basés sur les données ou effectuant des recherches médicales et des essais cliniques.
Parmi les alternatives plus formelles à la mise en commun des données figurent les trusts de données, des entités juridiques assurant la gestion des données personnelles selon les termes des trusts, équivalents à l’objectif social poursuivi par les coopératives de données. Cependant, contrairement à la mise en commun, les trusts peuvent être publics ou privés, et leurs membres sont des professionnels au lieu de volontaires. De plus, ces membres ont la responsabilité légale (obligations fiduciaires) de promouvoir l’intérêt des personnes concernées par les données. En d’autres termes, même s’ils touchent une rémunération pour leur travail, ils ne peuvent en tirer profit aux dépens des personnes concernées par les données. Les trusts de données gagnent de plus en plus d’attention, en particulier au Royaume-Uni, grâce au travail d’organisations telles que l’Open Data Institute et la Data Trusts Initiative.
Une autre piste, dans laquelle l’UE a investi, serait l’identité auto-souveraine (IAS). Le plus souvent construite sur des technologies de registres distribués (TRD) comme Blockchain, l’identité auto-souveraine repose sur des entrepôts (ou portefeuilles) de données rassemblant les attributs de l’identité d’une personne et permettant aux individus de décider, au cas par cas, quelle information partager et avec qui, afin de leur donner le plein contrôle sur leurs données. Au cours des cinq dernières années, de nombreux projets d’IAS à petite échelle ont été lancés à travers le monde, parmi lesquels le plus célèbre et prometteur, le réseau open source Sovrin.
Bâtir une économie de données équitable
Quel que soit le modèle de gestion des données personnelles choisi par notre société, il sera indispensable de l’intégrer dans notre écosystème plus vaste de données. L’établissement d’un cadre de gouvernance et d’exigences architecturales pour cet écosystème constitue justement la mission de deux initiatives européennes en cours.
La première, DECODE, est un projet financé par l’UE ayant mis au point un réseau anonyme et contrôlé de partage de données et de vérification des attributs d’identité permettant de mettre en relation citoyens et administrations locales. Son architecture repose sur la technologie Blockchain et la cryptographie basée sur les attributs. Elle envisage la création d’une mise en commun de données ouvertes à l’échelle municipale. Le système, testé à Amsterdam et à Barcelone, permet d’accéder à une plateforme de démocratie numérique, un réseau social local et un registre municipal, mais aussi de partager des données de manière anonyme à partir de capteurs résidentiels de l’IdO. Découvrez-en davantage ici sur ces essais pilotes.
La seconde initiative, IHAN, est un projet du fonds d’innovation finlandais Sitra. IHAN propose un cadre technique de gouvernance pour un « marché de données équitable et tourné vers l’humain », permettant un flux de données libre et sécurisé tout en étant disponible à la fois aux PME, aux grandes entreprises et au secteur public. Les spécifications techniques de cette architecture sont disponibles dans le Blueprint 2.5, tandis que les accords de partage d’échantillons de données figurent dans le Rulebook. On prévoit également d’ici la fin de l’année un banc de test permettant aux entrepreneurs et développeurs d’expérimenter des modèles et applications économiques basés sur les normes d’équité et les technologies d’IHAN.
Il est aujourd’hui trop tôt pour identifier les théories, modèles et architectures de réseau qui prévaudront à l’avenir, mais trois choses sont claires à leur sujet : premièrement, ils donneront naissance à de nouveaux modèles économiques basés sur les données ; deuxièmement, ils permettront un partage plus équitable et plus important des données ; et enfin et surtout, ils donneront aux individus le pouvoir de contrôler leurs données et de les intégrer à l’économie de données de demain.
À bientôt pour de nouvelles dataventures !
Les silos organisationnels sont un véritable frein au partage des données et à la collaboration, augmentant les risques tout en limitant l’efficacité et l’innovation. Comment les supprimer pour favoriser une circulation fluide des données au sein de l’entreprise ?
Quelles sont les mesures à mettre en œuvre pour créer un programme de gouvernance des données au sein de votre organisation ? Comment assurer que cette stratégie de gouvernance viendra soutenir vos objectifs en matière de démocratisation des données ? Nous avons interrogé l'experte Nicola Askham pour en savoir plus.