Language

[Product Talk] Aider les métiers à consommer les données : data marketplace ou data catalog ?

Je m'inscris
Actualités

Visite guidée de Datastro, portail de données sur l’astronomie

Datastro - 0

Notre collègue Lise Guerriero est passionnée d'astronomie de longue date. Elle a eu envie d'utiliser la plateforme Opendatasoft pour y mettre des données qui l'intéressent.

Brand content manager, Opendatasoft
Voir tous ses articles

Notre collègue Lise Guerriero est passionnée d’astronomie de longue date et travaille dans l’équipe marketing d’Opendatasoft depuis un an. Elle a eu envie d’utiliser la plateforme pour y mettre des données qui l’intéressent. Car l’avantage d’une plateforme de gestion de données, c’est qu’elle traite toutes les données (tableaux, images, temps réel, etc.) sur toutes les thématiques possibles et imaginables (transport, énergie, culture, santé, urbanisme, etc.). À partir des fichiers Excel que Lise a constitués ou récupérés d’autres sources de données en ligne, elle a pu ouvrir une vingtaine de jeux de données liés à l’astronomie. Elle nous propose dans cet article une petite visite du portail Datastro.

Les deux types de données du portail sont organisés autour de deux thématiques :

  • le support à l’observation astronomique
  • des informations variées sur l’astronomie (catalogues, chiffres, listes de lieux, de missions, photos historiques…).

Le portail dispose également d’un onglet « Pollution lumineuse » qui montre une utilisation poussée de l’éditeur de carte de la plateforme : si chaque jeu de données comprenant des coordonnées géographiques est par défaut visible sous forme de carte, il est possible de construire une carte complexe à partir de plusieurs jeux de données.

Copy to clipboard Datastro - 1
Le portail est doté d’une carte permettant de visualiser la pollution lumineuse depuis 2006.

Ici, je suis partie de la page des données sources du programme participatif Globe at Night : depuis 2006, des astronomes amateurs relèvent un ensemble de données liées à la pollution lumineuse à l’endroit où il se trouvent. Ainsi ils notent dans un formulaire les coordonnées et l’heure du lieu d’observation, la couverture nuageuse, les constellations observées, ou encore la luminosité maximale qu’ils arrivent à percevoir. Le site affiche les cartes des observations des années précédentes, une carte par an. Le nombre de données collectées, et donc la précision globale du programme, augmente fortement au fur et à mesure des années.

L’éditeur de carte d’Opendatasoft était un moyen rapide et facile d’afficher les données sur une carte et de les comparer visuellement. J’ai donc importé les dix jeux de données issus du site Globe at Night dans la plateforme, en utilisant la structure (identique) des données pour les rassembler dans un seul fichier. Il a ensuite suffi de les ajouter dans l’outil de construction de cartes puis d’appliquer un filtre permettant de visualiser chaque « couche de données » par année.

Les dernières étapes de la construction de l’outil « Pollution lumineuse » ont consisté à choisir une représentation des données en « carte de chaleur » (heatmap en anglais) sur un fond de carte sombre, définir son échelle de couleurs (7 couleurs ici), et personnaliser les attributs informatifs et visuels de chaque couche de données (affichage des informations, couleurs, logos, etc.).

Les données s’affichent là où elles ont été générées, avec un point d’autant plus lumineux que la luminosité minimale des étoiles observées est faible.

Copy to clipboard

Les missions Apollo de la Nasa

Un des jeux de données les plus importants est celui des photographies prises par les astronautes des missions Apollo de la Nasa, de 1961 à 1975. Mises à disposition du grand public, les images ont été importées sur la plateforme à l’aide d’un script Flickr.

Près de 15 000 images historiques sont rapidement et facilement consultables : on peut ainsi plonger dans cet âge d’or de la conquête spatiale qui a eu pour apogée les premiers pas sur la Lune le 20 juillet 1969 (21 juillet en France). Aucun astronaute n’est retourné sur la Lune depuis la dernière mission Apollo (Apollo 17 en 1972), ce sont donc les seules et uniques photographies de la Lune et de sa surface prises par des êtres humains. La quasi-intégralité des images sont disponibles : on peut donc y trouver des photos « ratées » à côté d’images historiques.

Deux documents de référence en astronomie figurent aussi sur le portail Datastro : la liste des 88 constellations visibles sur les deux hémisphères (arrêtée en 1930 par L’Union Astronomique Internationale) et le catalogue de Messier.

Les 88 constellations visibles sur les deux hémisphères

Ces ensembles d’étoiles reliées par des lignes imaginaires constituent une carte du ciel commune, indispensable au repérage nocturne. La vue Tabulaire donne le nom latin, anglais et français de la constellation, ses coordonnées, le mois de l’année où elle culmine à 20 heures, l’étoile principale, etc. La vue Analyse montre la répartition des mois où chaque constellation est la plus visible. Enfin, la vue Images montre une photographie de chaque constellation avec les tracés en couleur.

Le catalogue de Messier

Ce catalogue a été créé en 1774 par Charles Messier, un astronome qui travaillait sur les comètes. Il a répertorié les tâches floues et blanchâtres qu’il observait et qui n’étaient pas des comètes : il savait ainsi où ne pas observer de nouveau. Plus tard les astronomes ont compris que ces tâches blanchâtres étaient en réalité des galaxies semblables à la nôtre, des amas ouverts (quelques milliers d’étoiles groupées), des amas globulaires (une centaine de milliers d’étoiles, très âgées), des nébuleuses (nuages de gaz interstellaires)…

La liste numérotée de ces 110 objets de Messier (M1, M2…) est devenue une référence, et permet aux astronomes de désigner un objet céleste. M31 est par exemple l’autre dénomination de la célèbre galaxie voisine d’Andromède. Le spectaculaire amas d’Hercule, visible en été dans la constellation du même nom, s’appelle aussi M13 (l’autre catalogue de référence en astronomie, le NGC, sera également ajouté au portail).

Grâce aux processeurs de la plateforme, on peut aussi consulter une image qui indique où observer l’objet en question (sa position par rapport à la constellation la plus proche).

Le décompte des tâches solaires

Datastro - 2
Tâches solaires

Un autre jeu de données qui vaut le coup d’œil est celui du décompte des tâches solaires. Observées par Galilée dès le 17ème siècle, elles sont la manifestation d’une intense activité magnétique solaire. Sur Terre, les conséquences les plus visibles de cette activité sont les aurores boréales, résultat de l’interaction des particules solaires avec l’atmosphère terrestre. Les tâches solaires sont plus froides que la surface du soleil, et apparaissent donc comme des petites zones noires qui peuvent avoir plusieurs fois la taille de la Terre.

Leur nombre est lié à l’activité solaire. Leur décompte précis, débuté ici en 1749 a permis d’observer un cycle d’activité de 11 ans, que l’on constate clairement sur le graphique ci-dessous. On peut même observer un creux dans l’activité solaire : cette période de 1790 à 1830, coïncide avec une période froide sur Terre, c’est le minimum de Dalton.

Le catalogue des exoplanètes

Les exoplanètes sont des planètes qui gravitent autour d’autres étoiles que notre soleil, et qui sont donc dans d’autres systèmes solaires. La première a été découverte en 1995 à l’observatoire de Haute-Provence, on en connaît maintenant plus de 3 600. Les exoplanètes suscitent de plus en plus d’intérêt dans la communauté scientifique car elles sont liées à la recherche d’une vie hors du système solaire. Les planètes semblables à la Terre (telluriques, à la bonne distance de leur soleil) sont les meilleures candidates pour abriter la vie.

Ce catalogue recense donc toutes les exoplanètes planètes confirmées, avec leurs caractéristiques : nom, masse, position, temps pour faire le tour de son étoile, etc. Plus que la liste elle-même des informations brutes, c’est l’onglet Analyse qui est le plus instructif : il montre ici le nombre d’exoplanètes par type de méthode de découverte :

  • Transit (Primary transit) : lorsqu’une planète passe devant son étoile, la courbe de luminosité observée de cette étoile baisse. L’ampleur de la baisse permet d’évaluer la taille de la planète.
  • Vitesse radiale (Radial velocity) : la perturbation gravitationnelle provoquée par une planète qui tourne autour de son étoile peut être détectée. L’importance de la perturbation est liée à la masse de la planète.
  • Imagerie (Imaging) : les planètes peuvent être visibles sur des photos de télescopes.
  • Lentille gravitationnelle (Microlensing) : un objet massif au premier plan (l’étoile) dévie la lumière d’une étoile lointaine en arrière-plan. Une étoile possédant une planète déviera différemment la lumière.

Les positions précises futures des astéroïdes

Datastro - 3
Astéroïde

La série de jeux de données issus du Minor Planet Center (qui établit les positions précises futures des astéroïdes) est mise à jour quotidiennement. Dédiée aux observations détaillées des astéroïdes, elle affiche notamment des informations chiffrées sur les Near Earth Asteroids (NEAs) : les astéroïdes du système solaire dont l’orbite croise celle de la Terre, et qui constituent donc des dangers potentiels.

Le portail Datastro sera régulièrement enrichi. N’hésitez pas à suggérer des données que vous aimeriez voir figurer sur le portail, ou à nous faire un retour sur le projet.

Articles sur le même thème : Open data
Contenus associés
Quelles sont les différences entre un business glossary, un data dictionary et un data catalog ? Accès aux données
Quelles sont les différences entre un business glossary, un data dictionary et un data catalog ?

Les organisations font face à une explosion sans précédent des volumes de données. Éparpillées sous divers formats, ces informations s’avèrent difficiles à organiser, analyser et valoriser. Pourtant, la data devient plus que jamais le socle des décisions éclairées et de l'innovation.

Comment éliminer les silos organisationnels et réussir votre projet data Accès aux données
Comment éliminer les silos organisationnels et réussir votre projet data

Les silos organisationnels sont un véritable frein au partage des données et à la collaboration, augmentant les risques tout en limitant l’efficacité et l’innovation. Comment les supprimer pour favoriser une circulation fluide des données au sein de l’entreprise ?

Les 5 principaux défis rencontrés par les Chief Data Officers Tendances
Les 5 principaux défis rencontrés par les Chief Data Officers

Toute entreprise ayant pour ambition de devenir data-centric a besoin d’un Chief Data Officer dont le rôle est de garantir à chaque utilisateur un accès immédiat aux informations dont il a besoin. Découvrez les défis auxquels il est confronté, et quelles sont les stratégies et technologies à adopter pour les surmonter.