Voici maintenant le chapitre 7 des Chroniques, le Web Datarium. Je dois l’expression à Sébastien Heymann et à Florian Leclerc qui avaient esquissé un curieux projet de mise en scène des web data au cours de leurs stages d’élèves-ingénieurs. L’idée centrale de leur projet consistait à équiper un lieu public de différents instruments d’exploration et de visualisation d’un même jeu de données. En particulier, on aurait pu suivre son évolution au cours du temps, un enjeu central pour veiller des données web. Pour que le spectacle ait lieu, il faut que le dispositif de traitement des données aligne différents processus de façon parfaite, depuis l’extraction continue des données sur le web, la vérification de leur pertinence et leurs connexions hypertextes jusqu’aux algorithmes de spatialisation, le tout concourant à la scénographie finale. Ce chapitre 7 en reprend l’idée en se focalisant sur cet sorte de web 1.0, lent et rudimentaire, constitué par des pages web donnant accès à bases de données scientifiques dans une étude cartographique que j’ai réalisée il y a quelques années. Mon idée était de pouvoir démontrer à la fois l’organisation magistrale de certaines ressources web en terme de corrélation contenu/connectivité hypertexte et l’efficience des outils dont je disposais à l’époque pour la faire apparaître, de façon spectaculaire. Depuis les patterns statistiques de mon jeu de données jusqu’aux lois de spatialisation générées par l’algorithme ForceAtlas2, j’avais éprouvé ce sentiment de satisfaction, presque de jubilation, à regarder s’aligner mon corpus et mes instruments d’observation, ensemble fusionnés dans ce spectacle final qu’a constitué la cartographie finale. Un moment rare en data sciences

chapitre7