Ce printemps voit l’émergence de nombreuses initiatives orientées autour de la visualisation ou de l’exploration de données : des outils, des applications ou des systèmes en ligne. J’aurai l’occasion de revenir bientôt sur les objectifs scientifiques (et pas « seulement techniques ») de ma démarche d’observation et de participation aux nombreux projets dont ce blog fait état régulièrement. De plus en plus souvent, on me demande en effet d’expliciter la démarche de « sciences des réseaux » : les départements d’informatiques (ou de mathématiques appliqués) y voient essentiellement « de la visualisation de données », mes collègues de Sciences Humaines et Sociales une série d’outils « automatiques » tournés vers les propriétés statistiques des graphes et l’ingénierie de l’information, tandis que d’autres, orientés par une réflexion générale et abstraite sur les « systèmes » dits « complexes », considèrent qu’il s’agit, après tout, d’une sorte de vaste plate-forme distribuée où les outils se répondent et s’associent et dans laquelle ils n’ont qu’à puiser des ressources techniques. Dire que tous les projets auxquels je m’intéresse, ce n’est « que de la viz », que de « la technique » et qu’une série « d’outils » rassure mes collègues, tant que l’on ne viole pas les frontières de disciplines (où chacun doit être à sa place) et que leur reconnaît cette faculté à abstraire (et donc à produire des « théories ») ce que ne peuvent pas faire des « ingénieurs » et des « techniciens » tournés vers les données et leur manipulation numérique. Mais je laisse encore un peu de temps à cette idée surfaite, qui, après tout, ne dérange rien ni personne tant que l’on n’a pas pris la mesure de ce qu’implique scientifiquement une approche « data driven » comme vient de le faire récemment (et avec grand bruit) V.-L. Barabasi dans la communauté des physiciens. Voilà donc quelques bons posts à venir…

Instruments. Mais, revenons à notre printemps avec, tout d’abord, par la publication du projet sigmajs porté par Alexis Jacomy (Linkfluence) et qui va permettre d’améliorer significativement les initiatives de visualisation de graphes à partir de javascript.

On pourra trouver sur le site plusieurs exemples de fonctionnalités d’affichage et d’exploration de fichiers GEXF (Gephi). Le premier exemple est un graphes de plus 1600 expressions verbales liées à la thématique de la fonte des glaces au pôle Nord et au réchauffement climatique, sujet sur lequel j’ai travaillé avec Alexis il y a deux ans et pour lequel nous avons développé une méthode d’interrogation des réseaux de co-occurrences de termes à partir de 22.000 URL indexées sur le moteur Exalead. Les données ont été extraites via les A.P.I. Exalead.

On pourra trouver sur ce blog, dans la catégorie “Collection”, le poster associé ainsi que quelques explications générales du projet « L’Arctique, Terres de controverses sur le Web? » (2010).

La dernière version beta en date de GEPHI (O.8.1) apporte elle aussi régulièrement des contributions significatives en termes de visualisation et d’analyse de graphes. La nouvelle version de Gephi contient quelques features intéressantes comme la nouvelle time-line, le ranking des noeuds de façon globale ou local seulement ou encore les améliorations apportées aux méthodes de détection de communautés.

On doit ces nouvelles fonctionnalités aux travaux issus du Google Summer of Code 2011 et, à noter, Gephi est encore au programme du Gsoc en 2012.

Depuis le Médialab de Sciences-Po-Paris, Mathieu Jacomy continue de mettre en place une série d’outils et de processus de traitement des données qui pourraient figurer dans un « Design-Lab » en ligne. Mathieu vient de publier « Colors for Data Scientists« , un système d’optimisation du choix des palettes de couleurs pour les graphes à partir Chroma.js. L’objectif est annoncé : « Spatializing colors evenly in a perceptively coherent space, constrained by user-friendly settings, to generate high quality custom palettes ». L’interface de monitoring de génération de palettes de couleurs y est particulièrement bien réussie.

Elections. En ces temps d’élections, plusieurs dispositifs de monitoring de données concernant le champ des médias et de la politique ont été produits. Il n’est pas rare aujourd’hui de trouver sur le web de petites applications qui rendent compte du « buzz » généré par les candidats à l’élection présidentielle. C’est le cas du travail de Guillaume Lebourgeois (Data-Publica) avec son « Autre observatoire » associé au travail de design graphique de Matière Primaire.

Dans le domaine, on ne peut pas éviter l’observatoire des discours politiques né d’un partenariat entre Linkfluence, Jean Véronis Technologies et LeMonde.fr. Le couplage de l’interface développée par Linkfluence (Antonin Rhomer et Alexis Jacomy) et le travail d’analyse de Jean Véronis est saisissant, en particulier la manipulation de la time-line et du « radar de thèmes » qui évolue dynamiquement au cours du temps.

Le dispositif, à lui seul, montre tout le profit que l’on peut attendre de la rencontre entre données (les discours archivés), expertise (Jean Véronis) et interface d’exploration (Linkfluence). A utiliser, sans modération, pour comprendre comment nos candidats se positionnent sur des questions sur l’environnement, les retraites ou l’immigration au cours du temps et au fil des discours de campagne !

Tactile. La rencontre entre cartographie de l’information et supports mobiles et tactiles devient chaque jour de plus en plus évidente et naturelle. C’est ce que démontrent les jeunes designers de la société Bakasable qui travaillent de concert avec Jean Dufour de la CCI Nord-Pas-De-Calais à travers un dispositif innovant de table tactile où se rencontrent interactivité et travail de veille informationnelle. Le résultat est impressionnant mais il ne s’agit que d’une première étape tant les dispositifs cartographiques sont appelés à migrer petit à petit vers les nouveaux supports.

J’en profite, au passage, pour signaler qu’à l’Université de Technologie de Compiègne je m’essaie aussi à quelques séances exploratoires avec les étudiants en testant différentes spatialisations de grandes masses de données à partir de Gephi implémenté sur une grande table tactile. L’immersion dans les données a quelque-chose de fascinant, en particulier quand on utilise des algorithmes de type « force directed » (par exemple le forceatlas2 qui travaille avec finesse et que l’on peut régler de bien des façons possibles en termes d’attraction et de répulsion des noeuds dans l’espace de projection).

En ce printemps très riche, d’autres projets seront publiés bientôt, sur ce blog ou ailleurs, qui vont surprendre, je l’espère, les lecteurs de ce blog (que je remercie au passage pour leurs fréquentes visites…).