Chaque semestre est une nouvelle occasion d’étonnement au moment où les étudiants rendent leurs travaux collectifs pour évaluation (je ne pratique pas les examens « individuels sur table », nos étudiants ayant passer l’âge des interrogations, du moins à mon sens). Si une partie de l’enseignement est basé sur des exposés théoriques sur les réseaux distribués et la cartographie de l’information, l’autre est dédiée à la réalisation de projets (qui vivent parfois bien au delà du semestre comme Gephi, Linkfluence ou L’Atelier Iceberg). Soyons franc sur ce point (n’ébruitez pas l’information au-delà de ce blog…): en procédant ainsi, et étant donné mon niveau « technique », je m’ôte la possibilité d’évaluer objectivement des projets devant lesquels je reste la plupart du temps admiratif. Si j’entrevoie des usages possibles pour certains d’eux, ou si je peux aider méthodologiquement les étudiants sur certains aspects, les projets sont de plus en plus nourris d’apports divers (design d’interface, travail sur les données, scripts d’extraction sur le web via des A.P.I., traitements statiques…), croisés (chacun pouvant aider un autre groupe) et externes (comme les nombreuses visites du semestre parmi lesquels nos amis Fabien Château de Virtual Sensitive, Alexis Jacomy pour Sigmajs et Aymric Brisse de Perfect Memory).  L’Université de Technologie de Compiègne permet cette liberté pédagogique comme l’Ecole de Design Nantes-Atlantique qui constitue, pour moi, un second foyer important d’innovation (notamment en termes de cartographie de l’information) où, avec l’Atelier Iceberg, nous avons animé un séminaire de 5 jours pour les étudiants d’interactivité. Là aussi, l’occasion d’observer à titre de spectateur averti des dispositifs graphiques ou numériques inédits, et souvent aboutis.

Côté ingénieurs, parmi tous les projets réalisés ce semestre, Emilien Kenler s’est attaché à développer un crawler-web (un « classique » dans cet enseignement). Avec son interface en ligne, Unicrawler se révèle un outil bien utile aller explorer le web et lire directement les résultats dans Gephi. L’expert porte aussi bien sur les graphes d’URL de pages que les Keywords reliés par occurrences dans chaque URL. Mais, surtout, le crawler peut être réglé selon différents paramètres: filtrage des pages en fonction d’un ou plusieurs « mots-clef » (filtrage des URL, des titres des pages et du contenu), choix des niveaux de profondeur du processus de crawl à partir d’une liste d’URL que les utilisateurs peuvent soumettre. Emilien compte développer son projet durant l’automne prochain mais, déjà, c’est bel outil que je range volontiers dans ma boîte à outils.

unicrawler

D’autres projets ont été dédiés à l’extraction et à l’analyse de certains types de données. Joris Andrade, Elie Liabeuf, Victor Levefre  se sont par exemple attaqués à l’étude des échanges pair à pair (p2p) sur les réseaux torrents. La conception d’une chaîne de traitement de l’information et son développement en prototype opérationnel constitue un terrain privilégié de validation dans mon enseignement, surtout si, comme c’est le cas ici, il intègre des fonctionnalités cartographiques. Les trois étudiants ont pris soin de documenter leur démarche, notamment pour la phase d’extraction des IPs des peers. Une série d’expérimentations ont été menées  pour extraire un échantillon représentatif nous avons de plus de 55.000 IP’s sur le top 100 des dernières 48 heures du site The Pirate Bay sur plusieurs jours du mois de juin. Cet échantillon représentatif des fichiers les plus échangés sur les réseaux p2p au mois de juin 2013, a ensuite été analysé et filtré sous forme de graphes avec Gephi. Le dump des données via une A.P.I. et une version modifiée du client web Transmission ont permis d’indexer les informations contenus dans 5 champs Les champs concernés dans

 les dumps sont les suivants : country_code : code à deux caractères du pays de l’IP, country_name : nom du pays de l’IP, city : ville de l’IP, latitude & longitude : coordonées GPS – à la ville près seulement et, enfin, le type de fichiers. Les informations traitées permettent de nombreuses analyses, comme par exemple des statistiques sur le type de documents échangés:

Peer4

…ou encore les fichiers les plus populaires:

Peer3

Enfin, les données peuvent être géolocalisées et explorées dynamiquement sur GoogleEarth et GoogleMap:

Peer1

Peer2

Sylvain Coulombel, Arnaud Schwartz, Benoît Soufflet et Sylvain Verhille ont développé GithubExplorer (encore un!…petit clin d’oeil aux ingénieurs de Linkfluence) en analysant à grande échelle la distribution des acteurs et des langages de programmation sur la plate-forme.

GitHub1

Côté design d’interfaces, le stage de formation à l’Ecole de Design Nantes-Atlantique en interactivité 3e année m’a aussi apporté son lot de surprises. Organisé sous la responsabilité de l’Atelier Iceberg, la formation de 5 jours a débouché sur 6 projets de posters ou de sites web en sigmajs. Le travail des étudiants, pour l’ensemble de la promotion, a été presque titanesque en cinq jours: principes des réseaux distribués d’information, apprentissage de Gephi, conception et développement d’un projet de cartographie. Pour la première fois, j’ai proposé un thème de travail commun: la controverse sur le projet de construction d’un aéroport à Notre-Dames-Des-Landes. Plus que les autres années, les étudiants ont dû constituer leurs propres corpus d’information, en consultant un grand nombre de sources (notamment les médias « traditionnels » en ligne) qu’ils ont tagués manuellement pour repérer et décrire les concepts comme les acteurs de cette controverse (l’occasion de découvrir, parmi d’autres, le travail de l’ACIPA et la qualité de ses archives). Les 6 groupes ont ainsi rendu, en annexe des projets, les fameux fichiers « xls » qui constituent désormais une base qualitative et très exhaustive d’informations: concepts ou arguments, positionnements et tonalité, acteurs et organisations, événements et mobilisations, enjeux politiques et éthiques, environnement économique du projet d’aéroport. Un vrai « trésor de guerre » que l’on pourrait exploiter pour proposer un service en ligne, peut-être l’an prochain.

EDNAa

(Ici, le projet de Clara Bove, Sophie Arnaudeau, Simon Bertrand, Corentin Fatus, Morgane Sanglier, Emmanuelle Bories)

Les rendus graphiques (posters ou interfaces)  ont encore été l’occasion de mesurer le principe d’économie, d’équilibre ou d’esthétique que déploient les designers d’interactivité en réduisant à des formes simples et pertinentes (et potentiellement interactives) des informations qui à la source sont d’une certaine complexité. Tout comme les jeunes EDNAbcingénieurs, les jeunes designers ont une culture « spontanée » du tableau de bord destiné à concentrer les différentes facettes d’un phénomène informationnel complexe. Au travail de finalisation des vues centrales ou principales produites avec Gephi, les designers associent le développement d’instruments de contrôle de l’information (vues secondaires ou outils graphiques) et de mise en contexte, notamment avec la présence de la time line.

Spécialistes des interfaces et des scénarios d’usage, les étudiants d’interactivité à l’Ecole de Design Nantes-Atlantique sont aussi baignés dans l’univers de la mobilité et des flux de data, domaines que les jeunes designers nantais maîtrisent de plus en plus. Voilà une promotion parmi laquelle certains étudiants poursuivront leurs études de la nouvelle filière « information design » qui ouvre à la rentrée de septembre prochain. Si la cartographie d’information reste encore un enjeu mineur en France en termes de recherche comme d’innovation ou de création d’entreprises (thème d’un post à venir), nul doute qu’en termes de formation  le domaine prospère auprès des plus jeunes.

C’est en rédigeant ce post, que je m’amuse un peu avec un instrument qui montre combien peut être enrichissante la rencontre du « design » et de « l’informatique », ce que le M.I.T. et son médialab ont réalisé avec immersion. Le service est ligne, interroge votre compte e-mail sur Google et produit à la volée une cartographie interactive et dynamique. La navigation dans les données est très souple, les solutions graphiques pertinentes et, avec la time-line réglable, on peut remonter dans ses flux de messages et de personnes contactées depuis l’ouverture du compte.

MediaLabMITb

Au regard d’immersion, les projets réalisés ce semestre montrent que nous ne sommes pas loin de développer de tels services et révèlent, encore une fois, le potentiel qui existe en France en termes d’innovation. Reste à comprendre pourquoi notre pays, avec une telle jeunesse, n’est guère capable de transformer tous ces talents en plus-value économique, scientifique ou sociétale…