L’étude publiée le 25 novembre dernier par le « cellule d’enquête » du Matin Dimanche et de SonntagsZeintung constitue un exemple remarquable de data journalisme. Si l’article signé de J. Schmidli,M. Stoll et T. Plattner étonne par la précision dans la description des dysfonctionnements du système d’attribution des commandes de la Confédération Helvétique, la cartographie réalisée par M. Grandjean constitue un exemple techniquement abouti et enthousiasmant de visualisation de données. Comme le rappelle l’article, le « Data Journalisme » met « à disposition de la Confédération » cet outil qu’est la cartographie d’information « pour lutter plus activement contre la corruption et le copinage ! ». Si les mots décrivent, la cartographie réalisée avec GEPHI (évidemment) frappe parce qu’elle atteste de la réalité d’un phénomène qui semble massif et systématique : le marché public helvétique est « noyauté par la très grande mobilité de ses hauts fonctionnaires, qui, au passage du public au privé (ou l’inverse), font profiter leurs entreprises de la manne gouvernementale ».

UneMatin

Cet exemple remarquable vient rappeler combien la cartographie d’information peut constituer une arme politique ou sociale redoutable. Alors que je reste concentré ces derniers temps sur la conception d’instruments cartographiques d’aide à la décision (et donc sur une diffusion restreinte de mes réalisations), je reste admiratif devant tout ce travail de révélation raisonnée entamé par des organisations de la société civile, des citoyens ou des journalistes. Certes, le succès de GEPHI ou « l’évangélisation » dont nos méthodes sont l’objet y contribuent mais, au delà, c’est toute une culture de l’analyse et du croisement de l’information qui se développe aujourd’hui, largement soutenue en particulier par l’ouverture des données (open-data) ou leur accessibilité (sur le web notamment). En somme, un nouvel espace à occuper pour les journalistes ou tous les activistes de l’information (qui peuplent notamment le web depuis sa création).

UneAllemand

Les termes sont forts et accusateurs: « ARGENT PUBLIC : Voici comment des fonctionnaires et des exfonctionnaires profitent des mandats de la Confédération. Un petit Atlas du copinage » mais ils illustrent de façon exemplaire la façon dont on peut mobiliser la cartographie à des fins de communication publique. Il serait difficile de dresser la liste de tous les objectifs idéologiques, des motivations personnelles ou des raisons politiques qui peuvent pousser chacun à produire ce type de cartographie. Cependant, l’analyse et la cartographie des masses de données produites par notre activité sociale (ou issues de notre simple présence sur les réseaux de communication) constitue un domaine privilégié appelé à un grand développement. Avec des informations de plus en plus accessibles et des instruments aujourd’hui matûrs et orientés vers l’étude des réseaux sociaux comme l’est GEPHI, le terrain du « dévoilement » social, politique ou culturel constitue déjà une aire de jeu fascinante pour les cartographes avertis. Je vois, presque tous les jours, auprès des publics que je peux toucher l’appétence pour la visualisation des « réseaux d’influence », des « lobbies », des « groupes informels », des systèmes de propriétés et des prises de participation, voire bientôt des transactions financières, des appels d’offre de marchés publics et leurs attributions à différents types d’acteurs économiques. Je rajouterai combien l’impact de ce type de cartographie contribue à l’intérêt que les étudiants portent à une approche réseau : à chaque début de semestre, je ne peux m’empêcher d’ouvrir les séances consacrées à Gephi sans prendre des sets de données comme ceux des « administrateurs des sociétés du CAC40 » ou encore des sites web dédiés à la « scientologie ».

Vers un « âge de la transparence »? Désormais traçable, le social est donc aussi devenu cartographiable. Cela annonce-t-il pour autant une sorte « d’âge de la transparence » à venir? L’heure est-elle venue du dévoilement systématique des « structures cachées », à peine soupçonnées, implicites qui règlent la forme des organisations sociales et la distribution des rôles pour chacun de ses acteurs? Difficile à dire, si l’on tient compte de toutes les formes de résistance à la démarche ou bien des aspects éthiques ou juridiques. Car il ne s’agit plus de cartographier des gènes, des sites web ou des espèces animales dans un biotope mais bien nos contemporains en rassemblant et en croisant les informations qu’ils produisent (souvent malgré eux), ce qui revient à exercer une forme de pouvoir dont ce blog a déjà fait écho. L’exemple de FaceNuke lancé par GreenPeace le 13 avril 2012 est là pour nous rappeler combien la cartographie du social est périlleuse et risquée. Le site, depuis quelques temps, nous en avertit ainsi :

 » Cet outil est une cartographie des personnalités, des organisations, une visualisation du réseau social qui compose aujourd’hui la politique énergétique de notre pays. FaceNuke permet ainsi de visualiser les personnalités connues et moins connues, les enchevêtrements d’entreprises, d’associations…C’est la volonté de faire la transparence sur le fonctionnement du système énergétique et notamment nucléaire français qui a guidé cette démarche.Certaines des personnalités présentes dans la cartographie n’ont pas apprécié cette démarche de transparence et ont souhaité que soient retirés leurs noms. Pas parce que les informations étaient erronées, non. Parce que leur nom était utilisé sans autorisation. Plutôt que déséquilibrer le graphe de Facenuke en en retirant certains des noms les plus importants, car au cœur même du système, nous avons choisi de mettre l’outil en suspens. Le temps, pour nous, de revenir avec de nouveaux éléments. Parce que nous pensons que, dans les mois à venir la transparence sera plus que jamais nécessaire ».

Cependant, le mouvement me semble lancé durablement et il faut s’attendre à voir « cartographiés » de façon ciblée toutes les structures de décision, les réseaux d’interaction entre des acteurs influents, les commissions, les « groupes d’experts » et tout ce qui constitue, de près ou de loin, ces fameux « corps intermédiaires », constitués ou non, qui règlent la distribution effective des pouvoirs dans une démocratie libérale comme la notre. Dans le domaine qui est le mien, la recherche, les mécanismes d’attribution des financements des projets de recherche en Sciences Humaines et Sociales et en Sciences de l’§information mériteraient incontestablement d’être ainsi « mappés » pour peu que les données soient disponibles (et anonymisées, évidemment) . Armés de Gephi, de sa time-line et de données où figurent par exemple les porteurs de projets ANR ainsi que leurs « évaluateurs », on verrait peut-être année après année les rôles s’inverser, un même acteur passant du statut de « déposant » au statut « d’expert » dans un jeu fermé qui conduit à reconduire les mêmes thématiques de recherche ou les mêmes équipes de recherche. Gage de stabilité et « d’excellence académique » ou bien frein manifeste à l’innovation scientifique ? Le principe de l’endogamie peut aujourd’hui se mesurer, depuis que les accès à une foule de sets de données se multiplient et, sans doute, les systèmes culturels n’échapperont pas à cette approche réseau qui se développe tant dans le domaines des sciences exactes depuis quelques années.

Rassembler, croiser, spatialiser.  «Quand un de mes collaborateurs est venu dans mon bureau avec la liste des 55 mandats du projet Insieme délivrés de gré à gré, se souvient le vice-directeur de l’Office fédéral de la construction et de la logistique René Graf, j’ai tout de suite vu que nous avions un souci.» précise l’un des acteurs de l’affaire. Ah…encore ce fameux fichier Excel dont je parle tant dans ce blog, emblème de tout ce que chacun peut accumuler sous forme de listes ou de tableaux et qui n’attend plus que d’être rassemblé, croisé (d’une colonne à l’autre) et, enfin spatialisé sous la forme d’une « vue sur les données ». Le travail réalisé par les journalistes (suisses je suppose) est exemplaire, non pour la nature des informations traitées, mais bien pour la clarté de la méthode adoptée, détaillée avec précision jusque dans les choix graphiques finaux. En particulier, l’opération centrale de croisement des données qui donne naissance à une structure de réseaux (sous forme de graphes relationnels ) attire toute l’attention des journalistes :

schemaBases

C’est de cette opération que naît la « carte » qui rassemble, concentre (comme un Atlas) mais aussi qui croise et enrichit (comme un filtre) : « A chaque fois que la Confédération achète quelque chose–elle le fait pour 5,4milliards de francs par an – elle se déplace dans un environnement où les relations entre fonctionnaires fédéraux et entreprises privées s’entremêlent. C’est ce que montre une analyse du «Matin Dimanche». Les données de 1745 mandats fédéraux publiés sur la plate-forme officielle Simap entre 2009 et 2012 ont systématiquement été examinées en fonction des réseaux de relations. Cela a permis de mettre au jour une série de cas problématiques, dont certains relèvent clairement du copinage ». C’est toute la valeur de cette carte: les parcours inédits qu’elle propose s’inscrivent au niveau où sont croisées les informations et non sur les « données brutes » ou de départ.

Et ils poursuivent ainsi : « Le travail journalistique peut donc, une fois cette liste de correspondances établie, se porter sur l’étude de ces quelques cas particuliers, mettant au jour des relations d’affaire teintées de favoritisme ou de copinage. Ce travail sur les bases de données offre une vision que ni la Confédération, ni les entreprises, ni les autorités de contrôle externes n’étaient jusqu’alors en mesure d’apprécier« . Et c’est tout l’intérêt de la démarche d’investigation et de dévoilement public des résultats de l’enquête : une fois connus et dévoilés, les faits cartographiés (les informations) comme la méthode utilisée peuvent aussi être discutés, validés collectivement ou non, chacun forgeant son opinion. Je parle maintenant régulièrement « d’indicateurs de gouvernance » à propos de ce qui me semble être un domaine majeur de la cartographie d’information à l’heure actuelle : l’expression pourrait être adoptée ici puisque les jounalistes suisses pourraient, par exemple, reconduire la même cartographie (et selon la même méthode) l’an prochain et livrer ainsi une sorte « d’indicateur public de gouvernance ». De toute évidence, la première vertu d’un dévoilement public vient, non pas tant de la nature des informations publiées, que des questions, voire du débat (nécessaire) que pose le projet cartographique (soit sur la nature des données prises en compte, soit sur sa méthode).

Le pouvoir du cartographe.  Cet étude cartographique des marchés publics helvétiques rappelle surtout le pouvoir du cartographe, politiquement parlant comme je l’ai déjà détaillé il y a longtemps. A peine tolérée en marge des techniques de knowledge discovery ou de data analysis, toujours « coincée » dans les organisations entre « service informatique » et « documentation », la cartographie d’information (quand elle se déploie) permet de redécouvrir un type d’artefact qui peut transformer l’information en connaissances, éventuellement en instrument de gouvernance dont le cartographe tire (presque d’un coup) une forme de pouvoir, voire de prestige. 

Il est le maître du jeu. Dans l’espace tout d’abord puisqu’il rendant présents, attestables des phénomènes jusque-là implicites, abstraits, difficiles à isoler dans les listes ou les tables de données. C’est tout l’art des techniques de spatialisation et des phénomènes d’attraction-répulsion (algorithme forceatlas2 dans l’exemple du Matin). Certes, les fameuses « vues sur les données » supposent des choix, peut-être une forme de « story-telling » dont il importe avant tout de communiquer les procédures et de partager les méthodes avec son public. Cependant, l’effet d’adhésion est (quasiment) immédiat et rapidement la cartographie d’information devient carte de navigation dans un espace social dont elle dévoile les méandres à travers des réseaux d’affinités et d’accointances dont on peut suivre les orientations et les relais à travers les noms des entreprises et des appels d’offre fédéraux de marchés publics.

Mais la « plus value cartographique » ne s’arrête pas là : elle inclue de fait une forme originale d’enrichissement des données de départ qui sont croisées entre elles pour donner naissance à une structure de réseau. Si deux sets de données peuvent éventuellement s’aditionner quantitativement, c’est de leur croisement que naît qualitativement leur enrichissement et la production de « méta-données » orginales. Et peu importe, finalement, de croiser les différentes dimensions d’un même set ou bien différentes sources hétérogènes: les parcours cartographiques s’effectuent dans un espace inédit qui constitue une pierre angulaire selon moi d’un travail de valorisation du patrimoine informationnel des organisations (« Vous êtes sûrs que ce sont nos données? » m’a-t-on déjà dit lors des premières présentations à des partenaires). Moins visible que la spatialisation des données, ce pouvoir d’enrichissement constitue une compétence stratégique pour les organisations quand elles sont en recherche d’indicateurs inédits et pertinents. Là aussi, des choix s’imposent et le cartographe ne livre souvent que les « insights » les plus utiles ou, comme dans l’exemple du Matin, les plus frappants. 

carnetc

C’est en cela que la cartographie d’information relève d’un exercice mesuré ou raisonné : le cartographe la fait varier en fonction des contextes, en fonction des contextes la carte ne porte pas sur les mêmes types d’informations selon que le dispositif est destiné à un service, un acteur précis, une direction ou selon qu’il est destiné à être utilisé par tous les collaborateurs d’une entreprise, voire même rendu public et accessible sur le web. L’exercice doit être d’autant plus maîtrisé que l’on peut être amenés à déployer un projet de cartographie dans un contexte où agissent des acteurs qui sont souvent eux-même impliqués à titre « d’objets cartographiés » : outre le fait (parfois pesant) qu’il faut ménager les susceptibilités individuelles (« comment cela, je suis en périphérie? »), l’exemple des cartes de collaborations entre laboratoires dans le domaine de la recherche montre combien le rassemblement de données éparses et leur enrichissement devient un enjeu sensible, politique, stratégique. En ce sens, la réussite d’une cartographie ne dépend pas tant de l’étendue du public touché mais de la difficulté à toucher efficacement la cible visée. Dans l’enquête publiée par le Matin, les deux objectifs se confondent, et avec réussite.