Les premières sessions de formations réalisées par l’Atelier Iceberg, sur site comme à Nantes dans nos locaux, se sont achevées en ce mois de juin, avant de reprendre dès les 12 et 13 septembre prochains. Bien que différentes dans les objectifs et le profil des stagiaires, ces sessions de deux journées permettent déjà d’évaluer le calibrage de l’offre de l’Atelier mais aussi de tirer quelques premiers enseignements en matière de formation à la cartographie d’informations.

BandeauPlanning

Données et instruments. Une formation à la cartographie de l’information, c’est d’abord entrer dans un univers peuplé de savoirs-faire largement implicites que l’activité de formation oblige à formaliser. Une formation à la cartographie exige que soient largement et précisément transcrits en savoirs-déclaratifs, guidés par une série de supports scénarisés, toutes les manipulations que nous font passer des données à leur géographie (sous forme de graphes relationnels, soit sous forme d’indicateurs statistiques) et que l’on applique chaque jour comme autant de recettes incorporées aux pratiques. Certes, c’est le cas de toute formation, qui plus est technique mais la cartographie d’information est un domaine en évolution rapide, alimentée depuis quelques années par la culture du web au carrefour des interfaces d’accès et du traitement des data. Ce caractère émergent et dynamique multiplie les difficultés dans le cadre d’une formation où il faut encore admettre les méthodes et les outils « en l’état » sans garantir leur pérennité.

La transmission d’un « savoir-faire cartographique » n’est donc pas aisée : si la première expérience de spatialisation des données reste un moment privilégié d’émerveillement pour les stagiaires, la somme de contraintes techniques à lever constitue encore aujourd’hui une épreuve. Quand on baigne, comme moi,  dans son propre environnement technique, avec des méthodes éprouvées et des instruments dont on connaît bien le potentiel mais aussi les limites, la production d’une cartographie peut-être réalisée en quelques minutes. Pour un stagiaire, la découverte (et les difficultés) portent au moins autant sur la construction de routines maîtrisées de transformation des données que sur l’exercice de spatialisation des données. Ce qui paraît évident à un cartographe peut vite devenir une somme importante de contraintes à lever, qui s’emboîtent les unes dans les autres comme un jeu de poupées russes. Les données de départ sont-elles « propres » et correctement formatées? Le jeu de données de départ (souvent issu du contexte-métier des stagiaires) se prête-t-il aux différents croisements attendus? Autrement dit, le projet de cartographie s’accompagne-t-il d’un travail préalable suffisant sur les données et leurs différentes dimensions?

illus2

C’est d’abord cela un stage de cartographie de l’information: comprendre à quel point les visualisations sont dépendantes du travail d’écriture préalable sur les données qui permet de les transformer en information signifiantes et utiles. Identifier des communautés d’acteurs, comprendre des relations de coopération entre établissements de recherche, hiérarchiser des familles de brevets par antécédence ou par importance, voir l’évolution temporelle des thématiques de recherche d’un laboratoire: soit, mais les données permettent-elles de le faire? Les dates, les affiliations, les titres ou l’ensemble des méta-données associées sont-elles correctement écrites dans un fichier conçu pour produire des cartographies? Selon la stratégie de formation développée par l’Atelier Iceberg, j’ai testé pour chaque stagiaire au préalable un extrait de données utilisées en contexte métier, suffisamment pour comprendre à quel point la cartographie peut être un exercice facile ou, au contraire, semé d’embûches qui chaque fois nous conduit tous à retourner au fichier (Excel) d’origine. Sur ce point, on aurait tord de penser que l’automatisation en cours de certaines tâches dispensera à l’avenir de tout ce travail de contrôle qualitatif sur les données sur lequel est basé l’ensemble de la chaîne de production, du recueil des données à leur distribution dans un espace, en passant par la production de fichiers de graphes, l’utilisation de Gephi ou l’étape de finalisation graphique. A ce titre, il me paraît aujourd’hui tout à fait clair que les exigences que l’on fait porter sur la qualité des données d’origine dans la conduite d’un projet de cartographie ouvre de façon incontournable sur une évaluation plus globale des contextes de travail dans les métiers de l’information, de la distribution des tâches dans un service de veille à l’évaluation d’une technologie que l’on doit acheter.

La cartographie dans les organisations: orientations et niches d’usage . Les projets portés par les stagiaires ont été d’une grande diversité (données brevets, notices Scopus, données factuelles internes, tableaux statistiques, structures de recherche géoréférencées, rendu de la temporalité et comparabilité des cartes au cours du temps…). Avec un peu de recul, on s’aperçoit rapidement qu’ils relèvent globalement de deux types d’approche assez différents. On peut ranger dans le premier type tous les projets liés à de la représentation de données, préalablement analysées et accompagnées d’un discours interprétatif assuré. Ces projets émanent le plus souvent d’une demande interne précise (pour la DRH, un directeur d’établissement ou de laboratoire, un chercheur, un responsable de filière…) et voient dans la cartographie un moyen pertinent de « mise en scène graphique » d’informations stratégiques pour une organisation. En un sens, on peut donc considérer la cartographie d’information comme un instrument ou un vecteur orienté vers des fins de communication interne ou externe (notamment associé à des événementiels), de promotion d’un service ou d’une activité, voire-même de célébration esthétique de données internes en grand nombre et/ou de qualité. Pour de tels types de projets de cartographie, les stagiaires sont plutôt attirés par la démonstration de routines de traitement et de visualisation (notamment avec Gephi, le triptyque qui recueille tous les suffrages: spatialisation des données avec un ForceAtlas, hiérarchisation des noeuds – taille – en fonction d’un score lié au nombre de liens et, enfin, distribution des couleurs de chaque noeud en fonction de catégories préconstruites). Dans ce type de cas, on rêverait avec raison d’une sorte de « Gephi-light », par exemple sous la forme d’un service en ligne, qui permettrait de passer directement d’un fichier Excel à une structure spatialisée minimale sur laquelle porterait alors un effort important de finalisation graphique, voire de conception d’interface.

NDLa

(Cartographie des acteurs et des thèmes associés à la controverse sur le projet d’aéroport à Notre-Dame-Des-Landes et produite lors d’une formation à la cartographie de l’information à l’Ecole de Design de Nantes-Atlantique en mars 2013 – Marc Teyssier, Benoit Senand, Gregoire Davenas, Vincent Lorant, Vincent Guillevic)

L’autre orientation me semble beaucoup plus exploratoire, souvent liée à une activité de veille des données au long cours et des formes inédites qu’elles peuvent prendre une fois analysées sous forme de graphes. Je sais que « l’observation de la vie » de grands corpus qualifiés (le monitoring de données) n’occupe pas (encore) de place déterminante dans les métiers de l’information, du moins en France. Ces projets d’exploration sont plutôt construits comme des espaces personnels d’expérimentations techniques et méthodologiques où l’on va, par exemple, mobiliser bien des fonctionnalités de Gephi pour apercevoir des patterns surprenants ou inédits, parfois déroutants. Pour un cartographe averti, ce sont deux aspects, complémentaires et successifs, dans la chaîne de production. Pour les stagiaires, ce sont plutôt deux orientations nées de contextes métier différents, le dernier plus lié à une activité de recherche et d’expérimentation (une sorte de « RetD » interne dédié à l’exploration de son propre patrimoine informationnel) et le premier très associé à des objectifs de communication interne ou publique. Sur ce point, et pour répondre finalement à deux types différents de demandes, il me paraît utile de réfléchir à moyens termes à la possibilité de proposer deux offres distinctes de formation: l’une orientée « analyse de données » et l’autre « design et interfaces », les deux compétences sur lesquelles est fondé l’Atelier Iceberg.

Au delà de ces deux orientations en termes de positionnement du projet cartographique, un type de cartographie semble concentrer le plus grand intérêt des stagiaires: les « cartes (de réseaux) d’acteurs » (plus que les cartes de « contenus » ou de « thèmes »). Les cartes de « réseaux d’acteurs » peuvent porter sur différents types d’entités nommées et les informations associées dans le fichier « Excel d’origine »: noms propres de chercheurs, noms et acronymes de laboratoires et d’établissements, projets de coopération avec des partenaires extérieurs, identification des acteurs et/ou des services mobilisés dans telle ou telle opération, voire cartographie des relations à différents niveaux (projets ANR et européens, structures de rassemblement comme les PRES, participation aux différents appels d’offres type « grand emprunt » comme les Labex, Equipex…) ou encore les dispositifs et plateformes de RetD partagés…). Voilà un indice supplémentaire qui me confirme dans l’idée qu’il existe quelques affinités profondes entre la pratique de la cartographie d’informations et ce que globalement on peut appeler le « social », et donc les acteurs et les organisations. De ce point de vue, tout le monde (ou presque), sous l’influence actuelle des réseaux sociaux et du web, a compris l’intérêt d’identifier ces « flux » ou ces « accointances » que ne permettent pas d’observer les diagrammes hiérarchiques des gestionnaires et qui fondent différentes dynamiques de rapprochement ou d’éloignement au sein de l’organisation. Rien de surprenant d’ailleurs: on retrouve là l’univers dans lequel est né Gephi mais aussi l’hypothèse de l’organisation des pages web en  agrégats – principe associé aux travaux de Jon Kleinberg – l’approche en « affinités communautaires » de Linkfluence ou encore la démarche de conception des outils du Médialab de Sciences-Po Paris. Hypothèses, méthodes et instruments participent tous du pari commun que derrière les « masses d’information », en science comme ailleurs, les « concepts » ou les « idées » sont d’abord portés par des acteurs incarnés, situés dans le temps et l’espace, et que ce sont leurs interactions qui impriment aux connaissances leur géographie.

PosterGDR

(Travail cartographique réalisé par l’Atelier Iceberg pour le Groupement De Recherche (GDR 3536)  « Architecture et Dynamique Nucléaires ». L’un des objectifs poursuivis consistait à partir de l’analyse de plus de 2.000 notices extraites de PubMed d’identifier les réseaux de collaborations entre les membres permanents des laboratoires associés au GDR, du point de vue temporel, géoréférencé et par thématiques de recherche – février 2013)

Au delà de la cartographie: l’univers des métiers de l’information. L’activité de formation constitue un observatoire unique et privilégié, non seulement de la « place » qu’occupe la cartographie de l’information dans les organisations, mais aussi au delà de la distribution des tâches et des instruments de traitement de l’information. Parmi les mille et une choses que je retiendrais de ces premières sessions de formation de l’Atelier Iceberg, la question des « systèmes d’information » ou encore de la « technologie » occupe une place de choix. La plupart de nos stagiaires disposant d’accès à des bases de données payantes et spécialisées (je pense surtout aux bases brevets type Patbase et aux notices de Scopus ou du Web of Science, en promettant à mes lecteurs de dresser une liste exhaustive en intégrant des systèmes de veille et de traitement), la question qui revient systématiquement en milieu de stage concerne la compatibilité de la démarche de cartographie avec les systèmes existants. Soyons clair sur ce point: les projets de cartographie que développe l’Atelier Iceberg (auquel on associera l’Atelier de Cartographie désormais) ne sont que faiblement compatibles avec les technologies existantes, en général fonctionnant sur la base de corpus propriétaires fermés, avec des accès limités (par exemple 500 notices maximum autorisées par requête sur certaines bases, conçues pour de la recherche verticale (interrogeable à partir d’expressions), restituant les résultats sous forme de liste à plat (difficilement exportables parfois) et censées intégrer du « sémantique ». Les gymnastiques techniques peuvent ainsi être complexes quand il s’agit d’en traiter les résultats à des fins cartographiques (d’où le passage par l’incontournable « fichier Excel » qui sert de pivot à bien des pratiques de traitement de l’information, bien au delà du domaine restreint de la cartographie d’informations). Les instruments performants de traitement de l’information d’un côté, et une approche plus tournée vers les compétences humaines et le partage des outils de visualisation de l’autre côté me semblent compatibles et les cartographes (ou les designers) ont tout intérêt à se tourner vers les technologies des « géants » de l’industrie de l’information dont les deux univers sont de plus en plus tournés vers les application web, la culture des A.P.I. et du javascript ou les « apps » mobiles.

illus1Cependant, une incompatibilité majeure rend cette rencontre impossible pour le moment: la fameuses « affiliations », très largement défaillantes dans tous les sets de données avec lesquels sont venus nos stagiaires. Un seul exemple suffit: dans une étude en cours sur le « véhicule autonome », j’ai isolé manuellement une cinquantaine de notices bibliographiques parmi 2.000 retenues pour notre étude et issues d’une base très connue (concurrente du Web of Science) et concernant les travaux des chercheurs de mon université. Sur cinquante notices, l’Université de Technologie de Compiègne est une structure signalée par 11 appellations différentes, de « U.T.Compiègne » à « Compiègne », sans oublier multiples façons d’associer le nom de l’université avec celui du laboratoire (« Compiegne-Heudyasic », « U.T. Heudyasic…). Dans d’autres bases, ce sont les orthographes fantaisistes des noms de chercheurs qui grèvent le potentiel cartographique, ou bien encore la relativité qui règne dans l’identification des sources de publication. A décharge des éditeurs, on peut signaler le penchant très français pour l’empilement des structures administratives successives, un même laboratoire pouvant être rattaché à une université (elle-même rattachée à un PRES), investi dans un Equipex, lui-même issu d’un regroupement préalable de structures de recherche différentes, dans le cadre d’une « logique de site » ou d’un rapprochement avec le CNRS qui conduit à le transformer, finalement, en « EA – Equipe d’accueil 0001 », etc. Etant donné l’appétit croissant pour les cartes d’acteurs ou d’organisations, on comprend rapidement dans quelles difficultés se trouve plongé le documentaliste ou le veilleur qui les produit et à qui on demande croiser des titres et des auteurs, des projets et des laboratoires, des réseaux de coopération et des établissement et même des numéros de brevets avec des « assignees ». Et je ne détaille pas la question des façons de noter les dates ou des coordonnées GPS des sièges sociaux d’organisations absentes la plupart du temps de la quasi-totalité des bases (pourtant utiles pour faire des cartes géoréférencées ou visualiser les données à partir de Gephi et les exporter directement dans GoogleEarth). L’extrême relativité des appellations et des méta-données associées aux objets numériques condamne ainsi le cartographe à un lourd travail de normalisation, en rappelant notamment combien chacune de ces erreurs « se voit tout de suite » dans un graphe sous Gephi. Sur ce point, comme sur d’autres, il apparaît clairement combien la cartographie d’information rend hommage au lent et patient travail qualitatif des chargés d’études, veilleurs, documentalistes ou bibliothécaires qui constituent toujours le maillon essentiel des chaînes de traitement de l’information. Les formations ont ainsi largement confirmé combien les résultats d’un projet de cartographie dépendent de la qualité des données d’origine.

On aperçoit ici l’arrière-plan sur lequel se déroule une formation à la cartographie d’information et qui interroge la place, le statut ou les formes que revêtent les métiers de l’information dans les organisations. Nos formations accueillent une majorité de professionnels de l’information et il est symptomatique de constater combien ils travaillent souvent indépendamment, ou sans le support, de leurs services informatiques. J’exagère à peine en disant souvent que dans nos grands établissements de recherche si l’on vous indique l’emplacement des services informatiques en bas à gauche, vous pouvez être (presque) sûr de trouver le service documentation, de veille ou la bibliothèque en haut à droite! Ce cloisonnement hiérarchique et vertical des services (et donc des compétences humaines) constitue à mon sens le verrou essentiel à lever dans les organisations pour y développer des projets pérennes de cartographie de l’information. En ce sens, la démarche de formation de l’Atelier Iceberg mise en premier lieu sur le développement des compétences humaines pour introduire, petit à petit et partout où cela est possible, des procédures de traitement de plus en plus automatisées mais toujours contrôlées qualitativement par les professionnels. Parfois il me semble que l’écart est grand qui sépare l’univers de la formation professionnelle (avec ses environnements métier et ses contraintes d’organisation) de celui de la formation des jeunes ingénieurs et de leur culture spontanée des réseaux, de leur sens inné de l’information distribuée, de leur art du « bricolage » technologique, de leur aisance de navigation dans les outils et les masses de données. Pourtant, chaque passerelle établie entre les deux univers contribue presque à fois à ouvrir des pistes innovantes et redistribuer de façon complémentaire les compétences humaines et techniques dans les organisations. Et les formations à la cartographie de l’information, à l’Atelier Iceberg comme ailleurs, en sont chaque fois l’occasion.