La Fondation pour la Recherche sur la Biodiversité (FRB) vient de rendre public son rapport sur la « Base de Données Nationale des acteurs, structures et projets de recherche sur la biodiversité ». J’en suis corédacteur à titre de « cartographe » en association étroite avec Cédric Chavériat (que j’ai eu le plaisir d’accueillir en formation de cartographie de l’information, le responsable de la base), Flora Pelegrin (responsable du pôle Stratégie et Animation Scientifiques), Fatima Fadil (chargée de mission  portail et interfaces web) et Xavier Le Roux (directeur de la FRB). Ce rapport est le résultat d’un long travail d’analyse et de mise au format des données que gère la FRB depuis 2009 et le déploiement public de la BDD constitue l’une des missions de la fondation.

Le territoire numérique que nous avons exploré et analysé est vaste et complexe : la BDD contient à ce jour des informations sur plus de 4300 chercheurs français et 1200 étrangers qui publient dans des journaux internationaux à comité de lecture et/ou participent à des projets de recherche financés sur appels à projets compétitifs. Elle contient aussi des renseignements sur 342 laboratoires de recherche français participant plus ou moins directement à la recherche sur la biodiversité, et 308 projets de recherche financés depuis 2005 sur ce thème. Néanmoins, comme je l’espérai depuis le début de ce partenariat avec la FRB, les cartographies ont contribué de façon significative à l’étude de questions complexes pour un champ de recherches très pluridisciplinaire où le chimiste croise l’éthologue ou le biologiste dans l’étude de biotopes qui s’étendent depuis les fonds marins, les milieux aquatiques continentaux, les zones cultivées jusqu’aux déserts, sous l’angle de l’histoire comme de la génétique.

Quels sont donc leurs principaux objets et écosystèmes étudiés ? Comment les différentes disciplines sont représentées au sein d’une telle communauté ? Comment s’organisent les réseaux de collaborations entre laboratoires de recherche, entre acteurs individuels, ou entre disciplines au sein d’une telle communauté et pourquoi ? Comme le souligne le rapport « Au fil de ce rapport se dessine la géographie d’une communauté de recherche pluridisciplinaire, travaillant sur une large gamme d’enjeux, et dont l’ampleur était jusqu’ici méconnue ». Et la troisième partie du rapport, intitulée « Analyse des réseaux de collaborations » et où se concentrent les cartographies (au sens où je l’entends dans l’Atelier), constitue, à ma connaissance, une contribution inédite pour un rapport d’activité officiel dans l’analyse des données archivées par une grande institution de recherche.

La production cartographique. Le travail cartographique réalisé pour la FRB s’est déroulé sur plus d’un an et a permis de capitaliser de nombreuses informations importantes dans la perspective d’un déploiement de la méthode et des outils sur d’autres données ou d’autres bases (notamment dans les organismes de recherche). J’ai notamment pu vérifier à quel point le déploiement d’un projet cartographique d’ampleur dans une organisation entraîne un coût en termes d’investissement humain : formation des acteurs, temps consacré au projet, difficultés techniques à surmonter. En particulier, il apparaît indéniablement que les croisements des différentes dimensions de l’information dans une BDD nécessaires à la production de cartographies multiples (et il en irait de même si les cartographies avaient été produites à partir d’un fichier Excel avec ses lignes et ses colonnes) constitue un test qualité de grande ampleur pour le système d’information interne à une organisation. C’est à mon sens, un exemple frappant du statut des « SI » aujourd’hui, utilisés souvent pour archiver des données et que l’on mobilise pour sortir deux ou trois fois dans l’année pour extraire des statistiques générales et approximatives ou encore pour produire un tableau de données synthétique sur les projets « en cours ». L’application d’une « couche cartographique » ne va pas de soi et, en tout état de cause, ne supporte ni l’approximation des informations (par exemple la façon de labelliser des objets ou de noter des affiliations) ni les « manques » ou les « trous ». Cela est vrai techniquement (par exemple dans les dates associées aux données puisqu’il est possible de produire des vues temporelles avec GEPHI) mais aussi et surtout en termes de communication publique : des acteurs, des laboratoires ou des entités peuvent soit absentes de la carte soit présentes plusieurs fois parce que les informations contenues dans le SI sont défaillantes et le regard des experts ou des acteurs peut être sévère sur la carte quand elle contient trop d’approximations. Avec les « coupes transversales » qu’exercent les structures de graphes sur les BDD (comme une série de contrôles), on aperçoit rapidement le niveau qualitatif des informations archivées et, au-delà, les capacités d’une organisation à mobiliser son « système d’information » pour des applications externes.

C’est tout l’avantage, comme à la FRB, de placer la gestion de la BDD sous la responsabilité d’acteurs ou de services tournés vers l’animation scientifique, la communication publique ou la gestion des interfaces web, autrement dit dans des « lieux » ou des « fonctions » d’une organisation orientés vers les usages et les services. Les travaux cartographiques qui y ont été déployés ont été couplés dès le départ à des questions d’épistémologie des disciplines, de nature des réseaux de collaborations entre laboratoires ou d’agrégation de compétences chez les chercheurs autour de certaines problématiques. Les cartographies contenues dans le rapport ne constituent qu’une partie seulement de la production. Elles témoignent cependant de la capacité de la Fondation de la Recherche sur la Biodiversité à déployer maintenant sur ses propres données un système continu d’observation, un observatoire effectif et régulier de ses propres archives qui lui permet ainsi de monitorer les différentes dimensions de la recherche en biodiversité.

Les dimensions de l’information. Ce sont ces différentes dimensions de l’information contenues dans la structure de données que le travail cartographique a pour objectif de traiter en les croisant. La méthode déployée est celle de VisIR en privilégiant notamment l’analyse des projets labellisés et/ou financés par la fondation. Le modèle d’analyse utilisé permet de décrire le paysage de la recherche en biodiversité en termes de structures (unités mixtes ou propres, institutions administratives de rattachement, etc.), d’acteurs individuels (notamment parce qu’une partie significative des informations présentes dans la base proviennent des fiches de renseignement remplies par les chercheurs eux-mêmes), de thématiques (mots-clés notamment), de disciplines scientifiques (distribuées sur deux niveaux de hiérarchie et que le dispositif cartographique à inciter à fixer et à éclaircir), de localisation géographique des acteurs et des structures, d’objets d’étude (terrains d’étude, taxons et écosystèmes étudiés).

A partir de là, le travail de croisement peut commencer selon une procédure réglée et dont la fondation a développé toute la connectique logicielle à titre pérenne :

Nous n’avons pas procédé à tous les croisements possibles, bien qu’ils soient nombreux étant donnée la richesse des dimensions des données. En détail, le tableau suivant donne une idée du nombre de « photographies » déployables sur le système continu de production de données qu’est la base de la FRB :

Laboratoires et structures de recherche. On lira dans le rapport les analyses qu’en tire la FRB sur le paysage de la recherche en biodiversité, notamment sur la richesse du réseau de collaborations entre disciplines comme entre structures de recherche. En particulier, il s’agissait d’évaluer le degré de coopération inter-régionale entre structures de recherche impliquées dans la participation commune à des projets financés. La carte, évidemment, est anonymisée car il n’est pas question de classer les institutions ou les laboratoires mais de visualiser de façon synthétique le tissu de collaborations qui s’est construit en plusieurs appels à projets successifs depuis 2005.

Quand elle intègre toutes les informations de la base, cette carte peut être mobilisée pour favoriser la mise en réseaux des acteurs et permettre la mise à disposition de la communauté scientifique un outil d’aide au montage de partenariats de recherche. En particulier, elle peut constituer un élément important pour améliorer la mobilisation de l’expertise dans le domaine de la biodiversité, pour i) répondre aux besoins des organisations nationales et internationales à l’interface sciences/sociétés ou sciences/politiques (ipBes, IUCN, ministères, etc.), et ii) disposer d’un outil pour identifier des experts dans le cadre de la gestion d’appels à projets. La vue produite correspond à une cartographie type « réseaux sociaux » mais d’autres sont possibles à partir du même jeu de données (b : géoréférencement des laboratoires et structures et vue circulaire associée, c : autre spatialisation mais avec des calculs de « centralité » pour analyser les laboratoires ou structures jouant un rôle clé en termes de partenariats scientifiques) :

Au delà des laboratoires et structures reliés entre eux par la participation commune à des projets labellisés, se dessinent deux grands ensembles de données : les réseaux d’acteurs et de chercheurs (reliés entre eux par des mots-clé ou des thématiques de recherche en partie communes) et la « géographie » des disciplines dans laquelle prennent place les projets scientifiques et la recherche en biodiversité.