L’analyse des réseaux d’acteurs a constitué un terrain riche de données dans l’exploration de la Base de la FRB. Il s’est agi d’un chantier stratégique car on touche là à l’une des missions essentielles de la Fondation : la construction de projets de recherche communs entre chercheurs issus d’institutions différentes et inscrits dans des laboratoires différents, dans un démarche interdisciplinaire de mutualisation des moyens et des résultats et dans une perspective de co-construction avec les acteurs de la société civile. A ce titre, le travail de longue haleine de la Fondation pour la Recherche sur la Biodiversité ne laisse pas de me fasciner dans un paysage de la recherche académique découpée verticalement en disciplines, laboratoires, institutions et/ou universités aujourd’hui autonomes et jalouses de leurs spécificités et de leurs moyens humains et financiers. C’est en explorant les relations que les acteurs entretiennent au niveau individuel que se mesure au mieux la recherche sur la biodiversité comme l’agrégation d’une communauté : plus encore que les disciplines ou les laboratoires, les connexions inter-personnelles constituent un marqueur (ou un niveau de « granularité ») pertinent pour comprendre la géographie sociale qui gouverne l’émergence d’un champ de recherche.

Les données contenues dans la base auraient pu être mobilisées pour tenter, une énième fois, d’évaluer « l’excellence » scientifique des acteurs. Au contraire, dès le départ, l’étude s’est orientée vers la recherche de ces indicateurs qui permettent de comprendre comment les connaissances sur la biodiversité sont une production collective issue d’un vaste réseau d’acteurs coopérants, qui s’agrègent autour d’objets d’étude comme les écosystèmes plus que par distribution en disciplines ou en laboratoires. Pour y arriver, Cédric Chavériat, à la Fondation, a développé toute cette connectique nécessaire à la circulation de l’information depuis la BDD jusqu’aux structures de graphes de façon pérenne, et donc jusqu’aux nombreuses cartographies produites. Dans un premier temps, il a fallu « transformer les liens acteur-projet en liens acteur-acteur, en considérant que la participation de différents acteurs à un même projet génère des liens entre tous ces acteurs » comme le précise le rapport. Les liens entre acteurs ont été enrichis ensuite en fonction du nombre de projets communs et, enfin, différents processus de traitement de l’information liée aux acteurs dans le BDD (profil, disciplines, mots-clés associés, terrain de recherche…) ont été mis en place pour faire varier la structure de graphe en fonction de différents paramètres. Toute cette connectique BDD-FRB / GEPHI a permis, par exemple, de colorer les nœuds ou de faire varier leur taille en fonction de paramètre comme la présence de mots-clés commun dans les domaines de recherche ou des projets auxquels sont associés les acteurs.

Les graphes acteurs-acteurs (reliés les projets) ont été les premiers à être produits : ils comprennent 1655 individus différents participant à 185 projets (issus de plusieurs Appels A Projets, AAP) pour lesquels les consortia sont connus et renseignés dans la base. Hormis quelques groupes isolés du reste de la structure générale, la grande majorité des acteurs sont connectés entre eux, de proche en proche, dans une géographie très clutérisée (et habituelle en matière de cartographie des sciences, qu’il s’agisse d’articles ou de revues). La recherche en biodiversité apparaît donc constituée comme un continuum de « noyaux denses de compétences ». Bien qu’anonymisés dans le rapport, les graphes laissent apercevoir le rôle important que jouent certains individus à l’articulation de plusieurs clusters et dont le rôle est capital pour assurer à cet espace son unité comme le montre la vue centrale de l’exemple plus haut où ils apparaissent sous forme de nœuds rouge dont la grosseur varie en fonction de leur score de « centralité ». A droite, la vue ne laisse apparaître en rouge (rôle de premier plan) et en vert (rôle de second plan) que les acteurs en position centrale participant à plusieurs projets et ayant des thématiques de recherche complémentaires mais différentes.

Ces graphes, typiques des réseaux sociaux, ont servi de base à l’étude des autres dimensions de l’information contenues dans la base. La FRB fournit régulièrement un travail conséquent de remise à jour des données en les enrichissant systématiquement : la Fondation dispose ainsi de profils « acteurs » à jour et, donc, d’un puissant outil d’analyse qui peut servir maintenant d’aide à la mobilisation d’experts et à la formation de consortiums de recherche. En particulier, le croisement de différentes sources d’information constitue un moteur essentiel de renseignement des informations (alors mobilisable pour enrichir les capacités descriptives des nœuds du graphe). En dehors des projets dépendant des Appels à Projets (AAP) gérés par la FRB, quatre autres sources d’information sont utilisées à ce jour par la Fondation pour l’enrichissement des informations « acteurs » :

Les organismes français de recherche membres fondateurs de la FRB. Fin 2010 ces organismes (BRGM, Cemagref, CIRAD, CNRS, Ifremer, INRA, IRD, MNHN) ont transmis à la FRB des listes d’acteurs relevant de leur organisme et qu’ils considéraient comme pertinents pour la base de données nationale. Parmi les acteurs identifiés, 2099 acteurs n’étaient pas déjà présents dans la base. La validation de ces acteurs supplémentaires, par recherche bibliographique, est en cours.

Des recherches internet. L’équipe FRB peut incorporer des acteurs dans la base de données après recherche sur internet et identification de laboratoires ou d’équipes de recherche dans le domaine de la biodiversité, suivi d’un processus de validation par recherche bibliographique.

Des recherches bibliographiques. Ceci permet de valider si un acteur ne faisant pas partie d’un projet de recherche biodiversité et pré-identifié par un organisme de recherche ou la FRB est à prendre en compte ou non dans la base, en fonction de publications qu’il a ou pas sur le thème biodiversité (depuis 2005). Les acteurs peuvent aussi être directement identifiés par recherche bibliographique. L’établissement d’un profil bibliographique étant particulièrement laborieux pour l’ensemble du champ biodiversité, cette approche n’est réalisée à ce stade que pour des thèmes particuliers (par exemple celui des scénarios de la biodiversité, en cours).

Enquête auprès des chercheurs. Chaque personne dont les informations sont entrées dans la base de données est ensuite contactée par mail pour l’informer que nous stockons des informations la concernant et lui permettre de faire valoir son droit d’accès, de rectification ou d’opposition, conformément à la loi informatique et libertés de 1978. L’acteur peut compléter et corriger les informations le concernant, ou signaler des modifications à effectuer sur les structures ou projets qui lui sont rattachés. Il peut aussi quantifier la part de la biodiversité dans ses travaux de recherche. Il peut enfin donner les autorisations d’utilisations de la totalité ou d’une partie des données le concernant.

L’ensemble de ces informations vient donc nourrir, in fine, les graphes d’acteurs. On peut ainsi croiser les graphes acteurs-acteurs (reliés par les projets) à des batteries de mots-clés significatifs décrivant soit le champ disciplinaire auxquels appartiennent les acteurs, soit les thématiques abordées dans les projets, soit encore les objets, les terrains sur lesquels ils travaillent de concert. Parmi toutes ces variables, plusieurs ont été testées et l’une s’est révélée particulièrement intéressante : la « géographie » des écosystèmes sur lesquels travaillent les acteurs.

En termes descriptifs, cette carte est d’une autre nature que celle des laboratoires, souvent de grosses structures à fort effectifs rassemblant des chercheurs travaillant sur des thèmes qui peuvent être très différents (sans parler, comme je l’ai maintes fois expérimenté auparavant, du fait que les cartographies de laboratoires qui reposent par exemple sur les informations contenus dans leurs sites web ou les documents officiels qu’ils produisent me semblent assez artificiels et généraux, souvent tournés vers des objectifs de communication institutionnelle). La carte acteurs-écosystèmes révèle au contraire un vaste réseau d’affinités thématiques qui transcende aussi bien les appartenances institutionnelles que disciplinaires : des clusters d’acteurs (vers la gauche de la carte) travaillent sur la biodiversité marine (les mots clés vont de la « haute mer » aux «estuaires », et incluent aussi « socio-écosystème», traduisant sans doute l’historique de l’approche écosystémique  utilisée dans la communauté marine) tandis que les mots clés « récif corallien » et « Île» sont localisés ensemble à proximité du cluster marin, mais pas en son sein, traduisant une spécificité partielle des acteurs travaillant sur ces milieux. Des clusters d’acteurs (vers le bas de la carte) travaillent sur la biodiversité des eaux douces (les mots clés sont ici « rivière», «dulçaquicole», ou « hydrosystème») tandis que d’autres acteurs (vers le centre de la carte) sur les « zones urbaines », les « sites pollués » ou  les « friches industrielles », bien qu’il soit difficile d’identifier un cluster précis pour ces acteurs. Dans la partie haute de la carte, des clusters d’acteurs travaillent sur différents types d’écosystèmes terrestres (forêt tropicale, forêt tempérée, prairie, montagne, agro-écosystème…), dans une déclinaison systématique des biotopes placés aujourd’hui sous l’observation des scientifiques. Il me semble évident aujourd’hui que l’on pourrait tirer de cette cartographie, en la scénarisant, un instrument pédagogique des plus efficaces pour faire découvrir toute la richesse de la recherche en biodiversité.

Cette approche par les acteurs, au-delà des écosystèmes, permet en retour de qualifier de façon fine la géographie thématique des laboratoires (ou leurs « spécialités » à partir des terrains réel occupés par les chercheurs). On peut ainsi croiser les disciplines auxquels se réfèrent les acteurs avec la carte des laboratoires pour apercevoir les réseaux transversaux réels d’où émergent des objets communs de recherche. C’est ce type de connectique analytique qu’a développé Cédric Chavériat, notamment à partir de procédures qui permettent pour chaque laboratoire identifié de calculer le nombre relatif de chercheurs par disciplines ou objets d’étude et, ainsi, de faire varier les vues produites sous GEPHI. Dans les deux vues ci-dessous (produites dans le rapport final), si la grosseur des nœuds des laboratoires dépend du nombre de participations à des projets labellisés par la FRB, les couleurs en termes de dégradés et d’intensité dépendent des objets d’étude réels des chercheurs et de leur nombre respectif :

Les variations de vues rendues possibles par le croisement de variables sont en réalité impressionnantes, et le travail d’exploration n’a fait que commencer. Une certitude cependant : ces variations ne sont déployables que si les données sont issues d’un long travail de vérification manuelle et si elles admettent de nombreuses dimensions, souvent issues de plusieurs sources d’information. Deux conditions sine-qua-non de cartographies de l’information pertinentes.