En cette rentrée 2015, une «branche» de la cartographie d’informations se développe rapidement autour de moi: la cartographie d’informations juridiques et stratégiques. En soi ce n’est pas une nouveauté. La cartographie de brevets, par exemple, existe depuis longtemps et c’est un domaine spécialisé dans lequel évoluent quelques acteurs français comme FIST-SA, filiale du CNRS et de la BPI (bien que je n’ai pas trouvé d’exemples de cartographies sur le site) ou encore Veille Innovation Aquitaine (VIA-inno) très actif dans le Sud-Ouest autour de Bordeaux (un excellent projet me semble-t-il et qui serait si utile à nos futures régions). La cellule est adossée à différents organismes de recherche et à une Chaire d’Intelligence Technologique (et, en plus, on y utilise Gephi!).

C’est aussi l’une des compétences de l’Atelier Iceberg à Nantes. La start-up que j’ai accompagnée à ses débuts vogue désormais sur une péniche en centre-ville où son équipage peut recevoir ses partenaires. J’y suis encore mais sous la forme symbolique d’un portrait placé dans la timonerie!

iceberg1

L’Atelier a déjà produit d’excellents travaux de cartographie pour différents clients. Je me souviens que l’une de nos premières productions publiques aura été celle des 85 Technologies-Clef 2015, nouant ainsi des relations fortes avec le cabinet Erdynn que la DGCIS avait mandaté pour produire le rapport initial de ce document stratégique pour identifier les secteurs-clef de l’innovation industrielle de la France. Le poster associé, toujours accessible sur ce blog au format A0, a été présenté à Emmanuel Macron au printemps dernier à l’Ecole des Mines de Nantes où était hébergé L’Atelier Iceberg. Mais les compétences de l’atelier vont au-delà du domaine classique de la cartographie de brevets (par exemple pour identifier un univers concurrentiels ou des domaines technologiques émergents). EllicebergEes s’étendent aujourd’hui à différents aspects de la cartographie de l’information juridique en termes de méthodes comme de terrains. En termes de méthode, il y a déjà quelques mois que j’ai préparé avec l’Atelier une méthode d’identification des jeunes acteurs de la recherche dans un domaine d’activité particulier pour un groupe du CAC40 (si l’on passe, évidemment, les difficultés de la vérification des informations contenus dans les notices de brevets!). Le procédé intéresse aujourd’hui différents services internes (comme les RH en particulier ou la stratégie) bien au-delà du seul cadre du services juridiques. Si l’on tient compte de toutes les informations potentiellement croisables avec les réseaux sociaux (notamment à vocation professionnelle comme linkedin), on devine tout le potentiel que recèlent les informations brevets.

A bien y regarder, en termes cette fois de terrain, les données brevet ne constituent qu’un silo d’informations parmi d’autres, et l’une des grandes plus-values de la cartographie sera de pouvoir les croiser. D’une certaine façon, les technologies actuelles permettent déjà d’entamer l’exploration d’espaces inédits où se mêlent différents types d’informations juridiques, stratégiques, éventuellement sensibles. Les méthodes et la technologie développées par une autre belle start-up, linkurious, semblent particulièrement profilées pour s’emparer bientôt d’un nombre impressionnant de terrains liés à la stratégie et à la sécurité. Le blog de la société recèle quelques exemples frappants sur le champ qui se découvre pour des cartographies d’informations contextualisées: les données téléphoniques dans la résolution d’affaires criminelles, les réseaux de comptes bancaireslinkA

… et récemment les acteurs du projet automobile Tesla dans une interface qui intègre de nouvelles fonctionnalités:

linkurious1

Personnellement, je suis assez fan de la fonctionnalité qui permet, par drag-and-drop depuis mon PC, de visualiser des fichier JSON ou GEXG. Au mois de juin dernier, linkurious s’est vu attribué un prêt d’honneur par la Fondation Telecom, qui vise à soutenir l’entrepreneuriat dans les écoles Télécom de l’Institut Mines-Télécom (un prêt à taux zéro pour la qualité du projet). Le jury les a notamment récompensées pour “l’innovation de leurs produits, la pertinence de leurs business models et les compétences commerciales et techniques des équipes”. Evidemment, étant donné les perspectives qui se déploient au carrefour de l’information sensible et d’une technologie simple et fluide.

X-leaks. Les cartographies d’informations stratégiques et/ou juridiques déployées aujourd’hui par l’Atelier Iceberg et linkuriuous s’inscrivent dans le champ ouvert par linkfluence en 2010 avec l’affaire wikileaks et la diffusion des câbles diplomatiques des ambassades américaines dans le monde. Les cartographies d’informations sensibles intéressent depuis lors les ingénieurs et les étudiants, comme avec lexmex. J’avais fait part de mon intérêt pour l’étude cartographique publiée par deux grands journaux suisses sur l’affaire des appels d’offre de marchés publics dans la fédération helvétique. J’ai aussi remarqué il y a quelques temps la parution d’une série d’articles sur le journal Le Monde (version en ligne) à propos, cette fois-ci, du Swissleaks où linkurious a été mobilisé comme outil d’exploration des données par les journalistes de l’ICIJ ( l’International Consortium of Investigative Journalists, un réseau international de 190 journalistes d’investigation issus notamment des grands journaux américains). Peut-être verra-t-on un jour le jeu des acteurs et des flux financiers dans une sorte de Greece-leaks à cartographier…On retrouve l’ICIJ dans l’affaire, cette fois, du Luxleaks et de l’évasion fiscale de grands groupes internationaux au Luxembourg. Suite à des fuites, sont apparus des documents fiscaux établis entre 2002 et 2010 par les filiales luxembourgeoises de grands cabinets comptables pour le compte de 343 sociétés multinationales. Bien que légaux, ces rescrits sont alors perçus comme une forme de dumping fiscal privant de nombreux États européens de leurs rentrées fiscales. Les données sont publiées sur le site de l’ICIJ à travers un jeu de fiches particulièrement bien fait. Il n’en fallait pas plus pour Maxime Margerin, Henry Nomichith, deux étudiants inscrits dans mon enseignement au semestre dernier, pour s’intéresser de près au Luxembourg leaks qui est un des plus importants scandales financiers ayant éclaté ces dernières années lorsque plusieurs centaines de documents ont fuité de l’administration luxembourgeoise. Parmi les 584 contrats
fuités, 568 exploitent le mécanisme de rescrit fiscal (ou tax ruling) qui permet aux entreprises d’alléger les impôts perçus. À noter que cette liste de documents n’est, a priori, en aucun cas exhaustive. Un rescrit fiscal est rédigé à la demande d’un contribuable, l‘ICIJ n’est qu’entré en possession de quelques rescrits acceptés par l’administration Luxembourgeoise. Ils ont commencé à analyser 584 contrats liant 384 entreprises,de  82 pays différents et dans 9 secteurs industriels majeurs: Médias, Technologie, Industrie manufacturière, Santé, Alimentation, Commerce de détail, Énergie, Finance, Transports. A priori, 4 cabinets d’audit sont impliqués (Pricewaterhousecoopers -574 contrats, Ernst & Young-8, Loyens & Loeff-1 et KPMG-1). Nous avons commencé à réaliser quelques statistiques sur les données, notamment la concentration de contrats lux1entre les ann
ées 2007 et 2011 pour un montant de 193 017 996 720 € sur 10 ans du système.

Le projet poursuivi par Maxime Margerin et Henry Nomichith commence à porter ses fruits et le travail d’analyse par graphe est en cours. Nous n’avons pas encore achevé la première phase d’expérimentation mais l’objectif de ce type de travail est fixé: se doter d’une base générale et d’une méthodologie de description des entités juridiques qui constituent encore une sorte de jungle difficile à observer. En attendant, évidemment, que les données soient disponibles…

Lux2

L’un des aspects de ce travail qui mérite réflexion est constitué par ces nombreux schémas associés aux documents juridiques des données du luxleaks, ceux des montages juridiques (par exemple un groupe et plusieurs de ses filiales) entre entités différentes mais reliées entre elle par des liens de dépendance. Notre idée serait de pouvoir automatiser en partie le recueil de données pour transformer les informations en structures de graphes.

Lux3

Nous n’en sommes qu’aux phases de conception et des premiers développements mais le principe pourrait augurer, là aussi, de cartographies de dépendance et/ou d’interaction juridiques entre un très nombre d’entités sur une vaste échelle.

Les acquisitions de start-ups par les géant de l’information. Les rachats de sociétés, notamment les start-ups, par de grands groupes industriels peut aussi constituer un domaine juridique à cartographier. Observer à grande échelle, et sur plusieurs années, les stratégies de rachats d’entreprises des 5 géants de l’information (Apple, Facebook, Google, Microsoft, Yahoo!) a constitué l’objectif de Nicolas Rouquette, Alexandre Coden et Mike Grevelinger au semestre dernier. Evidemment, pour des élèves-ingénieurs en informatique, il s’agit de cartographier un univers dans lequel ils baignent quotidiennement.

AcquisitionA

Les données associées aux entreprises ont été extraites de Wikipédia (date d’acquisition, nom de l’entreprise achetée, type de l’entreprise, pays de l’entreprise achetée, le prix de rachat quand il est disponible, le sous-groupe de l’acquéreur auquel l’entreprise acheté a été intégrée). Au total, le graphe comporte 589 références d’entreprises. Le parti pris pour produire la carte finale a été d’associer manuellement aux entreprises des tags indiquant le type de technologie, de secteur d’activité et/ou d’usage. Ainsi, un index de descripteurs a été produit comportant 43 termes (web, blogging, programming, network, communication, service, image, design, video, audio, streaming, voice, cloud, device, knowledge, marketing, management, mobile, game, ia, security, advertising, mapping, connected, software, 3D, commerce, social, mailing, analysis, virtual, recognition, robotic, searching, payment, datamining, wordprocessing, collaboration, productivity, energy, mechanical, music, database). La nature et le nombre de termes semble optimum puisqu’il permet à la fois de relier les entreprises rachetées par des descripteurs communs mais aussi différenciants, donc de lier les entités de façon à faire émerger des zones particulières. La carte générale a donc été construite comme un graphe bi-partite (589 entreprises+ 43descripteurs) spatialisé avec Gephi en ForceAtlas2.  Les couleurs ont été distribuées en fonction du des classes identifiées avec l’algorithme Modularity.

AcquisitionB

 La carte met essentiellement en évidence les « zones thématiques » où se regroupent les technologies par types (les noms des entreprises y figurent et sont lisibles une fois le poster imprimé). Les zones software et web + service sont manifestement les plus importantes avec des extensions significatives autour de device, mobile et streaming. Les variations temporelles apportent aussi leur éclairage: 3 périodes ont été choisies 1987 – 1999, 1999 – 2008 et 2008 – 2015. On a fait ainsi apparaître les descripteurs (bleu) ou les termes nouveaux pour chacune des périodes. Ainsi, si la première période paraît contenir l’essentiel des descripteurs (1987-1999), une analyse plus fine a montré que software apparaissait dès le début tandis que web et service interviennent plus tard (autour de la période 1993-1995). La seconde période (2000-2008) est marquée par l’apparition des thématiques des réseaux sociaux d’un côté et, de l’autre, de celles liées au mobile et aux technologies de streaming. Enfin, la troisième (2009-2013) est marquée par l’apparition des thématiques de la santé et des devices incluant aussi bien la robotique que les objets connectés.

AcquisitionC

A partir de la base de données et des requêtes d’autres tris des données sont possible. Nous avons ainsi testé des comparaisons d’empreintes entre chacun des 5 géants de l’information. Dans ce cas, nous avons mis en valeur («allumé» de différentes couleurs) les entreprises qu’ils ont racheté. On peut ainsi situer et contextualiser les différentes stratégies de chacun des groupes. Seul Google semble s’inscrire dans tous les domaines. En revanche, si l’on compare attentivement les positions de Microsoft et de Yahoo! en termes de zones thématiques occupées comme de rachat d’entreprise, les deux profils associés semblent eux aussi couvrir l’ensemble de la carte. La carte illustre à sa façon les accords entre les deux acteurs dont les positionnements stratégiques semblent particulièrement complémentaires, et depuis 1987.

compA

Les services de cartographie proposés par les start-ups comme les expérimentations menées par les étudiants de l’U.T.C. ne constituent qu’un premier pas et l’exploration des données sensibles reste un objectif générique en terme de développement. A titre personnel, j’attends de pouvoir traiter un jour prochain un ensemble suffisamment vaste et varié d’informations sur les investissements et les acteurs liés à l’innovation et à la recherche, en régions comme au niveau national et dans une perspective d’évaluation. Si suffisamment de données ne sont pas encore accessibles, et si les méthodes pour cartographier des systèmes aussi complexes ne sont pas non plus finalisées, un ensemble d’indices collectés au cours des dernières années commencent à faire tableau.