LBSLogo

 

 

Avec la masse de données du web, leurs formats différents et leurs différentes dynamiques (du temps réel à tous les segments du temps différé), le dashboard (tableau de contrôle des données) est naturellement devenu un terrain majeur des technologies réseaux. Très lié à l’origine, me semble-t-il, à la culture Apple des interfaces, le dashboarding est aujourd’hui devenu l’espace privilégié du contrôle de l’information par les usagers: sélectionner des sources, rassembler des contrôles d’application, programmer des tâches, suivre un événement en concentrant les flux sont autant de fonctionnalités que doivent assurer ces panneaux de contrôle, si caractéristique, par exemple, des interfaces des téléphones mobiles de dernières générations. La conception d’un dashboard pour l’univers du web et ses données est un véritable défi, quels que soient les contextes d’utilisation ou les données traitées. Pour moi, il s’agit du rassemblement en un même espace d’indicateurs différents, hiérarchisés ou logiquement articulés entre eux selon une scénarisation (ou des usages programmés). La notion d’indicateur a déjà été abordée maintes fois sur ce blog (et détaillée ailleurs). Elle illustre parfaitement cette double compétence si importante aujourd’hui pour le développement des technologies de services informationnels: côté pile, il s’agit d’un exercice de conception d’une interface matérielle auquel nous a habitué la mode de l’infoviz; côté face, il s’agit de calculer selon certaines métriques ou certaines méthodes des propriétés extraites des masses ou des flux de données. L’indicateur permet donc à minima d’observer un « comportement » des données (par exemple des flux, des résultats de calcul, des données issues de capteurs…) mais aussi, le plus souvent, d’agir sur le processus de traitement de l’information (activer un filtre sur les données, remonter le temps via une time-line interactive, orienter une vue, redistribuer des éléments en nouveaux sous-ensembles…).

L’indicateur permet donc d’agir sur les données et leurs propriétés via une interface graphique ou matérielle. C’est pourquoi le design d’interface et l’ingénierie des données sont deux compétences nécessairement associées dans la conception d’indicateurs, éléments centraux notamment des dispositifs de contrôle de l’information web où les masses, les formats et la dynamique des données natives rend l’exercice particulièrement difficile. On comprend aussi par là l’intérêt de les développer pour des secteurs comme la veille stratégique sur certains domaines particuliers: un dashboard, comme une sorte de « tout-en-un » composé d’indicateurs différents et pluggés sur des sources pertinentes, permettant de visualiser et de piloter des calculs automatiques, effectués selon des métriques définies en fonction de scénarios d’usage prédéfinis, serait assurément d’une grande plus-value en terme de raisonnement et de décision. Ceux qui ont développé cette double compétence interface-data (individuellement ou collectivement) occupent indéniablement une position stratégique dans l’univers du développement technologique actuel, surtout si, de plus, ils sont sensibles ou ont été initiés aux sciences des réseaux pour intégrer à leur travail quelques-unes de ces propriétés fascinantes qui font du web un véritable écosystème informationnel. Je pense là, évidemment, à Linkfluence dont Radarly (le dashboard de monitoring du web social) figure maintenant parmi les 3 meilleurs technologies mondiales (3e prix des meilleurs « Earned Media Analytics » lors de la 4ème édition du classement Goldbach qui désigne les meilleurs outils de social media monitoring mondiaux).

Cette troisième marche du podium mondial ne me fait pas oublier d’autres dashboard intelligents et astucieux, comme celui développé par Linkurious. Dans l’univers feutré des données sensibles (banques, assurances, télécommunication, santé…) et relationnelles (traiter les données comme un vaste système d’interactions, et donc analysables sous forme de graphes), linkurious vient de sortir lauréat du concours I-lab édition 2014. 1 314 candidatures déposées, 221 lauréats parmi lesquels 54 jeunes entreprises innovantes lancées en 2013 parmi lesquelles linkurio.us : ici encore la preuve de la combinaison pertinente d’indicateurs graphiques et de procédés originaux de traitement des données. Mais il reste tant encore d’univers informationnels à explorer, à monitorer, à analyser, en somme à contrôler en partant d’un projet de dashboard, avec ses widgets branchés sur l’exploitation de formats documentaires multiples et de sources variées. C’est tout l’enjeu actuel de ces dashboard dédiés à l’intelligence des données pour la décision, la prospective ou la veille territoriale ou stratégique, comme celui que développe l’Atelier Iceberg en ce moment en partant de données journalistiques, de notices de brevets, de publications scientifiques ou de données d’entreprises. Les indicateurs développés actuellement par l’Atelier montrent là aussi combien le succès repose sur la maîtrise de toutes les étapes d’une chaîne de traitement de l’information, aussi bien sur le versant data que sur le versant interface.

« MySpace, c’est le bar, Facebook, c’est le barbecue au fond du jardin, et LinkedIn, c’est le bureau. » (Reid Hoffman, cofondateur de linkedin). Ces belles réalisations ne doivent pas faire oublier que tout commence avec une forme ouverte d’expérimentation, synonyme d’innovation technologique prometteuse, quand se concrétise l’idée d’une indicateur manifestant à travers une forme matérielle l’exécution de calculs originaux, exploitant de nouvelles métriques appliqués à des données encore peu explorées. La perspective convient parfaitement aux séances de travaux dirigés que j’anime à l’U.T.C. (rapidement transformés en séance de créativité dès le début du semestre d’enseignement) et aux « séminaires » ou aux « formations » d’une ou deux semaines consécutives comme cette année à l’Ecole de Design de Nantes-Atlantique. L’occasion de réfléchir, cette année et dans les deux écoles, à ce que pourrait être un dashboard pour faire de la veille et de l’analyse sur des données issues des réseaux professionnels, en particulier linkedin où officie Mathieu Bastian, un autre compagnon de longue route, ingénieur U.T.C., et lead-developer de Gephi. Si l’on se souvient d’inmaps (qui s’arrête bientôt je crois), on a déjà une bonne idée de ce que peut donner l’association d’une interface (cartographique pour l’occasion) et d’un traitement de données relationnelles à grande échelle. Rapidement, l’intérêt s’est porté vers l’étude de la distribution des skills, ces compétences déclarées et reconnues par les inscrits du réseau et que l’on peut voir comme une forme ascendante d’ontologie-métier. L’idée n’est pas neuve mais avec plus de 300 millions d’inscrits, des compétences technologiques de très haut niveau et l’objectif de proposer régulièrement de nouveaux services (par exemple d’aide au recrutement par les entreprises), linkedin a aujourd’hui les moyens et les données suffisantes pour imaginer ce que pourrait être un dashboard global, adaptable aux organisations, aux groupes ou aux individus particuliers. Parmi les nombreuses connexions possible à partir des profils (ne serait-ce que le réseau des invitations ou encore des réseaux de discussion professionnels avec linkedin answers), des étudiants de l’EDNA (Ecole de Design de Nantes-Atlantique) comme de l’U.T.C. ont conçus les premiers éléments de ce que pourrait être un dashboard dédié à l’étude de la nature et de la distribution des skills au sein de leur univers respectifs.

A Nantes, Thomas Chevillotte, Amandine Dugrain, Adrien Frey, Hélène Gérard et Morgane Guyot ont testé différents types de mesures et de calculs et ont élaboré un ensemble d’indicateurs qui composent leur projet de dashboard linkedin. Les cinq jeunes designers d’interactivité ont donc eu l’occasion d’approcher les multiples enjeux d’un travail de modélisation et de veille sur les compétences professionnelles accessibles sur linkedin. Le choix de linkedin est très lié à la place que la plateforme a trouvée dans le vaste écosystème du web où chaque application rencontre sa « niche ». En incitant les membres à agréger les nombreuses informations qui constituent un réseau professionnel, linkedin fonctionne comme une sorte de synthèse du réseau social et du réseaux de connaissances, la plateforme se nourrissant de la dynamique de la recommandation de compétences et/ou de profils. Pour chacun des membres la participation à la plateforme permet, en retour, de cumuler du capital social basé sur un principe de confiance. On comprend l’intérêt qui lui portent les étudiants, les entreprises ou les associations pour développer de nouvelles idées, identifier et mobiliser des compétences ou tisser des partenariats, exploiter la dynamique du crowdsourcing. La question de l’identité ou de la singularité d’un membre (sous la forme, entre autre, du personal branding) y est donc fortement corrélée aux différents réseaux dans lesquels elle se définit et où l’e-reputation individuelle s’y calcule selon différentes échelles (au premier degré, nos contacts directs; au second degré les contacts de nos contacts; etc. jusqu’à ce qu’un profil, sous quelle que facette que ce soit, ne trouve plus d’écho dans les masses de données).

LinkedinTableauGeneral

Le dashboard linkedin des designers a été conçu comme un espace unique et fixe (ici, sous forme de poster) et agrégeant différents types d’indicateurs. L’objectif est d’en faire un espace d’information public et accessible en interne dans les organisations. Au delà des enjeux d’analyse des compétences, voire même d’aide à la décision en termes de gestion ou d’orientation des formations, le dispositif mise évidemment sur « l’effet politique » généré par sa diffusion publique (mise à jour des profils individuels, densification des relations, augmentation des recommandations au sein de la communauté…). Ce tableau de monitoring se concentre sur l’observation des skills, les compétences déclarées et/ou reconnues. Le principe est particulièrement efficace pour faire émerger, à grande échelle, des « profils métiers » par concentration de compétences qui ne dépendent pas d’une classification à-priori (en générale, très verticalisée et très cloisonnée si l’on prend les rubriques « métiers » des catalogues de formation). Les connexions liées aux skills partagées ou non constituent une couche de connectivité transversale aux acteurs (donc de les regrouper et de les identifier) qui permet d’interconnecter de façon très riche et diversifiée des entreprises, des organisations ou des acteurs à d’autres acteurs. La mesure de cette production ascendante de descripteurs de l’activité professionnelle commence ici avec des données statistiques générales sur la gestion des comptes linkedin dans une communauté donnée (en l’occurrence une promotion d’étudiants)

LBSStatsDonneesGeneralesA

LBSStatsDonneesGeneralesC

Ces indicateurs primaires de « taux de présence au réseau » et aux façons de l’utiliser (langage, données personnelles, mise à jour des données…) peuvent aussi fonctionner, dans le cadre d’un projet public et commun, comme de véritables incitations, voire des injonctions implicites. L’indicateur principal du tableau, à mon sens, consiste à juxtaposer les taux individuels de complétude des profil linkedin à une première identification des skills communes (le « top 10 » de droite).

LinkedStat3

Une classification ascendante de compétences à partir des profils individuels peut constituer un élément très pertinent d’analyse (ou d’aide à la décision) pour un responsable de formation ou un établissement en termes de veille des « profils de sortie ». Ils peuvent par exemple correspondre, on non, aux profils « officiels » déclarés par un organisme ou un programme de formation. Dans d’autres cas, cette classification ascendante peut être mobilisée pour comparer deux formations ou deux établissements comme les écoles de design en France. L’introduction de la dimension temporelle (que les étudiants ont testée) pourrait permettre d’identifier des « profils émergents » au cours du temps ou, dans l’autre sens, ceux qui ont disparu. De nombreux feed-back vertueux entre établissements de formation le réseau linkedin peuvent être imaginés et incarnés sous forme d’indicateurs placés dans un dashboard global de contrôle.

Adobe, coeur de compétences. Au coeur du réseau de recommandation de compétences, la suite Adobe occupe la place principale (avec ACS pour gérer les documents Adobe sur les mobiles notamment). Au centre, une illustration avec 3ds max des multiples façons de labéliser une même compétence. A grande échelle, les problématiques de « multi-labélisation » (une même compétence pouvant être nommée différemment par les membres), voire même de langues différentes pour désigner une même compétence, doivent sûrement poser de nombreux problèmes aux ingénieurs de linkedin. Au niveau local du projet, la diffusion publique du dashboard peut amener les membres du groupe à adopter un même « vocabulaire » véhiculaire (permettant de fixer les variations locales d’une sorte d’ontologie-métier).

LBSStatsAdobe

En retour, une première classification permet de distribuer les profils individuels en fonction des compétences, de la même façon qu’un graphe bipartite peut être redistribué en deux graphes « simples » (relations étudiants-étudiants reliés par les compétences communes; relations compétences-compétences selon la façon dont elles sont liées sur les profils individuels).

LBSStatsEtuParSkillsCommunes

Les variations temporelles peuvent être appliquées à chacun des indicateurs du dashboard. Un exemple de variation temporelle a été produit en comparant les recommandations de compétences entre deux promotions (2013 et 2014).

LBSStatsTempAnnées

Surtout, le bandeau bleu en bas du dashboard vient rappeler l’un des effets majeurs généré par le développement du projet lui-même au sein de la promotion. C’est l’une des plus value espérée du projet: mesurer le type et le taux de modification des profils  dans la semaine qui suit l’annonce et la présentation du projet devant la promotion.

LBSStatsTempAnnéesB

Parmi toutes les modifications apportées aux profils personnels durant une semaine, on peut apercevoir l’intensification des relations de recommandation au sein de la promotion (en bleu, la nouvelle distribution; en blanc, l’ancienne une semaine au préalable).

LBSStatsTempMemePromo

Les relations étant plus riches, le nouveau classement des skills laissent apparaître des changements notables (redistribution des compétences 3, 4 et 5 en particulier) mais pas pour les deux premières (Photoshop, Illustrator).

LBSStatsTempMemePromoSkills

 

LinkedBySkills, B. Côté U.T.C., le dashboard linkedin a d’abord été conçu comme un outil de recrutement potentiel, un outil d’identification de compétences pour la constitution d’une communauté professionnelle. Pauline Cuche, Simon Robain, Alexandre Abrantes, Nicolas Monchy, Vincent Lainé et Benjamin Calméjane, ont développé une première version opérationnelle d’un dashboard assez complet techniquement qui assure plusieurs fonctionnalités comme la récupération automatisée des données des profils linkedin (skills notamment), le traitement sous forme de base de graphes, la visualisation dynamique avec sigmaJS. La perspective des étudiants est donc ici plutôt du côté du data mining avec un prototype en ligne constitué de plusieurs pages html intégrant les modules javascript.  L’extraction des données a été conçue comme un processus générique et pilotable en ligne. En son principe, elle fonctionne comme un crawler: on extrait les données (notamment les skills) à partir d’une série de comptes individuels précis puis on renouvelle l’opération pour les profils en relation directe (profondeur 1 ou à « un clic de distance ») ainsi qu’au second degré (relations indirectes ou « les amis de mes amis »). Les données extraites pour le prototype sont à priori relativement homogènes puisque l’extraction a été lancée depuis des profils d’étudiants d’école d’ingénieurs, donc avec un taux important de compétences communes (notamment en informatique).

LBS2worflow

Ce dashboard dédié aux recruteurs permet de composer une équipe en fonction de compétences identifiées, notamment à partir de trois panneaux distincts et complémentaires dans le scénario d’usage imaginé: cartographie des compétences (reliées entre elles comme elles le sont sur les profils linkedin), la recherche de profils particuliers avec des menus associés et, enfin, la cartographie de l’équipe en cours de constitution en termes de compétences associées (sous forme de dendogramme).

LBS2dashboard

La cartographie des compétences permet de naviguer dans le jeu de compétences issu de la phase d’extraction. Elle est basée, comme la suivante, sur une visualisation de graphe relationnel spatialisé avec un algorithme de type ForceAtlas. Ce type de représentation permet tout à la fois de hiérarchiser les compétences en fonction de leur degré de « généralité » ou de partage dans les profils analysés mais aussi d’esquisser des sous-ensembles ou « clusters de compétences ». Le zoom dynamique permet de passer des compétences les plus génériques aux plus « locales » ou les plus originales (partagées par peu de membres du set de données).

LBS2SkillsMap

La sélection d’un noeud (compétence) sur la carte peut activer à la volée une recherche sur la base de profils personnels et les afficher dans une frame dédiée.

LBS2Futur

Cette fonctionnalité de gestion des profils peut être enrichie par un affichage des informations associée à chaque membre du réseau analysé.

LBS2SRightPaneBlueLetters

Enfin, chacun des profils individuels pertinents dans une tâche de recrutement peut être sélectionné et ajouté à l’équipe en cours de constitution, l’organisation collective étant alors représentée sous de dendogramme. Ce troisième panneau permet d’afficher des informations complémentaires, comme les compétences communes ou, au contraire, uniques. Les informations étant disponibles dans le set de données traitées, les noms des universités d’origine des étudiants ou des professionnels potentiellement recrutés.

LBS2Team

Ces premiers essais ouvrent des pistes prometteuses, par exemple dans la recherche de profils particuliers sur un réseau comme linkedin ou encore observer, à partir des groupes de discussion, les sujets émergents dans certains secteurs industriels. Au delà du soin qu’apportent désormais les étudiants à leurs profils linkedin, ils auront aussi découvert quelques-unes des méthodes qui permettent déjà peut-être de les observer sur le web.