Actualités

[BELLE HISTOIRE] Faciliter le quotidien des recruteurs à l’aide des graphes et du deep learning

28 avril 2026 • Big Data & IA - Industrie du futur - Smart City

Dans le cadre d’une thèse CIFRE réunissant le cabinet de recrutement Easy Partner, le laboratoire SAMOVAR de Télécom SudParis, école composante de l’institut Carnot TSN, et l’Efrei, Éric Behar a développé un outil d’aide à destination des recruteurs. Grâce à une représentation sous forme de graphe et à un modèle de deep learning, son système de recommandation peut ainsi identifier des candidats pertinents pour une offre de poste et, inversement, des offres correspondant à un candidat.

Easy Partner est un cabinet de recrutement spécialisé dans les métiers de la tech. Son rôle consiste à aider ses clients à identifier et à attirer les meilleurs profils, en particulier dans le développement, l’ingénierie ou la data science. Et pour y parvenir au mieux, l’entreprise mise sur l’innovation. En 2021, elle souhaitait ainsi lancer un projet de recherche afin d’assister ses recruteurs au quotidien.

« À l’époque, je cherchais un emploi en data science, après avoir notamment dû renoncer à une thèse CIFRE, un an auparavant, à cause du covid », se souvient Éric Behar, chercheur en IA. « Après avoir postulé auprès du cabinet, je suis entré en contact avec le fondateur d’Easy Partner, qui m’a parlé de son projet d’innovation et indiqué que mon profil pourrait correspondre à cette recherche. Cependant, il n’était pas encore fixé sur les modalités de la démarche et c’est moi qui lui ai alors proposé de mettre en place une thèse CIFRE. » L’entreprise convaincue, il ne restait, dès lors, plus qu’à identifier le partenaire académique idoine. Ce serait finalement le laboratoire Services répartis, Architectures, MOdélisation, Validation, Administration des Réseaux (SAMOVAR) de Télécom SudParis, école composante de l’institut Carnot TSN, avec une codirection de thèse assurée par Amel Bouzeghoub, professeure à Télécom SudParis, Julien Romero, maître de conférences à Télécom SudParis, et Katarzyna Wegrzyn Wolska, directrice adjointe de l’Efrei Research Lab.

Aider les recruteurs dans la présélection de candidats

L’objectif de cette démarche était de s’attaquer à l’une des difficultés du métier de recruteur : l’étape de présélection. Autrement dit, pour une offre d’emploi donnée, comment trouver rapidement une première liste de candidats pertinents ? Alors que les réseaux professionnels offrent désormais l’accès à une quantité colossale d’informations, cette tâche revient à chercher une aiguille dans une botte de foin. « L’ambition n’était pas du tout de remplacer le recruteur, ni de supprimer les interactions humaines, absolument capitales dans le recrutement », insiste Éric Behar. « Il s’agissait plutôt d’aider les recruteurs à traiter un volume de données impossible à analyser par un être humain et à effectuer un premier filtrage des candidats, en étudiant finement les offres de poste et les profils. »

Une idée qui n’était, bien sûr, pas nouvelle. À l’heure actuelle, il existe d’ailleurs divers systèmes automatiques de recommandation. Néanmoins, développer une solution fiable demeure un défi, notamment en raison de la quantité de données nécessaires. « Ainsi, les outils disponibles aujourd’hui sont souvent jugés décevants par les recruteurs, par rapport aux promesses annoncées », note Éric Behar. À l’inverse, un acteur comme LinkedIn possède une base de données suffisante et des moyens technologiques adaptés. Mais ses objectifs ne sont pas ceux d’un cabinet de recrutement : le réseau professionnel cherche plutôt à maximiser le nombre de clics de ses utilisateurs et à vendre des abonnements payants.

Un graphe pour représenter le marché du recrutement de la tech

Dans le cadre de sa thèse CIFRE, Éric Behar a donc développé un nouveau système de recommandation à destination des recruteurs. Une démarche décomposée en plusieurs étapes, à commencer par une représentation du marché du recrutement sous forme de graphe, constitué de plusieurs nœuds, reliés par des arêtes. « Les graphes font l’objet de nombreux travaux de recherche, car il s’agit d’un outil qui représente bien une information complexe », souligne le chercheur. « Ici, chaque nœud correspond à un candidat, à une offre de poste, à une compétence, ou encore à une localisation. Et il y a une arête en cas de lien entre deux entités. Par exemple, un candidat sachant coder en Python et habitant à Paris sera relié à ces deux nœuds. Il en est de même pour une offre de poste nécessitant ce langage de programmation et situé à Paris. » Cette représentation permet ainsi de positionner un candidat globalement sur le marché du recrutement de la tech. Et ce, grâce à la base de données mise à disposition par Easy Partner.

Ce travail préliminaire se heurtait toutefois à quelques difficultés. En effet, des informations telles que les compétences viennent de celles déclarées par les candidats ou renseignées par les recruteurs. Or, deux termes différents peuvent, en réalité, être rattachés à une même expertise. Un ingénieur cloud peut ainsi mentionner « Microsoft Azure » dans son CV et un autre « AWS » : il s’agit néanmoins de deux profils similaires. De plus, pour un recruteur, il n’est pas toujours aisé de suivre l’évolution des compétences, voire des noms de métier. « Par exemple, j’étais auparavant considéré comme un « data engineer« , mais ce terme a été remplacé par « AI engineer« », cite Éric Behar. « Le métier n’a pas changé, c’est uniquement la popularité de l’IA qui a induit cette évolution sémantique. »

Par conséquent, afin de disposer d’un graphe représentant exhaustivement le marché du recrutement de la tech, il était nécessaire de lire entre les lignes, voire derrière les lignes. C’est pourquoi le chercheur s’est également appuyé sur deux bases de données publiques : la classification ESCO (European Skills, Competences and Occupations) et Wikidata. La première recense et catégorise les aptitudes, compétences, certifications et professions pertinentes pour le marché du travail dans l’Union européenne. La seconde, grâce à son immense base de connaissance en libre accès, vient compléter les informations, en particulier sur les technologies propriétaires.

Un modèle de deep learning qui apprend à partir du graphe et de cas réels

Ensuite, à partir de cette représentation fidèle du marché du recrutement de la tech, comment établir une correspondance entre des offres de poste et des candidats ? Pour cela, Éric Behar a eu recours à un « graph neural network », un modèle de deep learning, reposant sur un réseau de neurones artificiels, conçu pour fonctionner sur des graphes. Son but : reproduire le travail de « matching » réalisé par un recruteur, entre une offre et des candidats. « Notre modèle apprend à établir des liens à partir des proximités qu’il observe entre différents nœuds », explique le chercheur. « Par exemple, il peut voir, grâce à notre travail d’enrichissement du graphe, que les termes « Azure » et « AWS » sont proches de la compétence « service cloud ». De cette façon, il comprend que deux profils a priori différents peuvent correspondre à une offre de poste nécessitant des compétences en cloud. »

L’apprentissage du modèle d’IA s’appuie également sur des recommandations passées, réellement effectuées par des recruteurs d’Easy Partner. Il s’agit de candidatures qui ont été présélectionnées pour une offre de poste, mais qui n’ont pas nécessairement abouti à un recrutement. En effet, le système développé vise à faciliter uniquement la première étape de filtrage, pas à intervenir au moment de la décision finale du client. De plus, afin d’affiner sa compréhension du travail de matching, le réseau de neurones a aussi été alimenté par des candidatures qui n’ont pas été retenues par les recruteurs pour une offre donnée.

Comment prendre en compte le temps dans le système de recommandation ?

De cette façon, le modèle a appris à établir des recommandations dans les deux sens : des candidats pertinents pour une offre de poste et des offres correspondant à un candidat. Une approche qui possédait cependant des limites, notamment en raison de l’absence de prise en compte de temporalité. « Un candidat n’est pas indéfiniment en recherche ; de même, une offre d’emploi finit par être retirée du marché », note Éric Behar. « Dès lors, comment injecter une notion de temporalité dans notre représentation, tout en gardant sa richesse sémantique ? »

La réponse à cette question impliquait de tenir compte des spécificités du graphe : ici, le temps ne devait s’appliquer qu’à certains types de nœuds. D’autres, en revanche, n’étaient pas concernés par cet impératif : par exemple, la localisation « Paris » n’est pas associée à une durée limitée. Il n’était donc pas possible d’appliquer un modèle ordinaire de graphe temporel. « Nous avons alors opté pour une autre approche, en créant un nouveau type de nœud, représentant une recommandation, dans lequel est stockée l’information relative au temps », révèle Éric Behar. « Ainsi, les candidats et les offres de poste ne sont plus reliés directement par une arête : le matching prend à présent la forme d’un triplet associant un candidat, une offre et une recommandation, à laquelle est associé un temps. »

Vers une meilleure explicabilité et une utilisation dans la santé ?

Le système de recommandation ainsi développé a été récompensé du Best Paper Award lors de la conférence internationale de référence Web Intelligence and Intelligent Agent Technology (WI-IAT) 2024. De plus, les apprentissages issus des travaux de recherche ont permis l’implémentation d’un outil d’aide à l’identification de candidats potentiels, qui est désormais utilisé par les recruteurs de l’entreprise. « Il s’agit d’une vraie fierté de voir mon travail servir concrètement à ceux qui ont toujours été au cœur de ce projet de recherche », se réjouit Éric Behar.

Par ailleurs, le chercheur envisage d’autres applications à ses travaux, comme dans le secteur médical. Il s’agirait alors de lier, au sein d’une représentation par graphe hétérogène, des patients, des pathologies et des traitements, un contexte dans lequel la temporalité joue un rôle primordial. Cependant, il reste déjà de nombreuses pistes à explorer autour du recrutement, telles que celle de l’explicabilité. Le système pourrait ainsi justifier les recommandations proposées, afin de renforcer la confiance des utilisateurs et de favoriser son adoption.

« Néanmoins, il convient de rappeler que le recours à un tel outil soulève des questions éthiques », avertit Éric Behar. « En tant que chercheur, mon rôle est de proposer des méthodes permettant de concevoir des systèmes fiables et de les implémenter de manière transparente. Pour autant, faut-il le faire ? La réponse à cette question n’est pas simple, tant elle implique des problématiques sociétales essentielles. »