Projet INRIA MALICE : l’IA pour percer les mystères de l’interaction laser-matière
3 septembre 2024 • Industrie du futur
Réunissant des chercheurs et enseignants-chercheurs du laboratoire Hubert Curien, l’équipe-projet Inria MALICE vise à favoriser la collaboration entre physiciens et experts de l’intelligence artificielle. Leur objectif : développer de nouvelles méthodes de machine learning pour mieux comprendre l’interaction laser-matière, un enjeu majeur en ingénierie des surfaces. Et ce, malgré les écueils que représentent la connaissance physique partielle des phénomènes et le manque de données.
L’intelligence artificielle fait régulièrement parler, en raison des multiples possibilités offertes, notamment par l’apprentissage automatique, ou machine learning. Ses champs d’application semblent infinis, de la santé à l’automobile, en passant par la sécurité et l’industrie. Et depuis quelques années, un nouveau domaine de recherche en la matière a vu le jour : le « physics-informed » machine learning, c’est-à-dire un apprentissage automatique ne s’appuyant plus seulement sur les données, mais également sur des connaissances physiques, modélisées par des équations. Les programmes ainsi développés peuvent, par exemple, prédire le comportement d’un liquide, en respectant les lois de mécanique des fluides.
Machine learning et ingénierie des surfaces
« Les travaux actuels de ce type s’intéressent généralement à des phénomènes physiques bien modélisés, avec pour principal objectif d’accélérer la résolution des équations », remarque Marc Sebban, professeur en informatique à l’Université Jean Monnet Saint-Étienne et responsable de l’équipe-projet MALICE. « C’est le cas, entre autres, de la mécanique des fluides ou des transferts thermiques. Or, l’apprentissage automatique pourrait aussi s’avérer d’une grande utilité pour en apprendre davantage sur des mécanismes que l’on ne sait modéliser que partiellement. »
C’est l’objectif de l’équipe-projet Inria MALICE (MAchine Learning with Integration of surfaCe Engineering knowledge), hébergée au laboratoire Hubert Curien, UMR CNRS, auquel est adossé Télécom Saint-Étienne, école membre de l’institut Carnot Télécom & Société numérique. Créée officiellement en décembre 2023, elle vise à étudier les apports mutuels entre l’intelligence artificielle et l’ingénierie des surfaces. Elle réunit ainsi des experts en informatique et en mathématiques appliquées : six enseignants-chercheurs de l’Université Jean Monnet Saint-Étienne et deux chercheurs à temps plein de l’Inria, accompagnés d’une dizaine de doctorants et post-doctorants.
Et pour apporter la connaissance en physique, l’équipe peut s’appuyer sur une particularité du laboratoire Hubert Curien. « Depuis sa naissance, en 2006, notre structure rassemble au même endroit des spécialistes du numérique et des physiciens », souligne Marc Sebban. « Cette spécificité rare nous donne un avantage considérable pour mener à bien nos travaux de recherche. Nous avons plus de cinquante physiciens qui travaillent dans les bureaux voisins aux nôtres ! »
Le casse-tête de l’interaction laser-matière
Cette collaboration entre les univers du machine learning et de l’ingénierie des surfaces se concentre sur un phénomène physique en particulier : l’interaction laser-matière. « Lorsque vous envoyez un faisceau laser ultrabref sur la surface d’un matériau, de multiples modifications à l’échelle nanométrique interviennent », explique Marc Sebban. « Parmi les phénomènes que le laboratoire étudie, il y a celui de l’auto-organisation : en répétant les impulsions laser, la matière s’organise elle-même pour faire apparaître des motifs à partir des nombreuses interactions locales. »
Si ce phénomène peut être facilement observé à l’aide d’un microscope, ses mécanismes demeurent encore mal compris. Et pour cause : ils impliquent une combinaison de phénomènes physiques relevant de la thermodynamique, de la mécanique des fluides, ou encore de la propagation d’ondes. Un comportement si complexe qu’il ne fait aujourd’hui l’objet que d’une modélisation incomplète, à travers une équation n’expliquant que partiellement le problème. D’autant que la variété des motifs générés est quasiment infinie : ceux-ci dépendent du matériau, mais aussi des paramètres du laser – son énergie, le nombre d’impulsions, le délai entre chacune… Et le moindre changement sur une seule propriété suffit à aboutir à un résultat totalement différent.
L’écueil de la quantité de données disponibles
C’est de ce phénomène d’auto-organisation en interaction laser-matière que l’équipe-projet MALICE souhaite améliorer la compréhension, à l’aide du machine learning. Mais au-delà de la connaissance partielle, cette problématique s’accompagne d’un écueil majeur pour l’apprentissage automatique : le manque de données. En effet, celles-ci représentent le carburant indispensable d’un modèle de machine learning pendant sa phase d’entraînement – étape lors de laquelle il « apprend » à réaliser la tâche demandée, avant de pouvoir produire lui-même des résultats. Or, sur un tel mécanisme physique, la production de données en grande quantité impliquerait de répéter de multiples expérimentations à de nombreuses reprises, ce qui serait long, coûteux et complexe techniquement.
« C’est pourquoi nous entendons développer des modèles hybrides de machine learning, capables de s’appuyer à la fois sur un niveau de connaissance physique partiel et sur un faible volume de données », annonce Marc Sebban. « Pour cela, nous allons recourir à de nouvelles architectures de réseaux de neurones artificiels dont il faudra analyser le comportement non seulement d’un point de vue algorithmique mais aussi théorique. » L’idée est ainsi de compenser le manque de données par l’apport des équations de modélisation – même imparfaites – et, inversement, de compenser la connaissance partielle du phénomène physique par la présence de données – même en faible quantité.
Afin de produire davantage de données, l’équipe-projet MALICE a néanmoins déjà commencé à travailler avec les physiciens du laboratoire pour mettre en place de nouveaux protocoles expérimentaux. Ils vont également recourir à la « data augmentation », une technique consistant à générer de nouvelles données à partir de celles déjà disponibles, par exemple en y ajoutant du bruit. « Néanmoins, nous ne disposerons jamais d’une quantité de données qui suffirait à entraîner nos algorithmes avec une approche complètement ‘’data-driven’’», tempère Marc Sebban. « D’où l’intérêt de développer des modèles hybrides de machine learning, qui s’appuient également sur les équations physiques pour assurer la consistance des prédictions. »
Un modèle de collaboration gagnant-gagnant
La problématique à laquelle s’attaque l’équipe-projet MALICE ne manque donc pas de défis à relever. Mais pour son responsable, c’est cette complexité qui inscrit la collaboration dans une démarche d’enrichissement mutuel. « Nous ne sommes pas au service des physiciens : eux aussi nous apportent de la valeur », précise Marc Sebban. « En l’occurrence, les écueils soulevés par l’interaction laser-matière nous conduisent à développer de nouvelles contributions méthodologiques en intelligence artificielle, via nos modèles hybrides de machine learning. Et, à l’inverse, nous aidons bien sûr les physiciens à mieux comprendre le phénomène physique en jeu. »
En effet, le travail de l’équipe de recherche permettra d’approfondir la connaissance actuelle, en complétant les équations existantes, voire en en découvrant de nouvelles. Les chercheurs se pencheront également sur l’apprentissage par transfert, qui consiste à répondre à la question suivante : la connaissance déjà acquise sur un matériau est-elle transférable sur un autre, sans devoir tout reprendre à zéro ? Une problématique courante en machine learning, sur laquelle l’équipe a déjà développé une expertise.
Des applications possibles dans de nombreux domaines
De plus, MALICE entend aussi aborder le problème de l’interaction laser-matière sous un autre angle. « Au lieu de prédire la façon dont la matière va s’auto-organiser au contact du laser, pourquoi ne pas envisager de résoudre le problème inverse ? », avance Marc Sebban. « Partant d’un motif que le physicien souhaiterait obtenir, nos modèles détermineraient alors les paramètres laser permettant de le générer. »
Une telle capacité pourrait s’avérer précieuse en ingénierie des surfaces. En effet, les motifs façonnés par l’auto-organisation de la matière peuvent conférer de nouvelles propriétés au matériau : aérodynamisme, hydrophobie, imperméabilité, etc. Il est ainsi possible d’envisager des applications dans l’industrie automobile, avec des « nano-trous » favorisant la lubrification de pièces mécaniques, ou en santé, en renforçant la protection du matériau contre les virus et les bactéries, à l’aide de « nano-pics ». De même, la connaissance de l’interaction laser-matière peut être utilisée pour sécuriser et contrôler l’authenticité des documents d’identité, en y encodant de l’information. Une problématique sur laquelle travaille déjà le laboratoire Hubert Curien, dans le cadre d’un laboratoire commun avec l’entreprise HID Global, auquel l’équipe-projet MALICE contribue à travers deux thèses.