Chaire DSAIDIS : Science des données et IA pour l’industrie
10 novembre 2023 • Big Data & IA - Cybersécurité - Industrie du futur - Médias du futur
Le secteur industriel a tout intérêt à exploiter le potentiel des grandes quantités de données qu’il génère quotidiennement. Mais comment utiliser et analyser efficacement ces données, parfois incomplètes, hétérogènes, contenant du bruit ou des valeurs extrêmes ? La Chaire DSAIDIS, soutenue par l’Institut Carnot TSN et animée par deux enseignants-chercheurs de Télécom Paris, cherche à répondre à ces défis par une coopération étroite avec les acteurs de l’industrie et des services.
L’essor du big data et de l’intelligence artificielle (IA) a ouvert de nouvelles perspectives aux entreprises. Elles peuvent analyser rapidement de grands volumes de données, aider à la prise de décision en temps réel et faire des prévisions fiables. Ces avancées récentes offrent des opportunités sans précédent pour de nombreux secteurs professionnels.
Cependant, parmi ceux-ci, l’industrie et les services possèdent certaines spécificités auxquelles les systèmes doivent s’adapter. Dans ces secteurs, l’analyse des données collectées (en quantités considérables) présente de nombreux défis :
– les données contaminées, le bruit, les valeurs extrêmes ou manquantes
– des conditions qui changent au fil du temps
– des données non ou partiellement étiquetées, c’est-à-dire avec peu d’informations associées
– l’hétérogénéité due, entre autres, à la diversité des sources utilisées
– une quantité de données parfois insuffisante, qui oblige le système à générer de nouvelles données ou à fonctionner avec une faible quantité.
De plus, ces obstacles surviennent dans un contexte où, pour l’industrie en particulier, les systèmes doivent prouver qu’ils sont « dignes de confiance » pour être pleinement adoptés. Les systèmes doivent donc répondre à des normes élevées démontrant leur fiabilité, leur robustesse et leur capacité à être expliqués.
Des outils d’IA capables de répondre aux réalités du terrain
Pour répondre à ces défis, la chaire DSAIDIS (Data Science & Artificial Intelligence for Digitalized Industry & Services) a été créée avec le soutien de l’Institut Carnot TSN. Elle regroupe une vingtaine d’enseignants-chercheurs de Télécom Paris, qui collaborent avec les cinq partenaires industriels : Airbus Defence and Space, Engie, IDEMIA, Safran et Valeo. « Nos liens avec les entreprises sont forts et chacun se nourrit de l’autre », témoigne Pavlo Mozharovskyi, enseignant-chercheur à Télécom Paris et co-animateur de la chaire. « De notre côté, nous nous inspirons de leurs problématiques réelles pour nos travaux. Et quand nous y répondons, nous leur proposons des systèmes capables de leur apporter une valeur ajoutée concrète. »
L’ambition de la chaire DSAIDIS est ainsi d’élaborer des outils méthodologiques applicables dans des conditions réalistes. Une approche qui nécessite, pour chaque projet, une phase théorique de modélisation, suivie du développement d’algorithmes, qui exploitent concrètement les résultats précédemment obtenus. À cet effet, les chercheurs s’appuient sur des méthodes de machine learning, ou apprentissage automatique, une branche de l’intelligence artificielle.
« L’adaptation de nos systèmes à des conditions d’usage réalistes constitue le cœur de notre approche », souligne Florence d’Alché, enseignante-chercheuse à Télécom Paris et titulaire de la chaire. « Nous n’appliquons pas nos modèles à des cas idéaux, éloignés de la réalité. Ils sont au contraire conçus pour s’adapter à des environnements bruités, à des données contaminées, à des valeurs extrêmes, etc. Et ce, tout en satisfaisant des critères élevés de fiabilité et en offrant un maximum de garanties théoriques. »
De plus, les outils développés s’inscrivent dans une problématique générale actuelle : la sobriété. « Nous faisons en sorte que nos modèles et nos algorithmes nécessitent le moins possible de mémoire, de puissance de calcul, mais aussi de données », affirme la chercheuse. Une préoccupation encore récente au sein de la communauté de l’IA.
4 axes pour une plus grande confiance en l’IA
Dans le détail, la recherche s’articule autour de quatre axes, définis en collaboration avec les cinq partenaires industriels.
1) Analyse et prévision de séries temporelles
Si ce premier axe peut paraître classique, les chercheurs entendent l’aborder sous un nouveau prisme, notamment en croisant des méthodes classiques de statistiques et des outils de machine learning. « L’originalité de notre étude consiste aussi à s’intéresser non pas à une série de mesures à un instant T, mais à considérer une portion de signal sur un intervalle de temps », explique Florence d’Alché. « Une approche qui offre des outils supplémentaires pour identifier des propriétés pertinentes dans le cadre d’une prise de décision. »
2) Exploitation à grande échelle de données partiellement étiquetées et hétérogènes
Cet axe, qui couvre un large périmètre, vise à répondre aux problématiques associées au big data dans l’industrie et les services. En particulier, comment exploiter efficacement un grand volume de données, en dépit d’un étiquetage incomplet et d’une grande diversité au niveau des sources ?
3) Machine learning au service d’une prise de décision fiable et robuste
Ici, l’objectif est de renforcer la confiance des utilisateurs dans les outils d’IA. Comment les algorithmes de machine learning peuvent-ils tenir compte des imperfections des données (bruit, contamination, valeurs extrêmes…), tout en faisant preuve de fiabilité ? Comment peuvent-ils aider à corriger des biais et à garantir davantage d’équité ? Des enjeux qui vont au-delà des problématiques techniques et qui impliquent des chercheurs en sciences économiques et sociales.
Il est également question d’explicabilité. « Les modèles actuels d’apprentissage automatique sont complexes et fonctionnent à la manière d’une « boîte noire » », note Pavlo Mozharovskyi. « Nous cherchons donc à donner des explications aux décisions prises par la machine, de sorte que la « boîte noire » devienne, peut-être pas blanche, mais grise. » Un souhait vivement exprimé par les partenaires industriels de la chaire, et par la société en général.
4) Apprentissage en interaction avec l’environnement
En pratique, les systèmes d’intelligence artificielle sont amenés à s’intégrer au sein d’environnements changeants. Ils doivent donc être capables de prendre en compte ces évolutions et d’adapter leur fonctionnement en conséquence. L’équipe de recherche œuvre ainsi à doter les outils d’une faculté d’apprentissage autonome et continue.
Une collaboration fructueuse entre les mondes industriel et académique
Plusieurs projets ont déjà été menés, en collaboration avec les partenaires industriels de la chaire. Par exemple, Valeo a fait appel aux chercheurs pour améliorer une de ses lignes de production. En effet, comme tout fabricant, l’entreprise cherche continuellement à réduire son taux de pièces défectueuses, afin d’optimiser son rendement. « Nous avons commencé par une large phase de compréhension des données et des processus en jeu, avant de procéder à leur analyse », détaille le co-animateur de la chaire DSAIDIS. « Ensuite, grâce à un travail important de visualisation des données, nous avons pu identifier les paramètres déterminants pour éviter les défauts lors de la fabrication. Puis, nous avons utilisé des outils statistiques afin d’établir des recommandations. » Celles-ci ont alors été appliquées sur la ligne de production, avec des résultats immédiats : le taux de pièces défectueuses a été quasiment divisé par deux !
Ce succès a conduit au lancement d’une thèse CIFRE, encore en cours, auprès du même partenaire, sur une autre ligne de production. Ici, le but est d’expliquer les anomalies survenant pendant la fabrication et d’en identifier les sources les plus probables. « Notre analyse statistique permet de déterminer quels postes, sur la ligne de production, sont les plus susceptibles d’entraîner des défauts sur les pièces », résume Pavlo Mozharovskyi. « Ce qui permet à l’industriel de savoir où concentrer ses efforts pour améliorer son processus. » Un outil que les équipes de Valeo ont déjà commencé à utiliser, sur le terrain.
Par ailleurs, les chercheurs ont travaillé avec IDEMIA, qui développe des solutions de biométrie, notamment des systèmes de reconnaissance faciale. Une technologie qui a souvent été critiquée pour son manque d’équité. « Notre objectif est précisément de corriger les biais de sélection », indique la titulaire de la chaire. « Concrètement, notre système vise soit à repondérer les données d’apprentissage, afin d’estomper les effets d’une sous-représentation de certaines populations, soit à ignorer certains attributs (genre, couleur de peau…). »
À travers ces exemples, la chaire DSAIDIS illustre parfaitement la synergie possible entre les mondes industriel et académique. Et malgré une clôture officielle prévue fin 2023, l’aventure ne devrait pas s’achever cette année. « Nous travaillons actuellement au renouvellement de la chaire », annonce Florence d’Alché. « Nous rencontrons chacun des partenaires, afin de déterminer les sujets déjà étudiés qui méritent d’être prolongés, d’identifier de nouvelles problématiques et de leur proposer d’autres axes d’études. » Une réflexion également alimentée par la rencontre de nouveaux partenaires industriels, qui pourraient rejoindre la chaire dès 2024.