L’apprentissage par transfert de connaissance pour l’optimisation des procédés

Thèse de Loïc Iapteff : « Transfer Learning for Smart Predictive Analytics »

IFPEN est un leader mondial dans le développement de catalyseurs et de procédés pour la production de carburants propres. Pour que ces procédés soient eux-mêmes éco-efficients¹, il est nécessaire d’optimiser le couplage des catalyseurs avec les conditions opératoires, en fonction des charges utilisées et des spécifications recherchées pour les produits raffinés. Il est dès lors utile de pouvoir s’appuyer sur des modèles prédictifs quant aux performances atteintes et le recours à l’apprentissage (Machine learning) est une option intéressante dans ce cas.

Pour chaque procédé et chaque nouveau catalyseur, le modèle doit être entraîné avec des données expérimentales acquises sur des installations pilotes. L’exploitation de ces installations est longue et coûteuse, d’où un intérêt à réduire drastiquement le volume de données expérimentales nécessaires pour la mise au point des nouvelles générations de catalyseurs, tout en conservant la qualité des modèles prédictifs. C’est là qu’intervient l’apprentissage par transfert (transfer learning), approche consistant à pré-entraîner un modèle sur un domaine similaire, puis à l'adapter à une problématique spécifique, de manière à tirer parti de connaissances déjà acquises.

Des techniques de type bayésien² ont été mises en œuvre dans le cadre de cette thèse pour transférer différents types de modèles [1, 2], avec comme avantage principal, la réduction du nombre d’observations nécessaires pour obtenir une nouvelle modélisation efficace. Ceci est illustré à la Figure 1 relative à la teneur en azote pour le procédé de prétraitement en hydrocraquage : on observe l’efficacité du transfert bayésien par rapport au simple ajout de données et ce d’autant plus que le nombre de données rajoutées est faible.

Cette méthodologie d’apprentissage par transfert a permis de diminuer de manière importante (30 %) le nombre de points expérimentaux nécessaire pour optimiser des modèles relatifs au procédé d’hydrotraitement sur de nouvelles générations de catalyseurs. Ces travaux ont d’ores et déjà été étendus à d’autres cas d’application et pas moins de cinq projets de recherche en ont bénéficié pour accélérer la mise à disposition de nouveaux modèles et la réduction de leurs coûts d’accès.

Pour l’élaboration ou l’amélioration de modèles prédictifs dans le secteur industriel, il est nécessaire de disposer d’un grand nombre de données. La tendance actuelle est d’en produire de nouvelles. Notre travail pourra permettre de contrecarrer cette tendance grâce à une méthode innovante et efficiente. Celle-ci conduira à modéliser un phénomène à partir d’une quantité réduite de données expérimentales et en exploitant au maximum des connaissances antérieures.

Figure 1 : Evolution de la qualité de la prédiction de la teneur en azote (score = erreur moyenne absolue) en fonction du nombre de points utilisés (sample size) avec un transfert bayesien (bleu) et sans transfert (orange).

^1- L’éco-efficience exprime le lien entre le bénéfice économique et l'impact environnemental causé.
^2- Approches statistiques fondées sur l'inférence bayésienne, où la probabilité exprime un degré de croyance en un événement.

Références bibliographiques

L. Iapteff, J. Jacques, M. Rolland, B. Celse, Reducing the Number of Experiments Required for Modelling the Hydrocracking Process with Kriging Through Bayesian Transfer Learning, Journal of the Royal Statistical Society Series C Applied Statistics, 70(5), July 2021
>> DOI: 10.1111/rssc.12516
L. Iapteff, J. Jacques, V. Costa, B. Celse, Reducing the Number of Experimental Points to Fit Kinetic Models: A Bayesian Approach, July 2023
>> DOI: 10.1021/acs.iecr.2c03862

Contact scientifique : victor.costa@ifpen.fr

>> NUMÉRO 53 DE SCIENCE@IFPEN