Antoine Cornuéjols (AgroParisTech) s’est rendu à l’IRT SystemX le 15 octobre sur le site du Moulon, pour animer un séminaire sur le thème «On-line Learning, Learning Using Privileged Information (LUPI) and Transfer Learning ».
Résumé :
Une quantité croissante de données est issues de flux de données. C’est le cas par exemple de données provenant de systèmes de monitoring de patients dans les hôpitaux, ou bien des données sur l’état de la planète produites en continu par toute une panoplie de capteurs. Deux perspectives existent sur les flux de données : celle de l’apprentissage en-ligne et celle de la classification de séries temporelles. Dans la première, le problème est d’adapter une règle de prédiction face à des variations possibles de l’environnement. Dans la seconde, le défi consiste à savoir représenter et apprendre les structures séquentielles pertinentes.
Cet exposé va essayer de tisser des liens entre les deux perspectives. On présentera d’abord une tâche de classification précoce de séries temporelles dans laquelle chaque mesure supplémentaire a un coût. Nous introduirons ensuite un algorithme pour la classification précoce de séries temporelles et nous montrerons ses liens avec le cadre LUPI (Learning Using Privileged Information) introduit par Vapnik et Vashit en 2009.
Nous montrerons alors que la classification précoce de séries temporelles peut être considérée comme un problème d’apprentissage par transfert et que par conséquent l’algorithme présenté est un algorithme d’apprentissage par transfert.
Nous conclurons en suggérant que l’approche d’apprentissage par transfert décrite peut aider à déterminer quelle information sur le passé est utile dans l’apprentissage en-ligne, une question centrale pour la conception de ces systèmes.
Biographie :
Antoine Cornuéjols est professeur à AgroParisTech. Il est co-auteur avec Laurent Miclet et Vincent Barra de l’ouvrage « Apprentissage Artificiel. Deep learning, concepts et algorithmes ». Il s’intéresse particulièrement à l’apprentissage par transfert et aux méthodes d’apprentissage collaboratives supervisées et non supervisée. Il est responsable de l’équipe LINK (Learning and Integration of Knowledge) qui approche les problèmes de science des données en mariant les méthodes d’apprentissage automatique et les approches d’ingénierie des connaissances permettant d’enrichir et de fusionner des données et des informations provenant de sources multiples.