Contexte du stage
Au sein de l’Institut de Recherche Technologique SystemX, situé au cœur du campus scientifique d’excellence mondiale de Paris-Saclay, vous prendrez une part active au développement d’un centre de recherche technologique de niveau international dans le domaine de l’ingénierie numérique des systèmes. Adossé aux meilleurs organismes de recherche français du domaine et constitué par des équipes mixtes d’industriels et d’académiques, ce centre a pour mission de générer de nouvelles connaissances et solutions technologiques en s’appuyant sur les percées de l’ingénierie numérique et de diffuser ses compétences dans tous les secteurs économiques.
Vous serez encadré par des ingénieur-chercheur SystemX du domaine Cryptographie.
Vous travaillerez au sein du projet exploratoire PPML Privacy Preserving Machine Learning dont les partenaires académiques sont Télécom SudParis et Commissariat à l’énergie atomique et aux énergies alternatives (CEA).
Présentation du sujet
Objectifs du stage
La préservation de la confidentialité des données et des modèles d’apprentissage automatique est devenue un enjeu majeur à l’ère du big data et de l’intelligence artificielle. Avec l’augmentation exponentielle des données sensibles collectées et utilisées pour entraîner des modèles, le risque d’exposer des informations privées ou confidentielles s’accroît considérablement. De plus avec l’entrée en vigueur du Règlement Général sur la Protection des Données (RGPD) en Europe et l’IA Act [1], les exigences en matière de confidentialité et de protection des données ont pris une importance cruciale. Ces régulations obligent les organisations à mettre en place des mesures robustes pour protéger la confidentialité des données personnelles et sensibles, notamment dans le cadre de l’utilisation des technologies d’intelligence artificielle.
Une approche innovante consiste en l’utilisation du chiffrement homomorphe. Ce chiffrement permet de traiter des données chiffrées et d’entraîner des modèles sans avoir à les déchiffrer [2], [3], assurant ainsi que les données restent protégées tout au long du processus. Cependant, leur utilisation dans des scénarios pratiques reste largement sous-explorée en raison de la complexité des crypto systèmes et des ressources matérielles importantes requises pour la scalabilité et les déploiements à grande échelle.
Le stage a pour objectif d’identifier les limitations de l’application de la cryptographie homomorphe aux processus d’apprentissage automatique (réseau de neurones / arbre de décision) et proposer des améliorations techniques et/ou théoriques pour surmonter les limitations et absorber la complexité de leurs déploiements.
Missions
- Comprendre les principes fondamentaux de la cryptographie homomorphe et ses applications dans le domaine de la protection des données.
- Réaliser une analyse approfondie de l’état de l’art sur l’utilisation de la cryptographie homomorphe dans la sécurisation des processus d’apprentissage automatique, en mettant en lumière les limitations actuelles de son application aux arbres de décision et aux réseaux de neurones.
- Évaluer les techniques existantes de la cryptographie homomorphe et les adapter aux besoins spécifiques de l’apprentissage automatique. Cela implique par example de convertir des algorithmes de base de l’IA, tels que le SGD (Stochastic Gradient Descent), pour les rendre compatibles avec le chiffrement homomorphe.
- Proposer des axes d’amélioration et développer un PoC (Proof of Concept) démontrant les bénéfices des améliorations apportées.
- Rédiger un article scientifique décrivant les résultats de la recherche menée pendant le stage, en vue de le soumettre à une conférence ou à une revue.
Références bibliographiques sur le sujet
[1] “European approach to artificial intelligence | Shaping Europe’s digital future.” Accessed: Sep. 05, 2024. [Online]. Available: https://digital-strategy.ec.europa.eu/en/policies/european-approach-artificial-intelligence
[2] R. Bost, R. A. Popa, S. Tu, and S. Goldwasser, “Machine Learning Classification over Encrypted Data.,” in NDSS, The Internet Society, 2015.
[3] E. Hesamifard, H. Takabi, and M. Ghasemi, “CryptoDL: Deep Neural Networks over Encrypted Data,” Nov. 2017, [Online]. Available: http://arxiv.org/abs/1711.05189
Profil et compétences
De formation : BAC +5 / école d’ingénieur ou université licence ou master, dans le domaine de la cryptographie.
Compétences souhaitées :
- Connaissance des bases de la confidentialité des données et de l’apprentissage automatique.
- Compétences en programmation Python et C++.
- Capacités d’expression à l’oral et à l’écrit en anglais.
- Bonne connaissance d’Overleaf et Latex.
Aptitudes personnelles :
- Bonne capacité de communication,
- Capacité de travailler en équipe,
- Bon relationnel,
- Autonomie,
- Curiosité,
- Capacité de relever des défis et explorer des verrous scientifiques / techniques,
- Capacité d’analyse et de synthétisation de l’information
Merci d’indiquer la référence du stage dans l’objet de votre mail de candidature, d’y joindre CV, lettre de motivation, lettre(s) de recommandation et relevés de notes.
Informations clés
Durée du stage : 6 mois
Date de démarrage envisagée : janvier-février 2025
Localisation du poste : Palaiseau (91)
Référence de l’offre à mentionner dans l’objet dans votre e-mail de candidature : STAGE-2025-04-EXPLO
Postuler à cette offre d’emploi
Merci de joindre CV, lettre de motivation et relevé(s) de notes.
Domaine :