Rashedur Rahman a rejoint l’IRT SystemX en 2015 pour réaliser une thèse dédiée au peuplement d’une base de connaissance fondé sur l’exploitation d’un graphe d’entités. Il revient sur son doctorat effectué au sein de l’IRT SystemX et supervisé par le LIMSI (Laboratoire d’Informatique pour la Mécanique et les Sciences de l’Ingénieur, CNRS).
Quel était le sujet de votre thèse ?
Dans le cadre de ma thèse, j’ai étudié peuplement de base de connaissances (KBP), tâche importante porteuse de nombreux défis pour le traitement automatique des langues. L’objectif de cette tâche est d’extraire des connaissances de textes et de les structurer afin de compléter une base de connaissances.
Je me suis plus précisément intéressé à la reconnaissance de relations entre entités. L’extraction de relations (RE) entre une paire de mentions d’entités est une tâche difficile, en particulier pour les relations en domaine ouvert. Généralement, ces relations sont extraites en fonction des informations lexicales et syntaxiques au niveau de la phrase. Cependant, l’exploitation d’informations globales sur les entités n’a pas encore été explorée.
Les travaux menés dans le cadre de ma thèse proposent d’extraire un graphe d’entités d’un corpus global et de calculer des caractéristiques sur ce graphe afin de capturer des indices des relations entre paires d’entités. Pour évaluer la pertinence des fonctionnalités proposées, je les ai testées sur une tâche de validation de relation dont le but est de décider l’exactitude de relations extraites par différents systèmes. Les résultats expérimentaux montrent que les caractéristiques proposées conduisent à améliorer les résultats de l’état de l’art.
Que retenez-vous de votre doctorat ?
Tout au long de mon doctorat, j’ai appris à structurer une problématique de recherche et à recueillir les ressources nécessaires pour y répondre. J’ai eu l’opportunité de rencontrer de nombreux académiques et industriels chez SystemX, chacun expert de son domaine, qui m’ont beaucoup apporté. J’ai aussi eu la chance de travailler au sein d’une équipe très bienveillante et coopérative, celle du projet IMM (Intégration Multimédia Multilingue).
Pouvez-vous nous parler de votre meilleur souvenir à SystemX ?
J’ai beaucoup apprécié l’événement ThesisDay@SystemX qui m’a donné l’occasion de présenter mes travaux de recherche et de découvrir ceux des autres doctorants de l’IRT SystemX.
Quels sont vos projets pour la suite ?
Je suis depuis peu post-doctorant au sein au LIMSI (CNRS). Je travaille notamment sur l’analyse de données biomédicales pour le projet GoAsq. Il s’agit d’une mission très intéressante parce qu’elle crée un pont entre les sciences de l’information et les sciences médicales.
En savoir plus sur Rashedur Rahman
Sujet de thèse : Peuplement d’une base de connaissance fondé sur l’exploitation d’un graphe d’entités
Diplôme : Master en ingénierie de la technologie de l’information (Université de Frankfort de sciences appliquées, Allemagne)