• Bannière #6 de l'Institut des sciences cognitives

Soutenance de thèse de Ngoc Tan Le – 7 novembre

Soutenance de thèse de

Ngoc Tan Le
étudiant au doctorat en informatique cognitive

Traduction automatique pour une paire de langues peu dotée

Jeudi 7 novembre 2019
13 h 30
Salle PK-2265

Résumé :
Durant ces dernières décennies, le Traitement Automatique des Langues Naturelles (TALN) a sans nul doute fait des progrès considérables sur le plan de la diversité des outils linguistiques mis à la disposition de la communauté et celui de la qualité des résultats obtenus.  Néanmoins, ces progrès sont, jusqu’à une date récente, restés limités à un nombre relativement restreint de langues, majoritairement occidentales.

Les langues peu dotées, ou langues-π, langues moins bien informatisées que les grandes langues véhiculaires (l’anglais, l’espagnol, le français, etc.), souffrent du manque de ressources linguistiques dont les corpus parallèles, ressources importantes pour le développement de systèmes de TALN, notamment les systèmes de traduction automatique, et ainsi présentent plusieurs défis dans le domaine du TALN.

Ce projet de recherche se concentre sur la paire de langues peu dotée français-vietnamien afin de développer un système de traduction automatique performant tout en se focalisant sur la reconnaissance des entités nommées et leurs translittérations.  En premier, une analyse théorique, du point de vue cognitif, est abordée sous l’angle des théories de la linguistique et de la traduction.  Par la suite, du point de vue informatique, l’objectif principal de notre projet de recherche consiste à proposer une méthode originale et fiable ainsi que des solutions aux problèmes rencontrés lors de la traduction automatique des entités nommées.  Aussi, nous déterminons les sous-objectifs de ce projet de recherche, dont la reconnaissance des entités nommées pour la langue vietnamienne et également la tâche de la translittération des entités nommées bilingues pour la paire de langues français-vietnamien.  En plus des approches statistiques, nous adaptons l’approche d’apprentissage profond (en anglais, deep learning) au sein de nos différents systèmes afin d’améliorer davantage la qualité et l’efficacité de la traduction automatique des entités nommées.  Les contributions à la traduction automatique et à la translittération automatique des entités nommées bilingues ont permis non seulement de réduire le taux des mots hors vocabulaires, mots non traduits et/ou incorrectement traduits, mais aussi d’améliorer la qualité du système de la traduction automatique.

Jury d’évaluation :
Yllias Chali, professor, department of mathematics and computer science, University of Lethbridge, Alberta (membre externe)
Grégoire Winterstein, UQAM, département de linguistique (membre interne)
Vladimir Makarenkov, UQAM, département d’informatique (membre interne et président du jury)
Fatiha Sadat, UQAM, professeur au département d’informatique (directrice de recherche)
Lucie Ménard, UQAM, professeur au département de linguistique (codirectrice de recherche)

Institut des sciences cognitives

Fondé en 2003, l'Institut des Sciences Cognitives de l'UQAM vise à favoriser la recherche et le développement de compétences dans le domaine des sciences cognitives, à en partager les connaissances, à faciliter les échanges interdisciplinaires et à animer la communauté locale.

Coordonnées

Institut des sciences cognitives
Local DS-4202
320, rue Sainte-Catherine Est
Montréal (Québec) H2X 1L7