Développements récents en traitement de la parole

Douglas O’Shaughnessy, de l’Institut National de la Recherche Scientifique (Énergie, Matériaux et Télécommunication), donnera le vendredi 14 mars à 15h en salle DS-1950 (UQAM, Pavillon De Sève, métro Berri-UQAM) une conférence intitulée : “Développements récents en traitement de la parole”

Résumé : On cherche la résolution de problèmes majeurs en la reconnaissance de parole. Nous examinerons l’efficacité de différentes méthodes d’analyse spectrale qui pourraient conduire au développement de systèmes plus performants, c’est-à-dire plus précis et exigeant de moins grandes capacités de calculs. Il s’agit d’améliorer la performance d’algorithmes qui traduisent tout signal de parole en forme de texte correspondant, et ce tant pour le français que pour l’anglais. Les différentes applications devraient pouvoir fonctionner avec de la parole continue et spontanée, éventuellement par téléphone, pour des vocabulaires limités mais de différentes tailles.

On étudie l’analyse de la parole par ordinateur, la synthèse de la parole à partir du texte, la reconnaissance de la parole, la reconnaissance d’interlocuteur, et le rehaussement de la parole bruitée. Tous les aspects de traitement de la parole s’intègrent dans le domaine du multimédia et des interactions entre les humains et les machines (e.g., ordinateurs). Il s’agit de communications, souvent à distance, permettant d’obtenir et de manipuler des informations par l’intermédiaire des sens naturels chez l’être l’humain.

L’application principale est la reconnaissance automatique de la parole dont la production est continue et à vocabulaire moyen, pour des conversations pratiques, souvent par téléphone ou dans des environnements bruités. On fait la conception des logiciels et de l’analyse de la parole, capables de traiter de la parole avec distorsions. On cherche à trouver une meilleure façon d’analyse spectrale plus robuste contre les distorsions. Les outils qui existent dans ce domaine sont limités en application, à cause d’un manque de compréhension de la manière dont l’humain génére et comprend la parole. On cherchera à mieux comprendre ces points.

Biographie : Dans le domaine du traitement de parole, le professeur Douglas O’Shaughnessy est bien connu. Son texte (Speech Communication) est un livre de base étudié à travers le monde, par tous les étudiants qui étudient la parole et par tous les chercheurs dans le champs de traitement de la parole (i.e., codage, reconnaissance, synthèse). Actif depuis plus de 30 ans dans ce domaine d’activté, il a publié des dizaines d’articles dans des journaux importants et il a présenté plus que 100 conférences. Il a dirigé des dizaines d’étudiants dans leurs mémoires et thèses, et dirige toujours une équipe désireuse de faire avancer la recherche vers un système de dialogue verbal qui remplacerait l’exigence à taper sur le clavier de téléphone pour avoir accès à de l’information. Il est Fellow de l’IEEE et de l’ASA (Acoustical Society of America) et il est éditeur en chef d’un journal technique et éditeur associé à trois autres.

Retour

Institut des sciences cognitives

Fondé en 2003, l'Institut des Sciences Cognitives de l'UQAM vise à favoriser la recherche et le développement de compétences dans le domaine des sciences cognitives, à en partager les connaissances, à faciliter les échanges interdisciplinaires et à animer la communauté locale.

Coordonnées

Institut des sciences cognitives
Local DS-4202
320, rue Sainte-Catherine Est
Montréal (Québec) H2X 1L7