OTELO : OnTologies pour l’Enrichissement de l’analyse Linguistique de l’Oral (19-EX-03)
Porteurs
- Ioana VASILESCU (LIMSI)
- Fabien SUCHANEK (Télécom Paris)
Résumé
Le projet OTELO propose une analyse multi-niveaux de la langue parlée à partir de grands corpus oraux, segmentés et annotés automatiquement. L’hypothèse de travail est la suivante : la langue, qu’il s’agisse de sa variété écrite ou orale, est intrinsèquement ambiguë et polysémique. Les linguistes aspirent à rendre compte de cette ambiguïté dans le but de comprendre son fonctionnement. Les chercheurs en sciences et technologies de l’information sont également concernés par la formalisation de la variation linguistique dans des buts applicatifs. Les travaux qui s’intéressent à une description exhaustive de la langue sont rares car ils impliquent des démarches venant de plusieurs communautés scientifiques. Le projet OTELO est porté par deux chercheurs en linguistique (I.Vasilescu, LIMSI) et en informatique (F. Suchanek, Télécom Paris) et propose une analyse approfondie de la langue à partir de données orales. Segmentées en phones et mots, ces données seront ensuite enrichies avec des connaissances concernant le statut grammatical des mots, leurs relations syntaxiques et sémantiques en contexte. Les résultats attendus concernent le rôle de l’information phonétique dans la désambiguïsation des homophonies contextuelles impliquant des entités, et l’impact des connaissances linguistiques de « haut niveau » (grammaticales, syntaxiques, sémantiques) dans la diffusion des motifs de variation phonétique au sein des mots d’une langue.
(Mise à jour le 03 juillet 2024)
Retour à la liste des projets labellisés par la MSH Paris-Saclay