Le projet « HistorIA », porté par Ioana Vasilescu, chercheure au LIMSI (CNRS-UPSud), constitue le prolongement du projet « Émergence 2017 » déjà labellisé par la MSH, sur l’étude des changements sonores analysés par l’intelligence artificielle (IA). Il s’inscrit dans la linguistique instrumentée de l’oral, qui construit des connaissances linguistiques à partir de l’exploration outillée des données langagières.
Le projet rĂ©unit des chercheurs dans les domaines linguistique instrumentĂ©e, linguistique historique, sociolinguistique et informatique, autour du thème innovant de l’évolution des langues romanes, Ă©tudiĂ©e avec des techniques issues de la reconnaissance vocale, de la statistique et de la sociolinguistique (enquĂªtes de terrain). L’approche est fondĂ©e sur des analyses automatisĂ©es qui font appel Ă de grandes masses de donnĂ©es orales Ă la fois contemporaines (enregistrements mĂ©dia) et issues d’archives historiques (journaux radio depuis la seconde guerre mondiale). Ces donnĂ©es sont Ă©tudiĂ©es par une postdoctorante aidĂ©e des systèmes automatiques d’alignement son-texte dĂ©veloppĂ©s par le LIMSI.
GrĂ¢ce au soutien de la MSH Paris-Saclay, les chercheurs ont dĂ©jĂ Ă©tabli une cartographie des usages des dialectes italiens et corses disponibles en ligne (https://atlas.limsi.fr/?tab=IT ), qui complètent la cartographie française (https://atlas.limsi.fr/?tab=Hexagone).
Les résultats permettent de répondre à un triple objectif : la sauvegarde du patrimoine linguistique, la validation de théories et le développement du machine learning pour la reconnaissance vocale.