Nathalie Entringer et Sara Martin

© Uwe Hentschel

Nathalie Entringer et Sara Martin analysent une partie des données dans le cadre de leur thèse.

L’analyse des enregistrements vocaux constitue un projet ambitieux. « Notre équipe ne comporte pas beaucoup de membres, ces derniers se comptent plutôt sur les doigts d’une main », explique Nathalie Entringer. Sara Martin est l’un des membres. Nathalie Entringer et Sara Martin analysent une partie des données dans le cadre de leur thèse. Et cela représente un volume considérable. Si les enregistrements vocaux ne durent que quelques secondes, ils sont déjà au nombre de 160 000. Soit au total plus de 100 heures de matériel audio. 

Pimpampel, Millermoler ou Päiperlek ?

Le matériel a été collecté à l’aide de l’application « Schnëssen – Är Sprooch fir d’Fuerschung », développée par l’équipe resserrée de l’Institut fir lëtzebuergesch Sprooch- a Literaturwëssenschaft de l’Université de Luxembourg sous la direction de Peter Gilles, en coopération avec un éditeur de logiciels suisse. La fonction est très simple : l’utilisateur indique d’abord la localité dans laquelle il a grandi, répond à quelques questions personnelles, puis commence à réaliser les enregistrements. Il s’agit soit de la traduction de phrases en allemand ou en français vers le luxembourgeois, soit de questions ou d’images auxquelles l’utilisateur doit répondre ou qu’il doit décrire en luxembourgeois.

L’application a pour but d’aider les chercheurs à documenter la langue dans toute sa richesse. Par exemple, plusieurs termes existent en luxembourgeois pour traduire le mot « papillon », tels que « Pimpampel », « Millermoler » ou « Päiperlek ». Grâce à la localisation géographique des enregistrements vocaux et aux informations relatives à l’âge, les deux doctorantes peuvent déterminer dans quelle mesure certaines différences linguistiques peuvent être attribuées à l’origine ou à l’âge des utilisateurs. « Parfois, des mots différents sont utilisés, mais d’autres fois, il n’existe que des différences subtiles d’accentuation », explique Nathalie Entringer.

L’anonymat des utilisateurs est respecté

« Par exemple, si nous avons 1 500 enregistrements pour la traduction du mot "papillon", nous les écoutons un par un puis nous les recensons dans un tableau », explique Sara Martin. « Et à l’aide de ces données, nous pouvons ensuite créer une cartographie qui constitue un nouvel atlas de la langue luxembourgeoise », ajoute-t-elle. Les enregistrements vocaux collectés au moyen de l’application ne sont pas seulement mis au service de la science, mais sont également disponibles pour tous les utilisateurs en même temps.

Ainsi, tout le monde peut consulter la carte interactive pour repérer d’où proviennent les autres utilisateurs, puis écouter leurs enregistrements vocaux. « Nous accordons évidemment une attention particulière à la confidentialité et à l’anonymat », souligne Nathalie Entringer. « L’origine et le sexe sont les seules informations transmises dans l’application avec les enregistrements correspondants. Toutes les autres informations ont uniquement servi à des fins d’étude scientifique », ajoute-t-elle.

De leur côté, l’analyse des traductions et le remplissage des tableaux prennent parfois beaucoup de temps. « Certaines phrases recouvrent cinq ou six aspects que nous voulons étudier », explique Nathalie Entringer. Et c’est pour cette raison que ces enregistrements doivent ensuite être écoutés plusieurs fois. Pour toutes les deux, il est difficile d’évaluer la durée d’analyse de l’ensemble des fichiers audio. S’il est passionnant d’écouter de manière répétée le même mot ou la même phrase, cela s’avère aussi épuisant à la longue, expliquent-elles. « Il n’est pas possible de faire cela toute la journée », raconte Sara Martin en souriant. 

Déjà 4 000 utilisateurs au bout de quatre mois  

L’application a été téléchargée près de 6 000 fois depuis sa sortie fin avril. Plus de 4 000 utilisateurs ont déjà créé un profil. Et même si l’analyse implique beaucoup de travail, les deux linguistes sont satisfaites de l’écho positif rencontré par le projet. Pour accroître l’intérêt des utilisateurs, l’application est désormais dotée de nouvelles tâches de traduction. 

En outre, Christoph Purschke, un membre de l’équipe, a élaboré un questionnaire que les utilisateurs peuvent également remplir via cette application.  Purschke collecte des données sur la diversité linguistique au Luxembourg. Jusqu’à présent, 2 000 questionnaires ont déjà été entièrement remplis, et le catalogue de questions existant a récemment été remplacé par un nouveau. L’utilisation de l’application mobile n’est pas limitée dans le temps, explique la linguiste, Sara Martin. « Nous devons juste regarder pendant combien de temps les gens participent. »

Auteur : Uwe Hentschel

Photo : Uwe Hentschel

Graphiques: Université du Luxembourg

Aussi dans cette rubrique