(C) Uwe Hentschel

Judith Manzoni a aidé à développer le système.

Un peu d'allemand et de français ici et là : des chercheurs de Luxembourg et de Sarrebruck développent un logiciel doté d’une voix humaine pour le luxembourgeois.

Le luxembourgeois est une belle langue, mais pas seulement... Pour les logiciels de synthèse vocale, ces systèmes permettant de reproduire une voix humaine artificiellement, le luxembourgeois est un véritable défi. Même les fabricants de logiciels de navigation ne font pas partie de ceux qui sont vraiment de taille à relever le défi. Pourtant, de nombreux appareils disposent déjà d'annonces en luxembourgeois. Toutefois, il n’est pas nécessaire que le luxembourgeois soit notre langue maternelle pour reconnaître que la synthèse vocale se heurte souvent à ses limites, principalement lorsqu'il s'agit de noms de rues.

« Avec le luxembourgeois, le principal défi réside dans la reconnaissance des éléments de la langue qui proviennent de l'allemand et du français, ainsi que dans leur prononciation », explique Judith Manzoni. Cette linguiste de l’unité de recherche Identités, Politiques, Sociétés, Espaces (IPSE) de l’université du Luxembourg a développé, en collaboration avec le professeur universitaire Peter Gilles et les chercheurs Jürgen Trouvain et Ingmar Steiner, un logiciel capable de relever ce défi : MaryLux.

Prise en compte des sons français et allemands

MaryLux est le prototype d'un logiciel de synthèse vocale pour la langue luxembourgeoise qui repose sur la plateforme de synthèse MaryTTS librement accessible sur Internet. En plus des anglicismes, MaryLux a entre autres pour particularité de prendre en compte les sons de l’allemand et du français durant le processus de reconnaissance.

La voix que MaryLux utilise pour parler est celle de Judith Manzoni. Pour cela, cette Luxembourgeoise de langue maternelle a lu à haute voix des textes luxembourgeois, qui ont ensuite été introduits dans le logiciel. Cependant, la linguiste n'a tout de même pas récité tout le dictionnaire luxembourgeois. Des textes sélectionnés arbitrairement ont tout simplement été introduits dans le système, comme des contenus de Wikipédia, par exemple. « Nous avons enregistré environ quatre heures de texte, dit-elle. Deux heures en luxembourgeois, une heure en français et aussi un peu d’allemand. »

Comme le précise Judith Manzoni, le logiciel de synthèse vocale ne fonctionne pas avec des mots entiers, mais avec des blocs de mots. Elle explique qu’il prend également en considération la nature du mot, l’accentuation et la position dans la phrase. MaryLux reconnaît si le son provient du français ou de l'allemand en se basant sur la position des différents blocs.

Une aide précieuse pour les personnes atteintes de dyslexie ou de cécité

MaryLux serait donc en mesure de faire la lecture de textes luxembourgeois. Judith Manzoni admet toutefois que le logiciel ne fonctionne pas encore parfaitement. Il rencontrerait par exemple encore des problèmes avec les chiffres et les signes de ponctuation. Toutefois, ces aspects sont en cours de perfectionnement. La chercheuse est convaincue que « [u]ne fois terminé, le logiciel fonctionnera parfaitement ».

Les logiciels de synthèse vocale comme MaryLux sont particulièrement intéressants pour les personnes atteintes de dyslexie ou de cécité. Grâce à ce logiciel qui, une fois achevé, sera mis en libre accès à l'instar de la plateforme de synthèse MaryTTS, ces personnes pourront alors se faire lire des textes luxembourgeois sur Internet en toute simplicité.

Auteur: Uwe Hentschel

Photo: Uwe Hentschel

Aussi dans cette rubrique