(C) Uwe Hentschel

Judith Manzoni a aidé à développer le système.

Un peu d'allemand et de français ici et là : des chercheurs de Luxembourg et de Sarrebruck développent un logiciel doté d’une voix humaine pour le luxembourgeois.

Le luxembourgeois est une belle langue, mais pas seulement... Pour les logiciels de synthèse vocale, ces systèmes permettant de reproduire une voix humaine artificiellement, le luxembourgeois est un véritable défi. Même les fabricants de logiciels de navigation ne font pas partie de ceux qui sont vraiment de taille à relever le défi. Pourtant, de nombreux appareils disposent déjà d'annonces en luxembourgeois. Toutefois, il n’est pas nécessaire que le luxembourgeois soit notre langue maternelle pour reconnaître que la synthèse vocale se heurte souvent à ses limites, principalement lorsqu'il s'agit de noms de rues.

« Avec le luxembourgeois, le principal défi réside dans la reconnaissance des éléments de la langue qui proviennent de l'allemand et du français, ainsi que dans leur prononciation », explique Judith Manzoni. Cette linguiste de l’unité de recherche Identités, Politiques, Sociétés, Espaces (IPSE) de l’université du Luxembourg a développé, en collaboration avec le professeur universitaire Peter Gilles et les chercheurs Jürgen Trouvain et Ingmar Steiner, un logiciel capable de relever ce défi : MaryLux.

Prise en compte des sons français et allemands

MaryLux est le prototype d'un logiciel de synthèse vocale pour la langue luxembourgeoise qui repose sur la plateforme de synthèse MaryTTS librement accessible sur Internet. En plus des anglicismes, MaryLux a entre autres pour particularité de prendre en compte les sons de l’allemand et du français durant le processus de reconnaissance.

La voix que MaryLux utilise pour parler est celle de Judith Manzoni. Pour cela, cette Luxembourgeoise de langue maternelle a lu à haute voix des textes luxembourgeois, qui ont ensuite été introduits dans le logiciel. Cependant, la linguiste n'a tout de même pas récité tout le dictionnaire luxembourgeois. Des textes sélectionnés arbitrairement ont tout simplement été introduits dans le système, comme des contenus de Wikipédia, par exemple. « Nous avons enregistré environ quatre heures de texte, dit-elle. Deux heures en luxembourgeois, une heure en français et aussi un peu d’allemand. »

Comme le précise Judith Manzoni, le logiciel de synthèse vocale ne fonctionne pas avec des mots entiers, mais avec des blocs de mots. Elle explique qu’il prend également en considération la nature du mot, l’accentuation et la position dans la phrase. MaryLux reconnaît si le son provient du français ou de l'allemand en se basant sur la position des différents blocs.

Une aide précieuse pour les personnes atteintes de dyslexie ou de cécité

MaryLux serait donc en mesure de faire la lecture de textes luxembourgeois. Judith Manzoni admet toutefois que le logiciel ne fonctionne pas encore parfaitement. Il rencontrerait par exemple encore des problèmes avec les chiffres et les signes de ponctuation. Toutefois, ces aspects sont en cours de perfectionnement. La chercheuse est convaincue que « [u]ne fois terminé, le logiciel fonctionnera parfaitement ».

Les logiciels de synthèse vocale comme MaryLux sont particulièrement intéressants pour les personnes atteintes de dyslexie ou de cécité. Grâce à ce logiciel qui, une fois achevé, sera mis en libre accès à l'instar de la plateforme de synthèse MaryTTS, ces personnes pourront alors se faire lire des textes luxembourgeois sur Internet en toute simplicité.

Auteur: Uwe Hentschel

Photo: Uwe Hentschel

Smart Schoul 2025 Former les citoyens du numérique de demain 

Comment inspirer les étudiants pour l’informatique ? Une réponse pourrait être le projet Smart Schoul 2025 de l’Universi...

Virtual Metabolic Human Database Une base de données regroupant les connaissances sur le métabolisme humain

Un consortium international mené par le Luxembourg Centre for Systems Biomedicine (LCSB) a développé une base de données...

Protection des données en biomédicine Les bonnes choses prennent du temps – et c’est justement ce que les patients n’ont pas !

La protection des données est un thème important, pas seulement sur Internet, mais aussi dans la recherche biomédicale. ...

Aussi dans cette rubrique

Larochette
TEDxUniversityofLuxembourg Ce que l’on sait et, surtout, ce que l’on ne sait pas du château de Larochette

Marleen de Kramer se consacre à la reconstitution de châteaux forts. Dans le cadre de cet objectif, elle est confrontée à un problème crucial dont elle parlera lors de la TEDxUniversityofLuxembourg.

Nina Janz
History of Justice Hunting for documents promising new insights into Luxembourg’s history.

What can the past tell us about the present and future? Nina Janz gives insights into her work as a Research Associate at the Centre for Contemporary and Digital History (C²DH).

Marché du travail Quels sont les déterminants à la pratique du télétravail au Luxembourg ?

Pourquoi beaucoup de salariés ne profitent pas du télétravail ? Et est-ce que le télétravail est lié à la satisfaction au travail ? Une étude du LISER fait état du secteur privé.

Conny Roob et Nathalie Keipes
La recherche au service de la politique Pour que les décisions aient aussi un fondement scientifique

Dans le domaine de la jeunesse, le ministère compétent mise sur une collaboration avec l’Université du Luxembourg. Une décision judicieuse, mais qui n'a rien d'évident.

FNR