Google announced that 110 languages have been added to its Translate feature.

Jean Delaunay

Des langues régionales européennes en danger parmi les 110 nouvelles langues ajoutées à Google Translate

Le géant de la technologie a annoncé que 110 langues avaient été ajoutées à sa fonction de traduction, dont le sicilien, le mannois, le breton et le romani.

Google a annoncé que 110 langues ont été ajoutées à sa fonction Traduction, dont plusieurs langues européennes menacées.

Environ un quart des nouvelles langues proviennent d’Afrique, a indiqué la société, et toutes les nouvelles langues représentent plus de 614 millions de locuteurs.

Vous pouvez désormais envoyer un e-mail professionnel en manx, la langue celtique de l’île de Man qui « a presque disparu avec la mort de son dernier locuteur natif en 1974 », a indiqué la société dans un article sur son blog.

Les langues régionales de France, dont le breton – langue celtique parlée en Bretagne – et l’occitan, parlé dans le sud du pays, figurent également sur la liste.

Le sicilien et le vénitien, deux dialectes italiens originaires respectivement de Sicile et de Venise, ont également été ajoutés ainsi que le sâme du nord, une langue parlée dans le nord de la Scandinavie.

Le romani, une langue qui compte de nombreux dialectes et qui est parlée par environ 4,6 millions de personnes en Europe, figure également sur la liste.

L’objectif à long terme de Google est de « construire un modèle d’IA qui prendra en charge les 1 000 langues les plus parlées », a déclaré la société en 2022.

Comment ça marche?

La traduction de ces langues n’est pas aussi simple qu’il y paraît à première vue. Google utilise l’intelligence artificielle (IA) pour alimenter la fonction Traduction.

L’IA a besoin d’une quantité suffisante de données écrites, telles que du texte provenant de livres, d’articles et de sites Web, ce qui peut être rare pour les langues régionales et rares.

Ces données alimentent ensuite des algorithmes inspirés du cerveau humain, appelés réseaux neuronaux, permettant au système d’analyser des modèles, des contextes et des structures linguistiques afin de fournir des traductions au son naturel.

L’IA a tendance à être plus performante en anglais en raison de l’abondance des données de formation disponibles.

Google n’est pas la seule entreprise à s’intéresser aux langues rares.

En 2022, Microsoft a lancé la Microsoft Language Bank, soulignant que 40 % des langues du monde sont en voie de disparition, tandis que le Living Tongues Institute for Endangered Languages ​​s’est associé à la société audio Shure pour une campagne intitulée « No Voice Left Behind » visant à promouvoir la préservation des langues des régions reculées.

Stanford a également lancé sa propre initiative pour préserver les « langues numériquement défavorisées ».

Laisser un commentaire

19 − un =