La nouvelle intelligence artificielle (IA) développée par Meta (Facebook) est capable de traduire instantanément 200 langues.
« Imaginez visiter un groupe Facebook préféré, tomber sur un message en igbo ou en luganda, et être capable de le comprendre dans votre propre langue d’un simple clic sur un bouton. » C’est ce fantasme qui a motivé les troupes de Meta, propriétaire des plateformes Facebook, Messenger, Instagram et WhatsApp, à développer le modèle No language left behind (NLLB-200), dont la mission est de traduire toutes les langues du monde en temps réel.
Pour l’équipe qui a œuvré à sa création au sein du département Meta AI, cet important traducteur universel instantané est synonyme de progrès à plusieurs niveaux.
« Ce sont des millards de gens qui ne peuvent accéder au contenu en ligne dans leur langue maternelle », a indiqué Meta dans sa vidéo d’introduction. « La langue, c’est tout dans la vie. C’est vraiment ce qui nous permet de nous exprimer », y souligne Safiyyah Saleem, gestionnaire de programme technique chez Meta AI. « C’est la clé de l’inclusion. Si vous ne comprenez pas ce qui est dit ou écrit, vous êtes à la traîne », complète Jean Maillard, ingénieur à la recherche dans le même département.
« C’est la clé de l’inclusion. Si vous ne comprenez pas ce qui est dit ou écrit, vous êtes à la traîne. »
– Jean Maillard, ingénieur à la recherche chez Meta AI
S’il est encore loin des 7 000 langues parlées dans le monde, Meta peut déjà se targuer de traduire deux fois plus de langues que les modèles de pointe traditionnels. « Lorsqu’il s’agit de traduire en assamais, zulu, islandais ou hausa, l’enjeu de difficulté réside dans le fait qu’il y a très peu de ressources », et donc, très peu de data qui existe pour nourrir l’IA, explique Francisco Paco Guzmán, gestionnaire à la recherche chez Meta AI.
Alors comment s’est débrouillée l’équipe pour constituer cette data manquante? En cherchant « l’aiguille dans une botte de foin! », illustre Holger Shwenk, scientifique à la recherche. Meta a dû remonter à la source, et aller à la rencontre des gens qui s’expriment dans ces langues, afin d’entraîner leurs modèles à comparer les phrases, en procédant par l’échange automatisé de données et par des évaluations humaines.
Selon l’expert web Jim-Sam Pan, interviewé par CScience IA, « Meta n’est pas la seule compagnie dont les avancées technologiques permettent de traduire en 200 langues. La manière de traduire en 200 langues est la même qu’en 100. Seulement, elle est l’une des seules à réussir à collecter les données nécessaires dans les 200 langues à travers le monde depuis ses multiples produits. Étant donné que ses produits visent à faire communiquer les gens entre eux, c’est aussi un atout stratégique que Meta avait tout intérêt à développer. Les utilisateurs des plateformes comme Facebook et WhatsApp doivent se comprendre entre eux. Tout comme les modérateurs sur ces plateformes doivent pouvoir comprendre tout ce qui y est publié. Là où l’on peut se contenter des langues les plus courantes dans d’autres secteurs. »
Au-delà du réseau social
Mais au-delà du fait de rendre le contenu des géants GAFAM (Google, Apple, Facebook/Meta, Amazon et Microsoft) accessible à un plus grand bassin d’utilisateurs dans leur langue maternelle, il s’agit de mettre la table pour d’autres innovations en traduction par l’IA. Pensons, par exemple, au fait de pouvoir traduire de manière impeccable les pages d’un livre de cuisine, ou encore les poèmes de sa grand-mère, écrits dans une langue ancestrale.
Il y a quelques années, l’entreprise Waverly Labs a lancé son dispositif d’oreillettes Pilot. Un peu à la manière du traducteur universel utilisé dans l’univers fictif de Star Trek, il permet, grâce à une connexion Bluetooth vers le téléphone intelligent, d’échanger de façon presque tout à fait normal avec son interlocuteur, également muni d’une oreillette. Il suffit de tenir son téléphone près de sa bouche et de parler dans le micro. Sans fil, Pilot est composé de deux oreillettes Bluetooth intra-auriculaires. Les oreillettes se rechargent dans un boîtier qui offre selon le constructeur une autonomie totale de 10 heures. Les données sont traitées par un algorithme pour une traduction dans la langue sélectionnée au préalable dans l’application. L’appareil ne coûterait que quelques centaines de dollars, ce qui ne semble pas cher payé pour dépasser les barrières linguistiques. Mais le problème, c’est qu’il ne fonctionne que dans quelques langues. Et si Meta développait ses propres oreillettes dans le genre de Pilot? Il n’est pas difficile d’imaginer qu’un produit combinant le supertraducteur NLLB-200 à l’oreillette Bluetooth trouverait preneur au sein d’un grand bassin de consommateurs.
D’autres articles abordant cet enjeu :
- Article du 27 juin 2022 : Le top 5 des extensions gratuites sur Google Chrome qui utilisent l’IA
- Article du 11 mars 2022 : Les traducteurs sont-ils menacés par l’IA ?
- Article du 18 mai 2021 : L’IA transforme le monde du divertissement
Crédit Image à la Une : Dima Soloman et Greg Rosenke