En 2018, l’intelligence artificielle bouscule le monde de la traduction littéraire avec un ouvrage de référence dans la communauté scientifique. L’apprentissage profond en version française est le début d’une aventure qui interroge la profession de traducteur sur sa raison d’être. À la portée de tous les claviers, les programmes améliorent sans arrêt leurs performances et résolvent les tâches monotones. Mais quelles sont les limites de ces systèmes ?
De toutes les technologies disponibles, la traduction automatique est sans nul doute la plus rependue. Parmi les compétiteurs accessibles, DeepL GmbH, développé par une firme allemande, reste le plus populaire (Sources : Digitiz, Codeur.com, Htpratique) suivi de Google translate et Reverso. Ces 5 dernières années, Internet a démocratisé les systèmes de traduction automatique neuronale par apprentissage profond. Ces derniers ne demandent aucune connaissance particulière et demeurent abordables pour tous les utilisateurs.
LES PRÉMISSES DE L’AUTOMATISME
En 1965, le bureau de la traduction du gouvernement canadien met en place un projet original sous le nom de TAUM – MÉTÉO. Cette dénomination est l’acronyme de Traduction Automatique de l’Université de Montréal. On choisit d’appliquer ce projet dans le domaine spécifique de la météorologie. En 1977, la machine est lancée ! De Vancouver à Halifax, les stations météorologiques utilisent la traduction automatique de l’anglais vers le français. Donald Barabé, président de l’Ordre des traducteurs (OTTIAQ), explique que c’est l’un des systèmes les plus anciens toujours en cours d’utilisation : pour faire ces révisions, cela prend moins de dix traducteurs – sans ce programme, cela demanderait 150 traducteurs.
Les météorologues ont normalisé la manière de décrire les bulletins. D’après le site Open Édition, TAUM-MÉTÉO traduit en moyenne 30 000 mots par jour avec un vocabulaire limité à environ 2000 mots. La syntaxe figée autour d’un nombre de structures identiques ne nécessite en rien un apprentissage profond. Malgré la simplicité des phrases, une équipe de traducteurs professionnels 24h/24 pour réviser le contenu.
QUAND LES ALGORITHMES ENTRENT EN JEU
Au même titre que l’analyse et l’interprétation des images médicales, les algorithmes d’apprentissage automatique et d’optimisation permettent de résoudre les problèmes de données massives bien souvent ennuyeuses. Dans le secteur plus spécifique du livre, il est très rare que les éditeurs utilisent l’automatisation. Mais il aura tout de même fallu seulement douze heures à deux logiciels pour traduire en français 800 pages de l’ouvrage Apprentissage Profond (Massot Éditions).
Le tandem API DeepL et Quantmetry a réalisé cette prouesse en ajoutant des outils développés pour la traduction des fiches et des graphismes. L’équipe a créé un dictionnaire de deux cents mots pour garantir une cohérence dans la traduction des termes mathématiques. De même que pour d’autres domaines précis tels que médicaux ou juridiques. Les logiciels sont entraînés sur des corpus techniques et spécialisés pour avoir de meilleurs résultats.
L’édition de textes littéraires est un domaine où la traduction neuronale automatique s’applique le moins bien parce qu’il y a généralement des nuances. Donald Barabé donne l’exemple de la série littéraire Harry Potter car les récits contiennent énormément d’effets stylistiques.
Adapter autant de fantaisie reste un travail monumental pour l’Homme et presque impossible pour des robots qui n’ont aucune idée du contexte. Plus loin, Donald Barabé énumère d’autres domaines qui ne fonctionnent pas avec les systèmes existants : « traduire un jugement de la Cour suprême ou même de la poésie fonctionne seulement avec l’interprétation. Quand on touche aux attributs littéraires, le robot ne reconnaît pas les effets de style. »
COMMENT ÇA MARCHE ?
Au fil du temps, les programmes deviennent fiables dans bien des cas. Le style robotisé a laissé place à une lecture plus fluide qui respecte le génie de la langue mais sans proposition originale. La traduction neuronale automatisée est une affaire de probabilités. Si le robot a déjà vu le même enchainement de mots, il va traduire d’une même manière grâce à des probabilités.
« La machine ne fait que calculer les probabilités mais elle ne comprend pas. Par ses algorithmes, elle produit quelque chose de fluide, mais n’exprime pas nécessairement les nuances. » – Donald Barabé, président de l’Ordre des traducteurs, terminologues et interprètes agréés du Québec
L’humain, avec sa sensibilité, est capable d’interpréter et de donner les lettres de noblesse à ce qu’à voulu dire l’auteur. L’apprentissage profond lui, base ses performances sur des corpus, des masses de textes téléchargés dans l’ordinateur. Va-t-il faire la différence entre une table à manger et une table de multiplication ? Oui, s’il a été entraîné sur cet enchaînement de mots, mais il ne sort jamais de ses calculs.
ALLIÉ OU MENACE ?
La population a besoin des traducteurs automatiques, car beaucoup de contenu circule quotidiennement. CSA Research Inc. dépeint l’idée que sans traducteurs automatiques, il faudrait environ 25% de la population mondiale pour traduire le contenu qui circule en un jour. La multiplication des traducteurs automatiques inquiète sans doute à première vue car ils remplacent le savoir de l’homme. Cependant, le nombre de traducteurs ne diminue pas. L’automatisation augmente la productivité; de plus, on lui confie des contenus répétitifs et ennuyeux.
Le Conseil interprofessionnel du Québec (CIQ) relève le taux de tâches automatisables par profession réglementée. Le domaine médical et les techniciens professionnels arrivent à des taux avoisinant les 50% alors que la traduction obtient 16% seulement. Pour Donald Barabé, ce n’est pas la perte d’emploi qui est préoccupante, mais plutôt la variation de l’intégrité d’une œuvre. Une traduction erronée peut apporter des préjudices.
Google traduction va chercher les sites web en anglais et trouve des équivalents dans une autre langue. Il apparie les mots mais la qualité laisse à désirer car il apprend à partir d’un corpus ‘’pollué’’. L’enjeu des concepteurs de logiciels de traduction automatique est d’utiliser plutôt des corpus fait par des professionnels. Dans le cas de Facebook, les usagers améliorent le corpus en laissant des commentaires sur la traduction automatique.
Un vrai travail de fourmi ! Painstaking work ! Selon Google translate 😉
Crédits photo image de Une : Pexels