Alors que les outils de traduction automatiques existants analysent des phrases complètes, ce qui les empêche d'interpréter des paroles en simultané, Baidu et l'université d'État de l'Oregon viennent de présenter une IA capable de prévoir la suite probable d'une phrase et, par extension, de la traduire avec un retard minimal.
Google Translate et Skype Translator peuvent se préparer à accueillir un redoutable concurrent. Ce mercredi, le géant du Net chinois qu'est Baidu a présenté avec l'université d'État de l'Oregon le fruit de leur collaboration en matière de machine learning, à savoir une intelligence artificielle capable de prédire avec une grande pertinence les fins possibles d'une phrase et de traduire cette phrase dans une autre langue prise en charge alors même que le locuteur continue de parler. Baptisé "Simultaneous Translation with Integrated Anticipation and Controllable Latency" (STACL ; "traduction simultanée avec anticipation intégrée et latence contrôlable"), le projet est pour le moment très axé sur la traduction anglais-chinois, mais l'IA a déjà commencé à s'entraîner avec d'autres langues.D'après Baidu, le système a été conçu pour mimer le fonctionnement d'un interprète humain, ce que ne peuvent pas faire, notamment, les outils de Google et Microsoft, qui analysent les phrases en un bloc. Cela demande beaucoup d'apprentissage (déjà plusieurs millions de phrases traduites entre anglais et mandarin), mais la firme est confiante dans la qualité du résultat, au point d'ailleurs de laisser son nouvel outil traduire sa prochaine conférence mondiale à Pékin. Baidu ne s'attend pas à ce que la prestation livrée soit au niveau d'un bon interprète, mais souligne que l'IA a déjà des arguments pour elle : elle ne fatigue pas et ne souffre d'aucun problème de mémoire. Sans compter qu'elle ne peut que progresser.
Un aspect important du système est la latence réglable. Comme les développeurs le rappellent, toutes les langues n'utilisent pas les mêmes structures et ne sont pas aussi faciles à traduire en direct. Les langues où le verbe est placé à la fin de la phrase — comme cela peut être le cas en allemand — sont par exemple impossibles à transcrire virtuellement sans délai dans une langue où le verbe est placé au début. Il faut donc autoriser l'IA à prendre plus de temps avant de se lancer dans sa traduction. À l'inverse, les langues latines, relativement proches en termes de structure, peuvent être traitées avec une latence très réduite, l'IA n'ayant en théorie pas de problème à se projeter sur les possibles suites de l'énoncé. Naturellement, il est aussi possible d'autoriser une plus grande latence avec des langues proches, ce qui aboutit mathématiquement à des traductions globalement plus cohérentes. Mais Baidu assure qu'avec de l'entraînement, son bébé ne gagne pas grand-chose à bénéficier de plus de temps avec des langues bien connues.
De l'aveu même des développeurs, le remplacement des interprètes humains n'est pas pour tout de suite, les subtilités de la langue au cours de négociations ou de rencontres politiques n'étant pas encore à la portée d'une machine. Cependant, le projet pourrait effectivement déboucher sur une alternative viable dans certaines situations d'ici à quelques petites années.
Lire la suite : Baidu dégaine une IA capable de traduire en temps réel