Systran : l'intelligence artificielle face au grand défi de la ...

Par Louise Berthoux, le 21 octobre 2016

Inspirations>

Annoncé fin août et après une phase intensive de recherche et développement autour des nouvelles technologies offertes par les réseaux de neurones artificiels et l’apprentissage profond, l’éditeur SYSTRAN lance son moteur Pure Neural Machine Translation (PNMT).

Systran compte voir la marge d’erreur de sa traduction baisser et a déjà mis en ligne un démonstrateur couvrant une très grande variété de langues (européennes, asiatiques, arabes…) et lancé un programme test auquel participe un échantillon représentatif d’entreprises clientes de Systran dans des secteurs d’activité divers. Les premiers retours de ces expériences seront communiqués courant décembre. La traduction « parfaite » (naturelle) d’un texte d’une langue à une autre, effectuée par un ordinateur seul, est un sommet de l’utilisation de l’intelligence artificielle. En effet, chaque langue est liée à notre intelligence, notre humanité, notre histoire, notre culture, et un tel exploit consacrerait une conscience artificielle, reflet de la nôtre, au plus proche de l’humain.

La différence entre un moteur neuronal (NMT) et les traducteurs statistiques (SMT) ou programmés (RBMT), ce sont les réseaux de neurones artificiels. Avec les SMT et RBMT, l’ordinateur peut apprendre des règles et leurs exceptions, comme un humain. Mais cela se traduit souvent par un échec. Le moteur neuronal, lui, a la capacité d’apprendre des règles par lui-même. Comment ? Claude Touzet, spécialiste de l’apprentissage et maître de conférence au CNRS Aix-Marseille, a la réponse : « en analysant des millions de textes présents sur le web (livres, documents officiels, blogs…) et déjà traduits par les humains, l’ordinateur va mettre au point des statistiques permettant de créer de nouvelles traductions. C’est ce que l’on appelle la phase d’apprentissage. Comme le cerveau humain, l’ordinateur qui s’est crée ses propres connaissances à partir d’exemples est meilleur que celui qui applique des règles strictes ou des connaissances figées. » Puis, plus le temps passe, plus de nouvelles traductions humaines seront mises en ligne sur le web, augmentant la base de données des ordinateurs, qui ne pourront que s’améliorer.

Mais il y a certaines limites… « Le PNMT est une évolution dans le monde des sciences cognitives, mais ne permet pas encore aux machines de comprendre le contexte et la signification de ce qu’elles traduisent. Elles peuvent alors faire des erreurs, en choisissant le mauvais sens d’un mot par exemple » prévient Claude Touzet. Le cerveau des machines n’est donc pas aussi performant que le nôtre pour apprendre et contextualiser. Pour l’instant…