Avec la mondialisation croissante, la traduction automatique neuronale (TAN) joue un rôle de plus en plus important dans les échanges interlinguistiques. Bien que les outils de traduction actuels excellent dans le traitement de documents techniques et de textes simples, ils rencontrent encore de nombreux défis dans la traduction de textes littéraires. Les œuvres littéraires contiennent souvent des métaphores et des comparaisons riches en connotations culturelles et émotionnelles, que les systèmes de traduction traditionnels ont souvent du mal à restituer fidèlement.

image.png

Pour pallier ce manque, l'équipe de recherche de Tencent a lancé un nouveau système de traduction appelé DRT-o1. Ce système comprend deux versions : DRT-o1-7B et DRT-o1-14B. Ces deux modèles sont construits sur la base de Qwen2.5 et intègrent un nouveau cadre multi-agents, optimisé spécifiquement pour la traduction des métaphores et des comparaisons. L'équipe de recherche a collecté environ 400 livres du domaine public en anglais dans le projet Gutenberg, extrait 577 600 phrases et sélectionné 63 000 phrases contenant des métaphores et des comparaisons pour les utiliser comme données d'entraînement.

Le système DRT-o1 utilise une approche collaborative composée de trois rôles : traducteur, conseiller et évaluateur. Le processus de ce cadre multi-agents commence par l'identification et la traduction individuelle des termes clés de la phrase source, garantissant ainsi la précision du contexte. Après la génération d'une traduction préliminaire, plusieurs cycles d'amélioration et d'évaluation aboutissent à une traduction fluide et facilement compréhensible. Ce système, lors de la traduction d'œuvres littéraires, est capable de mieux saisir les nuances culturelles et émotionnelles.

Les résultats expérimentaux montrent que le score BLEU de DRT-o1-7B a augmenté de 8,26 points et le score COMET de 3,36 points, surpassant son prédécesseur Qwen2.5-7B-Instruct. DRT-o1-14B a également démontré d'excellentes performances, avec une amélioration du score BLEU de 7,33 points et du score COMET de 1,66 point. Ces résultats montrent que DRT-o1 surpasse les modèles existants dans la traduction littéraire, notamment sa version 7B qui dépasse même le modèle QwQ-32B plus grand.

image.png

Le système DRT-o1, grâce à l'introduction d'un cadre multi-agents et d'une méthode d'inférence à longue chaîne, apporte des avancées révolutionnaires dans le domaine de la traduction automatique neuronale. Il améliore non seulement la précision et la fluidité de la traduction, mais offre également de nouvelles solutions pour la traduction de textes littéraires complexes.

Accès au projet : https://github.com/krystalan/DRT-o1

Points clés :

🌟 Le système DRT-o1 comprend deux versions (7B et 14B) et utilise un cadre multi-agents pour optimiser la traduction des métaphores et des comparaisons.

📚 L'équipe de recherche a extrait et sélectionné 63 000 phrases littéraires à partir de 400 livres du domaine public pour les données d'entraînement.

🚀 DRT-o1 affiche une amélioration significative des scores BLEU et COMET, démontrant de puissantes capacités de traduction littéraire.