DRT-o1-7B est un modèle visant à appliquer avec succès le raisonnement approfondi à la traduction automatique neuronale (TAN). Ce modèle exploite des phrases anglaises adaptées à la traduction par raisonnement approfondi et propose un cadre multi-agents comprenant trois rôles : traducteur, conseiller et évaluateur, pour synthétiser des échantillons de TAN. DRT-o1-7B et DRT-o1-14B sont entraînés en utilisant Qwen2.5-7B-Instruct et Qwen2.5-14B-Instruct comme réseaux de base. Le principal avantage de ce modèle réside dans sa capacité à traiter des structures linguistiques complexes et une compréhension sémantique approfondie, ce qui est crucial pour améliorer la précision et le naturel de la traduction automatique.