DRT-o1は、長思考連鎖によって翻訳プロセスを最適化する神経機械翻訳モデルです。比喩や隠喩を含む英文を抽出し、翻訳者、アドバイザー、評価者を含むマルチエージェントフレームワークを用いて、長思考による機械翻訳サンプルを生成します。DRT-o1-7BとDRT-o1-14Bは、Qwen2.5-7B-InstructとQwen2.5-14B-Instructに基づいて訓練された大規模言語モデルです。DRT-o1の主な利点は、複雑な言語構造と深層的な意味理解を処理できることであり、機械翻訳の精度と自然性を向上させる上で非常に重要です。