Diaは、Nari Labsが開発した1.6億パラメータのテキスト音声変換(TTS)モデルであり、テキストから直接、非常にリアルな会話を生成できます。このモデルは、感情やトーンのコントロールをサポートしており、笑い声や咳などの非言語的なコミュニケーションも生成できます。その事前学習済みモデルの重みはHugging Faceでホストされており、英語の生成に対応しています。この製品は、研究や教育用途にとって非常に重要であり、対話生成技術の発展を促進します。