最近、テンセントAI Labは国内外の複数の学術機関と共同で、大規模モデルの幻覚問題に関するレビュー論文を発表しました。研究によると、従来のモデルと比較して、大規模モデルの幻覚評価は、データ規模が大きく、汎用性が高く、気づきにくいといった新たな課題に直面しています。幻覚を減らすために、事前学習、微調整、強化学習などの複数の段階で介入することができます。しかし、大規模モデルの実用化を促進するためには、信頼性の高い評価方法に関する更なる研究が必要です。
最近、テンセントAI Labは国内外の複数の学術機関と共同で、大規模モデルの幻覚問題に関するレビュー論文を発表しました。研究によると、従来のモデルと比較して、大規模モデルの幻覚評価は、データ規模が大きく、汎用性が高く、気づきにくいといった新たな課題に直面しています。幻覚を減らすために、事前学習、微調整、強化学習などの複数の段階で介入することができます。しかし、大規模モデルの実用化を促進するためには、信頼性の高い評価方法に関する更なる研究が必要です。
先日、魔楽コミュニティ(Modelers)で、階躍星辰が開発したオープンソースのマルチモーダル大規模モデルであるStep-VideoとStep-Audioが正式に公開されました。これらのモデルは、それぞれ動画生成と音声対話に使用され、開発者と企業ユーザーにより強力なAIツールを提供することを目指しています。Step-Videoモデルの正式名称はStep-Video-T2Vで、300億パラメーターという世界最大のオープンソース動画生成モデルです。このモデルは、20秒の動画を直接生成できます。