2023年、中国国産の大規模言語モデルは、演算能力、データ、アルゴリズムという三本柱において目覚ましい進歩を遂げました。演算能力は制約があるものの、禁輸措置が国産チップの台頭を促し、パブリッククラウド事業者は集中演算能力によって需要に対応しています。しかしながら、データの質が新たな課題となる可能性があります。中国語のデータセットは不足しており、質の高いデータの発掘が今後の発展の重点となるでしょう。
2023年、中国国産の大規模言語モデルは、演算能力、データ、アルゴリズムという三本柱において目覚ましい進歩を遂げました。演算能力は制約があるものの、禁輸措置が国産チップの台頭を促し、パブリッククラウド事業者は集中演算能力によって需要に対応しています。しかしながら、データの質が新たな課題となる可能性があります。中国語のデータセットは不足しており、質の高いデータの発掘が今後の発展の重点となるでしょう。
先日、魔楽コミュニティ(Modelers)で、階躍星辰が開発したオープンソースのマルチモーダル大規模モデルであるStep-VideoとStep-Audioが正式に公開されました。これらのモデルは、それぞれ動画生成と音声対話に使用され、開発者と企業ユーザーにより強力なAIツールを提供することを目指しています。Step-Videoモデルの正式名称はStep-Video-T2Vで、300億パラメーターという世界最大のオープンソース動画生成モデルです。このモデルは、20秒の動画を直接生成できます。