bilibili(B站)は、軽量AI言語モデルであるIndex-1.9Bモデルのオープンソース化を発表し、大きな注目を集めています。Index-1.9Bモデルには、基盤モデル、対照群、対話モデルなど複数のバージョンが含まれています。

1.9Bには以下のモデルが含まれます:Index-1.9B base : 基盤モデル。19億の非単語埋め込みパラメータを持ち、2.8Tの主に中国語と英語のデータで事前学習されています。同レベルのモデルと比較して、複数の評価基準で優れた性能を示しています。

Index-1.9B pure : 基盤モデルの対照群。baseモデルとパラメータと学習方法は同じですが、データから指示関連の情報を厳格に除去することで、指示がベンチマークに与える影響を検証するために作られました。

Index-1.9B chat : Index-1.9B baseを基に、SFTとDPOで調整された対話モデル。事前学習において多くのインターネットコミュニティデータが使用されているため、会話の面白さが格段に向上しています。

Index-1.9B character : SFTとDPOに加え、RAGを導入することで、少ない例でキャラクターロールプレイのカスタマイズを実現しています。

image.png

Index-1.9Bアクセス方法:https://top.aibase.com/tool/index-1-9b