2022年の世界的な生成AIブームを背景に、元始智能(RWKV)は2023年12月、天際資本から数千万人民元のエンジェルラウンドの資金調達を完了しました。今回の資金調達により、企業価値は倍増し、調達資金はチーム拡大、新アーキテクチャの開発、製品の商業化に充当されます。
RWKVの登場は、従来のTransformerアーキテクチャに対する強力な挑戦です。大規模言語モデル(LLM)の発展に伴い、モデルのパラメータ規模はますます大きくなっていますが、幻覚や精度といった問題点は依然として解決されていません。そのため、RWKVの創設チームは、より高い効率性と柔軟性を実現するため、全く新しいアーキテクチャの探求を決定しました。
RWKVの設計理念はTransformerとは全く異なります。共同創設者の羅璇氏は、従来のTransformerモデルはトークンを生成するたびに前文を「再読み込み」する必要があるのに対し、RWKVは各トークンの状態を記録する必要がないため、計算量を大幅に削減できると述べています。RWKVはRNN(リカレントニューラルネットワーク)の長所を組み合わせることで、効率性と言語モデリング能力の両面でブレークスルーを実現しました。
この革新的なアーキテクチャの利点は、RWKVが限られた状態空間で情報を処理できることであり、強化学習の方法により、モデルはいつ前文を振り返る必要があるかを自動的に判断できるため、記憶能力が向上します。従来のモデルと比較して、RWKVは複数のベンチマークテストで優れた性能を示しており、言語学習効率の向上を実証しています。
現在、RWKVは0.1Bから14Bまでのモデルのトレーニングを完了しており、海外コミュニティでは32Bのプレビューモデルを公開しています。今後、元始智能は2025年に70B以上のRWKV-7を発売し、新しい推論フレームワークとチップを開発することで、モデルの性能をさらに向上させる計画です。
事業面では、RWKVはオープンソースプロジェクトを提供するだけでなく、AI音楽生成や企業との連携など、積極的に商業化を進めており、国家電網など多くの企業と提携しています。技術開発と商業化の推進により、RWKVは、大規模モデル分野における「AndroidとLinux」になることを目指しています。