オープンソースAI分野では、巨大テクノロジー企業との差は計算能力だけではありません。AI2(旧Allen人工知能研究所)は、一連の先駆的な取り組みを通じてこの格差を縮小しており、最近発表されたTülu3後学習方案により、「生の」大規模言語モデルを実用的なAIシステムに変換することが容易になりました。
一般的な認識とは異なり、基礎言語モデルは事前学習後すぐに使用できるわけではありません。実際、後学習プロセスこそが、モデルの最終的な価値を決定する重要な段階です。この段階で、モデルは判断力の欠けた「何でも知っている」ネットワークから、特定の機能指向の実用的なツールへと変化します。
長年、大手企業は後学習方案を秘匿してきました。誰でも最新の技術を使ってモデルを構築できますが、モデルを特定の分野(心理カウンセリングや研究分析など)で機能させるには、独自の学習技術が必要です。MetaのLlamaのような「オープンソース」を標榜するプロジェクトでさえ、元のモデルのソースと一般的なトレーニング方法は厳重に守秘されています。
Tülu3の登場により、この状況が変わりました。この包括的な後学習方案は、テーマの選択からデータガバナンス、強化学習から微調整まで、あらゆるプロセスを網羅しています。ユーザーは、数学やプログラミング能力の強化、多言語処理の優先順位の低下など、必要に応じてモデルの能力を調整できます。
AI2のテストによると、Tülu3で学習したモデルの性能は、最上位のオープンソースモデルレベルに達しています。このブレークスルーは非常に重要です。企業に完全に自主管理可能な選択肢を提供するからです。特に、医療研究など、機密データを扱う機関にとっては、サードパーティのAPIやカスタムサービスに依存する必要がなくなり、ローカルで全プロセスを学習できるため、コスト削減とプライバシー保護の両方が実現します。
AI2は、この方案を発表しただけでなく、自社製品にもいち早く適用しました。現在のテスト結果はLlamaモデルに基づいていますが、彼らは自社のOLMoに基づき、Tülu3で学習した新しいモデルのリリースを計画しており、これは真に最初から最後まで完全にオープンソースのソリューションとなります。
今回の技術のオープンソース化は、AI2のAI民主化推進への決意を示すだけでなく、オープンソースAIコミュニティ全体に大きな刺激を与えました。真にオープンで透明性のあるAIエコシステムにより近づきました。