2025年1月20日、上海階躍星辰智能科技有限公司は、Stepシリーズ言語モデルの2つの新メンバーであるStep-2miniとStep-2文学大師版を発表しました。この発表は、様々な創作シーンにおける開発者の言語モデルに対する多様なニーズに応え、人工知能分野における応用能力をさらに拡大することを目的としています。
昨年、1兆パラメーターの巨大言語モデルStep-2を発表して以来、階躍星辰は業界をリードするモデル性能により、LiveBenchなどの国際的な権威あるランキングで、国産大規模モデルのトップに何度もランクインしています。Step-2の発表は、開発者に強力なツールを提供し、シナリオ作成、ロールプレイング、文案作成など、様々なAIアプリケーションをサポートしています。しかし、アプリケーションシーンの拡大に伴い、開発者からは言語モデルの応答速度、コスト効率、そして創作能力に対するより高い要求が寄せられています。そのため、階躍星辰は多様な市場ニーズに対応するため、Step-2Familyの2人の新メンバーを発表しました。
Step-2miniは軽量で敏捷なモデルであり、パラメーター数を約3%に抑えながら、Step-2の80%以上のモデル性能を維持しています。高い性能を維持しながら、生成速度とコストパフォーマンスを大幅に向上させています。4000トークンの入力の場合、Step-2miniの平均最初の文字までの遅延はわずか0.17秒であり、非常に高速な応答能力を示しています。さらに、このモデルは、自主開発の新規なアテンションメカニズムアーキテクチャであるMFA(多行列分解アテンション)とその変種であるMFA-Key-Reuseを採用しており、従来のマルチヘッドアテンションアーキテクチャと比較して、KVキャッシュのオーバーヘッドを約94%削減し、推論コストを大幅に削減しています。現在、開発者は階躍星辰オープンプラットフォームを通じてStep-2miniのAPIインターフェースを呼び出すことができ、入力コストは1元/百万トークン、出力コストは2元/百万トークンです。
一方、Step-2文学大師版はコンテンツ作成に特化しており、クリエイターにより強力なサポートを提供することを目的としています。このバージョンは、Step-2の知識蓄積と文章の細部への制御能力を受け継ぎ、さらにコンテンツ作成能力を強化しています。いくつかの大規模モデルが生成する「空虚な」コンテンツとは異なり、Step-2文学大師版はユーザーの創作ニーズを十分に理解し、論理的で簡潔な言葉で、思想豊かで独特なスタイルの作品を生成することができます。サスペンス小説、爽快小説、SF小説など、Step-2文学大師版は卓越した創作力を発揮します。例えば、生成されたSF小説は、最先端の科学知識に基づいているだけでなく、人文思想も取り入れ、深いテーマと魅力的な叙事スタイルを示しています。
現在、Step-2文学大師版は躍問Appで利用可能であり、ウェブ版も今週中に全面的に公開されます(https://yuewen.cn)。ユーザーは自由に体験できます。階躍星辰は、春節前までにさらに多くの新モデルを続々と発表し、ユーザーにより包括的で、より強力な汎用大規模モデルを提供すると述べています。