階躍星辰は先日、Stepシリーズモデルマトリックスの新メンバーであるStep-1oエンドツーエンド音声大規模モデルを発表しました。国内初の千億パラメーターエンドツーエンド音声大規模モデルと言われています。この新モデルの発表は、音声技術分野における大きな進歩を示しており、エンドツーエンドの音声ソリューションを通じて、音声の理解と生成を一体化することで、モデルの知性と感情の限界を向上させ、超自然的で高品質なコミュニケーション体験を実現します。
Step-1oモデルは、音声とテキストの混合形式の入出力に対応し、迅速な反応と中断を可能にすることで、便利なインタラクティブな体験を提供します。また、音色、リズム、方言、個性的な口語表現習慣などの音声特性を深く理解し模倣することで、まるで人間のような生き生きとした、感情豊かな表現を実現します。さらに、Step-1oは「賢い」音声大規模モデルであり、自己学習と模倣を通じて継続的に回答の質を向上させ、豊富な知識を備え、専門的なアドバイスと高い感情的価値のある伴走を提供します。
Step-1o音声大規模モデルの3つの特徴は次のとおりです。感情知能が高く、人間の複雑な意味、音声のトーンの裏にある感情情報を理解し、社会倫理と規則を深く認識しています。知能が高く、様々な専門分野の質問に高品質で回答でき、批判的思考能力を備えています。非常に高い理解力、模倣力、創造力があり、音声表現における細部を正確に捉え、リアルタイムで奇妙で不思議な音声ストーリーを作成し、語ることができます。
Step-1oの応用範囲は広く、ニュース速報、チャットの伴走、オーディオブック、オンライン教育、スマートハードウェア、自動車など、様々な業界の音声インタラクション技術のニーズに対応できます。
近日、Step-1oは躍問アプリに接続され、リアルタイムの音声通話サービスを提供する予定です。ユーザーは電話でStep-1oとコミュニケーションを取り、その忍耐強い傾聴と戦略立案サービスを楽しむことができます。この新機能の導入により、Step-1oの適用範囲がさらに拡大し、ユーザーにより豊かな音声インタラクション体験を提供します。