云知声、山海マルチモーダル大規模言語モデルを発表：音声の自由な切り替え、ビジュアルシーンの理解に対応

中国の人工知能分野で知られる企業、雲知声は、2024年8月23日、北京で最新開発成果である山海マルチモーダル大規模言語モデルを発表しました。

山海マルチモーダル大規模言語モデルは、雲知声Atlas人工知能基盤の一部であり、テキスト、音声、画像など複数のモーダル入力を受け取り処理し、テキスト、音声、画像の任意の組み合わせを出力としてリアルタイムに生成できます。この能力により、山海モデルは効率的な音声対話を行うだけでなく、人間らしい自然な会話に近いスムーズな体験を提供します。

微信截图_20240826134537.png

このモデルは高度なインテリジェント音声対話能力を備え、ユーザーの指示にリアルタイムで応答し、会話の途切れをサポートし、感情を感知して表現することで、ユーザーとの感情的な共感を生み出します。さらに、山海モデルは自由に音声を切り替えることができ、ユーザーの個性的なニーズに合わせて、専用のサウンドを作成できます。

視覚的インタラクションにおいては、山海モデルはカメラを通して周囲の環境を理解し、説明することで、正確な物体認識とシーン分析を実現します。また、ユーザーの指示に従って視覚コンテンツを迅速に作成し、パーソナライズされた視覚体験を提供します。

雲知声は、山海マルチモーダル大規模言語モデルの発表は、同社の技術プラットフォームである雲知脳の新しい中核であり、スマートライフとスマート医療の2つの分野により豊かで効率的な製品とソリューションを提供すると述べています。2023年5月の発表以来、山海大規模言語モデルは複数の権威あるコンテストで数々の賞を受賞し、その包括的な汎用能力と卓越した専門能力を示しています。

体験アドレス:https://shanhai.unisound.com/

AIニュース

云知声、山海マルチモーダル大規模言語モデルを発表：音声の自由な切り替え、ビジュアルシーンの理解に対応

AIbase基地

関連AIニュースの推奨

云知声、24時間無休AI自動ライブ配信システム「藍藻AI智播」を発表