人工知能は人間の感情を理解する上で目覚ましい進歩を遂げています。今月初め、第2回マルチモーダル感情認識チャレンジ(MER24)が盛況のうちに幕を閉じました。この権威あるコンテストは、複数の国際的に著名な学者によって共同で立ち上げられ、AI感情認識技術の実世界の人間と機械のインタラクションにおける応用を促進することを目的としています。
MER24チャレンジは3つのトラックに分かれており、その中でもSemiトラックは、その高い難易度と激しい競争から注目を集めています。Semiトラックでは、参加チームは少量のラベル付きデータと大量のラベルなしビデオデータを使用してモデルを訓練し、ラベルなしデータセットにおけるモデルのパフォーマンスと汎化能力を評価する必要があります。Soul Appの音声技術チームは、革新的な技術ソリューションにより、このトラックで1位を獲得しました。
大会公式サイト:https://zeroqiaoba.github.io/MER2024-website/#organization
Soulチームの成功は、マルチモーダルデータの理解、感情認識アルゴリズム、モデル最適化プラットフォームツール、内部ワークフロー構築などにおける深い蓄積と革新、そして技術チームの高い協調性によるものです。データの不足という課題に対し、Soulチームは半教師あり学習技術の改良、事前学習済みモデルによるマルチモーダル特徴量の抽出、効果的な特徴融合手法の提案、そしてビデオとテキストモーダリティに対する革新的なモデル開発など、様々な戦略を採用しました。
Soulチームの技術ソリューションは、感情認識の精度を向上させるだけでなく、混同しやすい感情の境界をより明確に区別することに成功しました。この成果は、Soulがソーシャル分野でAI大規模言語モデル技術、特にマルチモーダル感情的インタラクション能力を深く研究してきたことの集大成です。
ソーシャル分野における感情AIへの需要はますます高まっています。Soulは、感情的な能力を備えたAIを構築することで、「タスク実行者」から「人間の感情的なニーズを満たすコンパニオン」への転換を実現しました。Soulが独自開発したAI「苟蛋」、人狼ゲーム「狼人魅影」、異世界体験アプリ「異世界回響」などは、擬人化、知識、マルチモーダル、時間認識など多方面の融合能力を示しており、ユーザーに豊かで温かいAIインタラクション体験を提供しています。
2024年はAIGCアプリケーション元年と見なされており、Soulなどの中国企業は独自の技術蓄積を通じて、AIソーシャル分野で顕著な成果を上げています。Soulは独自開発の言語および音声大規模言語モデルに基づいて一連の製品を開発し、AIとユーザーの感情的なインタラクション体験の向上において、豊富な革新的な技術と実践経験を蓄積してきました。
今後、Soulのように技術と製品のイノベーションを堅持するプラットフォームは、ユーザーへの価値創造を継続し、活気のあるコンテンツとコミュニティエコシステムを形成することにより、より持続可能で多様なビジネス価値を実現していくでしょう。