Künstliche Intelligenz (KI) hat bemerkenswerte Fortschritte im Verständnis menschlicher Emotionen gemacht. Anfang dieses Monats endete erfolgreich der zweite Wettbewerb zur multimodalen Emotionserkennung (MER24), eine hochkarätige Veranstaltung, die von mehreren international renommierten Wissenschaftlern initiiert wurde, um die Anwendung der KI-Emotionserkennungstechnologie in realen Mensch-Computer-Interaktionsszenarien voranzutreiben.
Der MER24-Wettbewerb umfasste drei Kategorien, wobei die Semi-Kategorie aufgrund ihres hohen Schwierigkeitsgrades und des intensiven Wettbewerbs besondere Aufmerksamkeit erregte. In der Semi-Kategorie mussten die teilnehmenden Teams ein Modell mit einer geringen Anzahl von markierten und einer großen Anzahl unmarkierter Videodaten trainieren und die Leistung und die Generalisierungsfähigkeit des Modells auf unmarkierten Datensätzen bewerten. Das Sprachtechnologieteam von Soul App gewann mit seiner innovativen technischen Lösung den ersten Platz in dieser Kategorie.
Wettbewerbswebsite: https://zeroqiaoba.github.io/MER2024-website/#organization
Der Erfolg des Soul-Teams beruht auf seinen umfassenden Kenntnissen und Innovationen in den Bereichen multimodales Datenverständnis, Emotionserkennungsalgorithmen, Modelloptimierungsplattformen, internen Arbeitsabläufen sowie der effizienten Zusammenarbeit des technischen Teams. Angesichts der Herausforderung knapper Daten setzte das Soul-Team verschiedene Strategien ein, darunter die Verbesserung der halbüberwachten Lerntechnik, die Verwendung von vortrainierten Modellen zur Extraktion multimodaler Merkmale, die Entwicklung effektiver Merkmalsfusionsmethoden sowie innovative Modelle für Video- und Textmodalitäten.
Die technische Lösung des Soul-Teams verbesserte nicht nur die Genauigkeit der Emotionserkennung, sondern ermöglichte auch eine bessere Unterscheidung zwischen leicht zu verwechselnden Emotionsgrenzen. Dieses Ergebnis ist ein Ausdruck von Souls intensiver Beschäftigung mit KI-Großmodellen im sozialen Bereich, insbesondere mit multimodalen, emotionalen Interaktionsfähigkeiten.
Der Bedarf an emotionaler KI im sozialen Bereich wächst stetig. Soul hat durch den Aufbau einer KI mit emotionalen Fähigkeiten den Wandel vom „Aufgabenlöser“ zum „Begleiter, der die emotionalen Bedürfnisse des Menschen befriedigt“ vollzogen. Souls selbst entwickelte KI Gou Dan, das Werwolf-Mystery-Spiel und die Anwendung „Echo aus einer anderen Welt“ zeigen die Fähigkeiten von Soul in den Bereichen Personalisierung, Wissen, Multimodalität und Zeitwahrnehmung und bieten den Nutzern ein reichhaltiges und einfühlsames KI-Interaktionserlebnis.
Das Jahr 2024 gilt als das Jahr der AIGC-Anwendungen. Unternehmen wie Soul haben durch ihre selbst entwickelte Technologie im Bereich der KI-Sozialisierung bemerkenswerte Erfolge erzielt. Soul hat auf der Grundlage selbst entwickelter Sprach- und Sprach-Großmodelle eine Reihe von Produkten entwickelt und im Laufe der Verbesserung der emotionalen Interaktion zwischen KI und Nutzern umfangreiche innovative Technologien und praktische Erfahrungen gesammelt.
Zukünftig werden Plattformen wie Soul, die auf technologische und produktbezogene Innovationen setzen, weiterhin Mehrwert für die Nutzer schaffen und auf der Grundlage eines florierenden Inhalts- und Community-Ökosystems einen nachhaltigeren und vielfältigeren wirtschaftlichen Wert erzielen.