Kürzlich debütierte der von SenseTime's "Ruyin AI-Videogenerierungsplattform" erschaffene KI-Avatar der CCTV-Reporterin Wang Bingbing auf der „2024 China・AI Gala“.
AI Bingbings Auftritt auf der Bühne war sowohl professionell als auch natürlich. Dank SenseTimes großem Sprachmodell „SenseNova“ beherrscht sie fließend Türkisch, Russisch, Spanisch und viele weitere Sprachen, was die herausragenden Fähigkeiten der KI-Technologie im Bereich der Sprachverarbeitung unterstreicht.
Die KI-Videogenerierungstechnologie der Ruyin-Plattform von SenseTime ermöglichte nicht nur eine „haargenaue“ hochauflösende Reproduktion von Wang Bingbing, sondern erreichte auch eine hohe Natürlichkeit in Bezug auf Mimik, Mundbewegung und Gestik. AI Bingbings mehrsprachige Fähigkeiten basieren darauf, dass die Plattform nach Eingabe chinesischer Texte Videos in über 112 Sprachen generieren kann, wobei eine flüssige Sprachwiedergabe und eine präzise Lippenbewegungssynchronisation gewährleistet sind.
SenseTime Ruyin bietet eine starke technologische Grundlage, darunter Algorithmen zur Generierung von KI-Avatar-Videos, ein großes Sprachmodell für Audio und KI-Bildgenerierungstechnologien. Dies ermöglicht es AI Bingbing, auf der Bühne realistische visuelle Effekte und eine flüssige mehrsprachige Kommunikation zu präsentieren. Dieser Auftritt zeigt auch das Anwendungspotenzial von digitalen Avataren in der Medienbranche und die Möglichkeit, die Distanz zwischen Persönlichkeiten und ihrem Publikum zu verringern.