Lors du classement annuel des « Dix grandes réalisations nationales » organisé par le centre de presse de la Commission de supervision et d'administration des actifs de l'État du Conseil des Affaires d'État, le modèle linguistique de grande taille Xingchen, développé de manière autonome par China Telecom, a été sélectionné avec succès grâce à ses résultats technologiques révolutionnaires. En tant que premier système de modèle linguistique de grande taille complet, multi-modalités et entièrement national en Chine, le modèle Xingchen a démontré des capacités exceptionnelles dans les domaines de la sémantique, de la voix, de la vision et des multi-modalités.
Dans le domaine de la sémantique, le modèle Xingchen a réalisé des percées importantes. S’appuyant sur un cluster de dizaines de milliers de cartes nationales et un cadre d’entraînement, le modèle a atteint plus de 93 % de l’efficacité de calcul d’une puissance de calcul équivalente de NVIDIA, et le temps d’entraînement représente même 98 %. Il est à noter que ce modèle s'est classé premier au classement international C-Eval et a surpassé plusieurs modèles linguistiques de grande taille bien connus en Chine sur le classement OpenCompass.
En matière de technologie vocale, le modèle Xingchen présente des avantages uniques. En tant que premier modèle linguistique de grande taille vocal en Chine à obtenir une double autorisation de l'Administration du cyberespace, il a réussi à surmonter les difficultés techniques de la reconnaissance vocale multi-dialectale, couvrant 40 régions dialectales. Sa technologie de génération vocale ultraréaliste ne nécessite que 5 à 10 secondes d'échantillon pour atteindre plus de 90 % de similitude de timbre, atteignant un niveau de pointe dans le secteur.
Dans le domaine de la vision, le modèle Xingchen a reçu des éloges d'académiciens et d'experts, qualifiant ses performances de « niveau international avancé ». Actuellement, ce modèle est déployé sur 765 000 caméras à travers la Chine, avec un volume d'appels quotidien supérieur à 600 millions, jouant un rôle important dans la gouvernance urbaine et la gestion du trafic.
En termes de capacités multimodales, le modèle Xingchen a également fait preuve d'une performance remarquable. Ses capacités de génération d'images ont dépassé celles de la plateforme internationale renommée Midjourney, et sa technologie de génération vidéo est classée première au classement VBench. Notamment, il a été le premier à réaliser la génération continue de vidéos de 5 minutes.
Actuellement, le modèle Xingchen a été transformé en plus de 10 produits IA standardisés et est utilisé dans 50 scénarios de différents secteurs, notamment l'administration publique et l'industrie. En tant que système d'IA national entièrement autonome et maîtrisé, le succès du modèle Xingchen non seulement démontre les capacités techniques de China Telecom, mais marque également des progrès importants dans les percées technologiques clés du domaine de l'IA en Chine.