Dans le domaine de l'intelligence artificielle, la vitesse d'itération technologique est toujours étonnante. Kling, l'outil de génération de vidéos IA de Kuaishou, est passé en seulement six mois du statut de suiveur à celui de leader mondial de la génération de vidéos IA. La dernière version 1.6 témoigne de progrès technologiques remarquables.
Bien que la version ne soit augmentée que de 0,1, les percées technologiques apportées par Kling 1.6 dépassent largement les attentes. La nouvelle version, tout en maintenant son prix abordable de 35 inspirations/5 secondes de vidéo, a réalisé un bond qualitatif sur trois axes principaux : le réalisme des lois physiques, la capacité d'interprétation des personnages et le niveau de compréhension sémantique.

Amélioration significative du réalisme des lois physiques
L'interprétation précise du monde physique est le point culminant de cette mise à jour. Lors du test de la découpe de tomates, Kling 1.6 a démontré une précision digne d'un chef professionnel, tant dans l'interaction entre les ustensiles et les ingrédients que dans la force de la coupe. Les effets physiques dans les scènes quotidiennes, comme verser du thé, un chat sur un canapé ou un chien courant, sont également plus réalistes. Même le mouvement de la cape de Batman lors d'une course de voiture est plein de réalisme cinématographique, alliant réalisme et esthétique.
Les progrès en matière d'expressions et de mouvements des personnages sont tout aussi impressionnants. Des rides subtiles des sourcils à une élégante posture de ballet, en passant par la danse classique chinoise sous-marine extrêmement difficile, Kling 1.6 est capable de capturer avec précision les subtils changements émotionnels et les mouvements corporels complexes des personnages. Dans la reconstitution du segment de danse sous-marine de « Luoshen » de Henan TV, l'amplitude des mouvements des danseurs et les effets physiques des rubans de leurs costumes ont atteint un niveau étonnant.
En termes de compréhension sémantique, Kling 1.6 fait preuve d'une capacité accrue de compréhension des contextes. Que ce soit des actions successives comme « enlever ses lunettes et embrasser un faon » ou des scènes complexes comme « reculer et lever son arme », il est capable de comprendre et de générer du contenu vidéo conforme aux attentes, démontrant ainsi son excellente capacité d'analyse d'instructions complexes.
Bien sûr, en tant que mise à jour de la version 0.1, Kling 1.6 a encore une marge de progression. Par exemple, l'uniformité du style artistique lors de la génération de contenu en dehors de l'image d'origine doit être améliorée ; le traitement des détails des mains dans les scènes à plusieurs personnages nécessite encore des améliorations. Mais ces défauts sont mineurs et ne gâchent pas le tableau ; cette mise à jour a pleinement démontré les solides compétences techniques et la capacité d'itération rapide de l'équipe Kling.
Depuis son lancement officiel en juin, Kling est passé en six mois seulement du statut de « Sora chinois » à celui de « Kling mondial ». Sur la voie mondiale de la génération de vidéos IA, ce produit de Kuaishou est en train d'écrire un nouveau chapitre pour la technologie chinoise. Nous avons toutes les raisons de croire que la version 2.0 à venir nous réservera encore plus de surprises.