En el campo de la inteligencia artificial, la velocidad de iteración tecnológica siempre es asombrosa. Kling, la herramienta de generación de videos con IA de Kuaishou, en tan solo seis meses, pasó de ser un seguidor a convertirse en un líder mundial en el campo de la generación de videos con IA. La versión 1.6 recién lanzada muestra un progreso tecnológico notable.

Aunque el número de versión solo ha aumentado en 0.1, los avances tecnológicos que aporta Kling 1.6 superan con creces las expectativas. La nueva versión, manteniendo el precio asequible de 35 ideas/5 segundos de video, ha logrado un salto cualitativo en tres dimensiones principales: realismo de las leyes físicas, capacidad de interpretación de personajes y nivel de comprensión semántica.

QQ20241219-111043.jpg

Mejora significativa del realismo de las leyes físicas

La interpretación precisa del mundo físico es el mayor punto destacado de esta actualización. En la prueba de cortar un tomate, Kling 1.6 muestra una operación casi tan precisa como la de un chef profesional, tanto en la interacción entre los utensilios y los ingredientes como en la fuerza del corte. Los efectos físicos en escenas cotidianas como servir té, un gato pisando un sofá o un perro corriendo también son más realistas. Incluso el movimiento de la capa de Batman mientras conduce un coche está lleno de cine, combinando realismo y arte.

El progreso en las expresiones y movimientos de los personajes también es sorprendente. Desde un ligero fruncimiento de ceño hasta una elegante postura de ballet, pasando por el desafiante baile clásico chino subacuático, Kling 1.6 puede capturar con precisión los sutiles cambios emocionales y los complejos movimientos corporales de los personajes. En la recreación del fragmento de baile subacuático de "Luoshen" de Henan TV, la amplitud de los movimientos de la bailarina y los efectos físicos de la cinta de su vestido alcanzan un nivel asombroso.

En cuanto a la comprensión semántica, Kling 1.6 muestra una mayor capacidad de comprensión de escenas. Ya sea una acción continua como "quitarse las gafas y abrazar a un cervatillo", o escenas complejas como "retroceder y levantar el arma", puede comprenderlas con precisión y generar el contenido de video esperado, lo que demuestra su excelente capacidad de análisis de instrucciones complejas.

Por supuesto, como actualización de la versión 0.1, Kling 1.6 todavía tiene margen de mejora. Por ejemplo, al generar contenido fuera de la imagen original, la uniformidad del estilo aún necesita ser mejorada; el tratamiento de los detalles de las manos en escenas con múltiples personajes aún necesita mejoras. Pero esto no empaña el mérito de la actualización, que ha demostrado plenamente la sólida capacidad técnica y la velocidad de iteración del equipo de Kling.

Desde su lanzamiento oficial en junio, Kling ha pasado de ser "el Sora chino" a "el Kling mundial" en tan solo seis meses. En la carrera mundial de generación de videos con IA, este producto de Kuaishou está escribiendo un nuevo capítulo para la tecnología china. Tenemos razones para creer que en la próxima versión 2.0, Kling nos seguirá sorprendiendo.