MiniMax lanzó recientemente su primer gran modelo de generación de video de forma discreta, y al mismo tiempo presentó un video de 2 minutos generado por este modelo, titulado «Moneda Mágica». Aunque la empresa aún no ha revelado los parámetros específicos del modelo ni los detalles técnicos, el fundador Yan Junjie declaró en una entrevista con los medios que sus resultados en la generación de video superan a los de Runway.

Yan Junjie reveló que la versión lanzada actualmente es solo la primera, y que se realizarán iteraciones continuas en el futuro en cuanto a datos, algoritmos y detalles de uso. Además de la función actual de generación de video a partir de texto, en el futuro también se implementarán las capacidades de generación de video a partir de imágenes y la generación de video combinando texto e imágenes. En cuanto al plan de comercialización, Yan Junjie afirmó que lo considerarán una vez que el nuevo modelo alcance un estado satisfactorio.

En comparación con Kuaishou Ke Ling, el modelo de generación de video de MiniMax se lanzó uno o dos meses más tarde. Yan Junjie explicó que esto se debe a que el equipo ha estado resolviendo problemas técnicos más desafiantes, especialmente cómo entrenar contenido con mayor capacidad de cómputo. Hizo hincapié en que la idea central de investigación y desarrollo de MiniMax es la búsqueda de una mejora de rendimiento significativa, y no solo mejoras menores.

Robot, Inteligencia Artificial, IA (1)

Nota de la fuente de la imagen: La imagen fue generada por IA, proveedor de servicios de licencias de imágenes Midjourney

Yan Junjie considera que el motivo principal para desarrollar la capacidad de generación de video es aumentar la cobertura y el uso por parte de los usuarios. Señaló que el contenido consumido diariamente por los humanos se basa principalmente en texto e imágenes y videos, por lo que la generación de contenido multimodal es una dirección de desarrollo inevitable.

Sin embargo, los grandes modelos de generación de video enfrentan numerosos desafíos. Yan Junjie explicó que la complejidad de la generación de video es mucho mayor que la del texto, incluyendo el procesamiento de contextos largos, las enormes necesidades de almacenamiento y las actualizaciones de infraestructura.

Wei Weiye, responsable de la plataforma abierta de MiniMax, señaló que los principales desafíos que enfrentan los grandes modelos actuales incluyen las alucinaciones inevitables, los altos costos de uso y el desarrollo de aplicaciones multimodales. Cree que a medida que el costo de las API disminuya, se generarán más escenarios de aplicación.

Ante las numerosas controversias del sector, como el enfoque B2B o B2C, o el mercado nacional o internacional, Yan Junjie afirmó que MiniMax mantiene una actitud optimista hacia el progreso tecnológico, los usuarios y la eficiencia de la iteración de productos.