OpenAI ha vuelto a causar sensación en el campo de la IA de vídeo con una importante actualización de Sora, lanzada en febrero de este año. Según el Diario de Información, el objetivo principal de esta actualización es mejorar significativamente el rendimiento de Sora, permitiéndole generar vídeos más largos y de mayor calidad con mayor rapidez.
La versión inicial de Sora presentaba varios problemas que necesitaban solución. Generar un vídeo con la versión inicial llevaba más de 10 minutos, una eficiencia claramente insuficiente para aplicaciones reales. Peor aún, muchos cineastas criticaron la calidad de la salida de Sora.
La experiencia del productor Patrick Cederberg es un ejemplo típico: tuvo que generar cientos de clips para obtener un vídeo utilizable. Sora tenía dificultades para mantener la coherencia en el estilo, los objetos y los personajes, cometiendo numerosos errores físicos, lo que afectaba gravemente su utilidad.
Nota de la fuente de la imagen: Imagen generada por IA, proveída por Midjourney.
Sin embargo, estos desafíos no son infrecuentes en el campo de la IA de vídeo. El desarrollo de la nueva versión de Sora se centra precisamente en abordar estos problemas. Para mejorar el rendimiento del sistema, OpenAI está recopilando millones de horas de vídeo de alta resolución como material de entrenamiento, que abarca diversos estilos y temas, con el objetivo de reducir los sesgos del modelo y mejorar la calidad de la salida.
Cabe destacar que, desde el lanzamiento de Sora, la competencia en el mercado de la IA de vídeo se ha intensificado. En el mercado chino, se han lanzado cuatro nuevos sistemas: Keling, Vidu, Jimeng AI y MiniMax. Simultáneamente, Runway ML no se queda atrás, lanzando dos nuevos modelos de IA y anunciando recientemente una colaboración con Lionsgate. Esta competencia impulsará sin duda el rápido desarrollo de toda la industria.
Aunque OpenAI declaró a principios de septiembre a CNBC que Sora aún se encuentra en fase de investigación y necesita un diálogo profundo con los responsables políticos, la directora de tecnología, Mira Murati, mostró una gran confianza a mediados de marzo. Afirmó claramente que Sora se lanzará oficialmente este año. Sin embargo, Murati también admitió que el coste operativo actual del sistema es demasiado alto, describiéndolo como "un lujo entre los lujos", por lo que la reducción de los costes de generación también es una tarea importante para OpenAI.
Esta actualización de Sora es sin duda un viaje lleno de desafíos y oportunidades. No solo debe resolver problemas técnicos, sino que también debe encontrar un equilibrio entre eficiencia, coste y calidad. Si OpenAI logra superar estos obstáculos, Sora podría convertirse en una fuerza transformadora importante en la industria de la producción de vídeo.
Con la creciente profundización de la tecnología de IA en el campo del vídeo, podemos prever que la creación de vídeos futuros será más eficiente y diversa. Esto no solo proporcionará nuevas herramientas a los profesionales, sino que también podría abrir nuevas posibilidades de creación de vídeo para los usuarios comunes. Aunque Sora aún enfrenta muchos desafíos, su dirección de desarrollo representa sin duda la tendencia futura de la IA de vídeo.