AiShi Technology ha lanzado recientemente su producto de generación de video PixVerse V2, una herramienta innovadora basada en un gran modelo de video de IA diseñada para ayudar a los usuarios a liberar su potencial creativo. PixVerse V2 utiliza una arquitectura base Diffusion+Transformer (DiT) e incorpora innovaciones tecnológicas en varios aspectos, lo que hace que la generación de video sea más fluida, coherente y divertida.
Las características principales incluyen:
Mecanismo de atención espacio-temporal: PixVerse V2 incorpora un mecanismo de atención espacio-temporal de desarrollo propio, mejorando la capacidad de percepción espacial y temporal, especialmente en el manejo de escenas complejas.
Capacidad de comprensión de texto: A través de un modelo multimodal, PixVerse V2 puede alinear con mayor precisión la información de texto y la información de video, mejorando la capacidad de comprensión y expresión del modelo.
Entrenamiento de modelo optimizado: Sobre la base del modelo flow tradicional, PixVerse V2 utiliza una pérdida ponderada para promover una convergencia más rápida y mejor del modelo, mejorando la eficiencia general del entrenamiento.
Capacidad de generación de video: PixVerse V2 admite la generación de varios clips de video a la vez, con una duración de hasta 8 segundos por clip y hasta 40 segundos para varios clips, manteniendo la coherencia entre los clips.
Funcionalidad fácil de usar: PixVerse V2 admite la generación con un solo clic de 1 a 5 clips de video continuos, manteniendo la coherencia en la imagen principal, el estilo de la imagen y los elementos de la escena entre los clips. Además, los usuarios pueden editar los resultados generados para reemplazar y ajustar el contenido del video de forma flexible.
El equipo de AiShi Technology planea realizar varias iteraciones y actualizaciones en los próximos 3 meses para ofrecer una mejor experiencia de generación de video con IA. El objetivo de PixVerse V2 es hacer que la creación de videos con IA sea más conveniente y eficiente, ya sea para registrar la vida diaria o para contar historias en video.