Recientemente, un misterioso modelo de generación de imágenes de IA con el nombre en código "red_panda" ha logrado resultados sorprendentes en las pruebas de referencia de la plataforma de análisis colaborativo Artificial Analysis, superando significativamente a los productos de empresas líderes en la industria como Midjourney, Black Forest Labs y OpenAI.
Según los datos de la plataforma Artificial Analysis, "red_panda" lidera las pruebas de texto a imagen con una puntuación de 1244 puntos, superando en aproximadamente 40 puntos Elo al segundo clasificado, Flux1.1Pro de Black Forest Labs. Cabe destacar que este sistema de puntuación se deriva del sistema de evaluación de la fuerza de los jugadores de ajedrez y ahora se utiliza para comparar el rendimiento de los modelos de IA. Los datos de enfrentamientos reales muestran que "red_panda" tiene una tasa de victorias un 9% superior a la de Flux, lo que demuestra una clara ventaja tecnológica.
En cuanto al rendimiento, "red_panda" también es impresionante. El modelo tarda una media de solo 7 segundos en generar una imagen, lo que supone una mejora de más de cien veces en la eficiencia en comparación con DALL-E3 de OpenAI. La comparación de muestras de prueba reales revela que las imágenes generadas por "red_panda" presentan un alto grado de realismo, eliminando casi por completo las imperfecciones comunes en las obras de IA tradicionales; incluso supera en realismo al modelo Flux, conocido por su realismo. Además, el modelo muestra una excelente capacidad de comprensión y ejecución de indicaciones de texto.
Actualmente, "red_panda" se encuentra en fase de prueba cerrada y aún no está disponible para el público. Respecto al equipo de desarrollo, existen diversas especulaciones en la industria: algunos creen que podría ser una versión de Midjourney-V7, mientras que otros sugieren que podría ser una nueva creación de una empresa tecnológica china. Sin embargo, desde una perspectiva técnica, el modelo probablemente sea un modelo de ajuste fino Lora real basado en SD3.5 large turbo, en lugar de proceder de las principales empresas tecnológicas chinas.
Con el rápido desarrollo de la tecnología de generación de imágenes de IA, la aparición de "red_panda" ha impulsado una vez más la mejora de los estándares de la industria. El origen de este misterioso nuevo actor y cómo su tecnología líder afectará el desarrollo de la industria siguen siendo aspectos que merecen una atención continua.
Dirección de Artificial Analysis: https://artificialanalysis.ai/text-to-image/arena