El equipo de investigación de Snap Inc. ha lanzado recientemente SnapGen, un generador de imágenes de inteligencia artificial que puede generar imágenes de alta resolución directamente en teléfonos inteligentes de gama alta. Este lanzamiento permite a los usuarios disfrutar de una experiencia de creación de imágenes eficiente y conveniente en sus teléfonos, superando las limitaciones tradicionales de la generación de imágenes de IA que requieren una gran capacidad de cálculo.

La principal ventaja de SnapGen radica en la compacidad y eficiencia de su modelo. En comparación con generadores de imágenes populares como SDXL, SnapGen tiene solo 379 millones de parámetros, aproximadamente una séptima parte. Este diseño compacto hace que SnapGen no solo ocupe menos espacio de almacenamiento, sino que también tenga un rendimiento superior en velocidad. Según los resultados de las pruebas, SnapGen muestra un excelente rendimiento en la coincidencia de imágenes con descripciones de texto, con una puntuación de 0.66, superando la puntuación de 0.55 de SDXL, lo que demuestra una clara ventaja en calidad.

image.png

En cuanto a la velocidad, SnapGen destaca especialmente. En un iPhone 16 Pro Max, el sistema puede generar una imagen de alta calidad con una resolución de 1024×1024 píxeles en aproximadamente 1,4 segundos. Esta mejora de velocidad hace que los usuarios apenas perciban la demora durante el proceso de creación, pudiendo disfrutar de la generación de imágenes al instante.

Para lograr estas mejoras de rendimiento, el equipo de investigación rediseñó sistemáticamente la arquitectura de la red, simplificando los parámetros y la latencia del modelo, al tiempo que se garantiza la alta calidad de la generación de imágenes. Optimizaron especialmente la parte del decodificador, haciéndolo 36 veces más pequeño que los sistemas similares. Además, para que el rendimiento del modelo pequeño alcance el nivel de los modelos grandes, el equipo también adoptó los métodos de aprendizaje de sistemas de IA grandes como SD3 y SD3.5, desarrollando un proceso de entrenamiento especial que puede ajustar dinámicamente las estrategias de aprendizaje según la dificultad de la tarea.

Con el lanzamiento de SnapGen, la tecnología de generación de imágenes de IA en dispositivos móviles ha experimentado un nuevo avance. En el futuro, los usuarios podrán disfrutar de una creación de imágenes más rápida y de mayor calidad en sus teléfonos, impulsando aún más el progreso de la creación de contenido en las redes sociales.