OpenAI ha anunciado recientemente una tecnología innovadora llamada sCM (modelo de consistencia simplificado, estable y escalable), una innovación que está revolucionando la forma en que se entrenan los modelos de imágenes de IA. Esta tecnología representa un gran avance sobre los modelos de consistencia (CM) existentes, abriendo nuevas posibilidades para la generación rápida de imágenes.

Ventajas principales de la tecnología:

Genera imágenes de alta calidad con solo dos pasos de cálculo.

Genera una imagen en solo 0,11 segundos en una GPU A100.

50 veces más rápido que los modelos de difusión tradicionales.

El modelo más grande alcanza los 1500 millones de parámetros, un nuevo récord.

image.png

En las pruebas reales, el rendimiento de sCM ha sido impresionante. En el conjunto de datos CIFAR-10 obtuvo una puntuación FID de 2,06, y en ImageNet, al generar imágenes de 512x512 píxeles, alcanzó una excelente puntuación de 1,88. Estos indicadores son solo aproximadamente un 10% inferiores a los mejores modelos de difusión existentes, pero con una velocidad significativamente superior.

La clave de esta innovación tecnológica radica en la solución de un problema fundamental de los modelos de consistencia tradicionales. Los modelos anteriores utilizaban pasos de tiempo discretos, lo que requería parámetros adicionales y era propenso a errores. El equipo de investigación de OpenAI, mediante el establecimiento de un marco teórico simplificado, unificó varios métodos, identificando y resolviendo con éxito las principales causas de la inestabilidad del entrenamiento.

Lo que es aún más prometedor es el enorme potencial de escalabilidad de esta tecnología. OpenAI ha logrado entrenar con éxito un modelo con 1500 millones de parámetros en el conjunto de datos ImageNet, algo sin precedentes en modelos similares. Los estudios han demostrado que a medida que aumenta el tamaño del modelo, la calidad de la imagen mejora continuamente, lo que sugiere la posibilidad de entrenar modelos a una escala aún mayor en el futuro.