Google ha anunciado recientemente que su último modelo de generación de imágenes, Imagen3, ya está disponible para los desarrolladores a través de la API de Gemini. Este modelo no solo posee una potente capacidad de generación de imágenes, sino que también puede crear imágenes con diversos estilos artísticos según las indicaciones de texto introducidas, abarcando una amplia gama desde el surrealismo hasta personajes de anime.

El uso de Imagen3 es muy sencillo. Los desarrolladores solo necesitan enviar una descripción de texto a través de la API, y el modelo generará rápidamente imágenes de alta calidad. El coste de generación de cada imagen es de solo 0,03 dólares, lo que lo hace ideal para desarrolladores y empresas que necesitan generar imágenes a gran escala. Con esta estrategia de precios razonable, Google pretende reducir el umbral de las tareas creativas y permitir que más personas disfruten de la diversión de la creación artística con IA.

image.png

En la generación de imágenes, Imagen3 demuestra una capacidad excepcional. Ya sea en la precisión de los colores o en la complejidad de los detalles, el modelo puede plasmar con exactitud las ideas del usuario. Para mejorar la experiencia del usuario, Imagen3 también ha incorporado una función mejorada de seguimiento de indicaciones; cuanto más específica sea la descripción proporcionada por el usuario, más se ajustará la imagen generada a sus expectativas. Por ejemplo, al describir el aspecto de un animal y su entorno, el modelo puede generar una imagen extremadamente precisa que satisfaga las necesidades creativas del usuario.

Además, Imagen3 también tiene en cuenta los problemas de derechos de autor y uso indebido de las imágenes generadas. Cada imagen generada lleva una marca de agua digital invisible, llamada SynthID. Esta marca de agua no es perceptible a simple vista, pero puede verificarse mediante una tecnología específica para asegurar que la imagen ha sido generada por IA, lo que permite frenar eficazmente la difusión de información falsa y el uso indebido.

Para los desarrolladores, comenzar a usar Imagen3 también es muy sencillo. Mediante un simple ejemplo de código Python, los usuarios pueden interactuar rápidamente con la API y generar las imágenes que desean. Dado que Google planea integrar más modelos de generación en la API de Gemini en el futuro, los desarrolladores podrán crear contenidos más interactivos e impulsar la diversificación del desarrollo de productos creativos.

Google está explorando activamente la combinación de modelos de medios generativos y de lenguaje. Las aplicaciones futuras serán mucho más amplias, y los desarrolladores podrán aprovechar estas tecnologías para desarrollar un mayor potencial en la creación de contenidos y el desarrollo de herramientas.

Documentación: https://ai.google.dev/gemini-api/docs/imagen-prompt-guide?hl=es