Recientemente, el Laboratorio de Inteligencia Artificial de Shanghai (Shanghai AI Lab) lanzó InternLM-XComposer, su primer gran modelo de creación de texto e imágenes mixtas, también conocido como "Shusheng·Puyu Lingbi". Puyu Lingbi puede mantener conversaciones fluidas de texto e imagen en chino e inglés, comprender con precisión el contenido de las imágenes y, además, ha desbloqueado la capacidad de "generación con un solo clic" de artículos con una mezcla de texto e imágenes. Los usuarios solo necesitan proporcionar un tema, y Puyu Lingbi puede generar automáticamente un artículo con imágenes y texto. Puyu Lingbi utiliza un proceso de algoritmo de "tres pasos" para crear artículos con texto e imágenes, que incluye la generación de texto, la planificación de ilustraciones y la selección inteligente de imágenes. En varias evaluaciones de modelos multimodales principales, el rendimiento de Puyu Lingbi se encuentra entre los mejores, especialmente en la comprensión multimodal en chino. Puyu Lingbi ya está disponible en plataformas de código abierto como GitHub, y se invita a los desarrolladores a probarlo e innovar con sus aplicaciones.
El laboratorio de IA de Shanghai lanza el primer modelo grande de creación de imágenes y texto mixto de código abierto, "Pǔyǔ língbǐ"

上海人工智能实验室
Este artículo proviene de AIbase Daily
¡Bienvenido a la columna [AI Diario]! Aquí está tu guía diaria para explorar el mundo de la inteligencia artificial. Todos los días te presentamos el contenido más destacado en el campo de la IA, centrándonos en los desarrolladores para ayudarte a comprender las tendencias tecnológicas y conocer las aplicaciones innovadoras de productos de IA.