Recientemente, el Laboratorio de Inteligencia Artificial de Shanghai (Shanghai AI Lab) lanzó InternLM-XComposer, su primer gran modelo de creación de texto e imágenes mixtas, también conocido como "Shusheng·Puyu Lingbi". Puyu Lingbi puede mantener conversaciones fluidas de texto e imagen en chino e inglés, comprender con precisión el contenido de las imágenes y, además, ha desbloqueado la capacidad de "generación con un solo clic" de artículos con una mezcla de texto e imágenes. Los usuarios solo necesitan proporcionar un tema, y Puyu Lingbi puede generar automáticamente un artículo con imágenes y texto. Puyu Lingbi utiliza un proceso de algoritmo de "tres pasos" para crear artículos con texto e imágenes, que incluye la generación de texto, la planificación de ilustraciones y la selección inteligente de imágenes. En varias evaluaciones de modelos multimodales principales, el rendimiento de Puyu Lingbi se encuentra entre los mejores, especialmente en la comprensión multimodal en chino. Puyu Lingbi ya está disponible en plataformas de código abierto como GitHub, y se invita a los desarrolladores a probarlo e innovar con sus aplicaciones.