Recentemente, o Laboratório de Inteligência Artificial de Xangai (Laboratório de IA de Xangai) lançou o InternLM-XComposer, seu primeiro grande modelo de criação de conteúdo misto de texto e imagem. O InternLM-XComposer consegue realizar conversas fluentes em chinês e inglês com imagens, compreender com precisão o conteúdo das imagens e, ainda mais, desbloqueou a capacidade de "geração com um clique" de artigos mistos de texto e imagem. O usuário só precisa fornecer o tema, e o InternLM-XComposer pode gerar um artigo com texto e imagens de forma automática. O InternLM-XComposer utiliza um processo de algoritmo em "três etapas" para criar artigos com texto e imagens, incluindo a geração de texto, o planejamento de ilustrações e a seleção inteligente de imagens. Em várias avaliações de modelos multimodais principais, o InternLM-XComposer apresentou desempenho de ponta, especialmente na compreensão multimodal em chinês. O InternLM-XComposer já está disponível em código aberto em plataformas como o GitHub, e os desenvolvedores são convidados a testar e criar aplicações inovadoras.
Laboratório de IA de Xangai lança o primeiro modelo de criação de texto e imagem de código aberto, o "Pǔyǔ Língbǐ"
