A Shanghai Jieyue Xingchen Intelligent Technology Co., Ltd. anunciou recentemente uma atualização significativa em sua série de modelos de geração de imagens Step-1X, lançando a versão Step-1X-Medium com desempenho aprimorado. Esta versão atualizada apresenta melhorias significativas em vários aspectos: baseada na arquitetura MMDit, a velocidade de geração aumentou em mais de 30%; após treinamento direcionado, a nova versão apresenta maior capacidade de compreensão e consistência entre texto e imagem, gerando imagens com textura e detalhes mais naturais.
O Step-1X-Medium adiciona a funcionalidade "imagem para imagem", permitindo que os usuários carreguem uma imagem e forneçam instruções simples para aprimorar detalhes, transferir estilos ou modificar partes da imagem original. Além disso, a nova versão também foi aprimorada na criação de conteúdo com "estilo chinês", conseguindo capturar melhor a essência dos rostos orientais e apresentar uma textura de imagem mais sofisticada e delicada. O Step-1X-Medium também suporta a adição de texto em inglês no Prompt, permitindo que as imagens geradas apresentem legendas em inglês.
O Step-1X-Medium atualizado visa ser uma ferramenta poderosa para criadores, compreendendo profundamente a criatividade inserida e fornecendo resultados mais precisos e perfeitos. Atualmente, as novas funcionalidades do Step-1X-Medium estão disponíveis para os usuários por meio de chamada API no "Centro de Experiência" da plataforma aberta da Jieyue Xingchen.
A nova versão do Step-1X-Medium alcança um novo nível de qualidade de geração, capaz de gerar cenários mais diversos e com maior consistência entre texto e imagem. Ele também otimiza profundamente a imagem de personagens orientais, dominando facilmente o estilo chinês e gerando páginas de quadrinhos com estilo consistente para entusiastas de quadrinhos chineses, japoneses e americanos. Para designers de marca, o Step-1X-Medium pode gerar anúncios, embalagens de produtos e materiais de marketing que se alinham à identidade da marca, exibindo melhor a essência cultural da marca.
A funcionalidade "imagem base" lançada no Step-1X-Medium permite que os criadores carreguem imagens base, e o modelo rapidamente compreende a estrutura e o estilo da imagem, aprimorando detalhes, transferindo estilos ou realizando refinamentos locais com base na criatividade da imagem original. Além disso, o Step-1X-Medium também suporta a funcionalidade de geração SRef (referência de estilo), fornecendo uma imagem de referência de estilo, com o modelo extraindo as características estéticas e atmosféricas e as integrando à composição da imagem gerada.
O avanço da tecnologia de IA permite que o Step-1X-Medium adicione legendas curtas em inglês no Prompt, adicionando um toque especial às imagens. Essa atualização não apenas melhora a qualidade e a eficiência da geração de imagens, mas também oferece aos criadores mais espaço criativo e possibilidades.
Endereço de experiência: https://platform.stepfun.com/