A equipe do modelo de linguagem grande Doubao da ByteDance lançou recentemente o SeedEdit, o primeiro modelo de edição de imagem universal a ser comercializado na China. Essa tecnologia já está em fase de teste na versão para PC do Doubao e no site do Jimeng. Essa tecnologia inovadora permite que os usuários, com simples comandos de texto, consigam efeitos de edição de imagem de nível profissional.
Como uma ferramenta revolucionária de edição de imagem, o SeedEdit supera as barreiras tecnológicas da edição de imagem tradicional. Os usuários podem usar comandos em linguagem natural para facilmente realizar retoques, trocas de roupas, embelezamento, conversão de estilos e operações complexas como adicionar ou remover elementos em áreas específicas. Por exemplo, depois de gerar uma imagem de "um cachorrinho correndo na grama", o usuário só precisa inserir o comando simples "mudar o fundo para a praia" para obter um resultado perfeito de mudança de cenário.
A equipe da ByteDance, durante o desenvolvimento do modelo, resolveu de forma inovadora o problema da escassez de dados. Através de um esquema de criação de dados multimodelo, multi-escala e multi-padrão, a quantidade, a diversidade e a qualidade dos dados foram significativamente aprimoradas. Comparado com as tecnologias existentes no setor, o SeedEdit alcançou avanços em termos de universalidade, controlabilidade e qualidade de saída. Especialmente em tarefas tradicionais como segmentação de imagens, as imagens geradas pelo SeedEdit são mais naturais e não apresentam a sensação óbvia de "aplicação de textura".
Nos testes de desempenho, o SeedEdit apresentou excelente desempenho em benchmarks como o HQ-Edit, não apenas compreendendo comandos ambíguos, mas também apresentando maior taxa de retenção e sucesso de imagem na execução de edições detalhadas. Atualmente, o modelo suporta entrada em chinês e inglês e consegue identificar com precisão expressões idiomáticas e nomes próprios chineses.
A equipe do Doubao afirma que, embora o SeedEdit atualmente apresente melhores resultados no processamento de imagens geradas por modelos do que em imagens reais, a equipe está continuamente otimizando o desempenho do modelo. No futuro, o foco será melhorar o efeito de processamento de imagens reais, a capacidade de manutenção de ID e a precisão da edição, além de explorar a geração de conteúdo de histórias e quadrinhos de longa sequência, oferecendo aos usuários uma ferramenta de criação ainda mais poderosa.
Endereço para experimentar: https://top.aibase.com/tool/seededit