智源推出全能视觉生成模型 OmniGen，集多种功能于一身

AIbase基地

Publicado emNotícias e Informações de IA · 3 minutos de leitura · Oct 29, 2024

717

O Instituto de Pesquisa de Inteligência Artificial de Pequim (BAAI) anunciou recentemente o lançamento do OmniGen, um novo modelo de geração de imagens multifuncional, marcando um avanço significativo no campo da geração de imagens. O modelo OmniGen é conhecido por sua unidade, simplicidade e capacidade de transferência de conhecimento entre tarefas, podendo lidar com diversas tarefas de geração de imagens em um único framework, incluindo geração de imagem a partir de texto, edição de imagens, geração orientada por tema e geração condicionada por visão.

微信截图_20241029103628.png

A principal vantagem do OmniGen reside em sua arquitetura simplificada e operação amigável. Os usuários podem realizar tarefas complexas de geração de imagens com instruções simples, sem a necessidade de plug-ins adicionais ou etapas de processamento complexas. Este aprendizado em formato unificado permite que o OmniGen transfira conhecimento de forma eficiente entre diferentes tarefas, lidando com tarefas e domínios desconhecidos e exibindo funcionalidades inovadoras.

As capacidades do modelo OmniGen não se limitam ao descrito acima; ele também inclui recursos básicos de processamento de imagens, como redução de ruído e extração de bordas. Os pesos e o código do modelo foram abertos, permitindo que os usuários explorem mais as capacidades do OmniGen e o ajuste fino conforme necessário. O Instituto de Pesquisa de Pequim construiu um conjunto de dados de geração de imagens unificado, de grande escala e diversificado, X2I, contendo aproximadamente 100 milhões de imagens, que será disponibilizado em código aberto no futuro para impulsionar o desenvolvimento do campo da geração de imagens universais.

Links relacionados:

Artigo: https://arxiv.org/pdf/2409.11340

Código: https://github.com/VectorSpaceLab/OmniGen

Demonstração: https://huggingface.co/spaces/Shitao/OmniGen

Luma AI: Técnica IMM de pré-treinamento de imagem de código aberto acelera a geração de imagens em dez vezes

Vocês já sentiram que, mesmo após treinar modelos de imagem com grandes quantidades de dados, a geração de imagens de alta qualidade é lenta como uma lesma? Não se preocupe, a Luma AI recentemente lançou uma técnica de pré-treinamento de modelos de imagem chamada Inductive Moment Matching (IMM), que afirma acelerar a geração de imagens de alta qualidade em uma velocidade incrível. Estagnação de algoritmos? Luma AI quebrando barreiras! Nos últimos anos, a comunidade de IA tem...

Modelo de imagem Ideogram 2a lançado oficialmente: geração de imagens de IA mais rápida e econômica

A empresa canadense de geração de imagens de IA, Ideogram, anunciou hoje o lançamento oficial de seu novo modelo de imagem, o Ideogram 2a, disponível no site da Ideogram, na API e nas plataformas de parceiros. Este lançamento gerou uma rápida discussão na plataforma X, sendo considerado uma atualização importante no campo da geração de imagens por IA a partir de texto. O Ideogram 2a atrai a atenção de criadores e desenvolvedores em todo o mundo com sua velocidade de geração mais rápida, custo menor e capacidades de design gráfico e fotografia otimizadas.

Notícias e Informações de IA

智源推出全能视觉生成模型 OmniGen，集多种功能于一身

AIbase基地

Notícias de IA Relacionadas Recomendadas

Luma AI: Técnica IMM de pré-treinamento de imagem de código aberto acelera a geração de imagens em dez vezes

Fluxo de Silício: Modelos não registrados offline. Usuários devem migrar.

Sensacional! MiniMax lança novo modelo de geração de imagens, Image-01, com custo apenas 1/10!

Modelo de imagem Ideogram 2a lançado oficialmente: geração de imagens de IA mais rápida e econômica