A Cohere lançou o Embed3, seu modelo de busca de IA multimodal de última geração — agora com suporte para busca multimodal, o que significa que os usuários podem realizar buscas de nível empresarial não apenas por texto, mas também por imagens.
Desde seu lançamento no ano passado, o Embed3 tem sido continuamente otimizado para ajudar as empresas a transformar documentos em representações digitais, e esta atualização o tornará ainda melhor em buscas de imagens.
Aidan Gonzales, cofundador e CEO da Cohere, compartilhou nas redes sociais um gráfico mostrando a melhoria no desempenho do Embed3 em buscas de imagens.
Em um post de blog, a Cohere afirma que este novo recurso ajudará as empresas a explorar totalmente os dados massivos armazenados em imagens, aumentando a eficiência do trabalho. As empresas podem pesquisar ativos multimodais, como relatórios complexos, catálogos de produtos e arquivos de design, de forma mais rápida e precisa.
Com o desenvolvimento contínuo da busca multimodal, o Embed3 da Cohere pode gerar embeddings de texto e imagem simultaneamente. Este novo método de embedding permite que os usuários gerenciem imagens e texto em um espaço latente unificado, em vez de armazená-los separadamente. Esta melhoria aumentará significativamente a qualidade dos resultados da busca, evitando o viés para dados de texto e permitindo uma melhor compreensão do significado por trás dos dados.
Segue abaixo exemplos de uso prático do Embed3:
Gráficos e tabelas: As representações visuais são essenciais para a compreensão de dados complexos. Os usuários agora podem encontrar facilmente os gráficos apropriados para informar suas decisões de negócios. Basta descrever um insight específico e o Embed3 recuperará os gráficos e tabelas relevantes, permitindo que os funcionários de diferentes equipes tomem decisões baseadas em dados de forma mais eficiente.
Catálogos de produtos de e-commerce: Os métodos de busca tradicionais costumam limitar os clientes a encontrar produtos por meio de descrições de produtos baseadas em texto. O Embed3 muda essa experiência de busca. Os varejistas podem criar aplicativos que permitem a busca por imagens de produtos, além das descrições de texto, criando uma experiência diferenciada para os compradores e aumentando as taxas de conversão.
Arquivos e modelos de design: Os designers costumam trabalhar com um grande número de ativos, confiando na memória ou em regras de nomenclatura rígidas para organizar os visuais. O Embed3 simplifica a busca por modelos de IU específicos, modelos visuais e slides de apresentação com base em descrições de texto. Isso simplifica o processo criativo.
O Embed3 suporta mais de 100 idiomas, o que significa que ele pode atender a uma gama mais ampla de usuários. Atualmente, este Embed3 multimodal está disponível na plataforma da Cohere e no Amazon SageMaker.
À medida que mais usuários se acostumam com a busca por imagens, as empresas também estão acompanhando essa tendência, e a atualização da Cohere oferece a elas a oportunidade de desfrutar de uma experiência de busca mais flexível. A Cohere atualizou sua API em setembro, permitindo que os clientes migrem facilmente de modelos concorrentes para modelos Cohere.
Blog oficial: https://cohere.com/blog/multimodal-embed-3
Destaques:
🌟 O Embed3 suporta busca multimodal, permitindo que os usuários busquem por imagens e texto.
📈 O modelo atualizado melhora significativamente o desempenho da busca por imagens, ajudando as empresas a explorar o valor dos dados.
🔄 A Cohere atualizou sua API em setembro, simplificando o processo de migração de clientes de outros modelos.