A Cohere anunciou recentemente um grande avanço em seu modelo de busca Embed3, integrando pela primeira vez a busca de imagens e a recuperação de texto de forma perfeita. Essa inovação permite que as empresas realizem buscas unificadas de imagens e texto no mesmo banco de dados, revolucionando a gestão de grandes quantidades de imagens de produtos, arquivos de design e relatórios.

Do ponto de vista técnico, o novo sistema utiliza uma arquitetura de armazenamento unificada, eliminando completamente o problema de as empresas precisarem manter vários bancos de dados independentes. O sistema suporta os principais formatos de imagem, como PNG, JPEG, WebP e GIF, com um limite de tamanho de arquivo de 5 MB. Atualmente, o sistema suporta apenas consultas de imagem única; a funcionalidade de processamento em lote ainda está em desenvolvimento.

image.png

Com o suporte da tecnologia central, o sistema converte dados comerciais em representações vetoriais, melhorando significativamente a eficiência de recuperação de dados comerciais complexos. Os desenvolvedores podem acessar a nova funcionalidade por meio da API Embed existente; as imagens devem ser enviadas como URLs de dados codificados em Base64.

Vale ressaltar que o modelo atualizado suporta mais de 100 idiomas e possui excelente compatibilidade entre plataformas. Além de funcionar na própria plataforma da Cohere, ele também pode ser implantado no Microsoft Azure e no Amazon SageMaker. A empresa, fundada pela equipe de desenvolvimento da arquitetura Transformer, recebeu um investimento de US$ 500 milhões em julho do ano passado.

No contexto da crescente importância da busca de conteúdo multi-modal, gigantes da tecnologia como Google e OpenAI também lançaram produtos semelhantes. O foco da competição atual se voltou para a velocidade de processamento, precisão e segurança necessárias para aplicações empresariais.