O Google lançou recentemente o Vertex AI RAG Engine, uma ferramenta de desenvolvimento projetada para simplificar o complexo processo de recuperação de informações relevantes de um banco de conhecimento e alimentá-las em modelos de linguagem grandes (LLMs). Como parte da plataforma Vertex AI, o Vertex AI RAG Engine é definido como um serviço de orquestração gerenciado e uma estrutura de dados, especialmente desenvolvido para o desenvolvimento de aplicativos LLM aprimorados por contexto.

Google, google

Em um post de blog de 15 de janeiro, o Google mencionou que, embora a inteligência artificial generativa e os modelos de linguagem grandes estejam revolucionando vários setores, ainda existem alguns desafios, como informações falsas (geração de informações imprecisas ou sem sentido) e limitações de conhecimento além dos dados de treinamento, o que pode dificultar a adoção pelas empresas. O Vertex AI RAG Engine, por meio da implementação da tecnologia de geração aprimorada por recuperação (RAG), ajuda desenvolvedores de software e IA a construir soluções de IA generativa baseadas em evidências.

O Google destacou algumas vantagens principais do Vertex AI RAG Engine. Primeiro, é muito fácil de usar; os desenvolvedores podem começar rapidamente usando a API para criar protótipos e experimentar.

Em segundo lugar, o RAG Engine fornece recursos de orquestração gerenciados, capazes de lidar eficientemente com a recuperação de dados e a integração de LLMs. Além disso, os desenvolvedores podem escolher componentes como análise, segmentação, anotação, incorporação, armazenamento vetorial e modelos de código aberto, de acordo com suas necessidades, podendo até mesmo personalizar seus próprios componentes, demonstrando grande flexibilidade.

Além disso, o Vertex AI RAG Engine suporta a conexão com vários bancos de dados vetoriais, como Pinecone e Weaviate, ou o uso direto do Vertex AI Search.

O Google mencionou em seu blog casos de uso do mecanismo em setores como serviços financeiros, saúde e jurídico, demonstrando sua ampla aplicabilidade. O Google também fornece uma variedade de recursos, incluindo notas de introdução, exemplos de integração com o Vertex AI Vector Search, Vertex AI Feature Store, Pinecone e Weaviate, e um guia para otimizar os hiperparâmetros de recuperação, ajudando os desenvolvedores a dominar e aplicar melhor esta nova ferramenta.