Google ha lanzado recientemente Vertex AI RAG, una herramienta de desarrollo diseñada para simplificar el complejo proceso de recuperar información relevante de un repositorio de conocimiento e introducirla en un modelo lingüístico grande (LLM).

Google, google

En una entrada de blog del 15 de enero, Google mencionó que, si bien la inteligencia artificial generativa y los modelos lingüísticos grandes están revolucionando diversos sectores, aún existen desafíos, como la información falsa (generación de información inexacta o sin sentido) y las limitaciones de conocimiento más allá de los datos de entrenamiento, lo que puede obstaculizar la adopción empresarial. Vertex AI RAG ayuda a los desarrolladores de software e inteligencia artificial a construir soluciones de inteligencia artificial generativa fundamentadas mediante la implementación de la tecnología de generación mejorada por recuperación (RAG).

Google destaca varias ventajas clave de Vertex AI RAG. En primer lugar, su facilidad de uso: los desarrolladores pueden empezar rápidamente a través de la API para prototipar y experimentar.

En segundo lugar, el motor RAG ofrece funciones de orquestación administradas que procesan eficazmente la recuperación de datos y la integración de LLM. Además, los desarrolladores pueden elegir componentes como análisis, segmentación, anotación, incrustaciones, almacenamiento vectorial y modelos de código abierto según sus necesidades, o incluso personalizar sus propios componentes, lo que demuestra una gran flexibilidad.

Además, Vertex AI RAG admite la conexión con varias bases de datos vectoriales, como Pinecone y Weaviate, o el uso directo de la búsqueda de Vertex AI.

Google menciona en su blog casos de uso en sectores como servicios financieros, atención médica y legal, mostrando su amplia aplicabilidad. También proporciona abundantes recursos, incluyendo notas de inicio, ejemplos de integración con la búsqueda vectorial de Vertex AI, la biblioteca de características de Vertex AI, Pinecone y Weaviate, y una guía para la optimización de hiperparámetros de recuperación, para ayudar a los desarrolladores a dominar y aplicar esta nueva herramienta.