Google a récemment lancé officiellement le moteur Vertex AI RAG, un outil de développement conçu pour simplifier le processus complexe de récupération d'informations pertinentes à partir d'une base de connaissances et de leur intégration dans des grands modèles linguistiques (LLM).

Google, google

Dans un billet de blog du 15 janvier, Google a mentionné que, bien que l'intelligence artificielle générative et les grands modèles linguistiques soient en train de révolutionner divers secteurs, certains défis persistent, tels que la désinformation (génération d'informations inexactes ou sans signification) et les limites de connaissances au-delà des données d'entraînement, ce qui peut freiner l'adoption par les entreprises. Le moteur Vertex AI RAG permet de résoudre ces problèmes grâce à la mise en œuvre de la technologie de génération améliorée par la recherche (RAG), aidant les développeurs de logiciels et d'intelligence artificielle à construire des solutions d'IA générative fondées sur des preuves.

Google a souligné plusieurs avantages clés du moteur Vertex AI RAG. Premièrement, son utilisation est très simple : les développeurs peuvent rapidement commencer à l'utiliser via une API pour créer des prototypes et réaliser des expérimentations.

Deuxièmement, le moteur RAG offre des fonctionnalités d'orchestration gérées, permettant de gérer efficacement la récupération de données et l'intégration des LLM. De plus, les développeurs peuvent choisir les composants en fonction de leurs besoins : analyse, segmentation, annotation, plongement, stockage vectoriel et modèles open source. Ils peuvent même personnaliser leurs propres composants, ce qui témoigne d'une grande flexibilité.

De plus, le moteur Vertex AI RAG prend en charge la connexion à plusieurs bases de données vectorielles, telles que Pinecone et Weaviate, ou l'utilisation directe de la recherche Vertex AI.

Google a mentionné dans son billet de blog des exemples d'applications dans les secteurs des services financiers, de la santé et du droit, démontrant ainsi sa grande polyvalence. Google fournit également de nombreuses ressources, notamment des notes de démarrage, des exemples d'intégration avec la recherche vectorielle Vertex AI, la bibliothèque de fonctionnalités Vertex AI, Pinecone et Weaviate, ainsi qu'un guide d'optimisation des hyperparamètres de recherche, pour aider les développeurs à mieux maîtriser et utiliser ce nouvel outil.