Google hat kürzlich offiziell die Vertex AI RAG Engine vorgestellt, ein Entwicklertool, das darauf abzielt, den komplexen Prozess der Informationsbeschaffung aus Wissensdatenbanken und deren Eingabe in Large Language Models (LLMs) zu vereinfachen. Als Teil der Vertex AI Plattform wird die Vertex AI RAG Engine als gemanagte Orchestrierungsdienstleistung und Datenframework definiert, das speziell für die Entwicklung kontextbasierter LLM-Anwendungen entwickelt wurde.
In einem Blogbeitrag vom 15. Januar erwähnte Google, dass generative KI und Large Language Models zwar verschiedene Branchen revolutionieren, aber dennoch einige Herausforderungen bestehen, wie z. B. Fehlinformationen (Erzeugung ungenauer oder sinnloser Informationen) und die begrenzte Wissensbasis über die Trainingsdaten hinaus, die die Akzeptanz durch Unternehmen behindern können. Die Vertex AI RAG Engine unterstützt Software- und KI-Entwickler durch die Implementierung der Retrieval-Augmented Generation (RAG)-Technologie beim Aufbau fundierter generativer KI-Lösungen.
Google hebt mehrere entscheidende Vorteile der Vertex AI RAG Engine hervor. Erstens ist sie sehr einfach zu bedienen: Entwickler können über die API schnell einsteigen, Prototypen erstellen und experimentieren.
Zweitens bietet die RAG Engine gemanagte Orchestrierungsfunktionen, die die Datenabfrage und die LLM-Integration effizient handhaben. Darüber hinaus können Entwickler nach Bedarf Komponenten wie Parsing, Chunking, Annotation, Embedding, Vektorspeicher und Open-Source-Modelle auswählen oder sogar eigene Komponenten definieren, was eine große Flexibilität bietet.
Darüber hinaus unterstützt die Vertex AI RAG Engine die Anbindung an verschiedene Vektor-Datenbanken wie Pinecone und Weaviate oder die direkte Verwendung der Vertex AI Suche.
Google erwähnt in seinem Blog Anwendungsbeispiele in der Finanzdienstleistungsbranche, im Gesundheitswesen und im Rechtswesen, die die breite Anwendbarkeit der Engine verdeutlichen. Gleichzeitig stellt Google umfassende Ressourcen bereit, darunter Einführungshinweise, Beispielintegrationen mit Vertex AI Vektorsuche, Vertex AI Feature Store, Pinecone und Weaviate sowie eine Anleitung zur Feinabstimmung der Retrieval-Hyperparameter, um Entwicklern den Umgang mit diesem neuen Tool zu erleichtern.