L'Institut de recherche sur l'intelligence artificielle de Beijing et la Haute École d'intelligence artificielle de l'Université du Peuple chinois, soutenue par GaoLing Capital, ont conjointement lancé un nouveau framework de modèle d'intelligence artificielle : MemoRAG. Ce framework, basé sur une mémoire à long terme, vise à faire progresser la technologie de génération améliorée par la recherche (RAG), lui permettant de gérer des tâches plus complexes que de simples questions-réponses.

MemoRAG adopte un modèle novateur, utilisant un processus en trois étapes : « génération d'indices basés sur la mémoire – récupération d'informations guidée par les indices – génération de contenu basé sur les fragments récupérés ». Cela permet une récupération d'informations précise dans des scénarios complexes. Cette technologie est particulièrement adaptée aux tâches dans des domaines à forte intensité de connaissances tels que le droit, la médecine, l'éducation et le codage, démontrant un potentiel considérable.

微信截图_20240918162747.png

Le principal avantage de MemoRAG réside dans sa capacité de mémoire globale, capable de traiter des données monocouches allant jusqu'à un million de mots, offrant ainsi un support puissant pour le traitement de grandes quantités de données. De plus, MemoRAG est hautement optimisable et flexible, s'adaptant rapidement aux nouvelles tâches et optimisant ses performances. Il peut également générer des indices contextuels précis à partir de la mémoire globale, améliorant ainsi la précision des réponses aux questions et permettant d'extraire des informations plus profondes des données.

Pour soutenir la recherche et l'application de MemoRAG, l'équipe du projet a rendu open source deux modèles de mémoire, ainsi qu'un guide d'utilisation et les résultats des expériences. Les expériences montrent que MemoRAG surpasse les modèles de référence dans plusieurs tests de référence. L'Institut de recherche de Beijing indique que, bien que le projet MemoRAG en soit encore à ses débuts, il attend les retours de la communauté et continuera à optimiser la légèreté du modèle, la diversité des mécanismes de mémoire et ses performances sur les données en chinois.

Rapport technique :https://arxiv.org/pdf/2409.05591

Repo :https://github.com/qhjqhj00/MemoRAG