El Instituto de Investigación de Inteligencia Artificial de Beijing y la Facultad de Inteligencia Artificial GaoLing de la Universidad del Pueblo Chino han lanzado conjuntamente un innovador marco de modelo de inteligencia artificial: MemoRAG. Este marco, basado en la memoria a largo plazo, tiene como objetivo impulsar el desarrollo de la tecnología de generación mejorada por recuperación (RAG), permitiéndole manejar tareas más complejas que van más allá de las simples preguntas y respuestas.
MemoRAG emplea un novedoso modelo que, mediante un proceso de "generación de pistas basada en la memoria - obtención de información guiada por pistas - generación de contenido basada en fragmentos recuperados", logra obtener información precisa en escenarios complejos. Esta tecnología es especialmente adecuada para tareas en campos intensivos en conocimiento como el judicial, médico, educativo y de codificación, mostrando un gran potencial.
La principal ventaja de MemoRAG reside en su capacidad de memoria global, pudiendo procesar datos de un solo contexto de hasta un millón de palabras, lo que proporciona un sólido soporte para el procesamiento de grandes cantidades de datos. Además, MemoRAG presenta una alta optimización y flexibilidad, adaptándose rápidamente a nuevas tareas y optimizando su rendimiento. También puede generar pistas de contexto precisas a partir de la memoria global, mejorando la precisión de las respuestas a preguntas y extrayendo conocimientos profundos de los datos.
Para apoyar la investigación y aplicación posterior de MemoRAG, el equipo del proyecto ha publicado en código abierto dos modelos de memoria, proporcionando además una guía de uso y los resultados de los experimentos. Los experimentos muestran que MemoRAG supera a los modelos de referencia en varias pruebas de referencia. El Instituto de Investigación de Beijing afirma que, aunque el proyecto MemoRAG se encuentra todavía en una fase inicial, esperan los comentarios de la comunidad y continuarán optimizando la ligereza del modelo, la diversidad de los mecanismos de memoria y su rendimiento con datos en chino.
Informe técnico:https://arxiv.org/pdf/2409.05591
Repositorio:https://github.com/qhjqhj00/MemoRAG