VisRAG é um processo inovador de Geração Aprimorada por Recuperação (RAG) baseado em Modelo de Linguagem Visual (VLM). Diferentemente dos RAGs tradicionais baseados em texto, o VisRAG processa diretamente os documentos como imagens por meio de um VLM, para então recuperá-los e aprimorar a capacidade de geração do VLM. Este método maximiza a preservação das informações contidas nos documentos originais, eliminando a perda de informações introduzida durante o processo de análise. A aplicação do modelo VisRAG em documentos multimodais demonstra seu grande potencial em recuperação de informações e geração de texto aprimorada.