O Instituto de Inteligência Artificial Zhiyuan (Zhiyuan AI Institute) recentemente lançou três novos modelos vetoriais que demonstram excelente desempenho em tarefas de recuperação vetorial, estabelecendo novos patamares em vários benchmarks de avaliação.

  1. BGE-EN-ICL: Um modelo vetorial em inglês que aprimora a capacidade de expressão semântica ao incorporar exemplos de consulta-documento relacionados à tarefa como poucos exemplos.

  2. BGE-Multilingual-Gemma2: Um modelo vetorial multilíngue que apresenta desempenho excepcional, especialmente na melhoria das capacidades em chinês e inglês.

  3. BGE-Reranker-v2.5-Gemma2-Lightweight: Um modelo de reordenação multilíngue que, por meio de design otimizado, suporta saída antecipada por camada e compressão de tokens, economizando recursos computacionais.

Esses modelos são treinados com base em modelos de linguagem grandes, possuindo notável capacidade de adaptação a diferentes domínios e ampla capacidade de generalização. Eles também empregam a capacidade de aprendizado contextual e técnicas de destilação para melhorar o desempenho geral e a capacidade em tarefas de recuperação. O modelo BGE-Reranker-v2.5-Gemma2-Lightweight destaca-se pelo design leve, que o torna mais eficiente sem comprometer o desempenho excepcional.

Nos resultados experimentais, esses modelos demonstraram excelente desempenho em vários benchmarks de avaliação, como MTEB, BEIR e AIR-Bench. O BGE-Multilingual-Gemma2 se destaca em capacidade multilíngue, especialmente na melhoria das capacidades em chinês e inglês. O BGE-EN-ICL é particularmente notável em desempenho com poucos exemplos (few-shot). O BGE-Reranker-v2.5-Gemma2-Lightweight também alcançou melhores resultados na tarefa de reordenação, garantindo resultados superiores enquanto economiza recursos computacionais.

Links dos Modelos

(1) BGE-EN-ICL:

https://huggingface.co/BAAI/bge-en-icl

(2) BGE-Multilingual-Gemma2:

https://huggingface.co/BAAI/bge-multilingual-gemma2

(3) BGE-Reranker-v2.5-Gemma2-Lightweight:

https://huggingface.co/BAAI/bge-reranker-v2.5-gemma2-lightweight