hallucination-leaderboard
Um ranking que compara a taxa de alucinação de grandes modelos de linguagem (LLMs) ao resumir documentos curtos.
Produto ComumOutrosLLMDetecção de Alucinação
Este produto é um projeto de código aberto desenvolvido pela Vectara para avaliar a taxa de alucinação de grandes modelos de linguagem (LLMs) ao resumir documentos curtos. Ele utiliza o modelo de avaliação de alucinação Hughes da Vectara (HHEM-2.1) para detectar alucinações na saída do modelo e calcular o ranking. Esta ferramenta é de grande importância para a pesquisa e o desenvolvimento de LLMs mais confiáveis, ajudando os desenvolvedores a entender e melhorar a precisão dos modelos.
hallucination-leaderboard Situação do Tráfego Mais Recente
Total de Visitas Mensais
474564576
Taxa de Rejeição
36.20%
Média de Páginas por Visita
6.1
Duração Média da Visita
00:06:34