ZeroBench

ZeroBench es un benchmark visual de alta dificultad para modelos multimodales grandes contemporáneos.

Producto ComúnImagenMultimodalBenchmark
ZeroBench es un benchmark diseñado para evaluar la capacidad de comprensión visual de los Modelos Multimodales Grandes (LMMs). Desafía los límites de los modelos actuales mediante 100 problemas complejos cuidadosamente diseñados y revisados, junto con 334 subproblemas. Este benchmark busca suplir las deficiencias de los benchmarks visuales existentes, proporcionando una herramienta de evaluación más desafiante y de mayor calidad. Las principales ventajas de ZeroBench son su alta dificultad, ligereza, diversidad y alta calidad, lo que permite una discriminación eficaz del rendimiento de los modelos. Además, ofrece una evaluación detallada de los subproblemas, ayudando a los investigadores a comprender mejor la capacidad de razonamiento de los modelos.
Abrir sitio web

ZeroBench Alternativas