Aya Vision 8B de CohereForAI es un modelo de lenguaje visual multilingüe de 800 millones de parámetros, optimizado para diversas tareas de lenguaje visual, compatible con OCR, descripción de imágenes, razonamiento visual, resumen, preguntas y respuestas, etc. Este modelo se basa en el modelo de lenguaje C4AI Command R7B, combinado con el codificador visual SigLIP2, compatible con 23 idiomas y con una longitud de contexto de 16K. Sus principales ventajas incluyen soporte multilingüe, una potente capacidad de comprensión visual y una amplia gama de escenarios de aplicación. Este modelo se publica como pesos de código abierto para impulsar el desarrollo de la comunidad de investigación global. De acuerdo con la licencia CC-BY-NC, los usuarios deben cumplir con la política de uso aceptable de C4AI.