Aya Vision ist ein fortschrittliches visuelles Modell, das vom Cohere For AI-Team entwickelt wurde und sich auf mehrsprachige, multimodale Aufgaben konzentriert und 23 Sprachen unterstützt. Das Modell erzielt durch innovative Algorithmen wie synthetische Annotationen, mehrsprachige Datenerweiterung und die Fusion multimodaler Modelle eine deutliche Verbesserung der Leistung bei visuellen und Text-Aufgaben. Zu den Hauptvorteilen gehören die Effizienz (auch bei begrenzten Rechenressourcen) und die umfassende mehrsprachige Unterstützung. Die Veröffentlichung von Aya Vision soll die Weiterentwicklung der mehrsprachigen, multimodalen Forschung vorantreiben und der globalen Forschungsgemeinschaft technische Unterstützung bieten.