Aria-Base-64K
Modelo nativo multi-modal Mixture-of-Experts
Producto ComúnProductividadMultimodalProcesamiento de texto largo
Aria-Base-64K es uno de los modelos base de la serie Aria, diseñado específicamente para fines de investigación y entrenamiento continuo. Este modelo se ha formado después de una fase de pre-entrenamiento con texto largo, y ha sido entrenado con 33 mil millones de tokens (21 mil millones multimodales, 12 mil millones de lenguaje, 69% texto largo). Es adecuado para el pre-entrenamiento o ajuste fino de conjuntos de datos de preguntas y respuestas de videos largos o documentos largos. Incluso con recursos limitados, se puede realizar un entrenamiento posterior con un conjunto de datos de ajuste fino con instrucciones cortas y transferirlo a escenarios de preguntas y respuestas de texto largo. El modelo puede comprender hasta 250 imágenes de alta resolución o hasta 500 imágenes de resolución media, y mantiene un rendimiento básico sólido tanto en escenarios lingüísticos como multimodales.
Aria-Base-64K Situación del tráfico más reciente
Total de visitas mensuales
29742941
Tasa de rebote
44.20%
Páginas promedio por visita
5.9
Duración promedio de la visita
00:04:44