Aria-Base-64K

Modelo nativo multi-modal Mixture-of-Experts

Producto ComúnProductividadMultimodalProcesamiento de texto largo
Aria-Base-64K es uno de los modelos base de la serie Aria, diseñado específicamente para fines de investigación y entrenamiento continuo. Este modelo se ha formado después de una fase de pre-entrenamiento con texto largo, y ha sido entrenado con 33 mil millones de tokens (21 mil millones multimodales, 12 mil millones de lenguaje, 69% texto largo). Es adecuado para el pre-entrenamiento o ajuste fino de conjuntos de datos de preguntas y respuestas de videos largos o documentos largos. Incluso con recursos limitados, se puede realizar un entrenamiento posterior con un conjunto de datos de ajuste fino con instrucciones cortas y transferirlo a escenarios de preguntas y respuestas de texto largo. El modelo puede comprender hasta 250 imágenes de alta resolución o hasta 500 imágenes de resolución media, y mantiene un rendimiento básico sólido tanto en escenarios lingüísticos como multimodales.
Abrir sitio web

Aria-Base-64K Situación del tráfico más reciente

Total de visitas mensuales

29742941

Tasa de rebote

44.20%

Páginas promedio por visita

5.9

Duración promedio de la visita

00:04:44

Aria-Base-64K Tendencia de visitas

Aria-Base-64K Distribución geográfica de las visitas

Aria-Base-64K Fuentes de tráfico

Aria-Base-64K Alternativas