Qwen1.5-32B
Serie de modelos de lenguaje preentrenados basados en la arquitectura Transformer
Producto ComúnProductividadModelo preentrenadoTransformer
Qwen1.5 es una serie de modelos de lenguaje basados en la arquitectura Transformer de tipo decodificador, que incluye modelos de diferentes tamaños. Se caracteriza por el uso de la activación SwiGLU, bias en la atención QKV y atención de consultas agrupadas. Admite múltiples idiomas y códigos. Se recomienda el entrenamiento posterior, como SFT y RLHF. Su precio es gratuito.
Qwen1.5-32B Situación del tráfico más reciente
Total de visitas mensuales
29742941
Tasa de rebote
44.20%
Páginas promedio por visita
5.9
Duración promedio de la visita
00:04:44