Qwen1.5-110B

Primer modelo de lenguaje abierto de la serie Qwen1.5 con 110 mil millones de parámetros, compatible con múltiples idiomas y con una arquitectura de decodificador Transformer eficiente.

Selección NacionalProductividadInteligencia artificialAprendizaje automático

Abrir sitio web

Qwen1.5-110B es el modelo más grande de la serie Qwen1.5, con 110 mil millones de parámetros. Admite múltiples idiomas, emplea una arquitectura de decodificador Transformer eficiente e incluye atención de consulta agrupada (GQA), lo que lo hace más eficiente en la inferencia del modelo. En las evaluaciones de capacidades básicas, se compara con Meta-Llama3-70B, y destaca en las evaluaciones de chat, incluyendo MT-Bench y AlpacaEval 2.0. El lanzamiento de este modelo muestra un enorme potencial en la escalabilidad del tamaño del modelo y presagia mejoras de rendimiento aún mayores mediante la ampliación de los datos y el tamaño del modelo en el futuro.

Best AI Websites & Tools

Qwen1.5-110B

Qwen1.5-110B Situación del tráfico más reciente

Qwen1.5-110B Tendencia de visitas

Qwen1.5-110B Distribución geográfica de las visitas

Qwen1.5-110B Fuentes de tráfico

Qwen1.5-110B Alternativas

Qwen1.5-110B — Primer modelo de lenguaje abierto de la serie Qwen1.5 con 110 mil millones de parámetros, compatible con múltiples idiomas y con una arquitectura de decodificador Transformer eficiente.

RWKV v6 Finch 14B — RWKV v6 Finch 14B, un modelo de lenguaje grande de código abierto, eficiente en el procesamiento de textos largos.

MAP-NEO — Un modelo de lenguaje grande completamente de código abierto que ofrece capacidades avanzadas de procesamiento del lenguaje natural.

Snowflake Arctic — Modelo de inteligencia artificial empresarial de alta eficiencia que permite crear modelos personalizados de alta calidad a bajo coste.

Instella — Instella es un modelo de lenguaje de código abierto de alto rendimiento desarrollado por AMD, diseñado para acelerar el desarrollo de modelos de lenguaje de código abierto.

Migician — Migician es un modelo de lenguaje multimodal de gran tamaño centrado en la localización de múltiples imágenes, capaz de realizar una localización precisa de múltiples imágenes de forma libre.

IndexTTS — Sistema de texto a voz (TTS) de muestra cero, eficiente y controlable de grado industrial

El Manual de Sistemas Ultraescalables — Una herramienta enfocada en el diseño y optimización de sistemas ultraescalables, ofreciendo soluciones eficientes.

RAG-FiT — RAG-FiT es una biblioteca diseñada para mejorar la capacidad de los LLMs (Modelos de Lenguaje Grande) de utilizar información externa mediante el ajuste fino del modelo con un conjunto de datos RAG (Recuperación Aumentada de Generación) especialmente creado.

Tülu 3 405B — Tülu 3 405B es un modelo de lenguaje abierto de gran escala, cuyo rendimiento se ha mejorado mediante aprendizaje por refuerzo.

SpeechGPT 2.0-versión preliminar — Primer sistema de interacción en tiempo real a nivel humano orientado a la inteligencia contextual, que admite la interacción de voz con múltiples emociones y estilos.

Baichuan-M1-14B — Modelo de lenguaje extenso de código abierto desarrollado por Baichuan Intelligence, optimizado específicamente para escenarios médicos. Posee una capacidad general excepcional y un rendimiento superior en el ámbito médico.

Sonus-1 — Sonus-1: Inaugurando una nueva era para los modelos de lenguaje grandes (LLM)

Valley 2.0 — Modelo de lenguaje grande multimodal que mejora el procesamiento de datos de texto, imágenes y vídeo.

Ruyi-Mini-7B — Modelo de generación de vídeo a partir de imágenes de código abierto

Q-RWKV-6 32B Instruct Vista previa — Variante de modelo RWKV más potente, superando varios benchmarks en inglés.

CosyVoice Generación de Voz Modelo grande 2.0-0.5B — Modelo de síntesis de voz eficiente y multilingüe

InternVL 2.5 — Serie de modelos lingüísticos grandes multimodales de código abierto

OLMo-2-1124-7B-RM — Modelo de lenguaje grande para generación y clasificación de texto

OLMo-2-1124-7B-SFT — Modelo de generación de texto en inglés de alto rendimiento

HunyuanVideo — Marco de entrenamiento de modelos de generación de video a gran escala de código abierto de Tencent

OLMo-2-1124-13B-DPO — Modelo de lenguaje de alto rendimiento en inglés, adecuado para diversas tareas.

ProactiveAgent — Agente proactivo basado en modelos lingüísticos de gran tamaño (LLM), que predice las necesidades del usuario y ofrece ayuda de forma proactiva.

Ai2 OpenScholar — Modelo de lenguaje mejorado con búsqueda para la recuperación integral de literatura científica

OLMo 2 — Modelo de lenguaje completamente abierto de última generación

Llama-3.1-Tulu-3-8B-DPO — Modelo avanzado de generación de texto, compatible con diversas tareas

Llama-3.1-Tulu-3-8B — Modelo avanzado de seguimiento de instrucciones, con datos y código de fuente abierta.

Qwen Turbo 1M Demo — Qwen Turbo 1M Demo es un espacio de Hugging Face proporcionado por Qwen.

O1-Journey — O1-Journey: Informe de progreso estratégico - Parte 1

Tencent-Hunyuan-Large — Modelo de experto mixto grande y de código abierto líder en el sector