Qwen1.5-110B

Primeiro modelo de código aberto com 110 bilhões de parâmetros da série Qwen1.5, com suporte multilíngue e arquitetura de decodificador Transformer eficiente.

Seleção NacionalProdutividadeInteligência ArtificialAprendizado de Máquina

Abrir Site

O Qwen1.5-110B é o maior modelo da série Qwen1.5, com 110 bilhões de parâmetros, suporte multilíngue e arquitetura de decodificador Transformer eficiente, incluindo atenção de consulta em grupo (GQA), tornando a inferência do modelo mais eficiente. Seu desempenho em avaliações de capacidades básicas é comparável ao Meta-Llama3-70B, e se destaca em avaliações de bate-papo, incluindo MT-Bench e AlpacaEval 2.0. O lançamento deste modelo demonstra o enorme potencial de escalonamento do tamanho do modelo e sugere que melhorias de desempenho ainda maiores podem ser alcançadas através da expansão de dados e do tamanho do modelo.

Best AI Websites & Tools

Qwen1.5-110B

Qwen1.5-110B Situação do Tráfego Mais Recente

Qwen1.5-110B Tendência de Visitas

Qwen1.5-110B Distribuição Geográfica das Visitas

Qwen1.5-110B Fontes de Tráfego

Qwen1.5-110B Alternativas

Qwen1.5-110B — Primeiro modelo de código aberto com 110 bilhões de parâmetros da série Qwen1.5, com suporte multilíngue e arquitetura de decodificador Transformer eficiente.

Modelo de Geração de Voz CosyVoice 2.0-0.5B — Modelo de síntese de voz eficiente e multilíngue

RWKV v6 Finch 14B — RWKV v6 Finch 14B, modelo de linguagem grande de código aberto, eficiente no processamento de textos longos.

C4AI Command R+ 08-2024 — Modelo de geração de diálogo multilíngue avançado com 104 bilhões de parâmetros.

MAP-NEO — Um modelo de linguagem grande completamente de código aberto, oferecendo capacidades avançadas de processamento de linguagem natural.

Instella — Instella é um modelo de linguagem de código aberto de alto desempenho desenvolvido pela AMD, projetado para acelerar o desenvolvimento de modelos de linguagem de código aberto.

Migician — Migician é um modelo de linguagem grande multimodal focado na localização de imagens múltiplas, capaz de realizar localização precisa de imagens múltiplas de forma livre.

IndexTTS — Sistema de texto para voz (TTS) de amostra zero, eficiente e controlável em nível industrial

Qwen — Qwen Chat é uma ferramenta de bate-papo de inteligência artificial baseada em um modelo de linguagem avançado, oferecendo conversas inteligentes e diversas funcionalidades.

FireRedASR — Modelo de Reconhecimento Automático de Fala (RAF) em mandarim padrão de nível industrial e código aberto, compatível com diversas aplicações.

RAG-FiT — RAG-FiT é uma biblioteca para aprimorar a capacidade dos LLMs de usar informações externas, ajustando finamente os modelos com um conjunto de dados RAG aprimorado especialmente criado.

Tülu 3 405B — Tülu 3 405B é um modelo de linguagem de código aberto em larga escala, com desempenho aprimorado por meio de aprendizado por reforço.

SpeechGPT 2.0-prévia — O primeiro sistema de interação em tempo real de nível humano orientado para inteligência contextual, suportando interação de voz multi-emocional e multi-estilo.

Baichuan-M1-14B — Modelo de linguagem extenso de código aberto desenvolvido pela Baichuan Intelligence, otimizado para cenários médicos, com capacidades gerais excepcionais e desempenho superior na área médica.

Sonus-1 — Sonus-1: Inaugurando uma nova era para modelos de linguagem de grande porte (LLMs)

Valley 2.0 — Modelo de linguagem grande multi-modal, aprimora a capacidade de processamento de dados de texto, imagem e vídeo.

Ruyi-Mini-7B — Modelo de geração de vídeo a partir de imagem de código aberto

Recursal AI — Tornando a inteligência artificial acessível a todos

InternVL 2.5 — Série de modelos de linguagem grandes multimodais de código aberto

OLMo-2-1124-7B-RM — Modelo de linguagem grande, usado para geração e classificação de texto

HunyuanVideo — Framework de treinamento de modelos de geração de vídeo de grande porte de código aberto da Tencent

OLMo-2-1124-13B-DPO — Modelo de linguagem inglês de alto desempenho, adequado para diversas tarefas.

ProactiveAgent — Agente proativo baseado em modelos de linguagem grandes, que prevê as necessidades do usuário e oferece ajuda de forma proativa.

Skywork-o1-Open-PRM-Qwen-2.5-7B — Modelo de IA de alto desempenho, aprimorando a capacidade de tarefas de raciocínio.

OLMo 2 — Modelo de linguagem totalmente aberto de última geração

Demonstração do Qwen Turbo 1M — Demonstração do Qwen Turbo 1M é um espaço do Hugging Face fornecido pela Qwen.

O1-Journey — O1 Jornada de Replicação: Relatório de Progresso Estratégico - Parte 1

Tencent-Hunyuan-Large — Modelo de especialista misto de larga escala de código aberto líder do setor

genmoai — Modelo de geração de vídeo de código aberto