Qwen1.5-110B

Premier modèle open source de la série Qwen1.5 avec 110 milliards de paramètres, prenant en charge plusieurs langues et doté d'une architecture de décodeur Transformer efficace.

Sélection NationaleProductivitéIntelligence artificielleMachine learning

Ouvrir le site Web

Qwen1.5-110B est le modèle le plus grand de la série Qwen1.5, avec 110 milliards de paramètres. Il prend en charge plusieurs langues, utilise une architecture de décodeur Transformer efficace, et intègre l'attention de requête groupée (GQA) pour une inférence plus rapide. Ses performances dans les évaluations de capacités de base sont comparables à celles de Meta-Llama3-70B, et il excelle dans les évaluations de chat, notamment MT-Bench et AlpacaEval 2.0. La publication de ce modèle démontre un potentiel énorme en matière d'extensibilité des modèles et laisse présager des améliorations de performance significatives grâce à l'augmentation des données et de la taille du modèle.

Best AI Websites & Tools

Qwen1.5-110B

Qwen1.5-110B Dernière situation du trafic

Qwen1.5-110B Tendance des visites

Qwen1.5-110B Distribution géographique des visites

Qwen1.5-110B Sources de trafic

Qwen1.5-110B Alternatives

Qwen1.5-110B — Premier modèle open source de la série Qwen1.5 avec 110 milliards de paramètres, prenant en charge plusieurs langues et doté d'une architecture de décodeur Transformer efficace.

MAP-NEO — Un grand modèle linguistique entièrement open source, offrant des capacités avancées de traitement du langage naturel.

Snowflake Arctic — Modèle d'IA d'entreprise performant, permettant la création de modèles personnalisés de haute qualité à faible coût.

Instella — Instella est un modèle linguistique open source haute performance développé par AMD, conçu pour accélérer le développement des modèles linguistiques open source.

Migician — Migician est un grand modèle linguistique multimodale axé sur la localisation multi-images, capable de réaliser une localisation précise multi-images de forme libre.

IndexTTS — Système texte-parole zéro-shot industriel, contrôlable et efficace

Qwen — Qwen Chat est un outil de chat d'intelligence artificielle basé sur un modèle linguistique avancé, offrant des conversations intelligentes et de multiples fonctionnalités.

Le Manuel des Systèmes Ultra-Scalables — Un outil dédié à la conception et à l'optimisation de systèmes ultra-scalables, offrant des solutions performantes.

FireRedASR — Modèle de reconnaissance automatique de la parole (RAP) en mandarin standard industriel open source, compatible avec de multiples scénarios d'application.

RAG-FiT — RAG-FiT est une bibliothèque conçue pour améliorer la capacité des grands modèles de langage (LLM) à exploiter des informations externes, en affinant les modèles sur un ensemble de données spécialement créé pour l'augmentation RAG.

Tülu 3 405B — Tülu 3 405B est un modèle linguistique de grande envergure, open source, dont les performances ont été améliorées par apprentissage par renforcement.

SpeechGPT 2.0 - version préliminaire — Premier système d'interaction en temps réel de niveau humain axé sur l'intelligence contextuelle, prenant en charge l'interaction vocale multi-émotionnelle et multi-stylistique.

Baichuan-M1-14B — Modèle linguistique large open source développé par Baichuan Intelligence, optimisé pour les scénarios médicaux, offrant des capacités générales et des performances exceptionnelles dans le domaine médical.

DeepSeek-R1 — DeepSeek-R1 est un modèle d'inférence haute performance, prenant en charge plusieurs langues et tâches, adapté à la recherche et aux applications commerciales.

Sonus-1 — Sonus-1 : une nouvelle ère pour les grands modèles de langage (LLM)

Valley 2.0 — Modèle linguistique de grande taille multimodale améliorant le traitement des données textuelles, images et vidéos.

Ruyi-Mini-7B — Modèle open source de génération de vidéo à partir d'image

Recursal AI — Rendre l'intelligence artificielle accessible à tous

Q-RWKV-6 32B Instruct - Aperçu — Variante de modèle RWKV la plus puissante, surpassant plusieurs benchmarks en anglais.

CosyVoice Générateur de Voix 2.0 - 0.5B — Modèle de synthèse vocale performant et multilingue

InternVL 2.5 — Série de grands modèles linguistiques multimodaux open source

HunyuanVideo — Framework d'entraînement de modèles de génération vidéo de grande taille, open source de Tencent

OLMo-2-1124-13B-DPO — Modèle linguistique performant pour l'anglais, adapté à diverses tâches.

Ai2 OpenScholar — Modèle linguistique amélioré par la recherche de documents scientifiques

Llama-3.1-Tulu-3-8B-DPO — Modèle de génération de texte avancé, prenant en charge diverses tâches

Llama-3.1-Tulu-3-8B — Modèle de suivi d'instructions avancé, offrant des données et du code open source.

Démo Qwen Turbo 1M — La démo Qwen Turbo 1M est un espace Hugging Face fourni par Qwen.

Tencent-Hunyuan-Large — Modèle de grand expert mixte open source leader du secteur

genmoai — Modèle de génération de vidéo open source