Yuan2.0-M32

Modèle linguistique performant à routage d'attention expert mixte

Produit OrdinaireProgrammationExperts mixtesRoutage par attention

Yuan2.0-M32 est un modèle linguistique à experts mixtes (MoE) doté de 32 experts, dont 2 actifs. Il introduit un nouveau réseau de routage – le routage par attention – pour une sélection d'experts plus efficace, améliorant ainsi la précision de 3,8 %. Entraîné à partir de zéro sur 2000 milliards de jetons, son coût de calcul est seulement de 9,25 % de celui d'un modèle dense de taille de paramètres équivalente. Il affiche des performances compétitives en codage, en mathématiques et dans divers domaines spécialisés, n'utilisant que 3,7 milliards de paramètres actifs, avec un calcul en passage direct par jeton de seulement 7,4 GFLOPS, soit 1/19ème des besoins de Llama3-70B. Il surpasse Llama3-70B sur les benchmarks MATH et ARC-Challenge, atteignant des précisions de 55,9 % et 95,8 % respectivement.

Best AI Websites & Tools

Yuan2.0-M32

Yuan2.0-M32 Dernière situation du trafic

Yuan2.0-M32 Tendance des visites

Yuan2.0-M32 Distribution géographique des visites

Yuan2.0-M32 Sources de trafic

Yuan2.0-M32 Alternatives

Yuan2.0-M32 — Modèle linguistique performant à routage d'attention expert mixte

Yuan2-M32-hf-int4 — Modèle linguistique expert mixte haute performance

YuLan-Mini — Un modèle linguistique léger et performant de 240 millions de paramètres

Yuan2.0-M32-hf-int8 — Modèle linguistique expert mixte haute performance

Qwen2 — Modèle de pré-entraînement multilingue de nouvelle génération, aux performances exceptionnelles.

Instella — Instella est un modèle linguistique open source haute performance développé par AMD, conçu pour accélérer le développement des modèles linguistiques open source.

Framework Desktop — Framework Desktop est un mini-ordinateur de bureau hautes performances compatible avec les processeurs AMD Ryzen™ AI Max 300 Series, offrant des performances exceptionnelles pour l'IA et les jeux.

smallpond — Un framework de traitement de données léger basé sur DuckDB et 3FS

Mercury Coder — Mercury Coder est un modèle linguistique de génération de code hautes performances basé sur un modèle de diffusion.

DualPipe — Algorithme de parallélisation pipeline bidirectionnel pour le chevauchement des calculs et des communications pendant l'entraînement V3/R1.

GeForce RTX 5070 Ti — La carte graphique NVIDIA GeForce RTX 5070 Ti, basée sur l'architecture Blackwell, prend en charge la technologie DLSS 4, offrant des performances exceptionnelles pour les jeux et la création.

iPhone 16e — iPhone 16e : le dernier iPhone, abordable et performant, équipé de la puce A18 et d’un appareil photo Fusion 48 MP.

PaliGemma 2 mix — PaliGemma 2 mix est un modèle linguistique visuel multifonctionnel, adapté à diverses tâches et domaines.

Goedel-Prover — Goedel-Prover est un modèle de preuve de théorème automatisée open source, axé sur la preuve formelle de problèmes mathématiques.

OpenThinker-32B — OpenThinker-32B est un puissant modèle d'inférence open source, conçu pour améliorer les capacités d'inférence sur des données ouvertes.

FireRedASR-AED-L — Modèle de reconnaissance automatique de la parole (RAP) industriel open source, prenant en charge le mandarin, les dialectes chinois et l'anglais, aux performances exceptionnelles.

Webdone — Créez des sites web et des pages de destination époustouflants rapidement grâce à l'IA, sans aucune compétence en codage. Compatible avec Next.js.

MNN — MNN est un moteur d'inférence léger et haute performance open source d'Alibaba, prenant en charge plusieurs formats de modèles courants.

Gemini 2.0 Family — Gemini 2.0 est le dernier modèle d'IA générative lancé par Google, incluant les versions Flash, Flash-Lite et Pro.

Gemini 2.0 Pro — Gemini Pro est un modèle d'IA haute performance développé par Google DeepMind, spécialisé dans le traitement de tâches complexes et les performances de programmation.

DeepClaude — API et interface de chat unifiés combinant les capacités de raisonnement de DeepSeek R1 et la créativité et la génération de code de Claude.

Confucius-o1-14B — Modèle d'inférence léger développé par NetEase Youdao, déployable sur un seul GPU, offrant des capacités d'inférence similaires à o1.

Galaxy S25 — Le Galaxy S25 est le dernier smartphone de Samsung, offrant des performances puissantes et une technologie IA avancée.

DeepSeek-R1-Distill-Qwen-32B — DeepSeek-R1-Distill-Qwen-32B est un modèle linguistique open source haute performance, adapté à diverses tâches de génération de texte.

GeForce RTX 5090 — La NVIDIA® GeForce RTX™ 5090 est le GPU GeForce le plus puissant à ce jour, offrant des capacités révolutionnaires aux joueurs et aux créateurs.

OKMath IA — Puissant solveur de problèmes mathématiques IA, offrant des réponses précises et des solutions étape par étape.

Eurus-2-7B-PRIME — Modèle linguistique de 7 milliards de paramètres, entraîné avec la méthode PRIME et conçu pour améliorer les capacités de raisonnement.

Apprenez-moi n'importe quoi — Plateforme d'apprentissage en ligne proposant une variété de vidéos éducatives.

FlexRAG — Un framework flexible et haute performance pour la recherche et la génération d'informations.

Math Tutor on Groq — Un tuteur de mathématiques IA, calculant et affichant en temps réel des problèmes mathématiques au format LaTeX.