Le très attendu Deepseek V3 est enfin open source ! Ce nouveau modèle d'IA a réalisé une percée majeure dans les capacités de programmation multilingue. Ses performances lors des évaluations de programmation multilingue aider ont même surpassé celles de concurrents tels que Claude 3.5 et Sonnet V2, suscitant un vif intérêt dans le secteur.
Selon les informations disponibles, Deepseek V3 a réalisé un bond qualitatif en termes de performances par rapport aux versions précédentes. Le taux de réussite de Deepseek V2.5 lors des évaluations aider n'était que de 17 %, tandis que celui de V3 a grimpé à 48 %, démontrant ainsi une amélioration considérable.
Deepseek V3 utilise une architecture d'expert mixte (MoE) avec un nombre impressionnant de 685 milliards de paramètres. Cette architecture comprend 256 experts et utilise un routage sigmoïde, sélectionnant à chaque fois les 8 meilleurs experts (topk=8) pour les calculs. Cette conception permet au modèle de traiter les tâches complexes plus efficacement et d'améliorer ses performances.
La mise à disposition en open source de Deepseek V3 apportera sans aucun doute une nouvelle dynamique à la communauté de l'IA. Ses puissantes capacités de programmation devraient jouer un rôle important dans le développement de logiciels, l'automatisation et bien d'autres domaines, stimulant la modernisation intelligente de divers secteurs d'activité.
Adresse : https://huggingface.co/deepseek-ai/DeepSeek-V3-Base/tree/main