DeepSeek, filiale du géant chinois de la gestion de fonds spéculatifs, Huanfang Quant, a récemment lancé son dernier grand modèle linguistique spécialisé dans le raisonnement, R1-Lite-Preview. Ce modèle n'est actuellement accessible au public que via DeepSeek Chat, une plateforme de chatbot web.
DeepSeek est reconnu pour ses contributions innovantes à l'écosystème de l'IA open source. Cette nouvelle publication vise à offrir au public des capacités de raisonnement de haut niveau, tout en maintenant son engagement envers l'accessibilité et la transparence. Bien que R1-Lite-Preview ne soit actuellement disponible que via une application de chat, il a suscité un intérêt considérable grâce à ses performances proches, voire supérieures, à celles du modèle o1-preview récemment publié par OpenAI.
R1-Lite-Preview utilise un raisonnement en « chaîne de pensée » et permet de visualiser les différentes étapes de réflexion lors de la réponse aux requêtes des utilisateurs.
Même si certaines chaînes de pensée peuvent paraître absurdes ou erronées pour un humain, les réponses de R1-Lite-Preview sont globalement très précises. Il est même capable de résoudre des problèmes « pièges » qui posent difficulté à des modèles d'IA puissants tels que GPT-4o et la série Claude. Par exemple : « Combien de lettres R y a-t-il dans le mot « fraise » ? » ou « Qu'est-ce qui est le plus grand : 9,11 ou 9,9 ? »
Selon DeepSeek, le modèle excelle dans les tâches nécessitant un raisonnement logique, des réflexions mathématiques et une résolution de problèmes en temps réel. Ses performances surpassent celles d'OpenAI o1-preview sur des benchmarks établis tels qu'AIME (American Invitational Mathematics Examination) et MATH.
De plus, DeepSeek a publié des données complémentaires sur le modèle, montrant une amélioration constante de la précision lorsqu'on accorde plus de temps ou de « jetons de réflexion » au modèle pour résoudre les problèmes. Les graphiques soulignent l'augmentation des scores du modèle sur des benchmarks comme AIME avec l'augmentation de la profondeur de la réflexion.
Actuellement, R1-Lite-Preview affiche d'excellentes performances sur des benchmarks clés, capable de gérer une variété de tâches allant des mathématiques complexes aux scénarios logiques, avec des scores comparables à ceux de modèles de raisonnement de pointe tels que GPQA et Codeforces. Le processus de raisonnement transparent du modèle permet aux utilisateurs d'observer en temps réel ses étapes logiques, renforçant ainsi la responsabilité et la crédibilité du système.
Il est important de noter que DeepSeek n'a pas encore publié le code complet pour une analyse ou des tests de référence indépendants par des tiers, ni fourni d'interface API pour des tests indépendants. L'absence d'article de blog ou de documentation technique expliquant l'entraînement ou la construction de R1-Lite-Preview laisse planer le doute sur son origine.
R1-Lite-Preview est actuellement disponible gratuitement via DeepSeek Chat (chat.deepseek.com), mais son mode « réflexion approfondie » est limité à 50 messages par jour, permettant aux utilisateurs de tester ses capacités. DeepSeek prévoit de publier une version open source des modèles de la série R1 et les API correspondantes, afin de soutenir davantage le développement de la communauté de l'IA open source.
DeepSeek continue de stimuler l'innovation dans le domaine de l'IA open source. Le lancement de R1-Lite-Preview ajoute une nouvelle dimension à ses capacités en matière de raisonnement et d'évolutivité. Avec l'exploration par les entreprises et les chercheurs des applications de l'IA axée sur le raisonnement, l'engagement envers l'ouverture de DeepSeek permettra à ses modèles de devenir une ressource importante pour le développement et l'innovation.
Accès officiel : https://www.deepseek.com/
Points clés :
🌟 DeepSeek lance le modèle R1-Lite-Preview, dont les performances sont proches et dépassent celles d'OpenAI o1.
📊 Le modèle présente un processus de raisonnement transparent, permettant aux utilisateurs d'observer les étapes logiques en temps réel.
🔍 Capacité d'apprentissage profond et de raisonnement logique remarquables. Une version open source et des API seront prochainement disponibles.