IBM a récemment annoncé que sa plateforme de développement d'IA watsonx.ai prend désormais en charge les modèles Llama 3.18B et Llama 3.370B distillés par DeepSeek-R1. DeepSeek, grâce à la technique de distillation de connaissances, a optimisé plusieurs variantes de Llama et de Qwen en utilisant les données générées par le modèle R1, améliorant ainsi les performances du modèle.
Sur la plateforme watsonx.ai, les utilisateurs peuvent accéder aux modèles distillés DeepSeek de deux manières. Premièrement, IBM fournit des versions distillées de Llama dans le répertoire « Déploiement à la demande », permettant aux utilisateurs de déployer des instances dédiées pour garantir une inférence sécurisée. Deuxièmement, les utilisateurs peuvent également importer d'autres variantes de DeepSeek-R1, telles que les modèles distillés Qwen, via la fonction « Importation de modèles de base personnalisés », afin de répondre à des besoins applicatifs variés.
DeepSeek-R1 possède de puissantes capacités d'inférence, applicables à un large éventail de domaines, offrant aux entreprises et aux développeurs une solution IA efficace et flexible. Cette mise à jour enrichit davantage l'écosystème de modèles de watsonx.ai, aidant les utilisateurs à développer et déployer plus facilement des applications d'IA.