Nouvelles fraîches ! La version 0.2 d'Ollama est sortie ! Cette mise à jour active par défaut la fonctionnalité de concurrence, permettant à Ollama de traiter plusieurs requêtes simultanément, offrant ainsi une expérience utilisateur plus rapide. Cette mise à jour débloque non seulement la fonctionnalité de requêtes parallèles, mais prend également en charge le chargement simultané de différents modèles, permettant à Ollama de gérer plus efficacement diverses tâches.
Selon les annonces officielles d'Ollama, cette mise à jour permet à Ollama de gérer plusieurs sessions de chat, de fournir des services d'autocomplétion de code aux équipes, de traiter simultanément différentes parties d'un document, et même d'exécuter plusieurs agents en parallèle. De plus, Ollama prend en charge le chargement de différents modèles, tels que la génération augmentée par la recherche (RAG) et les agents, permettant aux utilisateurs d'exécuter simultanément des modèles de grande et de petite taille, améliorant ainsi la flexibilité et les performances du système.
Cette mise à jour ajoute également des fonctionnalités de chargement et de déchargement automatiques des modèles, ajustant dynamiquement l'utilisation en fonction des requêtes et de la mémoire GPU, garantissant ainsi la stabilité et l'efficacité du système. Grâce à toutes ces améliorations, Ollama est devenu plus puissant et intelligent, offrant une expérience utilisateur de meilleure qualité. Envie de tester la nouvelle version Ollama 0.2 ? Cliquez sur le lien pour la télécharger !
Adresse de téléchargement officiel : https://ollama.com/download