Neuigkeiten! Ollama Version 0.2 ist da! Dieses Update aktiviert standardmäßig die Parallelität, sodass Ollama mehrere Anfragen gleichzeitig bearbeiten und ein schnelleres Benutzererlebnis bieten kann. Diese Aktualisierung ermöglicht nicht nur parallele Anfragen, sondern unterstützt auch das gleichzeitige Laden verschiedener Modelle, wodurch Ollama verschiedene Aufgaben effizienter bewältigen kann.
Laut der offiziellen Ankündigung von Ollama kann die Software nun mehrere Chat-Sitzungen gleichzeitig handhaben, Code-Vervollständigungsdienste für Teams anbieten, verschiedene Teile von Dokumenten parallel verarbeiten und sogar mehrere Agents gleichzeitig ausführen. Darüber hinaus unterstützt Ollama das Laden verschiedener Modelle, wie z. B. Retrieval Augmented Generation (RAG) und Agents, sodass Benutzer große und kleine Modelle gleichzeitig ausführen und die Flexibilität und Leistung des Systems verbessern können.
Das Update beinhaltet außerdem die automatische Modell-Lade- und -Entlade-Funktion, die dynamisch an die Anfragen und die GPU-Speicherauslastung angepasst wird, um die Stabilität und Effizienz des Systems zu gewährleisten. Diese Verbesserungen machen Ollama leistungsfähiger und intelligenter und bieten den Benutzern ein besseres Erlebnis. Möchten Sie die neueste Version von Ollama 0.2 ausprobieren? Klicken Sie einfach auf den Link, um sie herunterzuladen!
Offizielle Download-Adresse: https://ollama.com/download