¡Últimas noticias! ¡Ya está disponible Ollama versión 0.2! Esta actualización habilita por defecto la funcionalidad de concurrencia, permitiendo que Ollama procese múltiples solicitudes simultáneamente, ofreciendo una experiencia más rápida al usuario.
Según el anuncio oficial de Ollama, esta actualización permite gestionar varias conversaciones de chat, proporcionar servicios de completado de código para equipos, procesar simultáneamente diferentes partes de un documento, e incluso ejecutar múltiples agentes al mismo tiempo. Además, Ollama admite la carga de diferentes modelos, como la recuperación aumentada de generación (RAG) y agentes, permitiendo ejecutar modelos grandes y pequeños simultáneamente, mejorando la flexibilidad y el rendimiento del sistema.
Esta actualización también incluye la carga y descarga automática de modelos, ajustándose dinámicamente según las solicitudes y el uso de la memoria GPU para garantizar la estabilidad y eficiencia del sistema. Estas mejoras hacen que Ollama sea más potente e inteligente, ofreciendo una experiencia de usuario superior.
¿Quieres probar la nueva versión Ollama 0.2? ¡Haz clic en el enlace para descargarla!
Dirección de descarga oficial: https://ollama.com/download