Notícias recentes! O Ollama versão 0.2 já foi lançado! Segundo informações, esta atualização ativou por padrão a funcionalidade de concorrência, permitindo que o Ollama processe vários pedidos simultaneamente, proporcionando aos usuários uma experiência mais rápida. Esta atualização não apenas desbloqueia a funcionalidade de pedidos paralelos, mas também suporta o carregamento simultâneo de diferentes modelos, permitindo que o Ollama processe tarefas diversas de forma mais eficiente.

image.png

De acordo com o comunicado oficial da Ollama, esta atualização permite que o Ollama processe múltiplas conversas de bate-papo, forneça serviços de conclusão de código para equipes, processe simultaneamente diferentes partes de um documento e até mesmo execute vários agentes ao mesmo tempo. Além disso, o Ollama suporta o carregamento de diferentes modelos, como geração aprimorada por recuperação (RAG) e agentes, permitindo que os usuários executem simultaneamente modelos grandes e pequenos, aumentando a flexibilidade e o desempenho do sistema.

Segundo informações, esta atualização também adicionou a funcionalidade de carregamento e descarregamento automático de modelos, ajustando-se dinamicamente de acordo com os pedidos e o uso da memória da GPU, garantindo a estabilidade e a eficiência do sistema. Essa série de atualizações torna o Ollama mais poderoso e inteligente, proporcionando aos usuários uma experiência de melhor qualidade. Quer experimentar a versão mais recente do Ollama 0.2? Clique no link para fazer o download!

Endereço de download oficial: https://ollama.com/download