O Google lançou oficialmente em 22 de janeiro de 2025 uma versão aprimorada de seu modelo de raciocínio Gemini 2.0 Flash Thinking, recuperando o primeiro lugar no Chatbot Arena. As melhorias desta versão se concentram principalmente na capacidade de processamento de contextos longos, suportando até 1 milhão de tokens de entrada, oferecendo aos usuários uma análise mais profunda ao lidar com textos longos.

image.png

Jeff Dean, chefe de IA do Google, declarou na apresentação que esta atualização experimental visa melhorar a confiabilidade do modelo e reduzir as contradições entre o processo de raciocínio e a resposta final. O Gemini 2.0 Flash Thinking não apenas mantém as vantagens da versão anterior, mas também adiciona a capacidade de raciocínio aprimorado baseado em pensamentos ("thoughts"), apresentando um desempenho excepcional.

image.png

Em termos técnicos, o Gemini 2.0 Flash Thinking alcançou duas grandes inovações: primeiro, a capacidade de processar contextos longos de até 1 milhão de tokens, crucial para diálogos e processos de raciocínio complexos e multiturnos; segundo, o modelo demonstra uma capacidade de autocorreção significativa, mantendo a coerência na conversa e aplicando flexivelmente informações acumuladas anteriormente. Isso significa que os usuários podem experimentar uma interação mais natural e consistente com o modelo.

image.png

Em uma demonstração, Jeff Dean mostrou como o modelo resolve problemas de física e explica o processo de raciocínio, impressionando a todos. Além disso, os participantes relataram que a experiência real com o novo modelo foi ainda mais rápida do que na demonstração.

Além da capacidade de processamento de contextos longos, o Gemini 2.0 Flash Thinking também apresentou melhorias significativas em testes de matemática, ciência e raciocínio multimodal, com destaque para um aumento de 54% no desempenho em matemática. Esses excelentes resultados geram grandes expectativas para o futuro do modelo.

image.png

Na interface de interação, os usuários podem acessar todas as funcionalidades do modelo na plataforma "Google AI Studio", incluindo criação de prompts, conversação em tempo real e desenvolvimento de aplicativos. Embora a funcionalidade da interface atual seja um pouco dispersa, o Google planeja fornecer relatórios técnicos e instruções de uso mais detalhados após o lançamento oficial do modelo, a fim de melhorar a experiência do usuário.

Olhando para o futuro, a equipe de desenvolvimento do Google está explorando ativamente a capacidade de processamento de dados 3D, demonstrando sua crença em inovação contínua. É previsível que a próxima grande inovação do Google na área de IA esteja próxima, e vale a pena acompanhar.

Link de teste: https://aistudio.google.com/prompts/new_chat