Google aprimora o Gemini 2.0 Flash Thinking, estabelecendo um novo recorde em processamento de contexto longo

AIbase基地

Publicado emNotícias e Informações de IA · 5 minutos de leitura · Jan 22, 2025

505

O Google lançou oficialmente em 22 de janeiro de 2025 uma versão aprimorada de seu modelo de raciocínio Gemini 2.0 Flash Thinking, recuperando o primeiro lugar no Chatbot Arena. As melhorias desta versão se concentram principalmente na capacidade de processamento de contextos longos, suportando até 1 milhão de tokens de entrada, oferecendo aos usuários uma análise mais profunda ao lidar com textos longos.

Jeff Dean, chefe de IA do Google, declarou na apresentação que esta atualização experimental visa melhorar a confiabilidade do modelo e reduzir as contradições entre o processo de raciocínio e a resposta final. O Gemini 2.0 Flash Thinking não apenas mantém as vantagens da versão anterior, mas também adiciona a capacidade de raciocínio aprimorado baseado em pensamentos ("thoughts"), apresentando um desempenho excepcional.

Em termos técnicos, o Gemini 2.0 Flash Thinking alcançou duas grandes inovações: primeiro, a capacidade de processar contextos longos de até 1 milhão de tokens, crucial para diálogos e processos de raciocínio complexos e multiturnos; segundo, o modelo demonstra uma capacidade de autocorreção significativa, mantendo a coerência na conversa e aplicando flexivelmente informações acumuladas anteriormente. Isso significa que os usuários podem experimentar uma interação mais natural e consistente com o modelo.

Em uma demonstração, Jeff Dean mostrou como o modelo resolve problemas de física e explica o processo de raciocínio, impressionando a todos. Além disso, os participantes relataram que a experiência real com o novo modelo foi ainda mais rápida do que na demonstração.

Além da capacidade de processamento de contextos longos, o Gemini 2.0 Flash Thinking também apresentou melhorias significativas em testes de matemática, ciência e raciocínio multimodal, com destaque para um aumento de 54% no desempenho em matemática. Esses excelentes resultados geram grandes expectativas para o futuro do modelo.

Na interface de interação, os usuários podem acessar todas as funcionalidades do modelo na plataforma "Google AI Studio", incluindo criação de prompts, conversação em tempo real e desenvolvimento de aplicativos. Embora a funcionalidade da interface atual seja um pouco dispersa, o Google planeja fornecer relatórios técnicos e instruções de uso mais detalhados após o lançamento oficial do modelo, a fim de melhorar a experiência do usuário.

Olhando para o futuro, a equipe de desenvolvimento do Google está explorando ativamente a capacidade de processamento de dados 3D, demonstrando sua crença em inovação contínua. É previsível que a próxima grande inovação do Google na área de IA esteja próxima, e vale a pena acompanhar.

Link de teste: https://aistudio.google.com/prompts/new_chat

Gemini2.0FlashThinking Contexto Longo Modelo de raciocínio Google

Este artigo é do AIbase Daily

Bem-vindo à coluna [AI Daily]! Este é o seu guia para explorar o mundo da inteligência artificial todos os dias. Todos os dias apresentamos os destaques da área de IA, com foco nos desenvolvedores, para o ajudar a obter insights sobre as tendências tecnológicas e a compreender as aplicações inovadoras de produtos de IA.

—— Criado pelo Grupo AIbase Daily

Notícias de IA Relacionadas Recomendadas

Boletim Diário de IA: ByteDance lança o modelo de raciocínio profundo Doubao 1.5; WeChat lança o primeiro assistente de IA, Yuanbao; OpenAI lança o4-mini e o3 com capacidade total

Bem-vindo à seção 【Boletim Diário de IA】! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os destaques do campo da IA, focando em desenvolvedores e ajudando você a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA. Saiba mais sobre novos produtos de IA clicando aqui: https://top.aibase.com/1、OpenAI lança dois modelos de raciocínio multimodal o4-mini e o3 com capacidade totalA OpenAI lançou seus mais novos modelos multimodais o4-mini e o3 com capacidade total em uma transmissão técnica,

Apr 17, 2025

330

ByteDance lança o modelo de raciocínio profundo Doubao 1.5: raciocínio profundo multimodal, baixa latência

Apr 17, 2025

Novo sistema da OpenAI bloqueia informações sobre riscos biológicos e químicos para garantir a segurança da IA

A OpenAI lançou recentemente um novo sistema projetado para monitorar seus mais recentes modelos de raciocínio de IA, o3 e o4-mini, a fim de bloquear prompts relacionados a ameaças biológicas e químicas. O objetivo do sistema é impedir que os modelos forneçam conselhos que possam incitar outros a realizar ataques prejudiciais, garantindo a segurança da IA. A OpenAI afirma que o o3 e o o4-mini têm capacidades significativamente aprimoradas em comparação com modelos anteriores, o que pode representar novos riscos nas mãos de usuários maliciosos. De acordo com os testes internos da OpenAI, o o3

Apr 17, 2025

Volcano Engine lança o modelo de raciocínio profundo Doubao 1.5: combinando compreensão visual e gerenciamento inteligente de projetos

No recente evento Volcano Engine FORCE LINK AI Innovation Tour, o presidente da Volcano Engine, Tan Dai, anunciou oficialmente o modelo de raciocínio profundo Doubao 1.5, marcando o lançamento oficial deste serviço de tecnologia inovadora para empresas. O Doubao 1.5 não apenas aprimora os recursos básicos, mas também introduz cenários de aplicação mais inteligentes, auxiliando as empresas a alcançar uma transformação digital mais eficiente. Tan Dai afirmou na apresentação que o modelo de raciocínio profundo Doubao 1.5 pode combinar a compreensão visual para fornecer mais recursos inovadores. Por exemplo, o modelo pode, com base nas imagens enviadas pelo usuário...

Apr 17, 2025

OpenAI lança novo modelo de raciocínio o3 com capacidade de pensamento de imagem

A OpenAI lançou recentemente seus mais novos modelos de raciocínio, o o3 e o o4-mini, marcando um grande avanço no campo da inteligência artificial. Esses dois modelos não apenas superam as versões anteriores em capacidade de raciocínio, mas também alcançam, pela primeira vez, a capacidade de pensamento de imagem, podendo integrar diretamente informações visuais no processo de pensamento. O o3 é considerado um modelo de "nível gênio", especialmente em tarefas de programação e matemática, com uma taxa de precisão de 87,5%. Os modelos o3 e o4-mini recém-lançados apresentam excelente desempenho em processamento multimodal, possuindo

Apr 17, 2025

Estrela Salto lança novo modelo de raciocínio multimodal - Step-R1-V-Mini

A equipe de tecnologia Estrela Salto anunciou o lançamento oficial de seu novo modelo de raciocínio multimodal, o Step-R1-V-Mini. O lançamento deste modelo representa um novo avanço no campo da inferência multi-modal colaborativa, injetando nova vitalidade no desenvolvimento da tecnologia de IA. O Step-R1-V-Mini suporta entrada de imagem e texto e saída de texto, possui boa capacidade de seguir instruções e generalidade, podendo perceber imagens com alta precisão e concluir tarefas de raciocínio complexas.

Apr 9, 2025

Quasar Alpha faz aparição misteriosa: Primeiro modelo de contexto longo secreto oferece experiência gratuita

Recentemente, um novo modelo de IA chamado "Quasar Alpha" foi lançado discretamente, atraindo a atenção da comunidade tecnológica e de desenvolvedores. Segundo informações, este modelo foi lançado por um laboratório de modelos não identificado, sendo chamado de seu primeiro modelo "secreto" (stealth), uma versão pré-lançamento de um modelo básico de contexto longo que será lançado em breve. O Quasar Alpha, com seu impressionante comprimento de contexto de 1 milhão de tokens, capacidade de codificação otimizada e acesso gratuito, rapidamente se tornou um foco de discussão na indústria, impulsionando a tecnologia de IA.

Apr 7, 2025

130

Boletim Diário de IA: Novo modelo de raciocínio visual QVQ-Max da Alibaba; novo recurso de efeitos sonoros de IA da Ke Ling AI; desempenho do GPT-4o dispara após atualização; Midjourney V7 a ser lançado na próxima semana;

Bem-vindo à seção "Boletim Diário de IA"! Aqui está seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os destaques do campo da IA, focando em desenvolvedores e ajudando você a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA. Saiba mais sobre novos produtos de IA: https://top.aibase.com/1、A Alibaba lança o novo modelo de raciocínio visual QVQ-Max A equipe de pesquisa de IA da Alibaba, Qwen, lançou seu mais novo modelo de raciocínio visual, o QVQ-Max. Apesar da intensificação da competição tecnológica entre EUA e China

Mar 28, 2025

160

Mureka O1: O primeiro grande modelo de raciocínio musical do mundo é lançado, marcando uma nova era na criação de música com IA

Apresentamos o Mureka O1, o primeiro grande modelo de raciocínio musical do mundo. Esta inovação revolucionária impulsiona a criação de música com IA para um novo nível, abrindo possibilidades ilimitadas para compositores e artistas.

Mar 26, 2025

Boletim Diário de IA: Novo modelo de geração de imagens da OpenAI permite edição de imagens com uma frase; receita da Co-AI ultrapassa US$ 100 milhões; Google lança o poderoso modelo de raciocínio Gemini 2.5

Bem-vindo ao boletim diário de IA! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os principais tópicos do campo da IA, focando em desenvolvedores e ajudando você a entender as tendências tecnológicas e os aplicativos de produtos de IA inovadores. Saiba mais sobre novos produtos de IA: https://top.aibase.com/1、A OpenAI lança um novo modelo de geração de imagens, desafiando o Google na edição de imagens com uma frase. A OpenAI lançou recentemente seu mais recente modelo GPT-4o, que integra um gerador de imagens avançado, mostrando...

Mar 26, 2025

Notícias de IA

IA Diário

Linha do Tempo da IA

Al hardware

Casos Recentes

Coleção de Imagens

Coleção de Vídeos

Coleção de Áudios

Coleção de Conteúdo

Tutoriais Recentes

Ranking de Produtos de IA

Ranking de Crescimento de Tráfego de IA

Ranking de Queda de Tráfego de IA

Ranking Semanal de IA

Estados Unidos

China

Índia

Brasil

Geração de Imagens

Assistente Pessoal

Geração de Personagens

Geração de Vídeos

Ranking de Projetos de IA

Ranking de Crescimento de Projetos de IA

Ranking de Desenvolvedores de IA

Ranking de Organizações de IA

Deepseek

TTS

LLM

ChatGPT

Visão Geral

Google aprimora o Gemini 2.0 Flash Thinking, estabelecendo um novo recorde em processamento de contexto longo

AIbase基地

Este artigo é do AIbase Daily

Notícias de IA Relacionadas Recomendadas

Boletim Diário de IA: ByteDance lança o modelo de raciocínio profundo Doubao 1.5; WeChat lança o primeiro assistente de IA, Yuanbao; OpenAI lança o4-mini e o3 com capacidade total

ByteDance lança o modelo de raciocínio profundo Doubao 1.5: raciocínio profundo multimodal, baixa latência

Novo sistema da OpenAI bloqueia informações sobre riscos biológicos e químicos para garantir a segurança da IA

Volcano Engine lança o modelo de raciocínio profundo Doubao 1.5: combinando compreensão visual e gerenciamento inteligente de projetos

OpenAI lança novo modelo de raciocínio o3 com capacidade de pensamento de imagem

Estrela Salto lança novo modelo de raciocínio multimodal - Step-R1-V-Mini

Quasar Alpha faz aparição misteriosa: Primeiro modelo de contexto longo secreto oferece experiência gratuita

Boletim Diário de IA: Novo modelo de raciocínio visual QVQ-Max da Alibaba; novo recurso de efeitos sonoros de IA da Ke Ling AI; desempenho do GPT-4o dispara após atualização; Midjourney V7 a ser lançado na próxima semana;

Mureka O1: O primeiro grande modelo de raciocínio musical do mundo é lançado, marcando uma nova era na criação de música com IA

Boletim Diário de IA: Novo modelo de geração de imagens da OpenAI permite edição de imagens com uma frase; receita da Co-AI ultrapassa US$ 100 milhões; Google lança o poderoso modelo de raciocínio Gemini 2.5