Capacidades de programação muito à frente? Claude 3.7 Sonnet e Claude Code lançados, impactando o OpenAI o3-mini e DeepSeek R1!

A Anthropic lançou o Claude 3.7 Sonnet e o Claude Code. O Claude 3.7 Sonnet, como o primeiro modelo de raciocínio híbrido global, possui um modo de raciocínio único e desempenho excepcional; o Claude Code é uma poderosa ferramenta de codificação inteligente. Seu lançamento atraiu ampla atenção na área de IA, oferecendo aos usuários serviços e experiências de desenvolvimento mais eficientes e inteligentes.

www-cdn.anthropic.png

Introdução ao Claude 3.7 Sonnet

Modo de raciocínio híbrido: O Claude 3.7 Sonnet é o modelo mais inteligente da Anthropic até agora, e também o primeiro modelo de raciocínio híbrido do mundo. Ele combina os modos de pensamento padrão e pensamento expandido. No modo padrão, é uma versão atualizada do Claude 3.5 Sonnet, capaz de responder rapidamente; no modo de pensamento expandido, o modelo realiza autorreflexão antes de fornecer uma resposta, melhorando significativamente o desempenho em tarefas de matemática, física, seguimento de instruções e codificação.
Tempo de reflexão controlável: Os usuários da API podem controlar o orçamento de reflexão do modelo, ou seja, dizer ao Claude para pensar por no máximo N tokens (o valor máximo de N é a limitação de saída de 128K tokens), equilibrando a velocidade (e o custo) com a qualidade da resposta.
Direção de otimização de desempenho: O desenvolvimento focou em tarefas reais que refletem melhor como as empresas usam LLMs na prática, com menos otimização para problemas de competições de matemática e ciência da computação. Em vários testes de referência, como o SWE-bench Verified (que avalia a capacidade dos modelos de IA de resolver problemas de software do mundo real) e o TAU-bench (uma estrutura que testa a capacidade dos agentes de IA de interagir com usuários e ferramentas em tarefas complexas do mundo real), o Claude 3.7 Sonnet obteve resultados excelentes.
Melhoria de segurança: O Claude 3.7 Sonnet faz uma distinção mais sutil entre solicitações prejudiciais e benignas, reduzindo as rejeições desnecessárias em 45% em comparação com a geração anterior.

www-cdn.anthropic (1).png

Destaques do Claude 3.7 Sonnet

Capacidade de raciocínio poderosa: No modo de pensamento expandido, ele pode realizar raciocínio passo a passo para problemas complexos, por exemplo, ao resolver o problema matemático da Teoria dos Jogos, o Problema de Monty Hall, ele mostrará o processo de pensamento detalhado, ajudando os usuários a entender profundamente a solução do problema.
Excelente capacidade de codificação: Apresenta desempenho excepcional em codificação e desenvolvimento web front-end, obtendo pontuações altas de 70,3% (usando uma estrutura personalizada) e 62,3% (estrutura padrão) no teste de referência SWE-bench Verified, superando em muito modelos como o o3-mini (high) da OpenAI e o DeepSeek R1, podendo ajudar os desenvolvedores a concluir tarefas de programação de forma eficiente, como criar jogos complexos, implementar simulações físicas e reproduzir páginas da web.
Boa capacidade multimodal: Apresenta melhorias significativas no processamento integrado de texto e imagem, possuindo o potencial de lidar com tarefas multimodais e podendo desempenhar um papel em cenários complexos envolvendo imagens e texto.
Compreensão e execução precisas de instruções: Apresenta excelente desempenho no seguimento de instruções, podendo entender e executar instruções do usuário com precisão, obtendo uma pontuação de 93,2% no teste IFEval, podendo concluir de forma eficiente várias instruções dadas pelo usuário.
Amplo suporte e compreensão de idiomas: Obteve uma pontuação de 86,1% no teste de perguntas e respostas multilínguas (MMMLU), indicando sua forte capacidade de compreensão e processamento de vários idiomas, podendo atender às necessidades de usuários de diferentes idiomas.
Capacidade inteligente de resolução de problemas: Apresenta excelente desempenho na resolução de problemas em matemática, física e outras disciplinas, como uma taxa de precisão de 96,2% no teste MATH 500, podendo fornecer ajuda eficaz na resolução de problemas para alunos, pesquisadores etc.
Mudança flexível de modo de pensamento: Os usuários podem alternar facilmente entre os modos de pensamento padrão e expandido de acordo com suas necessidades, para lidar com problemas de diferentes níveis de complexidade. O modo padrão é adequado para obter respostas rápidas e simples, enquanto o modo de pensamento expandido é usado para lidar com tarefas complexas.
Orçamento de reflexão personalizável: Os usuários da API podem definir com precisão o número de tokens de reflexão do modelo de acordo com as necessidades da tarefa, controlando assim de forma flexível o tempo e o custo de reflexão, equilibrando a qualidade e a velocidade de obtenção das respostas.

www-cdn.anthropic (2).png

Cenários de aplicação

Desenvolvimento de programação: Ajudar os desenvolvedores a escrever código, depurar programas e otimizar a estrutura do código. Ao desenvolver jogos, aplicativos ou sites, ele pode gerar rapidamente a estrutura do código, resolver problemas no código e melhorar a eficiência do desenvolvimento.
Pesquisa acadêmica: Auxiliar os pesquisadores em revisões de literatura, análise de problemas de pesquisa e design de experimentos. Ao lidar com problemas acadêmicos complexos, ele fornece suporte profissional de conhecimento e análise lógica.
Criação de conteúdo: Fornecer inspiração para escritores, editores e outros criadores de conteúdo, auxiliar na escrita de artigos, histórias, relatórios etc., melhorando a qualidade e a eficiência da criação.
Atendimento ao cliente inteligente: Aplicado a sistemas de atendimento ao cliente de empresas, respondendo perguntas de clientes de forma rápida e precisa, entendendo as necessidades dos clientes e fornecendo uma experiência de serviço de alta qualidade.
Análise de dados: Analisar e interpretar grandes quantidades de dados, ajudando empresas ou pesquisadores a extrair informações valiosas dos dados, realizar previsões de tendências e suporte à tomada de decisões.
Área da educação: Como uma ferramenta de tutoria inteligente, ajudar os alunos a responder a perguntas sobre várias disciplinas, fornecer métodos e ideias de aprendizagem e auxiliar os professores no trabalho de ensino.

www-cdn.anthropic (3).png

Tutorial de uso do Claude 3.7 Sonnet

Escolha da plataforma de uso: O Claude 3.7 Sonnet pode ser acessado por meio da plataforma Claude.ai (compatível com Web, iOS e Android), API Anthropic, Amazon Bedrock e Vertex AI do Google Cloud. Os usuários devem escolher a plataforma adequada de acordo com suas necessidades e cenários de uso.
Cadastro e login: Se for o primeiro uso, complete o processo de cadastro na plataforma correspondente e faça login na conta para acessar a interface de uso.
Escolha do modo de pensamento: Escolha o modo de pensamento adequado de acordo com a complexidade do problema. Se o problema for relativamente simples, como perguntar informações de conhecimento comum, você pode escolher o modo padrão para obter uma resposta rápida; se o problema for complexo, como problemas matemáticos ou tarefas de programação, escolha o modo de pensamento expandido.
Insira a pergunta: Insira a pergunta ou instrução de forma clara e precisa na caixa de entrada, como "Ajude-me a escrever um script Python para implementar a função de análise de dados" ou "Analise o princípio deste experimento físico".
Obtenha a resposta: O modelo processará de acordo com o modo escolhido e a pergunta inserida. Os usuários devem esperar um momento para obter a resposta. Se não estiver satisfeito com a resposta ou precisar discutir mais, poderá continuar fazendo perguntas ao modelo ou ajustar a formulação da pergunta.
Ajuste o orçamento de reflexão (usuários da API): Para usuários da API, se tiver requisitos específicos para a qualidade e velocidade da resposta, poderá controlar o tempo de reflexão do modelo definindo o orçamento de reflexão (número de tokens), definindo os parâmetros relevantes no pedido.

www-cdn.anthropic (4).png

Conclusão

O lançamento do Claude 3.7 Sonnet e do Claude Code representa um avanço importante na área de IA. O Claude 3.7 Sonnet, com seu modo de raciocínio híbrido, recursos poderosos e ampla gama de cenários de aplicação, oferece aos usuários uma experiência totalmente nova; o Claude Code fornece aos desenvolvedores uma ferramenta de auxílio à codificação eficiente. Eles não apenas demonstram a força inovadora da Anthropic em tecnologia de IA, mas também impulsionam o desenvolvimento de toda a indústria de IA.

No entanto, a tecnologia de IA está em constante evolução, e há ainda mais possibilidades a serem exploradas no futuro. Se tiver alguma descoberta nova, experiência interessante ou sugestão valiosa durante o uso, sinta-se à vontade para compartilhar e discutir na seção de comentários.

Notícias de IA

IA Diário

Linha do Tempo da IA

Al hardware

Casos Recentes

Coleção de Imagens

Coleção de Vídeos

Coleção de Áudios

Coleção de Conteúdo

Tutoriais Recentes

Ranking de Produtos de IA

Ranking de Crescimento de Tráfego de IA

Ranking de Queda de Tráfego de IA

Ranking Semanal de IA

Estados Unidos

China

Índia

Brasil

Geração de Imagens

Assistente Pessoal

Geração de Personagens

Geração de Vídeos

Ranking de Projetos de IA

Ranking de Crescimento de Projetos de IA

Ranking de Desenvolvedores de IA

Ranking de Organizações de IA

Deepseek

TTS

LLM

ChatGPT

Visão Geral