Recentemente, a Cursor AI anunciou a integração do Claude 3.7 Sonnet e atualizou sua interface de usuário para torná-la mais limpa e fácil de usar. Além disso, a Cursor introduziu a funcionalidade de conversas entre chats, permitindo o resumo automático das conversas e sua transferência para novas janelas de bate-papo, melhorando ainda mais a experiência do usuário.

Anteriormente, a Anthropic lançou oficialmente seu mais recente modelo de raciocínio - o Claude 3.7 Sonnet. Este modelo, com seu design inovador e capacidades de programação significativamente aprimoradas, rapidamente se tornou o foco da indústria. A inovação central do Claude 3.7 Sonnet reside em sua capacidade de combinar respostas rápidas com pensamento profundo, simulando o processo de pensamento do cérebro humano para fornecer uma experiência de interação mais fluida aos usuários.

Na prática, os usuários podem optar pelo modo padrão para obter respostas rápidas ou alternar para o modo de pensamento expandido, permitindo que o modelo se auto-reflita antes de responder. Este modo é particularmente adequado para tarefas complexas em matemática, física e programação, fornecendo respostas mais precisas e profundas. Através da API, os usuários também podem controlar precisamente o orçamento de pensamento do modelo, com um máximo de 128K tokens, encontrando assim o melhor equilíbrio entre velocidade, custo e qualidade da resposta. Ao contrário dos modelos tradicionais, o Claude 3.7 Sonnet concentra-se em aplicações comerciais reais, em vez de simplesmente competir em benchmarks.

Na área de programação, o Claude 3.7 Sonnet se destaca. Em um teste de programação, o Sonnet obteve uma pontuação alta de 70,3%, superando outros modelos conhecidos, como o o1, o3-mini da OpenAI e o DeepSeek R1, cujas pontuações ficaram em torno de 49%. Este resultado indica que a Anthropic pretende posicionar o Sonnet como uma poderosa IA de codificação, focada em melhorar as habilidades de programação para atender às necessidades dos desenvolvedores no processamento de bases de código complexas e atualizações de pilha completa.

微信截图_20250225082325.png

O Claude 3.7 Sonnet já está totalmente disponível, com versões gratuita, profissional, para equipes e empresarial, e pode ser usado na API da Anthropic, Amazon Bedrock e Google Cloud Vertex AI. No entanto, os usuários gratuitos atualmente não podem usar o modo de pensamento expandido. Em termos de preços, o Sonnet 3.7 mantém-se alinhado com os modelos anteriores: US$ 3 por milhão de tokens de entrada e US$ 15 por milhão de tokens de saída, incluindo tokens de pensamento.

Além de suas melhorias nas capacidades de programação, o Claude 3.7 Sonnet também demonstra desempenho excepcional em outras áreas. Por exemplo, no teste TAU-bench, o Sonnet atingiu uma precisão de 81,2% em cenários de varejo e 58,4% em cenários de aviação, superando todos os outros modelos. Além disso, o Sonnet também se destaca na compreensão de instruções, capacidade de raciocínio, processamento multimodal e escrita de código, especialmente quando o modo de pensamento expandido está ativado, mostrando um progresso notável em matemática e problemas científicos.