A Anthropic anunciou hoje o lançamento do Claude 3.5 Sonnet, o primeiro produto da série Claude 3.5. Este modelo superou seus concorrentes e seu antecessor, o Claude 3 Opus, em várias avaliações, mantendo simultaneamente a velocidade e o custo comparáveis ​​a modelos de médio porte, estabelecendo um novo padrão do setor.

O Claude 3.5 Sonnet já está disponível para o público em Claude.ai e no aplicativo Claude para iOS, e também está disponível comercialmente por meio da API da Anthropic, Amazon Bedrock e Vertex AI do Google Cloud. O modelo custa US$ 3 por milhão de tokens de entrada e US$ 15 por milhão de tokens de saída, com uma janela de contexto de 200K tokens.

image.png

Melhora significativa no desempenho

O Claude 3.5 Sonnet estabelece novos benchmarks do setor em raciocínio de nível de pós-graduação, conhecimento de nível universitário e capacidade de codificação. Ele apresenta avanços significativos na compreensão de nuances, humor e instruções complexas, e pode criar conteúdo de alta qualidade com um tom natural e amigável.

Vale ressaltar que o Claude 3.5 Sonnet é duas vezes mais rápido que o Claude 3 Opus. Em avaliações internas de codificação de agentes, o Claude 3.5 Sonnet resolveu 64% dos problemas, em comparação com 38% do Claude 3 Opus. Isso o torna especialmente adequado para tarefas complexas, como suporte ao cliente com contexto e coordenação de fluxos de trabalho de várias etapas.

image.png

Capacidade visual significativamente aprimorada

O Claude 3.5 Sonnet também alcançou avanços significativos no processamento visual, superando o Claude 3 Opus em testes de referência visuais padrão. Ele se destaca em tarefas que exigem raciocínio visual, como interpretar gráficos e diagramas, e também pode transcrever texto com precisão a partir de imagens imperfeitas, o que é significativo para setores como varejo, logística e serviços financeiros.

image.png

Novo recurso: Artifacts

A Anthropic também lançou o recurso Artifacts no Claude.ai, expandindo as maneiras como os usuários podem interagir com o Claude. Os usuários podem solicitar que o Claude gere conteúdo como fragmentos de código, documentos de texto ou designs de sites, que serão exibidos em uma janela dedicada junto com a conversa, criando um espaço de trabalho dinâmico.

Compromisso com segurança e privacidade

Apesar do salto na inteligência do Claude 3.5 Sonnet, a Anthropic afirma que ele permanece no nível de segurança ASL-2. A empresa trabalhou com especialistas externos, incluindo o Instituto de Segurança de IA do Reino Unido (UK AISI), para realizar testes de segurança rigorosos no modelo. A Anthropic enfatiza que os dados enviados pelos usuários não serão usados ​​para treinar seus modelos de geração, a menos que os usuários autorizem explicitamente.

Visão para o futuro

A Anthropic planeja lançar o Claude 3.5 Haiku e o Claude 3.5 Opus ainda este ano, completando a série Claude 3.5. A empresa também está desenvolvendo novos modelos e recursos para dar suporte a mais casos de uso empresarial, incluindo integração com aplicativos corporativos e recursos de memória personalizados.

A Anthropic convida os usuários a enviar feedback diretamente no produto para ajudar a melhorar o Claude 3.5 Sonnet e orientar o desenvolvimento futuro.