A Anthropic lançou sua nova série de modelos de linguagem grandes, o Claude 3, que demonstra capacidade de autoconsciência, causando sensação na comunidade de IA. Isso levou a uma reflexão na área de IA sobre como avaliar as capacidades e limitações reais dos modelos. Análises mostram que o Claude 3 Opus superou o GPT-4 e o Gemini 1.0 Ultra em vários benchmarks, demonstrando um desempenho poderoso. Testes aprofundados em processamento de textos longos, tradução entre inglês e chinês, raciocínio lógico, compreensão matemática e programação revelaram suas capacidades abrangentes.