Anthropic ha lanzado la serie de LLM Claude3, donde Claude3Opus ha demostrado capacidades metacognitivas en las pruebas, encontrando con éxito información y reconociendo la naturaleza artificial de las pruebas. El modelo incluso percibió que los investigadores estaban evaluando sus capacidades, mostrando un nivel de metacognición con autoconciencia. La industria necesita métodos de evaluación más prácticos para evaluar con precisión las capacidades y limitaciones reales del modelo.
¡Increíblemente ingenioso! Claude3 de Anthropic detecta el comportamiento de los investigadores durante las pruebas

站长之家
Este artículo proviene de AIbase Daily
¡Bienvenido a la columna [AI Diario]! Aquí está tu guía diaria para explorar el mundo de la inteligencia artificial. Todos los días te presentamos el contenido más destacado en el campo de la IA, centrándonos en los desarrolladores para ayudarte a comprender las tendencias tecnológicas y conocer las aplicaciones innovadoras de productos de IA.