Recientemente, Cursor AI anunció la integración de Claude 3.7 Sonnet y una actualización de su interfaz de usuario para una mayor simplicidad y facilidad de uso. Además, Cursor introdujo una función de conversación entre chats, capaz de resumir automáticamente las conversaciones y transferirlas a nuevas ventanas de chat, mejorando aún más la experiencia del usuario.

Anteriormente, Anthropic lanzó oficialmente su último modelo de razonamiento: Claude 3.7 Sonnet. Este modelo, con su innovador diseño y capacidades de programación significativamente mejoradas, se ha convertido rápidamente en el centro de atención de la industria. La innovación central de Claude 3.7 Sonnet radica en la fusión de respuestas rápidas con una capacidad de pensamiento profundo, simulando el proceso de pensamiento del cerebro humano para ofrecer una interacción más fluida.

En la práctica, los usuarios pueden optar por el modo estándar para obtener respuestas rápidas o cambiar al modo de pensamiento expandido, permitiendo que el modelo reflexione antes de responder. Este modo es especialmente útil para tareas complejas en matemáticas, física y programación, proporcionando respuestas más precisas y profundas. A través de la API, los usuarios también pueden controlar con precisión el presupuesto de pensamiento del modelo, hasta 128K tokens, encontrando el equilibrio óptimo entre velocidad, coste y calidad de la respuesta. A diferencia de los modelos tradicionales, Claude 3.7 Sonnet se centra en aplicaciones comerciales reales, en lugar de simplemente en el rendimiento competitivo.

En el ámbito de la programación, Claude 3.7 Sonnet destaca especialmente. En una prueba de programación, Sonnet obtuvo una alta puntuación del 70.3%, superando a otros modelos conocidos como o1, o3-mini de OpenAI y DeepSeek R1, que obtuvieron alrededor del 49%. Este resultado indica la intención de Anthropic de posicionar a Sonnet como una potente IA de codificación, enfocada en mejorar las capacidades de programación para satisfacer las necesidades de los desarrolladores en el manejo de bases de código complejas y actualizaciones de pila completa.

微信截图_20250225082325.png

Claude 3.7 Sonnet ya está disponible, con versiones gratuita, profesional, para equipos y empresarial, y se puede utilizar a través de la API de Anthropic, Amazon Bedrock y Vertex AI de Google Cloud. Sin embargo, los usuarios gratuitos no pueden utilizar actualmente el modo de pensamiento expandido. En cuanto a los precios, Sonnet 3.7 mantiene los mismos precios que su predecesor: 3 dólares por millón de tokens de entrada y 15 dólares por millón de tokens de salida, incluyendo los tokens de pensamiento.

Además de las mejoras en la capacidad de programación, Claude 3.7 Sonnet muestra un rendimiento excepcional en otras áreas. Por ejemplo, en la prueba TAU-bench, Sonnet alcanzó una precisión del 81.2% en escenarios de retail y del 58.4% en escenarios de aviación, superando a otros modelos. Además, Sonnet destaca en la comprensión de instrucciones, la capacidad de razonamiento, el procesamiento multimodal y la escritura de código, especialmente cuando se activa el modo de pensamiento expandido, mostrando una mejora espectacular en problemas matemáticos y científicos.