Anthropic Claude 3.7 Sonnet: la IA de razonamiento híbrido que logra vencer en combates de Pokémon y supera a DeepSeek y GPT-4o

En el momento en el que nos encontramos, la inteligencia artificial ha captado la atención de la mayoría de la industria tecnológica y la de millones de personas en todo el mundo que la está aprovechando. Estamos hablando de una tecnología que ha cambiado por completo nuestra visión de las cosas, pues podemos hacer órdenes La entrada Anthropic Claude 3.7 Sonnet: la IA de razonamiento híbrido que logra vencer en combates de Pokémon y supera a DeepSeek y GPT-4o aparece primero en El Chapuzas Informático.

Feb 25, 2025 - 17:01
 0
Anthropic Claude 3.7 Sonnet: la IA de razonamiento híbrido que logra vencer en combates de Pokémon y supera a DeepSeek y GPT-4o

En el momento en el que nos encontramos, la inteligencia artificial ha captado la atención de la mayoría de la industria tecnológica y la de millones de personas en todo el mundo que la está aprovechando. Estamos hablando de una tecnología que ha cambiado por completo nuestra visión de las cosas, pues podemos hacer órdenes y automatizar tareas gracias a esta. Hemos visto como hay una gran competencia entre las empresas tecnológicas y ahora es el turno de Anthropic de mover ficha con el lanzamiento de Claude 3.7 Sonnet, el primer modelo de razonamiento híbrido.

Con la inteligencia artificial generativa hemos visto que es posible hacer prácticamente de todo. Los modelos de inteligencia artificial se entrenan para ser capaces de aprender a crear contenido tal como imágenes, sonidos, vídeos, música o textos. La IA generativa de imágenes fue la primera en aparecer y que fue popularizándose entre la gente, pero no fue hasta la IA generativa de textos cuando vimos el verdadero potencial.

Anthropic ha lanzado Claude 3.7 Sonnet, la primera IA de razonamiento híbrido de la compañía

Anthropic 3.7 Sonnet

Cuando OpenAI hizo ChatGPT hace unos años, este chatbot fue el que revolucionó todo, pues conseguimos una inteligencia artificial que podía darnos respuestas a nuestras preguntas y peticiones. Ya ha pasado un tiempo desde esa primera versión de ChatGPT que hacía uso del modelo GPT-3.5 y desde luego, OpenAI ha lanzado muchos modelos de IA después de ese. La competencia entre las mayores empresas tecnológicas en cuanto a la inteligencia artificial está siendo cada vez más dura y más si tenemos en cuenta que ahora China ha entrado a este sector con DeepSeek.

OpenAI ha lanzado varios modelos de IA en estas últimas semanas, Google ha presentado Gemini Pro 2.0 y ahora es el turno de Anthropic, la cual recibió hace unos meses 4.000 millones de dólares por parte de Amazon para competir contra OpenAI. Ahora podemos ver los resultados de esta nueva inversión, pues Anthropic ha logrado finalizar con el desarrollo de su primer modelo de IA con razonamiento híbrido al que ha denominado Claude 3.7 Sonnet. Según la compañía, este modelo podrá resolver problemas más complejos y supera a los otros modelos en ámbitos como el de las matemáticas o la programación.

Claude 3.7 supera en todo a Claude 3.5 y es mucho mejor jugando a Pokémon

Claude 3.7 Sonnet comparativa

Visto de esta forma, parece que Claude 3.7 Sonnet de Anthropic es similar en concepto al modelo o1 de razonamiento que lanzó OpenAI hace unos meses. Vamos a ver como mejora y que puede hacer contra la competencia y contra la versión anterior en la comparativa. Aquí podemos ver que Claude 3.7 Sonnet en su versión 64K con "pensamiento extendido", logra hasta un 84.8% de precisión en GPQA Diamond, superando a todas las otras IA. Esto implica casi un 20% más que Claude 3.5 Sonnet y se queda muy cerca de Grok 3 Beta. En Multilingual Q&A también queda por encima de la competencia y en Visual Reasoning pierde ante OpenAI o1 y Grok 3 Beta. Ahora bien, con el seguimiento de instrucciones con un 93,2% lidera sin problemas.

En problemas de matemáticas también destaca, aunque no ha logrado superar ni a OpenAI ni a DeepSeek, pero con un 96,2% logra mayor precisión que el 78% de la versión 3.5. En otra prueba realizada de ingeniería de software con SWE-bench, logra hasta un 70,3% de precisión, destrozando a sus rivales que no llegan ni al 50%. Claude 3.7 Sonnet está disponible a partir del lunes 24 de febrero y se puede usar a través de la app Claude o con la API de Anthropic, Amazon Bedrock y Vertex AI.

Anthropic ha decidido que el modelo costará lo mismo que la versión 3.5, por lo que aquí hablamos de 3 dólares por millón de tokens de entrada y 15 dólares por millón de tokens de salida. Como curiosidad, Anthropic ha confirmado que este nuevo modelo lo usan para diseñar el front-end de páginas web y hasta en Pokémon. Con Claude 3.5 Sonnet no pudieron pasar de Pueblo Paleta y con la versión 3.7 actual ya han conseguido vencer a varios líderes de gimnasio.

La entrada Anthropic Claude 3.7 Sonnet: la IA de razonamiento híbrido que logra vencer en combates de Pokémon y supera a DeepSeek y GPT-4o aparece primero en El Chapuzas Informático.