Así es la nueva DeepSeek: la IA china se actualiza y supera con creces pruebas matemáticas

Sus avances han llamado la atención en la industria, con ingenieros y usuarios, e incluso se especula que esta versión podría abrir el camino para el próximo modelo.

Mar 30, 2025 - 06:44
 0
Así es la nueva DeepSeek: la IA china se actualiza y supera con creces pruebas matemáticas

DeepSeek ha superado en poco tiempo a ChatGPT como la aplicación gratuita más descargada en la App Store de EE. UU. con su modelo DeepSeek-V3, además de generar un gran revuelo y polémica en la industria tecnológica. De hecho, ha sido prohibida en gran parte del mundo por problemas de seguridad e incluso ha sido objeto de ciberataques.

Pese a todo, ahora han presentado una versión mejorada de su modelo (DeepSeek-V3-0324) con notables avances en generación de código y razonamiento matemático.

Resultados "impresionantes" en pruebas de matemáticas y programación

Según informan desde el diario hongkonés South China Morning Post (SCMP), esta actualización se basa en un sistema de razonamiento llamado R1 y cuenta con 685.000 millones de parámetros, lo que lo convierte en una herramienta potente para asistentes conversacionales y desarrollo web.

Una de las grandes novedades es que ahora está disponible bajo la licencia MIT, lo que permite su uso y modificación sin restricciones comerciales. Esto lo diferencia de otros modelos de IA y facilita su adopción en entornos de desarrollo.

En cuanto a su rendimiento, la nueva versión ha logrado resultados impresionantes en pruebas clave:

  • Matemáticas: obtuvo una puntuación de 59,4 en la American Invitational Mathematics Examination (AIME), superando ampliamente los 39,6 de su versión anterior.
  • Programación: mejoró 10 puntos en la prueba LiveCodeBench, alcanzando 49,2.
  • Generación de código: puede escribir más de 800 líneas sin errores y procesar más de 20 tókens por segundo, lo que lo hace muy eficiente en tareas de desarrollo.

Este modelo utiliza una arquitectura conocida como Mixture-of-Experts (mezcla de expertos), que divide las tareas entre diferentes módulos especializados para mejorar la eficiencia sin aumentar los costes computacionales.

Sus avances han llamado la atención en la industria, con ingenieros y usuarios, e incluso se especula que esta versión podría abrir el camino para el próximo modelo, DeepSeek R2.

Apúntate a nuestra newsletter y recibe en tu correo las últimas noticias sobre tecnología.