Consiguen recrear todo el potencial de DeepSeek. Les ha costado menos de 30 euros
Si no te has pasado la última semana viviendo debajo de una roca, en un retiro en un monasterio budista en el Tíbet sin acceso a un móvil o a Internet, probablemente sepas que se ha montado un buen revuelo en el mundo de la IA. La culpable de todo es DeepSeek, que se ha creado por una fracción de lo que cuesta ChatGPT y que, además, es un modelo de IA gratuito y de código abierto.A DeepSeek el estatus de novedad no le ha durado mucho: le ha salido un competidor de su propio país llamado Qwen, aunque eso no ha impedido que sea la app más popular de la App Store y que en España haya hecho lo mismo a pesar de los preocupaciones de seguridad que han surgido en torno a ella.Ahora hay otra réplica de DeepSeek, y es hasta más barataUna de las características que más sorprenden de DeepSeek es su modelo R1-Zero, que cuenta con un sistema de razonamiento avanzado que ayuda a dar respuestas muy precisas a las preguntas del usuario. Algunas compañías como Perplexity ya se habían hecho eco de dicho modelo y lo han incorporado al suyo propio, lo que no es ninguna tontería cuando hablamos de una IA enfocada a la investigación.Esto ha sido posible gracias a las características de código abierto de DeepSeek, que hacen posible que cualquiera pueda ver el código del programa y "hacer lo que quiera" (es una definición muy reducida, pero para este caso tendrá que valer) con él.También ha sido posible gracias a estas características que Jiayi Pan, un estudiante de doctorado de la Universidad de California en Berkeley, haya logrado junto con su equipo de investigación haber recreado las funciones principales de R1-Zero. Esto en sí es sorprendente, pero a fin de cuentas este tipo de logros se logran en los laboratorios de las universidades, ¿verdad?Sí, pero lo realmente sorprendente del asunto es que recrear lo que hace especial al modelo de DeepSeek es que sólo ha costado 30 dólares. Es una cantidad irrisoria de dinero si se compara con los millones que se invierten en desarrollar grandes modelos de lenguaje. Si la irrupción de DeepSeek y R1-Zero ya logró que NVIDIA cayese en bolsa tanto que no parecía haber fondo, ¿qué puede provocar en los mercados un modelo que sólo ha costado 30 dólares?Este grupo de estudiantes ha bautizado como TinyZero a su modelo de lenguaje, que entrenaron con un ejercicio de operaciones numéricas y que después aprendió gradualmente a base de revisar problemas complejos y buscar soluciones a ellos. Además, TinyZero está disponible en GitHub para quienes quieran acceder a él y experimentar con él, lo que parece presagiar que el desarrollo de modelos de IA ya no es competencia exclusiva de grandes tecnológicas.Si nos paramos a pensarlo un poco, con TinyZero se han demostrado varias cosas. Para empezar, un altísimo grado de eficiencia. Crear algo con poco dinero no es fácil pero crear un modelo de IA por 30 dólares es casi material para los mejores sueños de un ingeniero. Para seguir, que igual proyectos como Stargate quizá ya no sean tan necesarios. Para terminar, que puede que pronto las grandes empresas de IA comercial descubran competencia donde menos pensaban.El artículo Consiguen recrear todo el potencial de DeepSeek. Les ha costado menos de 30 euros fue publicado originalmente en Andro4all.

Si no te has pasado la última semana viviendo debajo de una roca, en un retiro en un monasterio budista en el Tíbet sin acceso a un móvil o a Internet, probablemente sepas que se ha montado un buen revuelo en el mundo de la IA. La culpable de todo es DeepSeek, que se ha creado por una fracción de lo que cuesta ChatGPT y que, además, es un modelo de IA gratuito y de código abierto.
A DeepSeek el estatus de novedad no le ha durado mucho: le ha salido un competidor de su propio país llamado Qwen, aunque eso no ha impedido que sea la app más popular de la App Store y que en España haya hecho lo mismo a pesar de los preocupaciones de seguridad que han surgido en torno a ella.
Ahora hay otra réplica de DeepSeek, y es hasta más barata
Una de las características que más sorprenden de DeepSeek es su modelo R1-Zero, que cuenta con un sistema de razonamiento avanzado que ayuda a dar respuestas muy precisas a las preguntas del usuario. Algunas compañías como Perplexity ya se habían hecho eco de dicho modelo y lo han incorporado al suyo propio, lo que no es ninguna tontería cuando hablamos de una IA enfocada a la investigación.
Esto ha sido posible gracias a las características de código abierto de DeepSeek, que hacen posible que cualquiera pueda ver el código del programa y "hacer lo que quiera" (es una definición muy reducida, pero para este caso tendrá que valer) con él.
También ha sido posible gracias a estas características que Jiayi Pan, un estudiante de doctorado de la Universidad de California en Berkeley, haya logrado junto con su equipo de investigación haber recreado las funciones principales de R1-Zero. Esto en sí es sorprendente, pero a fin de cuentas este tipo de logros se logran en los laboratorios de las universidades, ¿verdad?
Sí, pero lo realmente sorprendente del asunto es que recrear lo que hace especial al modelo de DeepSeek es que sólo ha costado 30 dólares. Es una cantidad irrisoria de dinero si se compara con los millones que se invierten en desarrollar grandes modelos de lenguaje. Si la irrupción de DeepSeek y R1-Zero ya logró que NVIDIA cayese en bolsa tanto que no parecía haber fondo, ¿qué puede provocar en los mercados un modelo que sólo ha costado 30 dólares?
Este grupo de estudiantes ha bautizado como TinyZero a su modelo de lenguaje, que entrenaron con un ejercicio de operaciones numéricas y que después aprendió gradualmente a base de revisar problemas complejos y buscar soluciones a ellos. Además, TinyZero está disponible en GitHub para quienes quieran acceder a él y experimentar con él, lo que parece presagiar que el desarrollo de modelos de IA ya no es competencia exclusiva de grandes tecnológicas.
Si nos paramos a pensarlo un poco, con TinyZero se han demostrado varias cosas. Para empezar, un altísimo grado de eficiencia. Crear algo con poco dinero no es fácil pero crear un modelo de IA por 30 dólares es casi material para los mejores sueños de un ingeniero. Para seguir, que igual proyectos como Stargate quizá ya no sean tan necesarios. Para terminar, que puede que pronto las grandes empresas de IA comercial descubran competencia donde menos pensaban.
El artículo Consiguen recrear todo el potencial de DeepSeek. Les ha costado menos de 30 euros fue publicado originalmente en Andro4all.