Meta supera a GPT-4o con Llama 4 Maverick, pero lo consiguió usando una versión custom

Estamos en una época donde las grandes empresas compiten entre ellas no solo en los sectores en los que se especializan, sino también en inteligencia artificial. De hecho, el segmento de la IA ha cobrado tal importancia que hay casos donde las compañías han movido la mayoría de sus recursos para ser empleados aquí. Empresas La entrada Meta supera a GPT-4o con Llama 4 Maverick, pero lo consiguió usando una versión custom aparece primero en El Chapuzas Informático.

Abr 8, 2025 - 13:44
 0
Meta supera a GPT-4o con Llama 4 Maverick, pero lo consiguió usando una versión custom

Estamos en una época donde las grandes empresas compiten entre ellas no solo en los sectores en los que se especializan, sino también en inteligencia artificial. De hecho, el segmento de la IA ha cobrado tal importancia que hay casos donde las compañías han movido la mayoría de sus recursos para ser empleados aquí. Empresas como Meta que se centraban en redes sociales ahora están muy involucradas en IA y hace poco publicaron Llama 4. Esta IA traía 3 nuevos modelos que superaban a sus rivales y resulta que ahora han descubierto que Meta manipuló los benchmarks para acabar siendo la ganadora con Llama 4 usando una versión custom de Maverick.

La inteligencia artificial ha avanzado mucho en poco tiempo, pues en cuestión de un par de años hemos visto mejoras increíbles en los resultados de algunos modelos de IA. Uno de los mayores cambios ha sido como han avanzado los modelos de IA generativa de imágenes y vídeos, pues hace unos años creaban contenido que se notaba enseguida que era falso y tenía muchos errores. A día de hoy no son completamente perfectas, pero son capaces de engañar a muchas personas y medios de comunicación que acaban publicando y hablando de cosas que no existen ni han ocurrido.

Pillan a Meta utilizando una versión custom de la IA Llama 4 Maverick para superar a GPT-4o

Los modelos de IA se entrenan usando grandes cantidades de datos y emplean LLM con millones de parámetros para así poder ofrecer respuesta a nuestras preguntas y órdenes, siendo capaces de tener información sobre casi cualquier cosa que exista. Hace poco Meta lanzó Llama 4 y con ella sus modelos Scout, Maverick y Behemoth que son los modelos de tamaño pequeño, medio y grande, respectivamente. Pudimos ver como Meta los colocaba como una mejor opción a las alternativas de Google con Gemini 2.0 y GPT 4.5/4o.

Con Maverick en concreto consiguieron la segunda posición en LMArena, pues con 1417 puntos consiguieron superar a OpenAI con GPT-4o y se quedaban un poco por debajo de Gemini 2.5 Pro Experimental, el modelo de IA más avanzado de la compañía. No obstante, descubrieron que había letra pequeña en estos resultados y como imaginarás, aquí está el secreto de su gran puntuación. Resulta que Meta utilizó una versión experimental de Maverick en LMArena la cual está "optimizada para la conversacionalidad".

LMArena actualizará su política para impedir el uso de IA custom que saquen ventaja

Meta Llama 3 IA

Si tenemos en cuenta esto, podemos entender que Meta ha aprovechado para utilizar una versión personalizada de su modelo de IA para sacar la mejor puntuación posible. Según la portavoz de Meta Ashley Gabriel, estuvieron experimentando con todo tipo de variantes custom y decidieron utilizar Llama-4-Maverick-03-26-Experimental. Sin embargo, han decidido lanzar una versión de código abierto para ver que logran los desarrolladores. Meta no incumplió las normas de LMArena, pero esta ha expresado su preocupación por los resultados que han conseguido aprovechándose de esto.

LMArena ha dicho que Meta debería haber avisado y dejado más claro que ha utilizado un modelo personalizado. Para evitar otra situación así, LMArena dice que actualizará sus políticas para evitar esto y obligar a utilizar modelos de IA estándar para que las comparativas sean más justas y precisas.

La entrada Meta supera a GPT-4o con Llama 4 Maverick, pero lo consiguió usando una versión custom aparece primero en El Chapuzas Informático.