OpenAI lanza o3 y o4-mini: los nuevos modelos de IA que "piensan con imágenes"
Estos modelos de IA comprenden el contenido de las imágenes e integran la información visual en su cadena de razonamiento.

OpenAI presenta sus nuevos modelos de razonamiento, o3 y o4-mini. Dichas innovaciones han sido desarrolladas para programar con el lenguaje de programación Python, navegar por la web, resolver problemas complejos y generar imágenes de forma autónoma, e incluso pueden "pensar con imágenes".
Con este lanzamiento, la compañía de Sam Altman aumenta la familia de modelos de la serie o, centrada en el razonamiento porque cuentan con la capacidad de pensar durante más tiempo antes de ofrecer una respuesta. Además, OpenAI afirma en su blog oficial que los modelos o3 y o4-mini “están centrados para razonar sobre cuándo y cómo utilizar herramientas para producir respuestas detalladas y reflexivas en los formatos de salida correctos, normalmente en menos de un minuto”.
Por otro lado, como gran novedad, son los primeros que "pueden pensar con imágenes", por lo tanto, con una simple fotografía —independientemente de la calidad— comprenden su contenido e integran la información visual en su cadena de razonamiento. Pero, ¿qué ofrece cada uno?
- o3: Este modelo es el más potente y destaca en programación, ciencia, percepción visual y matemáticas, cometiendo un 20% menos de errores respecto a o1 en tareas del mundo real.
- o4-mini: Dicho modelo está optimizado para tareas de razonamiento rápidas y rentables, especialmente en programación, tareas visuales y matemáticas. Asimismo, admite límites de uso mayores que o3.
También, tanto o3 como o4-mini siguen mejor las instrucciones y dan respuestas más naturales, personalizadas y similares a una conversación casual. Y como hemos mencionado anteriormente, dichos avances permiten a ChatGPT interpretar fotografías, diagramas de libros, esquemas o dibujos hechos a mano y, al mismo tiempo, manipular las imágenes sobre la marcha, girándolas, ampliándolas o editándolas.
Respecto a la disponibilidad, ambos modelos ya están disponibles para los usuarios de ChatGPT Plus, Pro y Team; y también en la API para desarrolladores.
Apúntate a nuestra newsletter y recibe en tu correo las últimas noticias sobre tecnología.