Actualité : Les modèles o3 et o4-mini d'OpenAI ont un niveau inhabituel d'hallucinations

OpenAI a lancé ses nouveaux modèles o3 et o4-mini sauf que selon les tests internes de l’entreprise, le taux d’hallucinations est très élevé.

Avr 20, 2025 - 22:01
 0
Actualité : Les modèles o3 et o4-mini d'OpenAI ont un niveau inhabituel d'hallucinations
OpenAI rapporte que son modèle o3 hallucine en réponse à 33 % des questions sur PersonQA, un benchmark qui mesure la précision des connaissances sur les personnalités. Il s’agit d’un score plus élevé que les modèles o1 et o3-mini qui ont, respectivement, 16 % et 14,8 %. Le modèle o4-mini fait pire avec ses 48 %.OpenAI admet que ses modèles hallucient...