Лучшие ИИ совсем не справились с новым тестом ARC-AGI-2 на мышление и рассуждение

Новый тест ARC-AGI-2 на интеллект ИИ поставил ведущие ИИ-модели в тупик. Даже самые продвинутые из них, включая OpenAI o1-pro и DeepSeek R1, набрали лишь 1-1,3%, в то время как люди справились с поставленными задачами на 60%.

Мар 25, 2025 - 19:43
 0
Лучшие ИИ совсем не справились с новым тестом ARC-AGI-2 на мышление и рассуждение
Новый тест ARC-AGI-2 на интеллект ИИ поставил ведущие ИИ-модели в тупик. Даже самые продвинутые из них, включая OpenAI o1-pro и DeepSeek R1, набрали лишь 1-1,3%, в то время как люди справились с поставленными задачами на 60%.