Лучшие ИИ совсем не справились с новым тестом ARC-AGI-2 на мышление и рассуждение
Новый тест ARC-AGI-2 на интеллект ИИ поставил ведущие ИИ-модели в тупик. Даже самые продвинутые из них, включая OpenAI o1-pro и DeepSeek R1, набрали лишь 1-1,3%, в то время как люди справились с поставленными задачами на 60%.
