Все ведущие модели ИИ провалили новый тест на общий интеллект
Новый бенчмарк ARC-AGI-2, разработанный для оценки общего интеллекта искусственного интеллекта, показал значительный отрыв между возможностями современных ИИ и человеческим разумом в задачах, требующих адаптации и понимания новых концепций. Большинство ведущих ИИ-моделей продемонстрировали крайне низкие результаты на этом испытании, в отличие от группы людей.
