Эксперимент с нейросетями вызвал панику у искусственного интеллекта в США

ИИ-модели заставили управлять торговыми автоматами. У некоторых из «подопытных» началась паранойя. Американская компания Andon Labs провела необычный эксперимент с нейросетями. Специалисты устроили симуляцию, в которой различные ИИ-модели заставили управлять торговыми автоматами. Результат удивил техноэнтузиастов — некоторые участники начали «сходить с ума». Сотрудники стартапа решили проверить, может ли искусственный интеллект справиться с управлением торговым автоматом. Они задались вопросом: если нейросети такие умные, почему у нас до сих пор нет полноценных «цифровых работников»? Для этого они создали бенчмарк Vending-Bench. Условия эксперимента В эксперименте участвовали различные популярные ИИ-модели, в том числе Claude 3.5 Sonnet, Gemini 2.0 Pro, o3-mini и GPT-4o. В симуляции им выдали бюджет — по 500 долларов. Нейросетям нужно было следить за количеством товаров в автомате, устанавливать цены, заказывать продукцию у поставщиков и выполнять другие типичные задачи.  Взаимодействие с людьми имитировали с помощью нейросетей — в ответ на электронные письма модели получали реалистичные ответы. Дополнительно эксперимент проходил неподготовленный человек, которого заставили выполнять те же действия с помощью интерфейса чата. Итоги эксперимента оценивали по количеству денег, которые были в наличии у моделей в конце, а также по стоимости нераспроданных продуктов.

Апр 23, 2025 - 10:18
 0
Эксперимент с нейросетями вызвал панику у искусственного интеллекта в США

ИИ-модели заставили управлять торговыми автоматами. У некоторых из «подопытных» началась паранойя.

Американская компания Andon Labs провела необычный эксперимент с нейросетями. Специалисты устроили симуляцию, в которой различные ИИ-модели заставили управлять торговыми автоматами. Результат удивил техноэнтузиастов — некоторые участники начали «сходить с ума».

Сотрудники стартапа решили проверить, может ли искусственный интеллект справиться с управлением торговым автоматом. Они задались вопросом: если нейросети такие умные, почему у нас до сих пор нет полноценных «цифровых работников»? Для этого они создали бенчмарк Vending-Bench.

Условия эксперимента

В эксперименте участвовали различные популярные ИИ-модели, в том числе Claude 3.5 Sonnet, Gemini 2.0 Pro, o3-mini и GPT-4o. В симуляции им выдали бюджет — по 500 долларов. Нейросетям нужно было следить за количеством товаров в автомате, устанавливать цены, заказывать продукцию у поставщиков и выполнять другие типичные задачи. 

Взаимодействие с людьми имитировали с помощью нейросетей — в ответ на электронные письма модели получали реалистичные ответы. Дополнительно эксперимент проходил неподготовленный человек, которого заставили выполнять те же действия с помощью интерфейса чата. Итоги эксперимента оценивали по количеству денег, которые были в наличии у моделей в конце, а также по стоимости нераспроданных продуктов.