Новый Open Computer Agent: заполняет формы и управляет браузером без вашего участия
Hugging Face представил Open Computer Agent — бесплатного AI-помощника, который может самостоятельно заполнять формы, бронировать билеты и искать маршруты в браузере, имитируя действия мыши и клавиатуры. Сообщение Новый Open Computer Agent: заполняет формы и управляет браузером без вашего участия появились сначала на DGL.RU - Цифровой мир: новости, тесты, обзоры телефонов, планшетов, ноутбуков.

- Компания Hugging Face представила инструмент искусственного интеллекта для навигации в Интернете от вашего имени
- Агент Open Computer использует настоящий веб-браузер для выполнения таких задач, как поиск маршрутов или бронирование билетов
- Агент и его демоверсия с открытым исходным кодом могут видеть, что происходит на экране, нажимать кнопки, заполнять формы и шаг за шагом выполнять задачи, как человек
Компания Hugging Face представила свой взгляд на растущее число полунезависимых ИИ-агентов, которые могут выполнять онлайн-задания для людей. Новый и бесплатный (хотя и ограниченный) Open Computer Agent — это как личный помощник, живущий в вашем веб-браузере.
В рамках текущей инициативы компании «smolagents» агент Open Computer может взаимодействовать с веб-сайтами и приложениями так же, как вы, управляя невидимой мышью и клавиатурой для выполнения запросов. ИИ может открывать браузер, вводить данные в формы, нажимать кнопки и многое другое. Попросите его проложить маршрут, и он перейдёт на Google Maps, введёт пункт отправления и пункт назначения и покажет вам маршрут, как добросовестный цифровой водитель.
Вы можете попробовать сами с помощью демо-версии в реальном времени. Предупреждаю, что из-за популярности сервиса возможны задержки и ошибки.
Агент ИИ
Агент Open Computer — это другая философия, основанная на идее, которая привела к созданию подобных инструментов, таких как оператор OpenAI, браузер Use прокси 1.0 и браузер-оператор Opera. Как и эти инструменты, агент Hugging Face — это активный участник, а не пассивный источник информации.
Как и в случае с браузером, Open Computer Agent имеет открытый исходный код, а это значит, что любой может посмотреть, как он работает, и создать на его основе что-то своё или, по крайней мере, настроить его для нишевых случаев использования. Агент — это начало чего-то более гибкого, а не готовый продукт с миллионом юридических оговорок. Это также означает, что демоверсия — это именно демоверсия, а не отполированный пакет. Она может работать неправильно и требовать от вас входа в систему и прохождения тестов CAPTCHA.
Бронирование билетов, проверка режима работы магазинов, поиск информации, прокладка маршрутов и переход по меню — всё это многие хотели бы делать с помощью одной команды на естественном языке. Одно дело — спросить ChatGPT, как найти дешёвые авиабилеты. И совсем другое — наблюдать, как инструмент заходит на туристический сайт, просматривает предложения и пытается нажать «Забронировать сейчас».
Возможно, он несовершенен и далёк от совершенства, но Open Computer Agent представляет собой подход к ИИ, который может стать таким же распространённым, как и повсеместно используемые сейчас генераторы изображений на основе ИИ.
Читайте также: Google Gemini на iPad: что предлагает новое приложение
Сообщение Новый Open Computer Agent: заполняет формы и управляет браузером без вашего участия появились сначала на DGL.RU - Цифровой мир: новости, тесты, обзоры телефонов, планшетов, ноутбуков.