Amazon запустил новую систему искусственного интеллекта Nova Act, способную самостоятельно управлять браузером. Продукт представляет собой набор инструментов для разработчиков (SDK), позволяющий создавать ИИ-агентов, которые могут выполнять сложные задачи в цифровой среде. Система доступна в превью-версии для разработчиков и клиентов из США.
Фото: Freepik
Nova Act разбивает комплексные процессы на отдельные команды. Последние могут включать поиск информации, проведение платежей и ответы на вопросы о содержимом экрана. Разработчики могут добавлять собственные инструкции, использовать сторонние API и взаимодействовать с браузерами через библиотеку Playwright. В ходе внутреннего тестирования система достигла более 90% успешности в взаимодействиях с интерфейсом, включая выбор дат и обработку всплывающих окон.
Компания утверждает, что Nova Act превосходит аналогичные модели от Anthropic и OpenAI в некоторых тестах. Система эффективно работает даже в совершенно незнакомых средах — например, браузерных играх. Amazon уже интегрировал новую модель в своего голосового помощника Alexa+.
В будущем Amazon планирует создать ИИ-агентов, способных самостоятельно выполнять многоэтапные задачи. Так, нейросети смогут планировать свадьбу или собирать целые ИТ-проекты. В отличие от традиционного обучения с учителем, компания планирует делать упор на обучение с подкреплением в различных средах, как это делает OpenAI для тренировки своего агента CUA.