Рубрики

О журнале

Соцсети

Напишите нам

Новости

Российские ученые предложили новый метод многоагентного планирования для роботов

Ученые Института AIRI, ФИЦ ИУ РАН и МФТИ представили свою разработку — MAPF-GPT, новый подход, который решает задачу многоагентного планирования эффективнее существующих обучаемых методов. Работа представлена исследователями в ходе ежегодной конференции по искусственному интеллекту AAAI 2025. Подробности — в распоряжении редакции «Инк.».

Многоагентное планирование помогает нескольким независимым роботам или программам координировать действия для достижения общей цели. Этот процесс используется в автоматизированных логистических системах и умных складах.

Главной сложностью является синхронизация действий агентов. Оптимальный маршрут должен не только учитывать начальные координаты, но и обеспечивать безопасное и плавное движение в динамической среде.

До сих пор большинство решений в этой области базировалось на статических графах, где маршруты составляются заранее. Такой подход гарантирует достижение цели, но плохо адаптируется к изменениям в реальном времени.

MAPF-GPT позволяет моделям принимать решения о действиях агентов непосредственно в процессе выполнения задачи. Вместо заранее заданного маршрута система адаптируется к неожиданным изменениям, таким, как появление человека в рабочей зоне или изменение карты.

Архитектура MAPF-GPT основана на модели трансформера, которая анализирует наблюдения. На их основании она строит оптимальные решения. Входные данные обрабатываются в виде последовательностей фиксированного размера (256 токенов), что позволяет эффективно кодировать информацию о среде и действиях агентов.

Ключевым элементом трансформера является механизм внимания, который выделяет значимую информацию и помогает учитывать поведение других агентов, тем самым повышая точность решений.

В отличие от традиционных методов, MAPF-GPT способен прогнозировать последствия своих решений и корректировать действия в реальном времени. Это делает его особенно перспективным для динамичных сценариев.

Будущие версии MAPF-GPT можно будет применять в задачах многоагентного обучения с подкреплением (MARL), где агенты обучаются в среде, аналогичной SMAC, основанной на популярной игре StarCraft II.

В ходе работы исследователи подготовили самый большой на сегодняшний день датасет для мультиагентного принятия решений. Его объем составил 1 млрд пар «наблюдение-действие». Датасет размещен в открытом доступе для поддержки научного сообщества и его можно использовать для воспроизведения результатов или улучшения модели.

Научный сотрудник группы «RL агенты» лаборатории «Когнитивные системы ИИ» Института AIRI Антон Андрейчук уверен, что MAPF-GPT поможет сообществу в развитии методов многоагентного планирования. По его словам, исследователи смогут адаптировать модель под новые задачи, а также предлагать более эффективные решения к уже существующим.

Ранее «Евраз НТМК» внедрил автономные электрогрузовики для перевозки проб металла и темплетов стальных заготовок по территории комбината. Робогрузовики произведены российской компанией «ЭвоКарго». Две машины могут ездить без водителей по заданным маршрутам общей протяженностью до 4 км.