Стэнфордский университет представил новый бенчмарк для робототехники под названием BEHAVIOR-1K. Разработчики позиционируют этот тест как единый стандарт для измерения прогресса в отрасли.

Figure AI

До сих пор в робототехнике отсутствовал такой общий стандарт. Каждая исследовательская группа использовала собственные тесты, что делало сравнение результатов практически невозможным. BEHAVIOR-1K, созданный при участии одного из авторов ImageNet, Фей-Фей Ли, призван решить эту проблему.

Бенчмарк включает 1 тыс. реалистичных бытовых задач, основанных на опросах о том, где люди больше всего нуждаются в помощи роботов. Многие из них, например, приготовление пищи или уборка, требуют выполнения длинных последовательностей действий. Для их симуляции создано более 50 интерактивных 3D-сред (дома, офисы, рестораны) с более чем 10 тыс. объектов.

Технической основой служит симулятор Nvidia Isaac Sim на платформе Omniverse с физическим движком PhysX, а также программное обеспечение OmniGibson от Стэнфорда. Эта связка обеспечивает реалистичное взаимодействие с жидкостями, тканями, твердыми и мягкими объектами. Бенчмарк поддерживает широкий спектр роботов, включая Franka, Fetch и Tiago.

Одновременно с запуском BEHAVIOR-1K Стэнфорд анонсировал соревнование BEHAVIOR Challenge 2025. В рамках него исследователи смогут протестировать свои разработки на одинаковых задачах и попасть в первую таблицу лидеров бенчмарка. Ожидается, что это подстегнет конкуренцию и ускорит создание практичных универсальных роботов.

