Новости

Google DeepMind научила роботов сортировать белье и мусор с помощью новых ИИ-моделей

Google DeepMind представила ИИ-модели для роботов, которые повышают их способности к рассуждению и позволяют решать более сложные задачи в реальном мире, включая сортировку белья и переработку мусора. Новинки, названные Gemini Robotics 1.5 и Gemini Robotics-ER 1.5, помогают роботам планировать многоэтапные действия, «мысля» перед выполнением, как указано в заявлении компании.

Google DeepMind

Модели позволяют роботам справляться с задачами, требующими нескольких минут, например раскладывать белье по корзинам по цвету. «Модели до сих пор хорошо справлялись с одной инструкцией за раз. Теперь мы переходим к настоящему пониманию и решению физических задач», — отметила старший директор и глава отдела робототехники Google DeepMind Каролина Парада.

В марте компания уже представила первую версию моделей, основанную на Gemini 2.0, которая помогала адаптироваться к новым ситуациям, реагировать на голосовые команды и манипулировать объектами.

Новые модели следуют сериям инструкций и используют инструменты вроде поиска Google для решения проблем. В демонстрации робот упаковал шапку и зонт в сумку для поездки в Лондон, проверив прогноз погоды. Другой пример — сортировка мусора по правилам в Сан-Франциско, найденным в интернете.

Google DeepMind

Еще одно новшество — технология под названием «перенос движения», которая позволяет одной модели ИИ использовать навыки, разработанные для определенного типа роботов, например роботизированной руки, и применять их к другому типу, например к человекоподобному роботу. Раньше обучение роботов было привязано к конкретному типу, а теперь обучающих данных станет больше.

Компания заявила, что ей еще предстоит преодолеть ряд технологических препятствий. В том числе создать возможность для роботов обучаться навыкам, просматривая видео, на которых люди выполняют разные задачи. В отчете сказано, что роботы должны стать более ловкими, а также надежными и безопасными, прежде чем их можно будет использовать в среде, где они взаимодействуют с людьми.

«Одна из главных проблем при создании универсальных роботов заключается в том, что-то, что интуитивно понятно людям, на самом деле довольно сложно для роботов», — сказала главный инженер-программист в области робототехники в Google DeepMind Канишка Рао.