Новости 13.03.2025

DeepMind представила алгоритмы, позволяющие роботам учиться на лету

Google DeepMind представила две новые ИИ-модели, созданные для расширения возможностей роботов при выполнении физических задач. Первая модель, Gemini Robotics, построена на базе Gemini 2.0 — она позволяет андроидам выполнять новые действия без предварительного обучения. Алгоритм добавляет физические действия как новую модальность к мультимодальному пониманию мира, которым обладает Gemini.

Gemini Robotics не только обобщает новые сценарии, но и лучше взаимодействует с людьми и окружающей средой. Управляемый ей робот способен выполнять более сложные физические задачи, требующие развитой мелкой моторики — например складывать бумагу или откручивать крышку бутылки.

Вторая модель, Gemini Robotics-ER, представляет собой продвинутую визуально-языковую систему для понимания сложного и динамичного мира. Как объяснила Каролина Парада, старший директор и руководитель робототехники в Google DeepMind, эта модель помогает роботам рассуждать подобно людям. Например, при упаковке ланч-бокса робот должен знать, где находятся все предметы, как открыть контейнер, как схватить предметы и куда их положить.

Google DeepMind сотрудничает с Apptronik для создания «следующего поколения человекоподобных роботов». Компания также предоставляет доступ к модели Gemini Robotics-ER «доверенным тестировщикам». В их число попали сотрудники Agile Robots, Agility Robotics, Boston Dynamics и Enchanted Tools. По словам Парады, команда сосредоточена на создании интеллекта, способного понимать физический мир и действовать в нём, а также на использовании этих возможностей в различных приложениях.

Темы

2025 IT ИИ