В основе разработки лежат нейросети. Технология помогает роботам воспринимать трудные языковые запросы, в которых есть сразу несколько задач.
Google совместно с компанией Everyday Robots, которая также принадлежит Alphabet, разработала экспериментальных роботов, в основе которых лежат языковые ИИ-модели, сообщается на официальном сайте. Чтобы понять, как роботы учатся, команда протестировала их в качестве «официантов» в офисах Google.
В основе системы лежат обучающиеся языковые модели, которые могут понимать абстрактные запросы, а не четкие команды. Например, услышав фразу: «Я только что потренировался, можешь принести мне что-нибудь перекусить?» — робот отправится на кухню и выберет снэк.
Во время первых тестов языковые модели понимали запрос, но предлагаемое решение зачастую было бесполезным. Например, нейросеть GPT-3 на жалобу о пролитом напитке предлагала пропылесосить жидкость, а FLAN и вовсе извинилась перед пользователем.
Чтобы улучшить результаты, разработчики объединили модель PaLM с уже подготовленным для роботов ПО, который распознает задачу и действие, создав систему PaLM-SayCan.
На первом этапе она воспринимает запрос, после чего трансформирует его в набор задач, которые лучше всего подходят с учетом контекста. Для обучения системы использовались десятки тысяч примеров выполнения запросов. Роботов также научили анализировать окружающее пространство, находить определенные предметы и обучаться на получаемом опыте.
Результаты теста показали, что система в 84% случаев верно выбирает последовательность действий. А в 74% случаев успешно справляется с задачей.
Роботов используют не только зарубежные компании. 1 августа российский IT-гигант «Яндекс» сообщил о разработке двух промышленных устройств для складов и дарксторов. Их уже начали тестировать. Компания считает, что роботы окупятся за полтора-два года.