В DeepMind и Университете Карнеги—Меллон узнали, как заставить алгоритмы учить языки через компьютерные игры

Команды разработчиков из DeepMind (подразделение холдинга Alphabet, которому также принадлежит Google) и Университета Карнеги—Меллон разработали похожие механизмы, которые позволят машинам определять для себя простые принципы языка на основе 3D-окружения, основанного на шутерах от первого лица. Об этом сообщает издание MIT Technology Review.

«Возможность сделать это в трехмерном пространстве определенно представляет собой значительный шаг к тому, чтобы сделать это в реальном мире», — рассказал изданию Девендра Чаплот, студент Университета Карнеги—Меллон. Конечная цель разработки — создание близкой к реальному миру симуляции, которая позволит искусственному интеллекту передавать ту информацию, которую он изучает в реальном мире.

Подход разработчиков использует глубокое обучение с подкреплением. Нейросеть получает необработанные данные об элементах изображения из виртуальной среды и использует вознаграждения, которые издание сравнивает с баллами в компьютерной игре, чтобы учиться методом проб и ошибок.

Во время разработки механизма ученые из DeepMind и Университета Карнеги—Меллон давали двум программам на основе искусственного интеллекта команды, которые требовали от алгоритмов найти необходимый объект в трехмерном окружении. Проиграв миллионы сценариев на высоких скоростях, обе программы научились связывать слова с конкретными объектами и характеристиками, что позволило системам выполнять команды. Отмечается, что алгоритмы научились понимать такие понятия, как «больше» или «меньше», которые позволяют различать похожие объекты.

При этом программы научились обобщать свои знания для ситуаций, в которых они еще не оказывались, отмечает издание. Это позволило повысить гибкость систем по сравнению с предыдущими разработками, которые основывались на определенных правилах.

В MIT Technology Review отмечают, что разработчики из Университета Карнеги—Меллон в ходе обучения системы смешивали визуальные и вербальные входные данные, чтобы сосредоточить внимание ИИ на наиболее релевантной информации, тогда как ученые из DeepMind поставили перед своей системой дополнительные цели обучения, которые позволили улучшить общую производительность алгоритмов.

Напомним, в июне ученые из Лаборатории по исследованию искусственного интеллекта Facebook (FAIR) обнаружили, что алгоритм, с помощью которого общаются боты, придумал собственный язык. Позднее разработчики социальной сети свернули работу над одной из систем после того, как чат-боты вышли из-под контроля и начали говорить на собственном языке.

Темы

искусственный интеллект обучение