Новости

Ученые из Google нашли замену нейросетям. Машины смогут видеть объекты в 3D

Фото: iStock

В 2012 году информатик Джеффри Хинтон вместе с двумя студентами Торонтского университета разработал систему, которая могла анализировать тысячи фотографий и самостоятельно учиться идентифицировать объекты на картинках. Затем нейронные сети распространились по всей технологической отрасли. Однако у нейросетей есть свои ограничения, поэтому Хинтон представил альтернативный математический метод — капсульные сети. О разработке рассказывает The New York Times.


Если обычную нейросеть натренировать на изображениях кружек, на которых они будут видны только сбоку, то алгоритм не сможет распознать перевернутую чашку. Метод капсульных сетей, который Хинтон предлагает вместе с исследователем Google Сарой Сабур, позволяет приблизить «зрение» системы к человеческому: в отличие от нейросетей, капсульные сети могут идентифицировать изображения в трех измерениях.

Ученые уже опубликовали исследование, в котором показали, что в определенных ситуациях их метод может точнее распознавать объекты, изображенные с незнакомых для алгоритма ракурсов. Капсульные сети пытаются имитировать сеть нейронов в мозге человека более сложным и структурированным образом, чем традиционные нейросети.


Сара Сабур

исследователь Google

«Она (капсульная сеть) может обобщать гораздо лучше традиционных нейросетей, которые все сейчас используют».

Люди не могут распознать объект, посмотрев лишь на одну или на несколько его сторон. Чтобы создать мысленный образ всего объекта, он должен быть помещен в трехмерное пространство. Поэтому многим людям не удается справиться с различными головоломками (The New York Times приводит в пример игру, в которой необходимо собрать пирамиду из двух блоков необычной формы). Подобные головоломки ставят людей в тупик из-за того, что головоломка не дает им представить, как должен выглядеть готовый объект в трехмерном пространстве.

С помощью капсульных сетей Хинтон надеется дать машинам возможность видеть в трехмерной перспективе. Это позволит алгоритмам распознать кофейную чашку с любого ракурса после обучения на изображениях, где она была представлена лишь с одной стороны. Пока что нейросети не могут справиться с этой задачей. По мнению ученого, это огромная ошибка разработчиков технологии компьютерного зрения.

Идея распознавания объектов обучаемыми машинами восходит к 1950-м годам, однако концепция нашла реальное применение лишь в последнее время. Это произошло благодаря увеличению вычислительных мощностей и большим объемам данных в сети. В последние пять лет нейросети начали использовать в цифровых помощниках в смартфонах и в автономных роботах. Однако эти решения пока не могут наделить машины настоящим интеллектом.

Орен Эцион, исполнительный директор Института искусственного интеллекта Пола Аллена (Allen Institute for Artificial Intelligence), обвинил индустрию искусственного интеллекта в близорукости: нынешние усилия ученых на создании нейросетей в долгосрочной перспективе навредят прогрессу искусственного интеллекта. А Эрик Хорвиц, который занимается технологией ИИ в Microsoft заявил, что нейросети и связанные с ними методы — лишь небольшие шаги по сравнению с теми технологиями, которые появятся в ближайшие годы. «Сейчас то, чем мы занимаемся, — нечто вроде алхимии, а не наука», — сказал он.

Сам Хинтон признает, что его нынешний проект показал только предварительные результаты. Однако он рассчитывает, что капсульные сети смогут найти применение в различных ситуациях и ускорить работу над компьютерным зрением и обработкой естественного языка в виртуальном собеседнике. По его мнению, эта технология сможет помочь другим сферам искусственного интеллекта, несмотря на скептицизм среди его коллег. Хинтон напомнил, что пять лет назад многие скептически относились к нейросетям.

Джеффри Хинтон и студенты Торонтского университета, которые участвовали в разработке нейросетей, начали работать в Google в 2013 году. В 2017 году Хинтон открыл лабораторию Google по изучению технологий искусственного интеллекта в Торонто.


Подписывайтесь на наш канал в Telegram!