Научно-исследовательский институт искусственного интеллекта AIRI совместно с НИУ ВШЭ разработали новый метод в области компьютерного зрения. Ученым удалось повысить точность обнаружения и распознавания 3D-объектов. Подробностями они поделились с Inc.
Им удалось экспериментально подтвердить преимущества использования малых генеративных моделей ИИ, обученных на качественном наборе данных, для дальнейшего обучения больших моделей искусственного интеллекта и решения задач 3D-детекции. Новая технология может применяться в развитии беспилотных автомобилей и в перспективе позволит точнее определять скорость и направление движения объекта, свойства его поверхности, а также позиционирование транспортного средства в пространстве.
Распознавание 3D-объектов — одна из ключевых задач для разработки полностью автономных транспортных средств. Для этого система на основе разрозненных показаний определяет местонахождение предмета. Однако такие сенсоры, как лидар, не всегда позволяют получить полную информацию о положении предмета в пространстве.
В реальных условиях один элемент может полностью или частично перекрываться другими объектами, что снижает эффективность работы лидара. Например, это может быть дерево или проезжающий мимо автомобиль. Предложенный российскими учеными подход представляет собой более точную методику определения предмета в 3D-пространстве с учетом неточностей данных лидара и наложения объектов.
В ходе исследования, которое длилось в течение года, команда обучала небольшую генеративную модель ИИ при помощи данных, полученных во время проезда автомобиля по улицам города. Такие данные группировались по трем сценариям: когда объект был полностью в поле зрения, была видна лишь его часть и когда он оставался позади. Далее при помощи метода Point Cloud Registration (PCR) они соотносились с конкретными автомобилями и другими предметами даже на основе небольшого видимого фрагмента. Затем эта модель-учитель применялась для обучения большой нейросети. В результате удалось значительно повысить точность работы нейросети. Это значит, что технология стала корректно предсказывать форму предметов в окружающем пространстве еще до того, как они появлялись в поле ее зрения.
«Мы начали работу над проектом параллельно с исследователями OpenAI, которые решили применить схожий подход для работы с текстами, тогда как наша команда сосредоточилась на компьютерном зрении. Интересно, что и сама идея, и полученные результаты показали свою состоятельность у обеих команд, которые пришли к схожим выводам не взаимодействуя друг с другом напрямую», — рассказал Илья Макаров, руководитель группы «ИИ в промышленности» Института AIRI.
Аналитический центр НАФИ провел опрос среди представителей малого и среднего бизнеса и сотрудников, работающих в компаниях, внедривших искусственный интеллект, и выяснил, что чаще всего российские предприниматели используют ИИ для повышения эффективности ежедневных процессов. Почти две трети представителей малого бизнеса благодаря искусственному интеллекту экономят время, а 37% опрошенных убеждены, что ИИ позволяет решать ранее недоступные задачи.