Новости

Google и МТИ научат искусственный интеллект связывать изображение, текст и звук в единое целое

Устранение несогласованности трех элементов позволит ИИ быстрее обучаться новому наравне с человеком, пишет HighTech.

Сотрудники МТИ и Google пояснили, что разработка, к примеру, позволит искусственному интеллекту, управляющему беспилотником, понять, что перед ним на дороге скорая помощь, и перестроиться на другую полосу, чтобы дать ей проехать. Для этого ИИ сопоставит звук сирены с изображением и сделает соответствующие выводы.

В данный момент большинство исследователей занимаются усовершенствованием технологий распознавания изображений и речи по отдельности. Из-за того что ИИ не может сопоставить звук с картинкой, которую он видит перед собой, система не может оперативно учиться новому.

Ранее Inc. сообщал, что в 2021 году доходы бизнеса увеличатся до $1,1 трлн за счет внедрения алгоритмов искусственного интеллекта.