Российский разработчик биометрии привлек 270 млн рублей от государства на систему анализа звука с помощью ИИ
Компания «ЦРТ-инновации» (принадлежит подконтрольному Газпромбанку «Центру речевых технологий») привлекла 270 млн рублей от «Национальной технологической инициативы» на разработку технологии «Нейроухо» для анализа звука с помощью искусственного интеллекта (ИИ). Об этом пишет газета «Ведомости».
ИИ позволит устройствам «слышать», что происходит вокруг. Если система зафиксирует нехарактерные шумы, то она отправит уведомления или направит на источник шумов видеокамеры. Технология также сможет распознавать пол и возраст человека, рассчитывают в компании.
По словам главы ЦРТ Дмитрия Дырмовского, современные системы способны распознавать речь человека, однако они пока не справляются с анализом сложной звуковой картины и отделением речи от посторонних шумов. Кроме того, технологии еще не могут определять такие параметры, как пол и возраст человека.
Стоимость всего проекта составляет 390 млн рублей. НТИ выделила деньги при условии 30%-ного частного софинансирования. 120 млн рублей в технологию вложит ЦРТ. Окупиться разработка должна к 2022 году. А еще через два года компания ожидает выручку в 2 млрд рублей. По словам руководителя отдела разработки голосовых технологий и продуктов «Яндекса» Дениса Филиппова, денег НТИ будет достаточно на создание прототипа. А на промышленную реализацию технологии потребуются дополнительные средства.
Филиппов отметил сложность при сборе данных, которые потребуются для обучения системы. Чтобы научить ее определять звуки, потребуется несколько сотен часов записывать объекты в разных шумовых окружениях и на разной дистанции от микрофона. При этом ЦРТ придется решить проблему наложения звуков.
Сейчас в России над системами распознавания речи работают до 10 игроков, отметил в разговоре с изданием управляющий директор Skolkovo Ventures Владимир Сакович. В ЦРТ отмечают, что этими разработками также заняты почти все работающие над искусственным интеллектом крупные компании: Google, IBM, Microsoft, Amazon и Nuance.
В конце сентября стало известно, что в Москве начала работать технология распознавания лиц российской компании NTechLab. За два месяца испытаний технология помогла задержать шесть преступников, находившихся в федеральном розыске.
А китайский стартап SpeakIn разработал технологию, которая позволяет определить уникальные характеристики голоса человека и идентифицировать его по речи.