Новости

Новый чип для распознавания речи сохранит 99% энергии

Исследователи из MIT разработали чип автоматического распознавания речи для мобильных устройств, который экономит от 90% до 99% энергии по сравнению с существующими аналогами, сообщает TechCrunch.

Сегодня смартфон, работающий с программой распознавания речи, расходует примерно 1 ватт. Потребляемая мощность нового чипа в зависимости от количества распознаваемых слов может варьироваться от 0,2 до 10 мВт, что обеспечит экономию 90-99% энергии.

Даже энергосберегающие системы быстро сажают батареи, если работают непрерывно. «Важно встраивать голосовой функционал так, чтобы не растрачивать лишнюю энергию», — пояснила профессор Анантха Чандракасан, чья группа разработала новый чип. Технология оснащена функцией голосовой активации и идеально подходит для использования в мобильных и носимых устройствах, которым важно как можно дольше работать на одном заряде. В экспериментальном прототипе тестировались три разные схемы голосовой активации. Самая сложная и энергозатратная в итоге обеспечила наилучшую эффективность работы чипа, так как давала значительно меньше ложных срабатываний, чем два других алгоритма.

В декабре минувшего года исследователи из Лаборатории информатики и искусственного интеллекта Массачусетского технологического института разработали новый подход к обучению систем распознавания речи, который не зависит от транскрипции. Вместо этого система анализирует соответствие между изображениями и разговорными описаниями этих образов. Затем система распознает, какие акустические особенности записи соотносятся с характеристиками, которые представлены на изображениях.

Новая звуковая система распознавания превосходит своих предшественников и не требует ручного «комментирования» данных, вводимых в компьютер. В ходе тестирования системы было установлено, что она на 13-15% точнее других систем и может распознавать речь лишь немногим хуже человека – система произвела правильную идентификацию в 74% случаях, тогда как люди справлялись с 81%.

По прогнозам Gadget Show, в течение 5 лет технологии распознавания лиц и голоса станет стандартом безопасности для миллионов мобильных устройств. С 2016 по 2021 год в мире появится более 600 миллионов устройств, которые будут оснащены инструментами биометрической идентификации. 

Стоит ли инвестировать в стартапы для распознавания изображений и речи, созданные на базе искусственного интеллекта,  читайте в материале Inc.

Иллюстрация на главной странице: Darius Dan/flaticon.com