Yandex B2B Tech запустил первый в России сервис Brand Voice Lite для быстрого синтеза речи, сообщила пресс-служба «Яндекса». Он доступен компаниям на платформе Yandex Cloud. Подробности — в распоряжении «Инка».
«Яндекс»
Компании могут загрузить 20–40 минут записи голоса диктора — актера, владельца бизнеса или амбассадора — чтобы создать уникальный голос для голосовых ботов, подкастов или образовательных материалов. Для добавления эмоций, таких как грусть или агрессия, требуется еще 20 минут записи. Модель синтеза формируется за 7 дней, а доступ к ней предоставляется только заказчику.
Главный технический директор Yandex Cloud Иван Пузыревский отметил, что синтезированные голоса востребованы у банков, ретейлеров и телеком-операторов, которые с их помощью автоматизируют первую линию поддержки. По его словам, технологии SpeechKit уже помогли создать более 50 голосов, а запуск Lite-версии увеличит число таких проектов.
Сервис использует ML-модели Yandex SpeechKit, дообучаемые на данных клиента, которые хранятся в защищенных дата-центрах. Бизнес обязан получить согласие на использование голоса, а сценарии применения ограничены правилами сервиса.
По данным Fortune Business Insights, мировой рынок диалогового ИИ в 2024 году составил $12,2 млрд, а в 2025 году вырастет до $14,8 млрд. Российский рынок, по прогнозам Naumen, достиг 7,45 млрд руб. в 2024 году.