Спецпроекты • Партнерский материал • 15 декабря 2023

ИИ для настоящей жизни:
как коммуникационные платформы
соревнуются за наш комфорт

ИИ для настоящей жизни: как коммуникационные платформы
соревнуются за наш комфорт

Текст: Алиса Горбунова

Иллюстрации: Ксения Балахнина


Интересно, что первые попытки создания систем для видеоконференций начались не вчера, а еще в 20-х и 30-х годах XX века с использованием аналоговых телефонных линий. В 60-х и 70-х годах с развитием КТ стали возникать более продвинутые варианты: одной из ранних платформ была Picturephone от AT& T. Но массовый пользователь узнал о коммуникационных платформах с видео лишь 20 лет назад — а настоящий бум видеоконференций случился во время пандемии COVID-19. С тех пор львиная доля рабочего и учебного процесса окончательно прижилась в онлайне — и это тренд не российский, а общемировой. При таком спросе расширилось предложение: сейчас разработчики внедряют в платформы искусственный интеллект (ИИ), добавляют новые фишки — все для того, чтобы стать первыми на прибыльном рынке. Как конкретно ИИ помогает улучшать использование продукта, что есть уже сегодня и что, возможно, станет реальным через пару лет? Говорим и рассуждаем вместе с МТС Линк.

Есть уже сегодня

1. Шумоподавление: онлайн-колл в любых условиях

Большинство удаленных работников научились быть гибкими и проводить встречи где угодно: дома, в кафе, на улице. Главная сложность очевидная — в отличие от офисных работников, у которых есть возможность уйти в переговорку, удаленщики не могут предсказать, что прозвучит через секунду: плач ребенка, музыка, дрель соседа.

Сегодня многие платформы видеоконференций уже научились подавлять посторонние звуки. Работа ИИ здесь непростая, состоит из нескольких этапов. Во-первых, алгоритмы анализируют звуковой поток и выделяют участников, говорящих в микрофон. Во-вторых, ИИ выявляет фоновые шумы, которые нужно удалить, — для этого нейросеть уже должна быть знакома с типовыми дорожками вроде гудения кондиционера, лая собаки, разговоров вне кадра и сотен других акустических помех. И, наконец, обработка сигнала: усиливаем все нужное и фильтруем отвлекающие звуки. Конечно, такую технологию можно создать без участия ИИ, но ее качество будет хуже. Только ИИ может адаптироваться к новым условиям и быстро на них реагировать.

Дмитрий Крюков,

руководитель направления гибридных коммуникаций МТС Линк:

«Бывают забавные ситуации, когда, к примеру, плач какого-то конкретного ребенка фильтруется хуже, чем плач других детей. Но такие кейсы рассматриваются отдельно, на них модели дообучаются, становятся лучше, и это непрерывный процесс».

2. Транскрибация звонка

Пять-семь лет назад в медиа впервые стало модно писать статьи о том, какие профессии скоро заменит ИИ. Сегодня уже можно судить о первых результатах: некоторые профессии действительно исчезают или трансформируются. Например, транскрибаторы аудио- и видеозаписей. Раньше им отправляли дорожки и платили за перевод звука в текстовый формат, а результата ждали около суток. Сегодня ИИ свободно транскрибирует любые записи — выберите сервис в поисковике, загрузите запись, получите результат. А в некоторых платформах для видеоконференций ИИ и вовсе делает эту работу автоматически.

Технически главная сложность создания такой фичи — корректное распознавание речи. А она бывает очень разной: это и языки, и акценты, и интонации, и уровни громкости, и тематика разговора. Собеседники банально могут перебивать друг друга. Но обработка естественного языка — передний край науки и технологий, так что эта функция улучшается непрерывно.

3. Подведение итогов встречи

Возможно, еще одна профессия прошлого — ассистент руководителя. По крайней мере присутствие на каждом собрании, внимательное участие, а в конце подведение итогов, да еще в эпоху непрерывных онлайн-встреч, — это функционал, который тянет на отдельную ставку. Но сегодня ИИ уже встраивается в конференц-платформы и подводит итоги сам. После встречи пользователь получает краткую текстовую сводку: о чем шла речь, что главное, о чем договорились. Это важно не только для тех, кто был на встрече, но и для тех, кто пропустил совещание, летучку или лекцию.

Дмитрий Крюков

руководитель направления гибридных коммуникаций МТС Линк:

«Сейчас происходит бум всевозможных саммаризаций, но в России мы пока единственные среди ВКС-платформ, кто эту функцию уже отдает пользователям и получает первую обратную связь. У международных игроков такой функционал реализован, как правило, через интеграции со сторонними сервисами. На наш взгляд, необходимо развивать этот сервис в качестве основного функционала внутри платформы, мы идем именно по такому пути».

Мечты о будущем

1. Анализ рабочих звонков

Глобальный отчет Asana The Anatomy of Work Index 2019 года сообщает, что сотрудники по всему миру суммарно тратят около 60% времени на «работу ради работы». Это, например, поиск файлов и документов, дублирование усилий, когда одну и ту же задачу выполняют разные исполнители, ожидание фидбэка, участие в ненужных встречах. Причем чаще всего работники об этом даже не подозревают: они оценивают долю упущенного времени лишь в 35%. А мы добавим, что при всех затратах в этих процессах всегда остается некоторый хаос: что-то потеряли, что-то не успели.

А теперь представьте универсального ассистента для всей команды: он будет слушать онлайн-совещание и обновлять базу знаний, ведь на звонке озвучили нечто ценное; рассылать ответы на вопросы тем, кто в ходе встречи их задавал; составлять библиотеку всех совещаний; планировать новые собрания и добавлять их в календари; обновлять план для всей команды и отдельных сотрудников — с учетом задач, озвученных во время собрания. Здесь ИИ точно будет полезен, и кажется, что предпосылки к появлению таких технологий уже есть.

Дмитрий Крюков

руководитель направления гибридных коммуникаций МТС Линк:

«Представим, что на собрании есть человек, который постоянно задает вопросы по некоторой теме. При этом у нас уже есть расшифровки всех рабочих звонков с привязкой к конкретным спикерам. Почему бы не посоветовать этому сотруднику нужного эксперта. Например, на совещаниях я часто говорю про искусственный интеллект и на основании этого меня можно выделить как специалиста, к которому можно обратиться по этой теме. Альтернативный вариант — посоветовать подходящий обучающий курс или статью в базе знаний, которые тоже могут быть сгенерированы с помощью больших языковых моделей».

2. Оценка настроения сотрудника

Исследование международной аудиторско-консалтинговой корпорации Deloitte показало, что 77% работников чувствуют выгорание на текущей работе, а основной причиной называют отсутствие поддержки и признания от руководства. И ведь правда: каждый из нас периодически устает, расстраивается, скучает и теряет ощущение смысла в работе. Эти состояния можно «прочесть» по нашему поведению, мимике и речи, но это если пристально смотреть. Всегда ли нам хватает сил на такой анализ? У ИИ силы есть всегда. Он-то и может быть помощником, например, руководителю. И после очередного собрания отправить сообщение: «Эй, приятель, в твоем отделе уставший сотрудник, давай предложим ему помощь!»

Дмитрий Крюков

руководитель направления гибридных коммуникаций МТС Линк:

«Сотрудник может говорить раздраженно, а может — с вдохновением, например. Сейчас это несложно определить как с помощью технологий анализа речи, так и с помощью анализа смыслов на базе больших языковых моделей. Отслеживая динамику таких параметров, можно вполне успешно определять, например, степень профессионального выгорания или чрезмерную усталость. Что делать с этим далее — второй вопрос. Как минимум обратить внимание самого сотрудника и посоветовать отдохнуть».

3.Виртуальный аватар

Представьте, что в понедельник вам нужно провести пять лекций для слушателей из пяти стран мира на разных языках. Звучит как длинный, сложный — но продуктивный день, в том числе и для самого лектора. Чем больше этих встреч, тем лучше ваши спикерские навыки, меньше страх перед незнакомой аудиторией, глубже понимание собственного материала.

Но что, если материал давно отработан и чтение лекции — уже не вызов, а рутинный процесс? Или график перегружен так, что к последней лекции качество работы с аудиторией падает? Виртуальный аватар в этом случае будет очень полезен. Он не зевает от скуки, не устает, может делиться материалом на любом языке, да еще оставаться всегда в хорошем настроении. Кажется, что это «маст хэв».

Реклама. ООО «ВЕБИНАР ТЕХНОЛОГИИ», ИНН 7707340808, erid: 5jtCeReNwy7uBLMS3UB4TaX