Разобраться • 8 октября 2024
Влияние ИИ: зачем сегодня бизнесу цифровые аватары
Влияние ИИ: зачем сегодня бизнесу цифровые аватары
Текст: Елизавета Пикулицкая
Считается, что феномен цифровых аватаров пришел из продуктов поп-культуры: изначально все, что связано с метаверс (англ. metaverse — метавселенная, виртуальный мир или виртуальная экосистема, в которой пользователи взаимодействуют при помощи аватаров. — Прим. ред.) имело коммерческий успех в рамках индустрии развлечений. С развитием интернета, графических технологий и искусственного интеллекта эволюционировали и аватары, становясь все более похожими на реальных людей. Сегодня они способны не только развлекать, но и выполнять реальные задачи, облегчая людям жизнь и работу. Inc. разобрался, зачем эта технология бизнесу.
Развитие такой инновации, как цифровой аватар, связано в первую очередь с ожидаемым ростом рынка искусственного интеллекта. В исследовании, проведенном американской аналитической компанией Gartner (исследование есть в распоряжении Inc.), говорится, что к 2025 году аватары, использующие технологию генеративного ИИ для преобразования текста в видео, будут поддерживать 70% цифровых и маркетинговых коммуникаций по сравнению менее чем с 2% в 2022 году. Аналитики также утверждают, что к 2025 году 30% маркетингового контента будут создаваться генеративным ИИ, но с человеческим дополнением, по сравнению менее чем с 2% в 2022 году.
Данные анализа российского рынка не менее впечатляющие: аналитическое агентство «Яков и партнеры» опубликовало исследование, в котором говорится, что к 2028 году потенциал искусственного интеллекта оценивается в 22–36 трлн руб. По прогнозам, эта индустрия принесет экономическую выгоду в размере 4,2–6,9 трлн руб., что составит до 4% от ВВП. Ожидается, что генеративный искусственный интеллект может принести до 1,3 трлн руб. экономического эффекта.
В ходе развития технологии цифровых аватаров с ее помощью даже было реализовано несколько успешных коммерческих проектов. Одним из первых стала игра Second Life, запущенная в 2003 году и существующая по сей день. Эта виртуальная игра позволяет создать свой аватар в виртуальной реальности. Зарабатывать авторам удается при помощи внутриигровых трансакций.
Другой проект, способствовавший популяризации аватаров, — запуск виртуального инфлюенсера Lil Miquela. По своей сути это высококачественная оригинальная 3D-модель с придуманной историей, за которой можно наблюдать через социальные сети.
Виртуальная модель имела колоссальный успех: проект и по сегодняшний день рекламирует известные бренды, среди которых Prada, Calvin Klein (вместе с Беллой Хадид), Samsung, Balenciaga. У девушки даже есть свой канал на YouTube и музыкальный клип, ведь по легенде она не просто модель, но еще и музыкант.
Стартап Brud, создатели Микейлы, после нее запускали несколько других аватаров, но ни один из них не повторил оглушительный успех их первой CGI-модели. Однако идею быстро подхватили и другие компании, создав целый тренд на виртуальных инфлюенсеров: экологический активист, оснащенная чат-ботом Leya Love, лицо бразильского ретейл-гиганта Lu Do Magalu, японская фэшн-модель Imma, выступавшая на TED Talks, и многие другие.
Вероятно, именно феномен цифровых инфлюенсеров продемонстрировал, что такой проект, как виртуальный, или мета-человек, может не просто нравиться адептам технологий, но также (при правильном позиционировании) быть серьезным маркетинговым инструментом. Идею быстро подхватили другие компании и трансформировали ее под нужды крупных игроков, у которых были средства, чтобы вложиться в последние технологии.
Видный игрок в этой индустрии — британский стартап Synthesia, основанный в 2017 году (через год после запуска Микейлы). Именно они первыми начали создавать ролики с ИИ-аватарами: во главу угла поставлена идея, что просмотр обучающих роликов со спикерами — самый эффективный метод усвоения информации.
На YouTube-канале Synthesia делятся примерами своих работ, сценариями использования своего продукта и последними новостями. Их цифрового человека уже почти не отличишь от реального — хотя пока что его все же выдают мелкие детали. А на своем сайте компания делится кейсами работ для крупных клиентов: Xerox, Zoom, Electrolux и даже Heineken.
Помимо обучающих роликов, Synthesia дают другие сценарии использования своего продукта. Это может быть b2b-проект для сотрудников по повышению квалификации, маркетинговые видео с описанием продукта или видео от службы поддержки с ответами на часто задаваемые вопросы. Компания самостоятельно создает не только цифровых аватаров, но и голос для них.
Помимо этого, у Synthesia даже есть библиотека уже разнообразных готовых персонажей, среди которых несколько — в свободном доступе, а их библиотека оснащена более чем 130 языками и диалектами: например, один из самых популярных языков мира предлагается в его доминиканском, костариканском, венесуэльском, кубинском и других диалектах.
Существуют и другие компании, которые могут составить Synthesia конкуренцию. Один из таких игроков — стартап из Венгрии Colossyan (о том, почему Венгрия — лучшая страна для запуска стартапа, — в материале Inc.). По собственным заявлениям, в прошлом году компании удалось вырасти на 600%, а недавно Colossyan объявила о получении $22 млн венчурных инвестиций от компании международной венчурной фирмы Lakestar.
«Теперь мы помогаем тысячам компаний (в числе которых Novartis, Vodafone и Paramount) изменить подход к созданию обучающих видео, — заявляет цифровая версия CEO и основателя компании Доминика Ковача. — Клиенты регулярно экономят до 90% своих затрат при производстве видео на 80% быстрее, и это только начало».
Colossyan может как предложить доступ к стоковым аватарам, так и реализовать индивидуальный проект. В базе сервиса есть более 70 доступных языков, функции ИИ-перевода текста и услуга по предоставлению цифрового ассистента. Помимо этого, их оригинальные фичи — интерактивные видео, анимация и жестикуляция аватаров (функция пока в стадии Beta) и использование нескольких цифровых спикеров в одном видео.
Есть еще один похожий проект — компания HeyGen, созданная Уэйном Ляном и Джошуа Сью в Лос-Анджелесе. Изначально будущие бизнес-партнеры познакомились во время учебы в Шанхайском университете Тунцзи, а затем вместе поступили в магистратуру университета Карнеги-Меллона. Позже Лян ушел работать в Smule (родительская компания TikTok), а Сью — в Snap. В 2020 Джошуа решил основать ИИ-стартап и, застряв во время пандемии в Китае, уволился из Snap, чтобы привлечь инвестиции от ведущих китайских венчурных фондов. Так на свет появился HeyGen.
Стартап предоставляет пользователям разный тарифный план, который повлияет на конечную цену и скорость производства, — это его главное отличие от конкурентов. Также HeyGen предлагает своим клиентам интеграцию с другими продуктами, среди которых ИИ-помощник для написания сценариев на основе GhatGPT и платформа для взаимодействия приложений Zapier, — по сути, проводник от редактора в HeyGen до любого популярного приложения, будь то YouTube, Gmail или OneDrive.
Сегодня развитие HeyGen идет семимильными шагами: со временем проект получал все больше финансирования, и сегодня стоимость компании оценивается в $500 млн. Выручка HeyGen в 2023 году составила $20 млн против $1 млн годом ранее: компания намерена в скором времени вырваться в лидеры рынка.
Основные лидеры индустрии находятся за рубежом, но и в России есть проекты по созданию цифровых аватаров. Достижения отечественных игроков также впечатляют.
Одна из самых известных российских компаний в этом сегменте — лаборатория «Наносемантика», основанная Игорем Ашмановым и Натальей Касперской в 2005 году. Сегодня «Наносемантика» занимается всем, что связано с искусственным интеллектом: разработкой нейросетей, работой с данными, а также созданием аватаров.
Руководитель отдела лингвистики в «Наносемантике» Анна Власова рассказывает, что компания изначально искала возможности коммуникации человека и машины, еще до того как термины «большие данные» или «искусственный интеллект» вошли в нашу повседневность:
Анна Власова,
руководитель отдела лингвистики «Наносемантики»
«В 2008 году мы создали социальную сеть говорящих аватаров „А-я-яй.ру“. Каждый участник сети мог выбрать себе подходящего рисованного персонажа, обучить его говорить и опубликовать в своем аккаунте в LiveJournal. Через два года (в 2010-м) он уже насчитывал 504 тыс. зарегистрированных пользователей и 1 млн созданных инфов (чат-ботов), несмотря на то что на рекламу этого проекта не было потрачено ни одного рубля. Стало очевидно, что возможность свободного диалога с ботом вполне востребована уже на тот момент, и эта востребованность явно будет расти».
По словам Власовой, примерно к 2010 году «Наносемантика» уже обладала собственными технологиями ведения автоматизированного диалога (технологии нечеткого поиска языковой модели, подходящей под запрос) на разных языках, практическими наработками и первой версией платформы для разработки ботов.
За 19 лет на рынке компания создала 12 собственных интеллектуальных продуктов, технологий и платформ, а также реализовала свыше 180 проектов для бизнеса и госкорпораций. А с 2021 года команда «Наносемантики» разрабатывает продукт «Цифровой аватар».
Анна Власова,
руководитель отдела лингвистики «Наносемантики»
«Первые аватары мы разрабатывали еще в рамках демо для внутренних целей. Первый проект, который увидел свет, была Мира для МИРЭА, она помогает студентам в стенах вуза. По-своему уникальной также стала Снежинка, 3D-аватар для мультимедийного стенда Международной арктической станции. Это был наш совместный проект с МФТИ. Но полноценную популярность цифровые аватары обрели после показа цифрового двойника Владимира Жириновского, которого мы сделали для ЛДПР, на ПМЭФ-2023. Цифровая копия полностью повторяла манеру речи и мысли реального прототипа, и ее демонстрация на форуме получила большой общественный резонанс. После запуска Жириновского мы стали получать все больше запросов на создание подобных аватаров от самых разных компаний и известных людей в РФ».
Другая компания, которая сейчас активно инвестирует в цифровые аватары, — маркетинговый холдинг Genius Group. Его модель сейчас находится в разработке, однако уже может похвастаться впечатляющими результатами.
Геннадий Нагорнов,
основатель и СЕО Genius Group
«У нас небольшая команда из шести человек: это machine-learning инженеры, исследователи и продуктолог. Мы проинвестировали в это направление около $500 тыс. за полтора года, и сейчас у нас есть достаточно хорошая технология липсинка, где „под капотом“ у нас находится 3D-голова. Мы сотрудничаем со швейцарским институтом Макса Планка, который создает математические модели антропометрии — когда через математику есть возможность задавать определенные параметры скул, например, или ширины, круглоты лица, и потом управлять мимикой. Трудность заключается в том, что просто технология говорящих голов никому не нужна: мало профессионалов, которые могут, так скажем, „достроить“ остальную часть экосистемы, которая необходима для генерации видео».
Сейчас Genius Group проводят много исследований относительно цифровых аватаров. Решение, к которому стремится компания, — графические редакторы, подобно тем, какие предлагают Synthesia, Colossyan или HeyGen. Компания стремится к созданию своего редактора с готовыми пресетами и инструментами для редактирования, которые помогут в создании контента.
Помимо этого, Genius развивают направление прямых трансляций с аватарами: чаты с возможностью обсуждать вопросы в реальном времени для оказания поддержки или же для простого общения. У Genius даже есть свой чат-бот с цифровым аватаром, который уже научился отправлять «кружочки» в Telegram: «Голосовые и текстовые боты существую уже давно, и это не новинка, — рассуждает Нагорнов. — А вот когда с тобой общается оцифрованный человек — это, конечно, вызывает наибольшее доверие».