Рынок разговорного искусственного интеллекта (conversational AI) стремительно растет: более чем в два раза ежегодно. И если к чатботам в мессенджерах и на сайтах мы уже привыкли, то программируемые навыки для голосовых ассистентов и умных устройств — явление относительно новое. Но именно эта технология уже в ближайшее время серьезно изменит мир и откроет перед бизнесом и разработчиками новые бизнес-перспективы. Рассказываем, как на этом можно заработать.
Что такое «умные» колонки
«Умные» колонки — абсолютно новый подход к донесению услуг и контента. Общение человека с интернет-сервисами происходит через разговорный UX, за которым стоят сложные системы разговорного AI и понимания естественного языка. Хотя производители дополняют гаджеты HDMI-выходами для трансляции видео, встроенными камерами, сенсорными панелями и «умными» экранами, именно речь — главный способ управления смарт-спикерами.
Ключевые игроки на этом рынке — Amazon, Google, «Яндекс» (в России), Baidu, Alibaba, Tencent и Xiaomi (в Азии) — разрабатывают собственных голосовых ассистентов и выпускают устройства с уже встроенными помощниками. Эти компании стремятся построить вокруг своих продуктов экосистемы новых услуг в сотрудничестве с разработчиками — когда-то по такому же принципу действовали Apple с Apple Appstore и Google c Play Market. Партнерская программа Google по разработке диалоговых приложений для Assistant называется Google Actions, у Amazon — Amazon Skills, у «Яндекса» — «Яндекс.Диалоги».
Если сохранится нынешняя динамика, через 3 года в мире будет более 0,5 млрд «умных» колонок (в том числе с экранами) и иных разговорных устройств вроде домашних роботов и «говорящих» игрушек. Все они станут важным каналом доступа людей к услугам и товарам.
К такому развитию событий должны готовиться не только производители устройств, но и разработчики голосовых навыков и приложений, — перед ними рынок «умных» колонок открывает новые горизонты. У тех, кто уже сегодня обратит внимание на эту сферу, есть все шансы выпустить оригинальные продукты, создать новую ценность для потребителей — ну и заработать денег заодно.
Вспомните, как возникла экосистема мобильных приложений. На смену простеньким играм, читалкам для книг и обоям для экрана пришли более сложные игровые и развлекательные аппы (вроде Angry Birds или Talking Tom). Потом настал черед специфичных продуктов, разработанных исключительно для смартфонов (таких как FourSquare), а лидеры веб-рынка взялись создавать свои приложения, адаптируя сайты к мобильной среде. Параллельно росла сопутствующая инфраструктура — рекламные сети, платформы для аналитики и разработок. Отдельные мобильные приложения вскоре стали самостоятельными многомиллиардными компаниями (например WeChat и WhatsАpp) и изменили ландшафт индустрии. На все это ушло примерно 7 лет.
Ждет ли экосистему «умных» колонок и разговорных интерфейсов такой же сценарий? И где искать пути для развития на этом рынке? Поделимся несколькими идеями.
Осваивайте инструменты разработки
По мере «взросления» «Яндекс.Алисы» и Google Assistant все больше людей будут покупать «умные» колонки и все больше компаний захотят взаимодействовать с аудиторией через голосовой канал. Бизнесу понадобятся эксперты и разработчики с опытом в сфере conversational AI.
Выполнение заказов по созданию голосовых навыков и приложений для сторонних клиентов — наименее рискованный и простой способ погружения в новый рынок. Помогайте небольшому и среднему бизнесу попасть в новые для них каналы. Для этого осваивайте платформы для создания навыков под разговорных ассистентов (наподобие Dialogflow) и визуальные конструкторы вроде Chatfuel или Aimylogic от Just AI. Стоит познакомиться и с более сложными решениями, как Amazon Lex, Microsoft Bot Framework или Just AI Conversational Platform, — они требуют глубоких знаний программирования, но дают больше возможностей для решения задач бизнеса.
Переосмысливайте пользовательский опыт
Сейчас важно переосмыслить поведение людей в рамках нового UX. Та же Angry Birds во многом стала популярной, потому что разработчики предложили свежую трактовку touch-интерфейса для игр.
Conversational First — новая парадигма взаимодействия человека с машиной. В ее основе подход, при котором общение на естественном языке становится первичным способом коммуникации, а визуальная информация и привычное касание экранов дополняют диалог и делают его удобнее. Задайтесь вопросом: как совместить этот новый и традиционные подходы? Какие новые возможности дает разговорный AI в привычных сферах — например в играх или обучении? Нейросети и машинное обучение — не самоцель (сегодня доступны тысячи алгоритмов и множество прекрасных библиотек наподобие DeepPavlov), а лишь инструменты. В основе удобной и эффективной коммуникации бизнеса с потребителем — пользовательский опыт (и разговорный AI — именно про это).
Рынок голосовых ассистентов в цифрах
«Умные» колонки — самый динамично развивающийся сегмент потребительской электроники (во всяком случае, с момента появления смартфонов). Число проданных по всему миру устройств с 2016 по 2017 год выросло в 5 раз и достигло 33 млн (по данным аналитической компании Canalys), а в 2018-м эта цифра, по прогнозам, приблизится к 56 млн. Только в США, по оценке компании eMarketer, в этом году «умными» колонками будут пользоваться 61,1 млн (18,7%) жителей страны. А ведь массовые продажи первого устройства этого типа (Amazon Echo) стартовали совсем недавно — в июне 2015-го. И пространства для роста еще предостаточно: по прогнозу Research And Markets, объем глобального рынка «умных» колонок в 2018 году составит $2,68 млрд и к 2023 году вырастет до $11,79 млрд.
Думайте об инфраструктуре на старте
Со временем число разработчиков навыков и самих навыков для ассистентов значительно увеличится. В условиях высокой конкуренции новым игрокам станет сложнее добиться успеха. Гораздо увереннее будут чувствовать себя инфраструктурные проекты, дополняющие разработку: сервисы статистики и аналитики, технологии безопасности, услуги по QA, медиа-сайты и другие дополнительные инструменты, которые помогут выстоять в борьбе за заказчика.
Проведите аналогии с рынком приложений и посмотрите, что уже есть, а чего не хватает. Подумайте, с чем стоит поэкспериментировать на новом рынке. Во все времена актуален подход Сэма Бреннана, начавшего продавать кирки и лопаты во время Золотой лихорадки 19-го века.
Помните про best practice
Не бойтесь повторять. Да, быть первым, создать ценность и донести ее до потребителя — идеальный вариант. Но часто бывает, что кто-то ее уже создал до вас. Повторять, модифицировать и адаптировать чужой успешный опыт к своему рынку — это нормально.
Когда в России появилась рыночная экономика, здесь стали открываться ровно те же форматы супермаркетов, кинотеатров и торговых центров, что и на Западе. И российские компании, которые раньше других воспользовались лучшим опытом зарубежных коллег, стали лидерами. Когда соцсеть «ВКонтакте» запустила первую flash-игру в жанре «ферма» — «Счастливый фермер» (по сути, это был перевод китайской игры Happy Harvest), некоторым казалось, что ниша уже занята. Однако позже уже совсем другим компаниям удалось построить целые игровые империи вокруг этого жанра.
Экспансия голосовых ассистентов и «умных» колонок началась с Азии и США. Изучайте иностранный опыт и статистику пользования, наблюдайте за конкурентами. Если кто-то создал что-то популярное — это вовсе не означает, что «поезд ушел». Возможно, ровно наоборот.
Экосистемы для голосовых ассистентов
В марте 2018 года компания «Яндекс» открыла разработчикам доступ к созданию навыков для «Алисы». Сегодня экосистема «Яндекс.Алисы» насчитывает несколько тысяч навыков, зарегистрированных в каталоге «Яндекс.Диалоги». «Алиса» может заказать пиццу, предсказать будущее, забронировать столик в ресторане, записать к врачу, заказать товары в интернет-магазинах, обучить скорочтению и делать сотни других интересных пользователям и бизнесу вещей.
С конца июля у российских разработчиков появилась возможность создавать диалоговые приложения на русском языке и для Google Assistant. Пока официальной статистики нет, но интерес к новому голосовому помощнику растет. Всего за 2 недели в конструкторе чатботов Aimylogic (он интегрирован с Google Assistant) было разработано 60 голосовых приложений.
Предусмотрите варианты монетизации
Поначалу в магазинах мобильных приложений тоже не все было гладко с приемом платежей (вспомните хотя бы Google Play в конце 2000-х). В экосистеме разговорного AI — она только зарождается — с этим сейчас еще хуже: платежных инструментов почти нет, но даже при их наличии успех не гарантирован, — с помощью Alexa от Amazon покупки совершают только 2% пользователей.
Но так, конечно, будет не всегда. Даже сейчас новый канал доступа к аудитории можно монетизировать: за счет рекламы и тех компаний, которые хотят на него выйти, лидогенерации и других косвенных способов получения денег. Думайте о своей монетизации уже сегодня.
Учите разговаривать
Научить говорить можно не только колонку. Подумайте, каким еще устройствам могут пригодиться голосовые интерфейсы? Разумеется, одно из перспективных направлений — игрушки. Хороший пример — Емеля, первый на российском рынке робот для детей, понимающий естественную речь (с момента появления на рынке в июне 2017 года продано более 7 тыс. этих роботов).
Некоторые стартапы (например Mishka AI и Cinemood) уже учат свои устройства говорить. Дальше их будет больше — куклы, детские роботы, гаджеты для автомобилей, бытовая техника. А может, и электронные роботы-официанты, принимающие заказы на столах в ресторанах? Не бойтесь мыслить шире и смелее.
Выходите за границы
Голосовые ассистенты и умные колонки — это будущее без национальных и государственных границ. Изучайте нужды бизнеса и потребителей в тех странах, где революция conversational AI только зарождается. Присматривайтес к потенциальным технологическим партнерам, ищите возможности локализации интересных голосовых навыков на другие языки. И помните: события на этом рынке развиваются быстро.