Взлететь

Давай голосом. Вспоминаем историю Siri — голосового помощника, который опередил Google, продался Apple и изменил жизни миллионов

Давай голосом. Вспоминаем историю Siri — голосового помощника, который опередил Google, продался Apple и изменил жизни миллионов

Фраза «Привет, Siri» стала неотъемлемой частью повседневной жизни миллионов людей по всему миру. Кажется, эта электронная женщина всегда жила внутри наших iPhone и была создана специально для них. На самом деле всё не совсем так: Siri — это разработка группы инженеров из Стэнфорда, в которую в самом начале пути никто не поверил. Никто, кроме Стива Джобса.

Об истории самого популярного в мире голосового помощника рассказывает один из его создателей, президент Стэнфордского исследовательского института SRI International Норман Винарски. Его статья попала в сборник «Harvard Business Review: 10 лучших статей. Предпринимательство и стартапы», который вышел в издательстве «Альпина Паблишер» в августе. Inc. публикует отрывок из этого текста.

Я только что занял свое место, рейс задерживали, и пассажир в соседнем кресле спросил меня, во сколько же мы теперь прилетим. Поскольку на тот момент я вместе с группой коллег как раз тестировал Siri, то просто достал телефон и спросил: «Siri, во сколько ожидается прибытие рейса 98 United Flight?» Когда Siri ответила с учетом времени задержки рейса, пассажир был просто потрясен. Он сказал: «У меня только один вопрос: почему вы в экономклассе? Ведь вы, должно быть, миллиардер!»

Я был так глубоко погружен в деловые, технологические, стратегические и финансовые проблемы нашего проекта, что упустил из виду, насколько блестящую технологию мы создали. Понадобилась отвисшая челюсть незнакомца, чтобы напомнить мне: мы разработали приложение для смартфона, которое может понимать голосовые вопросы и отвечать на них. И мы собираемся передать искусственный интеллект в руки миллионов потребителей. Но этому предшествовала долгая дорога и несколько крутых поворотов.

Долина смерти

Как президент SRI International (организация, основанная в 1946 году и получившая название Стэнфордский исследовательский институт), я возглавляю группу, которая создает, проектирует и реализует проекты на основе технологий SRI. У меня потрясающая работа. Каждый день я наблюдаю за развитием революционных технологий, которые могут сделать жизнь людей более безопасной, здоровой и продуктивной.

Но есть одно «но»: между изобретением и инновацией пролегает «долина смерти». Это метафора венчурного мира, и означает она то, что большинство изобретений погибают до того, как они достигнут рынка, из-за отсутствия достаточного и растущего спроса, ценности продукта, сильного бизнес-плана или необходимых ресурсов. Моя работа — помочь идее пересечь эту долину смерти. Иногда нам удается превзойти в этом даже самые смелые мечты, и Siri была одним из таких потрясающих прорывов.

Видение рынка, которое привело к появлению Siri, уходит корнями в 2003 год, когда основные приложения мобильных телефонов все еще были ограничены рингтонами и мессенджерами. Мы осознали, что итогом роста возможностей телефона станет коммуникационный суперкомпьютер в кармане у каждого, и мы поверили в свои силы, в то, что SRI International сможет стать лидером в неизбежной технологической и рыночной революции.

Мы создали команду под названием Vanguard для разработки концепций, ориентированных на рынок. Первыми ее решениями стали встроенные в смартфон интеллектуальные функции, позволяющие пользователям запрашивать с помощью текста или голоса выполнение таких задач, как планирование телефонной конференции, обычных звонков или заказ продуктов питания.

Примерно в то же время, когда была сформирована команда Vanguard, Агентство перспективных оборонных исследовательских проектов США (DARPA) выделило $150 млн на разработку когнитивного программного помощника. (Одним из источников вдохновения этого проекта был Радар О’Рейли — персонаж телесериала «Чертова служба в госпитале Мэш», который всегда знал, чего хочет его полковник еще до того, как полковник понимал это сам). Концепции проекта DARPA дополнили идеи Vanguard и в итоге побудили к созданию Siri.

Создание отдельного венчура под проект не входило в наши планы: в течение последующих четырех лет мы вели переговоры с десятками операторов связи и поставщиков мобильных телефонов. Мы хотели сделать совместный проект, который лицензировал бы нашу технологию и коммерциализировал интеллектуального помощника.

Это оказалось непростой задачей. Снова и снова мы выслушивали возражения: «Невозможно: время этой технологии наступит лет через 20», «Слишком дорого» (мы искали от $5 млн до $10 млн на финансирование разработки и лицензионные сборы), «Не вписывается в нашу бизнес-модель», «На создание продукта уйдет больше года», «Не принесет быстрого дохода», «Мы уже делаем это сами». Несколько совместных проектов мы все-таки запустили, но через них мы реализовали лишь незначительную часть нашего замысла, и в итоге мы решили основать отдельный венчур для создания совершенно новых продуктов.

Болевая точка

Несколько месяцев команда изучала рыночные возможности. Люди попросту устали нажимать кнопки в телефоне — в 2007 году сенсорные экраны смартфонов еще были далеки от совершенства.

Исследование рынка показало, что всякий раз, когда пользователям требовалось нажать на экран, 20% из них отказывались от намерения купить что-либо или установить приложение.

Прорывная идея, лежащая в основе Siri, была простой и мощной: в отличие от поисковых систем, Siri станет голосовым «механизмом действия». Она поймет ваш запрос, автоматически получит доступ к необходимой информации и превратит ее в ответ. Все усилия будут предприняты Siri, а не пользователем, — это будет виртуальный личный помощник, который поможет людям купить билеты на игру, забронировать столик, получить прогноз погоды или найти фильм за один-два клика.

Оригинальная технология

Технология, необходимая для устранения обозначенной проблемы, была революционной, хотя уже разрабатывалась не одно десятилетие. Преобразование речи в оцифрованный текст оказалось простейшей из задач (SRI еще в 1994 году запустила Nuance — мирового лидера в области голосовых решений). Сложнее всего было научить программу анализировать слова, чтобы понять намерения пользователя, делать из этого верные выводы и отвечать на запросы.

Компьютер должен был уметь идентифицировать понятия и связывать группы слов с ними. Люди легко выполняют такие задачи, но большинство из них на тот момент считали, что это не под силу компьютеру.

Основу для технологии распознавания естественного языка разработали Лаборатория речевых технологий и исследований SRI и Центр искусственного интеллекта SRI в рамках программы DARPA.

Были также привлечены собственные инвестиции SRI. Адам Чейер и Дидье Гуццони возглавили работу на завершающем этапе, что позволило нам сделать Siri продуктом для миллионов пользователей.

В течение почти двух десятилетий Чейер, один из самых дальновидных специалистов SRI, создавал и внедрял компьютерные системы, которые позволяют людям взаимодействовать с сетевыми программами и устройствами. Вместе со своим аспирантом Гуццони он разработал методы понимания и логической обработки естественного языка, которые упростили задачу ответов на запросы.

Команда

Нам повезло нанять выдающегося предпринимателя Дага Киттлауса на пост генерального директора нового венчура. Чейер решил покинуть SRI и присоединиться к новой компании. Том Грубер, ведущий новатор в области интеллектуальных пользовательских интерфейсов, присоединился несколько месяцев спустя и в итоге стал техническим директором. Билл Марк, президент SRI по вопросам информационных и компьютерных наук, и я тоже стали основателями. Мы вдвоем при этом остались в SRI, и я стал членом совета директоров венчурной компании.

Ценностное предложение

Первые шесть месяцев в центре нашего пристального внимания было ценностное предложение. Мы хотели решить проблему миллионов потребителей с помощью мощного продукта, который принесет миллиардную прибыль. В частности, Siri уменьшит дискомфорт, связанный с необходимостью постоянно кликать, сэкономит людям время и энергию, предоставит оригинальные и прорывные технологии распознавания речи, понимания естественного языка и возможности искусственного интеллекта, обеспечит приносящие доход виды использования и просто будет удивлять и радовать потребителей. Мы решили, что бизнес-модель Siri будет привязана к платежам, проведенным с ее помощью, а доход будет представлять собой процент от транзакций. Мы осознали, что доход от лидов, которые Siri предоставит отелям, ресторанам и авиакомпаниям, может быть значительным.

В конце 2007 года, после шести месяцев разработки ценностного предложения, мы решили искать внешние инвестиции для нового проекта. Мы знали, что найти спонсора будет непросто, потому что Siri зависит от прорывов как на рынке, так и в технологиях. Многие венчурные капиталисты были скептически настроены после шумихи, поднятой вокруг ИИ. Они скрупулезно изучали каждую деталь ценностного предложения и бизнес-плана, включая рынок, технологии и конкурентов. Сможем ли мы вырастить большую потребительскую базу? Хватит ли вычислительной мощности смартфонам? Будет ли технология ИИ работать? Не будут ли связь и обработка слишком медленными? Сможет ли бизнес-модель, основанная на генерации лидов, приносить достаточный доход? Как быстро потенциальные конкуренты, такие как Google и Microsoft, отреагируют собственными продуктами?

Читать также

Илон Маск в переработке. Как выпускник Принстона создал крупнейшую в мире частную компанию по утилизации мусора с оборотом $70 млн в год

В конце концов, их озабоченность мы могли только смягчить, но не устранить полностью. Да, Siri будет многообещающим, но рискованным вложением. Очевидно, что она повлияет на индустрию мобильной связи своей прорывной технологией, возникшей на пересечении глобальных тенденций, включая появление смартфонов, рост вычислительных возможностей и возможностей хранения данных, скорости связи, веб-сервисов и интерфейсов, а также разработку систем искусственного интеллекта. Время для запуска было подходящим. Мы собрали $8,5 млн — достаточно, чтобы финансировать проект в течение полутора лет. Однако процесс финансирования дал нам гораздо больше, чем просто деньги. Он дал нам смелых, проницательных инвесторов, которые стали нашими партнерами, помогли нам определить бизнес-модели, разработать стратегию, построить отношения с клиентами и многое другое.

Однако без проблем не обошлось: шесть месяцев сверх плана ушло на решение вопросов, связанных с медленным откликом сервера на пользовательские запросы и технологией распознавания речи. Тем временем Google и другие продвинулись в собственных решениях. Некоторые компании сделали нам предложения о приобретении. Условия сделок с провайдерами и веб-сервисами оказались сложными. Операторы беспроводной связи выступили с предложениями, которые увели нас в сторону от первоначального продукта.

Запуск

Наконец, завершив в феврале 2010 года трехмесячное пользовательское тестирование (во время которого я и продемонстрировал Siri в самолете), мы были готовы к запуску в Apple App Store. (То, что название «Siri» похоже на «SRI», является чистым совпадением. Мы выбрали его по другим причинам — из-за его лаконичности и из-за того, что оно не имеет отрицательной окраски ни в одном из существующих языков). Мы подготовили демонстрации и обзоры с ведущими блогерами таких ресурсов, как Scobleizer и TechCrunch. Демонстрации имели оглушительный успех и вызвали лавину потребительского интереса. Бесплатные загрузки Siri росли с астрономической скоростью. Она вошла в топ-50 всех приложений Apple и стала лучшим приложением для повседневной жизни.

Через две недели после запуска у Киттлауса зазвонил телефон: «Привет, это Стив Джобс». Киттлаус решил, что его разыгрывают, и повесил трубку. Но телефон зазвонил опять: «Клянусь, это Стив Джобс».

Они немного поговорили, Джобс поздравил Киттлауса с отличной работой Siri и пригласил его, Чейера и Грубера к себе домой, чтобы обсудить технологию Siri. Джобс понимал ценность ИИ-движка так же ясно, как и суть самой технологии. И он понимал, что ошибки в распознавании естественного языка будут возникать всегда, но это его не смутило. Поразительно, ведь практически все продукты Apple созданы «быть безупречными».

В течение следующих нескольких недель Джобс и Киттлаус обсуждали цену покупки Siri. Мы не спешили продавать, потому что полагали, что ценность бизнеса почти наверняка увеличится после новых успешных испытаний и подписанных соглашений о дистрибуции. Но Джобс сделал предложение, от которого инвесторы и исполнительная команда не смогли отказаться (сумма сделки не разглашалась, но по оценкам экспертов составила $200–250 млн). Команда также очень хотела поработать с Джобсом и Apple.

Год спустя Siri стала основной платформой для суперпопулярного сервиса на новом iPhone 4S от Apple. 4 октября 2011 года Фил Шиллер, вице-президент Apple по международному маркетингу, представил Siri как «самую крутую фишку iPhone 4S».

А на следующий день Стив Джобс умер. Но я благодарен судьбе, что он увидел презентацию.

В первые несколько недель после запуска аналитики сообщали, что Siri помогла увеличить продажи на миллиарды долларов. Она и сейчас остается ключевым элементом всех устройств на iOS.

Apple и многие другие компании, в том числе SRI, участвуют сегодня в гонке по разработке продуктов, которые способствуют развитию технологий и обслуживанию новых рынков. Все свершения еще впереди. Распознавание речи и естественного языка, машинное обучение все еще находятся в зачаточном состоянии. Новые виртуальные личные помощники будут еще лучше понимать слова и языки. Они будут поддерживать контекст, вести настоящие беседы, учиться у своих пользователей и станут «специалистами», открывающими потребителям доступ к такой информации, как медицинские записи и банковские счета.

Например, SRI недавно запустил новое предприятие Kasisto, которое переопределяет возможности мобильного банкинга с помощью голосовых, текстовых и сенсорных интерфейсов и обладает возможностями для общения. Несомненно, будущее виртуальных личных помощников в безопасности.