«Интернет как оружие»: что спецслужбы знают об интернет-пользователях и как обеспечивается безопасность в сети

«Интернет как оружие»: что спецслужбы знают об интернет-пользователях и как обеспечивается безопасность в сети

«Вся информация, которую мы оставляем о себе в интернете, попадает в ЦРУ», — это известная теория заговора. Яша Левин, американский журналист российского происхождения, в прошлом автор легендарной московской газеты для экспатов The eXile, решил разобраться, нет ли в подобных теориях хоть сколько-нибудь правды. В своей книге «Интернет как оружие» (выходит в издательстве «Индивидуум Принт») он рассказал историю взаимоотношений американских силовых структур и технологических компаний начиная с войны во Вьетнаме и до наших дней. Inc. публикует две главы, рассказывающие, как с чувствительной с точки зрения личной и общественной безопасности информацией обращались основатели компании Google в самом начале ее истории.


Прослушка мозга


В 1998 году Ларри Пейдж и Сергей Брин заселились в гараж дома, который принадлежал Сьюзен Воджицки, сестре будущей жены Брина — Энн Воджицки. У них был начальный капитал в виде чека на $100 тыс. от Энди Бехтольшайма, соучредителя Sun Microsystems — влиятельной компьютерной компании, которая сама выросла из финансируемой ARPA программы исследований, реализованной в 1970-е годы в Стэнфордском университете . За первоначальным небольшим вложением последовал транш $25 млн от двух крупных венчурных инвестиционных компаний: Sequoia Capital и Kleiner Perkins.

Брин и Пейдж были страшно довольны. Получив деньги, молодые предприниматели смогли нанять на работу несколько коллег по стэнфордской инициативе электронных библиотек и бросить всю энергию на усовершенствование поисковой системы Google, все еще находившейся в зачаточном состоянии.

Все ранние поисковые компании — Lycos, Yahoo!, AltaVista и AOL — понимали, что занимаются чем-то новым и волшебным. «Люди приходили на наши серверы и оставляли свои следы. Мы каждый день могли наблюдать, что для людей было важным в интернете, — говорил первый исполнительный директор Yahoo! Тим Кугл. — Суть сети в установлении связей… а мы были центром, связывающим людей». В Yahoo! пытались обрабатывать данные, чтобы понять потребности пользователей, но их инженеры не могли прорваться сквозь поверхностный слой ценной информации, которая у них накапливалась. Логи поисковых запросов Google были такими же. Но у Google было нечто, чего не было у всех остальных, — хитроумие и напористость, с которыми Брин и Пейдж подошли к извлечению и монетизации данных.

Изначально команда Google сфокусировалась на извлечении информации о поведении пользователей, чтобы поисковая система лучше предсказывала их намерения: «Если люди пишут что-то в поисковой строке, а после получения результатов возвращаются к поиску, корректируя прежний запрос, значит, результаты первого запроса их не устроили. Если они переходят на следующую страницу результатов — значит, они не нашли того, что искали. Эти признаки, указывающие на неудовлетворенность пользователя, можно изучать и применять для совершенствования поиска», — объяснил инженер Google . Исследуя журналы с целью обнаружения повторяющихся моделей, архитекторы Google начали использовать поведение пользователей для построения системы бесплатного краудсорсинга. Она действовала как петля обратной связи, обучая поисковую систему и делая ее «умнее». Функция, предлагающая автоматическую замену слова при возможной орфографической ошибке, позволила Google выявить незначительные, но важные особенности того, как люди пользуются языком, чтобы скорее угадать, что хотел человек написать, а не просто искать текстовые соответствия. «Сегодня, когда вы печатаете „ганди био“, мы знаем, что „био “ значит „биография“; но если вы напечатаете „био оружие“, „био“ будет означать „биологическое“», — объяснил еще один гугловский программист.

Стивен Леви, заслуженный технический журналист, который на раннем этапе карьеры в 1980-х даже сотрудничал с Whole Earth Software Catalog Стюарта Бранда, получил неслыханный инсайдерский доступ в Google, чтобы написать летопись компании. В результате получилась книга «В Сети: как Google думает, работает и формирует нашу жизнь» — агиографичная, но весьма информативная история о возвышении Google. Из книги понятно, что Пейдж и Брин на раннем этапе осознали: успех компании зависит от способности захватить и удержать собственный контроль над данными о поведении пользователей, которые собираются сервисом. Это был их самый большой актив. «Все эти годы данные, хранящиеся в логах, играли ключевую роль в эволюции поисковой системы, — пишет Леви. — Компания также использовала эти данные при разработке практически всех своих продуктов. При выпуске нового продукта они не просто отслеживали поведение пользователей, но и измеряли его в ходе бесчисленных экспериментов, чтобы протестировать новые решения и разнообразные улучшения. Чем больше узнавала система Google, тем больше новых маркеров можно было встроить в поисковую систему для повышения релевантности выдаваемых результатов» .

Повышение удобства пользования Google и релевантности результатов позволили ему стать самой популярной поисковой системой в интернете. К концу 1999 года компания выдавала результаты в среднем по 7 млн запросов в день, что приблизительно на 70 тыс. процентов больше, чем годом ранее . Теперь, когда Google доминировала в интернете, пришло время зарабатывать деньги. Компания быстро поняла, каким образом.

В 2000 году, сразу после переезда в просторный офис на Бэйшоравеню, 2400, в Маунтин-Вью, прямо по соседству с исследовательским центром Эймса (НАСА) и в нескольких минутах езды от стэнфордского кампуса, Пейдж и Брин нашли свою первую золотую жилу. Это была AdWords — таргетированная рекламная система, которая позволяла Google показывать рекламу на основании поисковых запросов. Она была проста и эффективна: рекламодатель выбирал ключевые слова, и, если они появлялись в цепочке запроса, Google показывал рекламу вместе с результатами поиска, однако деньги получал лишь при условии, что пользователь переходил по ссылке.

Логи поисковых запросов были принципиально важны для AdWords. Компания знала: чем лучше она будет понимать намерения и интересы пользователей, когда те нажимают кнопку «искать», тем эффективней сможет подбирать для них релевантных рекламодателей и за счет этого повышать вероятность перехода по рекламной ссылке. AdWords изначально была довольно примитивной: просто сопоставляла ключевые слова. Ей не всегда удавалось точно угадать интересы человека, но она была близка к этому. Со временем система Google все чаще попадала в цель, поэтому предлагала больше релевантной рекламы и зарабатывала больше кликов и денег для компании. Учитывая количество поисковых запросов (сотни млн в день), даже незначительное повышение вероятности, что пользователь перейдет по рекламной ссылке, существенно увеличивало доходы компании. В последующие годы Google жадно собирала все больше и больше данных для повышения эффективности рекламной программы. «Логи были на вес золота — пользуясь их данными, мы выставляли счета нашим рекламодателям», — объяснял Дуглас Эдвардс .

И действительно, деньги потекли рекой. В 2001 году Google наняла Шерил Сэндберг, бывшего председателя штаба Ларри Саммерса, главы казначейства во время президентства Клинтона. Ей было поручено развитие и управление рекламным бизнесом компании, в чем она преуспела, превзойдя все ожидания. С таргетированной системой, основанной на пользовательском поведении, доход от рекламы подскочил с $70 млн в 2001 году до $3,14 млрд в 2004-м, в основном благодаря тому, что нужная реклама всплывала в нужное время перед нужным пользователем . Программа была сродни новой форме алхимии: Google превращала бесполезные обрывки информации в горы золота .


Поджаренное мясо девушек


Пока инженеры компании выжимали максимум персональной информации о пользователях, число которых прирастало миллионами, ее руководители тревожились, что любая утечка информации об этих операциях может обернуться непоправимым бедствием для имиджа. Пейдж в особенности был обеспокоен тем, что Google может в будущем потерять пользователей, если те узнают, каким образом компания использует свои поисковые сервисы . Краеугольным камнем корпоративной политики стала защита этого секрета от посторонних .

Пейдж с параноидальным упорством противился раскрытию любой информации. По его настоянию политика конфиденциальности компании была изложена кратко и расплывчато, вспоминает Дуглас Эдвардс в книге «Мне повезет»: «Меня всегда расстраивало нежелание Ларри вынести на общее обсуждение политику конфиденциальности. Я был убежден, что мы можем начать с базовой информации и создать информационный центр, который откровенно и четко объяснил бы пользователям, на что они идут, отправляя запрос в Google или в любую другую поисковую систему. Те, кому это действительно важно, увидели бы нашу прозрачность. Пусть бы им не понравилась наша политика по сбору и хранению информации, но они бы как минимум о ней знали. Тогда с другой поисковой системой они бы шли на риск, понимая, что политика наших конкурентов могла быть еще хуже нашей» .

Пейдж видел все иначе.

Основатель компании хотел полной секретности. Его паранойя достигла таких высот, что его уже начал беспокоить висевший в вестибюле офиса в Маунтин-Вью дисплей, на котором в реальном времени отображались случайным образом поисковые запросы со всего мира. «Журналисты, приходившие в Google, останавливались в вестибюле, завороженные этим подсматриванием в новую реальность, и впоследствии воспевали международное влияние Google и усиление роли поисковых систем в нашей жизни. Посетители буквально впадали в транс и, расписываясь для получения временного пропуска, не отрывали глаз от дисплея, нисколько не заботясь о том, чтобы прочесть подписываемое соглашение о неразглашении, — пишет Эдвардс. — Ларри никогда не нравился этот дисплей с запросами. Он постоянно следил за градусом общественного мнения по вопросу утечки информации, и прокрутка запросов на дисплее вызывала у него тревогу». Пейдж опасался, что этот дисплей слишком много сообщал посетителям о том, чем на самом деле занимается его компания.

Как ни странно, широкая общественность получила уникальную возможность увидеть, сколь приватную информацию хранят в своих логах поисковые системы, совершенно случайно, благодаря доживающей свой век устаревшей интернет-компании. В августе 2006 года AOL, гигантский доисторический интернет-провайдер, выложил в открытый доступ несколько гигабайтов анонимных поисковых логов: 20 млн поисковых запросов от 657 тыс. пользователей за трехмесячный период. Результаты поиска выдавались системой Google, так как компании принадлежали 5% AOL и она управляла ее поисковой системой .

Пейдж считал эти логи прибыльным, но взрывоопасным активом, так как, оказавшись в открытом доступе, они могли бы угрожать основному бизнесу компании. Команда исследователей в AOL думала иначе: они выложили часть логов с благим намерением поддержать социальные исследования. С точки зрения общественности, это был хороший шаг. Однако для AOL и, соответственно, для Google выложенные логи означали фиаско в глазах общественности, так как проливали свет на объем и систематичность вторжения в личное пространство, на котором строилась экономика поисковых систем.

В ответ на общественное негодование AOL заявила, что ее инженеры анонимизировали лог, заменив информацию о персональных аккаунтах случайными цифрами. Однако журналисты быстро обнаружили, что идентификационные номера личных аккаунтов легко восстановить, — достаточно сделать несколько поисковых запросов. Личность одного из таких пользователей с номером 4417749 была легко установлена парой предприимчивых репортеров New York Times: это была пожилая женщина из сельской местности Джорджии.


Номер 4417749 сделал сотни поисковых запросов за трехмесячный период по различным темам: от «онемение пальцев» до «мужчина холостяк 60» и «собака, которая метит все вокруг». И так, поиск за поиском, клик за кликом, личность пользователя AOL под номером 4417749 все легче было разглядеть. У него встречаются такие запросы, как «виды в Лилберн, Джорджия», упоминаются несколько человек с фамилией Арнольд и «дома на продажу район озера шэдоу графство гвиннет джорджия». Большого расследования не потребовалось, чтобы по этим данным выйти на Тельму Арнольд, 62-летнюю вдову, проживающую в Лилберне, штат Джорджия, которая регулярно ищет информацию о заболеваниях близких и любит трех своих собак.

Данные из логов AOL показали кое-что еще. Многие поисковые запросы имели исключительно интимный, унизительный, тревожный и даже потенциально наказуемый характер. Среди обыденных запросов о ресторанах, телепередачах и отзывах на цифровые камеры встречаются связанные с заболеваниями и советами о том, что делать «утром после изнасилования», а в некоторых случаях запросы, казалось, указывали на психически неустойчивых пользователей на грани совершения жестоких и опасных поступков. Чтобы в полной мере осознать личный характер поисковых запросов, которые сейчас находятся в общем доступе, приведу выдержки из логов.


Пользователь 2281868

«как уничтожить демонов, живущих этажом выше»

«являются ли хип-хоп и рэп формой сатанизма»

«являются ли негры сатаной или демонами или гремлинами»

«секс с животными»

«имеют ли негры рентгеновское зрение»

Пользователь 6416389

«девушки откормленные на убой»

«поджаренное нежное мясо девушек»

«нарезание стейков из ягодиц девушек»

«задушенные и съеденные девушки»

«девушки нарезанные на стейки»

Пользователь 1879967

«я ем свою сперму и как долго она остается свежей»

«жизньнаграни»

«я использую свою сперму вместо крема после бритья»

«ненормально сохранять семя или сперму в стакан и выпивать его через неделю»

«я мажу лицо спермой, чтобы запахом привлеч девошек»

Я просматривал логи, и один из них привлек мое внимание. Он принадлежал пользователю 5342598 и содержал множество запросов о нераскрытом убийстве женщины в Сан-Хосе, равно как и способов определения, является ли человек серийным убийцей. Вот выдержка из этого канала:


Пользователь 5342598

«нераскрытые убийства в сан-хосе»

«тара маровски»

«нераскрытое убийство тары маровски»

«тара маровски найдена мертвой в машине»

«тара найдена мертвой в машине»

«нераскрытые преступления тара маровски»

«полиция сан-хосе нераскрытые дела»

«психологические тесты для заключенных»

«тест узнать являешься ли ты серийным убийцей»

Убил ли кого-то этот человек? Был ли он серийным убийцей? Был ли другой каннибалом? Верил ли на самом деле первый пользователь, что его соседи — демоны? Или же эти люди просто искали странные штуки в интернете? Ответить на эти вопросы невозможно. Запросы по убийству — удел правоохранительных органов, и поисковые логи действительно все чаще используются при ведении следствия.

Одно стало предельно ясно после публикации AOL: логи поисковых запросов давали неискаженную картину внутренней жизни людей со всей их странностью, постыдными пунктиками и личными страданиями, которые скрывались за деталями поиска. И Google владела всем этим.