Рядовой пример. Чтобы разработать концепцию рекламной кампании, бренд подгузников хотел в деталях знать, как живут и чем интересуются современные беременные. Алгоритм SocialDataHub нашел в соцсетях фотографии женщин, ожидающих ребенка, и проанализировал открытые данные их аккаунтов, начиная с даты рождения, лайков и комментариев и заканчивая участием в сообществах и геотегами. Обошлось такое исследование в 60 000 рублей.
Из более дорогих услуг (400 000 рублей в месяц) — поиск потенциальных подписчиков для провайдера интернет-телевидения. Клиент предоставил имена действующих абонентов. SocialDataHub нашел их аккаунты в соцсетях и проанализировал интересы, места работы, семейное положение и другие данные. Их усреднили и вывели идеальную аудиторию для рекламы — ту, которая еще не подключена к провайдеру, но с максимальной вероятностью сделает это.
А с журналистами из Life команда Артура работала над расследованием деятельности групп растлителей во ВКонтакте. Тогда удалось вычислить десятки сообществ распространителей детской порнографии. На дата-консалтинговые расследования у SocialDataHub действует почасовая оплата — около 1500 рублей за человеко-час. На изучение материалов о растлителях ушло примерно 20 человеко-часов, поделенных между тремя специалистами: двумя аналитиками и одним программистом.
Сейчас команда Артура развивает новое направление: помогает корпорациям следить за сотрудниками. Анализируя данные из соцсетей и рабочий интернет-трафик, SocialDataHub может выявить слабые звенья: работников, которые изучают вакансии других компаний, часто заходят в соцсети или вовсе пытаются украсть корпоративную информацию. Это может быть крупный начальник, случайно засветившийся на дискредитирующей фотографии клуба свингеров или во время обеда с конкурентом. О том, что такие кадры были сделаны, человек может даже не знать, но если снимки попали в сеть — SocialDataHub их найдет.
Большие данные
Термин Big Data появился в заголовках изданий всего 8 лет назад, а сейчас его знает каждый. Это комплекс методов обработки больших (и зачастую неструктурированных) массивов данных. Строго говоря, Big Data — это методы работы с тем, с чем не справляется Excel.
Последний громкий пример успешного использования Big Data пришёлся на президентские выборы 2016 года в США и Brexit-референдум в Великобритании. Получив доступ к лайкам, геотегам и другим приватным данным Facebook, компания Cambridge Analytica определила политические предпочтения англоязычных пользователей сайта. Получив результаты комплексной аналитики больших массивов данных, евроскептики и сторонники Трампа организовали бомбардировку сомневающихся избирателей персонализированными новостями. Так усилиями всего дюжины сотрудников Cambridge Analytica потерпела крах классическая социология.
После ухода Артура из рекламного агентства у него остались дружеские связи с менеджером отдела продаж. В агентстве он занимался госконтрактами и помог Хачуяну с первыми клиентами. Это были чиновники, которых интересовали технологии распознавания изображений.
Американским коллегам для получения информации из Facebook пришлось налаживать сеть приложений, ворующих персональные данные. А для SocialDataHub хватает и открытых данных из сети ВКонтакте: членство в группах, аудиозаписи, фотографии, списки друзей и прочее. Для поддержания актуальности информации данные приходится скачивать (парсить) 24/7. Чтобы следить за процессом, Артур оборудовал у себя в квартире миниатюрный ситуационный центр на три экрана. Команда Хачуяна использует и другую информацию открытого интернета (публикации в СМИ, форумы и блоги), чтобы получить почти универсальную базу данных.
— Многие задачи связаны с нашим движком поиска людей по лицам, — рассказывает Хачуян. — Госорганам от нас нужен поиск педофилов, дезертиров и других плохих людей. Это работа с определенным уровнем секретности — многие мои сотрудники невыездные. А жаль: я бы хотел увезти всех в Таиланд, как сделал Aviasales.
Деньги от работы с государством обеспечили легкий старт, позволили поднять компанию на ноги без внешних инвестиций, снять первый офис и привлечь клиентов из мира бизнеса. Сегодня основные заказчики — рекламные и диджитал-агентства, желающие исследовать аудиторию или узнать, что говорят о бренде в сети. Команда Хачуяна не только выявляет все негативные упоминания бренда в СМИ, но находит очаги их появления и предлагает способы урегулирования ситуации. Артур говорит, что после подобных исследований клиенты стали сами к нему приходить — по рекомендациям. Обходятся такие отчеты примерно в 150 000 рублей, но в зависимости от объема обрабатываемой информации сумма может вырасти и до 700 000 рублей.
Вопрос имиджа
Клиент SocialDataHub чувствует флер игривости уже с адресной строки: сайт расположен на домене.sexy. Почти эротический проморолик сразу предлагает пользователю «испытать дата-оргазм». Так компания успешно продает консалтинговые услуги рекламщикам и СМИ. Но хотя у Артура команда одна, однако есть и вторая компания, с более серьезным имиджем. FUBUTECH помогает чиновникам искать диссидентов и сотрудничает с крупными корпорациями.
Артур общается весьма непринуждённо, а его дреды отрицают классический корпоративный дресс-код.
— Пока продажами занимаюсь лично я. Когда вхожу в кабинет, меня представляют и выступают гарантом моей практической полезности. Но спустя 10–15 минут собеседник и сам понимает, что я не идиот. Вопросы о мытье головы с дредами в кабинетах не задают. Даже в Администрации президента всё было окей.
Сейчас в компании Артура уже 37 сотрудников: два front-end разработчика, два сисадмина, остальные — программисты и аналитики. Прежний офис стал мал, поэтому вся команда работает удаленно. Бухгалтера нет: всю бумажную работу делает скрипт.
В планах у предпринимателя — расширить штат до 50–70 человек, найти менеджеров по продажам (пока Артур ведет переговоры лично) и выйти на мировой рынок. В приоритете — развитие Big Data как инструмента безопасности, антитерроризма и маркетинга.
Если смотреть на ближайшее будущее, то аналитика больших данных станет локомотивом развития максимально таргетированной рекламы, уверен Хачуян:
— Это очень перспективная отрасль. Сейчас 90% рекламы в интернете — мусор. Остальные 10% начинают работать только тогда, когда тебе потребуется товар. Скажем, ищешь в интернете холодильник. Следующую пару недель ВКонтакте и Facebook выдают тебе рекламу холодильников. А теперь представьте максимально персонализированную рекламу, которая предугадывает ваши нужды и отзывается на них заранее. Вот это и есть ближайшее будущее Big Data-аналитики.