Разобраться • 26 января 2025
«Проще не давать согласие»: cколько стоят ваши персональные данные и кто на них зарабатывает
«Проще не давать согласие»: cколько стоят ваши персональные данные и кто на них зарабатывает

Даже если вы ничего не публикуете в соцсетях, десятки компаний собирают о вас информацию даже во время чтения этой статьи: каким устройством вы пользуетесь, какой браузер установлен, откуда зашли и какие страницы уже открывали сегодня. И зарабатывают на этом. Но если посмотреть на эту экономику не с точки зрения корпораций, а глазами обычного человека, возникает простой и неудобный вопрос: сколько на самом деле стоят данные одного пользователя?
Даже если вы ничего не публикуете в соцсетях, десятки компаний собирают о вас информацию даже во время чтения этой статьи: каким устройством вы пользуетесь, какой браузер установлен, откуда зашли и какие страницы уже открывали сегодня. И зарабатывают на этом. Но если посмотреть на эту экономику не с точки зрения корпораций, а глазами обычного человека, возникает простой и неудобный вопрос: сколько на самом деле стоят данные одного пользователя?
В среднем каждый человек оставляет в цифровых сервисах сотни следов в день. Учитывая, что ежедневно человечество генерирует около 2,5 квинтиллиона байт данных, объем этой информации растет быстрее, чем мы успеваем ее осмыслить. Такие данные называют пассивными, потому что мы производим их неосознанно, просто существуя в цифровой среде.
Марк Цукерберг хорошо понимает ценность такого ресурса. В 2025 году состояние основателя Meta* оценивается в $222 млрд, и значительная часть этой стоимости построена именно на системной монетизации пользовательских данных.
Начнем с рекламы. Компании вроде Meta* и Google используют наши данные для таргетинга, анализируя поведение, предпочтения, образ жизни и множество других атрибутов. В 2023 году средняя стоимость клика по рекламе в Meta* составляла $0,83, Google — $4,22 за клик. Для некоторых ниш, например юридических услуг, цена взлетала выше $5 за клик. Российские игроки действуют по той же модели: «Яндекс» и VK зарабатывают на таргетированной рекламе, используя данные пользователей своих многочисленных сервисов.
Сколько денег вы генерируете этим компаниям? Простой расчет: по всему миру в 2024 году цифровая реклама принесла $750 млрд при примерно 5,56 млрд интернет-пользователей, что дает среднюю выручку в $135 на человека в год.
Это средний показатель: если вы активно ищете товары или часто кликаете по рекламе, ваша ценность выше. И это только пассивные пользовательские данные.

Кристина Буренкова
ведущий специалист отдела анализа и оценки цифровых угроз Infosecurity (ГК Softline)
«Рыночная цена персональных данных сильно зависит от контекста и качества информации. Например, базовые данные, такие как списки клиентов банка или пользователей сервиса, имеют относительно невысокую стоимость. В то же время точечные данные, привязанные к конкретному человеку, становятся уникальным активом. Их стоимость резко возрастает, особенно если речь идет о финансовой истории или детализированной цифровой поведенческой модели. На теневом рынке актуальные данные одного пользователя могут оцениваться до $10, при этом их цена быстро снижается по мере устаревания информации».
В России основными бенефициарами экономики данных являются соцсети и контентные платформы, такие как VK, RuTube и «Яндекс», а также операторы связи и банки, отмечает Александр Яров, руководитель информационной безопасности ELMA. Эти компании собирают и используют данные пользователей для рекламы, персонализации сервисов и других коммерческих целей.
В последние годы особую ценность приобрела другая категория информации — активные данные. Это то, что пользователь создает осознанно: тексты, комментарии, изображения, видео, голосовые запросы и диалоги с цифровыми сервисами. Если пассивные данные десятилетиями кормили рекламные алгоритмы, то активные стали основой для обучения и улучшения ИИ-моделей.
Языковые модели нуждаются в постоянном притоке свежих данных для обучения, особенно на ранних стадиях развития. OpenAI, Google, Meta*, Microsoft и другие компании буквально скупают все, что можно купить.

Стас Дон
аналитик данных eBay
«Контент, сгенерированный пользователями (user-generated content, UGC), — один из важнейших источников данных для обучения языковых моделей. Именно наличие UGC в большом объеме помогает моделям быть не только сугубо теоретическими, но и разговорными и прикладными».
Как отмечает Стас Дон, сегодня растет ценность данных, которые трудно воспроизвести синтетически и которые несут высокий «информационный сигнал»: экспертная разметка, юридические кейсы, редкие области знаний. Также растет ценность данных с понятными правами на использование, прозрачной лицензией и юридически чистым происхождением.
Именно поэтому самые крупные сделки по лицензированию данных для обучения ИИ сегодня заключаются вокруг академического и новостного контента, то есть источников с высокой плотностью информации и понятным правовым статусом.
News Corp подписала пятилетний контракт с OpenAI на сумму более $250 млн, Financial Times получила более $10 млн в первый год своего соглашения с OpenAI, а академический издатель Springer Nature продал Google доступ к научным статьям за $23 млн.
По оценкам аналитиков, средний размер сделки по лицензированию контента для ИИ составляет около $24 млн, а общий объем обязательств ИИ-компаний перед издателями достиг $2,92 млрд.
Согласно исследованию АБД, Б1 и TAdviser, российский рынок Big Data и ИИ не отстает — по итогам 2025 года его объем может достичь 520 млрд руб. Рост по сравнению с показателем 2024 года (433 млрд) в таком случае составит 20%. Впрочем, это весь рынок, включая услуги, инфраструктуру и аналитику, а не только сделки по лицензированию контента.
У Google в этой гонке есть преимущество: компания владеет YouTube, Gmail и множеством других сервисов, которые генерируют огромные массивы данных. Microsoft тоже хорошо позиционирована благодаря Office 365, LinkedIn и другим продуктам. В России схожее преимущество у «Яндекса» с его большой экосистемой. «Сбер» и VK также контролируют широкий спектр сервисов — от банковских приложений до социальных сетей, накапливая детальные профили миллионов пользователей. Остальным приходится платить за данные.
Проблема в том, что не все готовы продавать свои данные добровольно. OpenAI уже несколько раз обвиняли в обучении ChatGPT путем несанкционированного доступа к контенту, на который у компании не было прав. Суды по этому вопросу тянутся уже несколько лет. С похожей ситуацией столкнулась и Adobe, обучавшая свои модели на пользовательских работах, включая иллюстрации, фото и дизайн. Клиенты крайне негативно отреагировали на такое изменение правил обслуживания — это привело к массовым отпискам от сервисов компании.
Исследование Стэнфордского университета показало, что все шесть ведущих американских ИИ-компаний (Amazon, Anthropic, Google, Meta*, Microsoft и OpenAI) по умолчанию используют данные пользовательских чатов для обучения своих моделей.
Если вы делитесь чувствительной информацией в диалоге с ChatGPT, Gemini или другими моделями, она может быть собрана и использована для обучения, даже если это отдельный файл, загруженный во время разговора.
При этом без постоянного притока новых данных ИИ-модели начинают деградировать. Это явление называется «коллапсом модели». Когда новые модели обучаются на данных, сгенерированных предыдущими ИИ-системами, они постепенно теряют связь с реальным распределением данных. ИИ начинает забывать редкие, но важные аспекты информации, производя все более однородные и менее разнообразные результаты.

Марат Кенжебулатов
старший разработчик Booking.com
«Масштабировать ИИ без притока новых данных действительно сложно. Важно также, чтобы эти данные были качественными и разнообразными. Иначе модели начинают “учиться” на шуме, что со временем может ухудшать качество ответов и снижать надежность. Для ИИ важны тенденции, распределения и статистические закономерности, а не отдельные фрагменты поведения конкретного человека. Исключение — это ситуации, когда у пользователя есть уникальная экспертиза в узкой области. Тогда его вклад может быть заметно ценнее среднего».
Готовы ли вы жертвовать своей конфиденциальностью ради того, чтобы ИИ-модели продолжали совершенствоваться?
Некоторые эксперты предлагают радикальное решение: «дивиденды за данные». Идея в том, что пользователи должны получать прямые выплаты от компаний за использование их информации. Бывший кандидат в президенты США Эндрю Янг в 2020 году даже запустил Data Dividend Project, призывая технологические компании платить людям за их данные.
Но критики указывают на серьезные проблемы. Electronic Frontier Foundation предупреждает, что монетизация персональных данных может превратить приватность в привилегию: те, у кого есть деньги, смогут ее сохранить, а остальные будут вынуждены обменивать личную информацию на доступ к базовым цифровым сервисам.
Facebook* в 2019 году зарабатывал в среднем всего $7 с пользователя в квартал. Даже если компании будут платить дивиденды, обычный человек получит в лучшем случае несколько долларов в год, отдав взамен интимные подробности своей жизни.

Андрей Чубин
руководитель направления анализа данных и ИИ Quantum One
«В ближайшей перспективе я скептически отношусь к идее каких-либо выплат пользователям за их данные. Скорее мы движемся в противоположную сторону: все больше приложений, сервисов и устройств, которые стали частью повседневной жизни, собирают данные по умолчанию.
Но если посмотреть на ситуацию с другой стороны, можно заметить, что из-за высокой конкуренции многие цифровые сервисы работают с минимальной маржой или даже в убыток, рассматривая это как инвестицию в рост аудитории. По сути, вместо прямых роялти компании предлагают пользователю более дешевые или удобные услуги в обмен на личные данные».
Марат Кенжебулатов отмечает, что прямые выплаты за пользовательские данные теоретически возможны, но вряд ли станут массовой практикой. По его словам, такие модели имеют смысл прежде всего в нишевых случаях, когда данные связаны с уникальной экспертизой, редкими навыками или труднодоступной информацией. Он считает, что именно в таких сегментах могут появляться механизмы роялти, лицензирования или прямого вознаграждения за использование данных.
Европейская комиссия в декабре 2025 года открыла расследование в отношении Google по поводу использования контента издателей и создателей YouTube для ИИ без надлежащей компенсации. Регулятор также изучает, предоставляет ли Google себе привилегированный доступ к контенту, ставя конкурентов в невыгодное положение.
В России вопрос регулирования рынка данных тоже выходит на первый план. Недавно Ассоциация больших данных (АБД), объединяющая «Яндекс», VK, «Сбер» и других игроков, направила министру цифрового развития письмо с предложениями по совершенствованию регулирования в сфере ИИ-технологий. Ассоциация хочет добиться увеличения объемов и разнообразия данных для обучения моделей, введения в гражданский оборот наборов данных (датасетов) с защитой прав их обладателей, создания правовых условий для свободного перетока данных между различными отраслями экономики.

Александр Яров
руководитель информационной безопасности ELMA
«Объективно у пользователей мало возможностей вернуть контроль или получить компенсацию за использование своих данных. Думаю, многие заметили плашки согласия на обработку данных и принятие cookies. Это одна из возможностей — не давать согласие и блокировать отслеживание.
Также у пользователей есть юридическая возможность, опираясь на требования 152-ФЗ, запросить перечень собранных персональных данных и при необходимости потребовать их уничтожения. Если у вас есть претензии к компаниям по обработке ваших данных, можно обращаться в Роскомнадзор с жалобами или в суды — компенсация варьируется от 5 до 100 тыс. руб».
Пока технологические гиганты строят империи на наших цифровых следах, мы только начинаем осознавать истинную стоимость того, что отдаем бесплатно каждый день.
*Деятельность организации признана экстремистской и запрещена на территории РФ