Новости

Роскомнадзор намерен создать «умный» фильтр трафика на базе ИИ

Роскомнадзор (РКН) планирует в текущем году разработать и внедрить новый механизм фильтрации интернет-трафика с использованием технологий машинного обучения. На реализацию этого проекта ведомство намерено направить 2,27 млрд руб. Соответствующие планы содержатся в документе о цифровизации РКН, который был представлен на рассмотрение правительственной комиссии по цифровому развитию 26 декабря, пишет Forbes. 

Steve Johnson / Unsplash

В настоящее время для блокировки запрещенных ресурсов РКН использует технические средства противодействия угрозам (ТСПУ), установленные на сетях операторов связи в рамках закона о «суверенном интернете». Эти системы применяют технологию DPI (глубокий анализ пакетов), позволяющую проверять содержимое интернет-трафика. По данным ведомства, с помощью ТСПУ уже заблокирован доступ к более чем 1 млн запрещенных ресурсов, а ежедневно ограничивается доступ в среднем к 5500 новым сетевым адресам и доменам.

Как поясняют эксперты, классические DPI-решения работают по фиксированным алгоритмам и правилам. Однако рост доли зашифрованного трафика и постоянное появление новых способов обхода блокировок (например, VPN-сервисов или «зеркал» сайтов) требуют более гибких и «интеллектуальных» подходов.

По мнению аналитиков, внедрение машинного обучения позволит РКН:

— Выявлять запрещенный контент не по адресам, а по смысловому содержанию (ключевым словам, выражениям, визуальным признакам), что особенно актуально для блокировки копий («зеркал») уже запрещенных сайтов.

— Эффективнее обнаруживать и классифицировать зашифрованный трафик, в том числе от VPN-сервисов.

— Автоматизировать процесс создания и применения правил фильтрации, повышая скорость и точность реагирования.

Роскомнадзор не первый год экспериментирует с искусственным интеллектом. Ведомство уже применяет нейросетевые технологии для анализа текстовой, аудио- и визуальной информации. Как ранее заявляли в РКН, это позволило сократить среднее время обнаружения запрещенного контента с момента его появления в сети до 6 часов (против 48 часов в 2020 году). Также в работе находятся автоматизированные системы «Окулус» (поиск запрещенного контента в видео и аудио) и «Вепрь» (мониторинг «точек информационной напряженности»).

Впрочем, не все эксперименты с ИИ оказались одинаково успешными. Например, при тестировании нейросетей для мониторинга утечек персональных данных их эффективность оценили лишь в 60%, а для повышения точности потребовались бы огромные объемы данных для обучения, что сочли преждевременным.