Минцифры предложило дать разработчикам нейросетей платный доступ к пакетам госданных. Это следует из проекта концепции, которую ведомство представило на тематической экспертной сессии АНО «Цифровая экономика». Об этом пишет РБК со ссылкой на копию документа, подлинность которого подтвердили два источника.
Представитель АНО «Цифровая экономика» сказал изданию, что в текущей версии концепции в дата-сеты входят любые данные: о медицинских обследованиях и поставленных по ним диагнозах, уровне цен в различных регионах, составе почвы для сельскохозяйственных работ, и т. д.
В зависимости от типа данных их формированием, анонимизацией и обезличиванием будут заниматься или госоператор, или аккредитованные организации, или сами ведомства, говорится в проекте. Их стоимость будет определяться исходя из сложности и объема.
Доступ к дата-сетам с общедоступной информацией будет безвозмездным, а большие массивы данных с различной степенью секретности смогут получить только организации, аккредитованные профильными ведомствами, например ФСБ. Аккредитованные организации смогут дополнять дата-сеты коммерческими данными.
«Возможность создать единую фабрику данных делает государство уникальным оператором, который имеет в своем распоряжении практически неограниченное количество дата-сетов и их комбинаций. Такие базы представляют интерес для бизнеса, который выстраивает маркетинговые коммуникации и планы развития, опираясь на аналитику дата-сетов», — сказал изданию зампред правительства Дмитрий Чернышенко.
По его словам, наборы данных «станут основой машинного обучения для организаций и предприятий, представляющих ключевые отрасли экономики», а внедрение искусственного интеллекта повысит производительность предприятий и ускорит цифровую трансформацию.
Зампред комиссии по правовому обеспечению цифровой экономики Московского отделения Ассоциации юристов России Борис Едидин считает, что одним из основных препятствий для развития технологии ИИ сейчас является недостаток или плохое качество данных. Доступ к госданным, по его словам, позволит расширить круг разработчиков IT-решений и «повысить саму культуры сбора, хранения и обработки данных».
Однако, если стоимость данных будет очень высокой, это отпугнет небольшие компании и стартапы. «С другой стороны, платность сформирует и определенные требования к качеству данных, предъявляемые покупателями (разработчиками). В перспективе это поможет решить проблему плохого качества данных», — добавил он.
Представитель МТС сообщил, что компания заинтересована в доступе к госданным. «Например, для анализа эффективности рекламы нам были бы полезны данные о распределении пассажиропотока и транзакциях в городском транспорте. Но крайне важно качество этих дата-сетов, в частности качество разметки. Если у нас появится доступ к действительно качественно размеченным данным, мы будем готовы за это платить», — пояснил он.
Анна Серебряникова, президент Ассоциации больших данных, объединяющей «Сбер», «МегаФон», «Яндекс», «Ростелеком», «МТС» и других игроков, назвала идею организации доступа к госданным правильной. По ее словам, важную роль играют организации, которые выступают посредниками и доверенной стороной при доступе компаний к дата-сетам и берут на себя решение организационных и технических проблем.
Такие посредники необходимы «в связи со значительной сложностью формирования запросов на необходимые для разработок данные, трудностями с решением вопросов контроля доступа, имеющимися ограничениями режима охраны различных дата-сетов», сказала изданию Серебряникова.
В декабре 2020 года Владимир Путин поручил правительству создать проект закона о доступе разработчиков ИИ к большим данным, в том числе государственным. По его словам, эта информация является «питательной средой для развития технологий искусственного интеллекта по целому ряду направлений».