Новости

GenAI от Google стала ожидать проверку оценки рисков конфиденциальности в Европе

Ведущий регулятор конфиденциальности в Европейском союзе начал расследование, чтобы выяснить, соблюдала ли Google законы о защите данных в отношении использования информации о людях для обучения генеративного искусственного интеллекта. В частности, он выяснит, должен ли был технологический гигант провести оценку воздействия на защиту данных, чтобы заблаговременно учесть риски, которые его технологии ИИ могут представлять для прав и свобод людей, чьи данные использовались для обучения моделей.

Генеративные инструменты ИИ печально известны тем, что могут создавать правдоподобные фейки. В сочетании со способностью предоставлять персональные данные по запросу это создает большой правовой риск для их создателей. Ирландская комиссия по защите данных (DPC), которая следит за соблюдением Google Общего регламента по защите данных (GDPR), имеет право налагать штрафы в размере до 4% от мирового годового оборота Alphabet, материнской компании Google, за любые подтвержденные нарушения.

Google разработала несколько инструментов генеративного ИИ, включая целое семейство больших языковых моделей общего назначения (LLM), которые она назвала Gemini (ранее Bard). Эта технология используется для создания чат-ботов с искусственным интеллектом, в том числе для улучшения веб-поиска. В основе этих потребительских инструментов ИИ лежит модель Google LLM под названием PaLM2, которую компания представила в прошлом году на конференции разработчиков I/O.

Ирландская DPC заявила, что расследует, как Google разработала эту основополагающую модель ИИ, в соответствии с разделом 110 ирландского Закона о защите данных 2018 года, который перенес GDPR в национальное законодательство. Для обучения моделей GenAI обычно требуются огромные объемы данных и типы информации, которую получили создатели LLM, а также то, как и где они ее получили, все чаще подвергаются тщательному контролю в связи с рядом юридических проблем, включая авторское право и конфиденциальность.

В последнем случае информация, используемая для обучения ИИ и содержащая личные данные жителей ЕС, подпадает под действие закона по защите данных, независимо от того, была ли она взята из открытых источников или получена непосредственно от пользователей. Именно поэтому ряд моделей ИИ уже столкнулись с вопросами и рядом принудительных мер по исполнению GDPR, связанных с соблюдением конфиденциальности, в том числе OpenAI, создательChatGPT, и Meta* (запрещена на территории РФ и признана экстремистской), которая разрабатывает модель ИИ Llama.

Компания X, принадлежащая Илону Маску, также вызвала вопросы о соблюдении GDPR и недовольство регулятора в связи с использованием персональных данных для обучения ИИ. Это привело к судебному разбирательству и обязательству X ограничить обработку данных, однако санкции наложены не были. Тем не менее, социальная сеть может быть оштрафована, если DPC решит, что обработка данных пользователей для обучения своего инструмента искусственного интеллекта Grok нарушает законодательство

Исследование, проведенное DPC в отношении GenAI компании Google, является последним действием регулятора в этой области. «Вопрос в том, выполнила ли компания Google обязательства по проведению оценки в соответствии со статьей 35 Общего регламента по защите данных до начала обработки персональных данных субъектов ЕС/ЕЭЗ, связанных с разработкой ее основополагающей модели ИИ, Pathways Language Model 2 (PaLM 2)», — говорится в пресс-релизе DPC.

«Это часть более широких усилий DPC, работающих совместно с аналогичными регулирующими органами ЕС и Европейской экономической зоны, по регулированию обработки персональных данных при разработке моделей и систем искусственного интеллекта», — добавили в DPC, ссылаясь на текущие усилия по достижению консенсуса о том, как лучше применять закон о защите персональных данных к инструментам GenAI.

Компания Google не стала отвечать на вопросы об источниках данных, используемых для обучения ее инструментов GenAI, но пресс-секретарь Джей Столл заявил: «Мы серьезно относимся к нашим обязательствам по GDPR и будем конструктивно сотрудничать с DPC, чтобы ответить на их вопросы».

Ранее соучредитель Google и бывший президент Alphabet Сергей Брин сказал, что он вернулся к «практически ежедневной» работе в Google, потому что не видел ничего столь же захватывающего, как недавний прогресс в области искусственного интеллекта, и не хочет ничего упустить. Брин рассказал об этом в интервью во время саммита All-In в Лос-Анджелесе.