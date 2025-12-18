Технологические гиганты все чаще сталкиваются с судебными исками из-за данных, на которых обучают искусственный интеллект. На этот раз под прицелом оказалась компания Adobe, которую обвиняют в использовании книг для тренировки одной из своих языковых моделей, пишет TechCrunch.

Freepik

В поступившем в суд коллективном иске утверждается, что компания использовала для обучения ИИ произведения, защищенные авторским правом, без согласия на то самих писателей. Речь идет о модели SlimLM, которую Adobe продвигает как инструмент для работы с документами на мобильных устройствах.

Согласно иску, модель обучалась на наборе данных SlimPajama, который является производным от другого набора — RedPajama. Именно он, в свою очередь, содержит знаменитую и спорную коллекцию Books3.

Books3 — это огромный архив, включающий около 191 тыс. книг. Он уже не раз фигурировал в судебных разбирательствах против IT-компаний, так как, по мнению авторов, содержит произведения, скопированные без разрешения правообладателей.

Ранее похожие обвинения звучали в адрес Apple и Salesforce, которых также подозревали в использовании этих данных для обучения своих нейросетей.

Эта история стала частью масштабного тренда. В сентябре компания Anthropic согласилась выплатить рекордные $1,5 млрд в рамках мирового соглашения с авторами, обвинившими ее в нарушении авторских прав при обучении чат-бота Claude. Теперь аналогичный прецедент может создать дело против Adobe.

Скандал обнажает ключевую проблему индустрии искусственного интеллекта: разработчики стремятся обучать модели на максимально больших и разнообразных массивах информации, но часто делают это, не утруждая себя проверкой легальности источников. Теперь, когда авторы начали массово отстаивать свои права в судах, эпоха бесконтрольного заимствования контента для ИИ, похоже, подходит к концу.