Reddit ввел ограничения на индексацию своего контента в Wayback Machine сервиса Internet Archive после обнаружения случаев, когда ИИ-компании извлекали данные из архива в нарушение платформенных политик. Об этом сообщает издание The Verge со ссылкой на представителя Reddit Тима Ратшмидта.

Unsplash

В результате архив сможет сохранять только главную страницу сайта, без доступа к постам, комментариям и профилям пользователей. Ограничения позволят Internet Archive фиксировать лишь популярные новости и посты на главной странице Reddit на определенные даты, но заблокируют детальные страницы.

По словам Ратшмидта, компания уведомила Internet Archive заранее, чтобы обсудить меры. Директор Wayback Machine Марк Грэм подтвердил наличие диалога с соцсетью.

«Мы ограничиваем их доступ к данным Reddit для защиты пользователей, пока они не смогут защитить свой сайт и соблюдать политики платформ, включая уважение к приватности», — отметил Ратшмидт.

Ранее Reddit неоднократно сталкивался с проблемами скрейпинга (автоматизированного сбора данных с сайта) для обучения ИИ. В прошлом году платформа заключила соглашение с Google на предоставление данных для поиска и ИИ, а затем заблокировала другие поисковые системы, если они не платят за доступ. Аналогичная сделка была с OpenAI, а в июне Reddit подал иск против Anthropic, обвинив ее в продолжающемся скрейпинге несмотря на заверения компании.