На днях компания Илона Маска Grok представила новую функцию генерации изображений с помощью ИИ, которая, как и сам чат-бот компании, имеет очень мало средств защиты. Это означает, что вы можете генерировать фальшивые изображения Дональда Трампа, курящего марихуану, или загружать их прямо на социальную платформу X. Но за этим инструментом стоит не компания Илона Маска, а новый стартап — Black Forest Labs.
О сотрудничестве между двумя компаниями стало известно, когда xAI объявила, что работает с Black Forest Labs над генератором изображений Grok, используя свою модель FLUX.1. Запущенный 1 августа ИИ-стартап Black Forest Labs, похоже, разделяет видение Маска о Grok как об «анти-активистском чат-боте», потому что он лишен таких ограничений, как Dall-E от OpenAI или Imagen от Google. Как и следовало ожидать, социальные сети уже наводнены изображениями, созданными новинкой.
Компания Black Forest Labs базируется в Германии и недавно получила финансирование в размере $31 млн. Как сообщается в пресс-релизе компании, инвестиционный раунд возглавила компания Andreessen Horowitz. Среди других известных инвесторов — генеральный директор Y Combinator Гэрри Тан и бывший генеральный директор Oculus Брендан Айриб. Основатели стартапа, Робин Ромбах, Патрик Эссер и Андреас Блаттманн, в прошлом помогали создавать ИИ-модели Stable Diffusion для Stability AI.
По данным Artificial Analysis, модели FLUX.1 от Black Forest Lab, по крайней мере по оценкам пользователей, превосходят по качеству Midjourney и OpenAI. Стартап заявляет, что «его модели искусственного интеллекта доступны широкой аудитории», и публикует ИИ, генерирующий изображения с открытым исходным кодом на Hugging Face и GitHub. По словам компании, в скором времени она планирует создать и модель, способную преобразовывать текст в видео.
В своем пресс-релизе Black Forest Labs заявляет, что ее цель — «повысить доверие к безопасности этих моделей». Однако многие изображения, например Пикачу, держащего автомат, не удалось воссоздать с помощью генераторов изображений Google или OpenAI. Нет сомнений в том, что для обучения модели использовались изображения, защищенные авторским правом.
Председатель совета директоров Black Forest Labs Анджни Мидха разместил на X серию сравнений между изображениями, полученными в первый день запуска Google Gemini и коллаборацией Flux компании Grok. Он подчеркнул хорошо известные проблемы Google Gemini с созданием исторически точных изображений людей, в частности неуместное внесение расового разнообразия в изображения.
«Я рад, что @ibab и команда отнеслись к этому серьезно и сделали правильный выбор», — написал Мидха в твите, ссылаясь на то, что FLUX.1, похоже, избежал этой проблемы (и упомянув аккаунт ведущего исследователя xAI Игоря Бабушкина). В феврале из-за этой ошибки Google извинилась и отключила возможность Gemini генерировать изображения людей.
Отсутствие гарантий безопасности нового инструмента может создать проблемы для Маска. Платформа X подверглась критике, когда платформу наводнили сгенерированные ИИ откровенные изображения Тейлор Свифт. Помимо этого инцидента, Grok генерирует фейковые новости.
Только на прошлой неделе пять государственных секретарей призвали X прекратить распространение дезинформации о Камале Харрис. Ранее в этом месяце Маск поделился видео, в котором голос политика, сгенерированный ИИ, рассказал о том, что она «нанята для поддержания разнообразия».
Похоже, Маск намерен позволить подобной дезинформации проникнуть на платформу. Разрешив пользователям размещать прямо на платформе изображения, созданные Grok, на которых, похоже, отсутствуют водяные знаки, он, по сути, открыл дезинформации путь в новостную ленту X.
Ранее стало известно, что компания X закрывает свою штаб-квартиру в Сан-Франциско и переводит сотрудников в офис в Сан-Хосе. Владелец X Илон Маск ранее критиковал Сан-Франциско в социальных сетях, жалуясь на налоги и преступность, и заявил, что перенесет штаб-квартиру компании в Техас. Несмотря на недовольство Маска, Сан-Франциско остается местом притяжения для технологических стартапов.