В начале июня сразу два стартапа представили новые модели для генерации изображений, ориентированные на более точное управление результатом. Ideogram выпустила модель 4.0 с 9,3 млрд параметров, которая заняла второе место в рейтинге предпочтений профессиональных дизайнеров среди девяти платформ. Krea одновременно анонсировала Krea K2 — первую собственную фундаментальную модель компании, созданную с нуля и заточенную под управление визуальным стилем. Изначально Krea K2 была закрытой, но после релиза Ideogram стартап открыл модель.

Ideogram 4.0 закрывает одну из самых болезненных задач в генерации изображений — точный рендеринг текста внутри картинки. По независимому бенчмарку модель воспроизводит надписи с точностью 97%, тогда как многие конкуренты по-прежнему заметно чаще ошибаются на этой задаче. Для дизайнеров, которые делают постеры, обложки, рекламные макеты и карточки для соцсетей, это может изменить привычный процесс работы: раньше текст часто приходилось добавлять вручную в Figma или Photoshop поверх сгенерированного изображения.
Еще один важный инструмент — управление расположением объектов через координаты и цветовые палитры в формате HEX. Пользователь может указать, где именно в кадре должен находиться нужный элемент, и задать до 16 конкретных цветов. Модель должна придерживаться этих параметров, а не свободно интерпретировать словесное описание. Это особенно важно при создании брендированных материалов с жесткими требованиями к цветам и компоновке.
В рейтинге предпочтений профессиональных графических дизайнеров, составленном по итогам 4366 парных слепых голосований, Ideogram 4.0 заняла второе место с ELO 1062 — после GPT Image 2 от OpenAI с результатом 1141. Модель опередила Grok Imagine, Luma 1.1, FLUX.2 Pro и Krea v2 Large, которая заняла восьмое место из девяти. Среди открытых моделей Ideogram 4.0 также оказалась одним из сильнейших участников рейтинга: ближайший открытый конкурент, Hunyuan Image v3 с 80 млрд параметров, набрал ELO 978.
Ideogram 4.0 имеет открытый исходный код и веса. Это означает, что при подтверждении лицензии разработчики могут запускать модель локально, встраивать ее в собственные продукты и дообучать под конкретные задачи. Это снижает зависимость от абонентской платы и ограничений API, хотя условия коммерческого использования все равно зависят от лицензии.
Krea K2, представленная почти одновременно, работает в другой нише. Если Ideogram сильнее сфокусирована на точности и следовании техническому заданию, то Krea сосредоточилась на творческом контроле над стилем — том, что многие генеративные модели до сих пор позволяют настраивать в основном через расплывчатые словесные описания.
В Krea K2 пользователь может загрузить референсное изображение, а модель перенесет его стилистику в новую работу. Степень влияния референса, его сочетание с другими источниками и разброс вариантов внутри серии регулируются отдельно. По сообщению сотрудника компании в X, Krea K2 также открыта как open-source.
Два релиза показывают разные ответы на один вопрос — чего не хватает нынешним инструментам для генерации изображений. Ideogram исходит из того, что такие модели должны быть надежными и предсказуемыми, почти как профессиональный дизайнерский софт. Krea, в свою очередь, делает акцент на контроле над визуальным стилем, а не только на общем качестве картинки.
Подпишитесь на «Инк» в Telegram. Там мы пишем нескучным языком о самом важном для предпринимателей. Подписаться.