Стартап Ideogram представил третью версию своей нейросети для генерации изображений. По словам разработчиков, изображения алгоритма стали заметно лучше как по качеству, так и по соответствию текстовому промпту. Ключевое преимущество новой модели — высокая точность передачи стиля, возможность загрузки до трех референсных изображений и генерация текста на картинке с различными шрифтами.
Сгенерировано в Ideogram
Нейросеть демонстрирует принципиально новый уровень реализма и креативности. В бенчмарках она показывает стабильно хорошие результаты среди аналогичных систем. В закрытом тестировании среди пользователей новая версия Ideogram превзошла конкурирующие алгоритмы по рейтингу Эло. Разработчики особо выделяют способности нейросети генерировать связный текст на картинке и сложные композиции, недоступные прошлым версиям алгоритма.
Представители малого бизнеса и дизайнеры могут использовать Ideogram 3.0 для создания логотипов, постеров, концептов лендингов и фотографий продуктов. Компания предлагает библиотеку из 4,3 млрд предустановленных стилей. Пользователь также может выбрать случайный стиль, чтобы поэкспериментировать с изображением.
Стартап Ideogram стал популярен благодаря тому, что первым смог создать нейросеть, способную очень точно генерировать текст на изображениях. До этого момента алгоритмы очень плохо справлялись с созданием надписей.
Ранее компания OpenAI обновила встроенную в чат-бота ChatGPT функцию генерации изображений. Теперь пользователи могут гибко редактировать определенные части картинки по текстовому запросу. Функция доступна и бесплатным подписчикам.