Американская компания разработала новый инструмент для генерации и редактирования изображений по текстовому запросу. Одна из ключевых особенностей новой платформы — способность создавать до 20 объектов в одном кадре с высокой степенью детализации и без визуальных артефактов. Модель хорошо справляется с надписями на картинках и точечным редактированием созданных изображений.
Фото: OpenAI
Технология GPT-4o способна не только генерировать изображения, но и анализировать загруженные пользователем картинки, интегрируя их детали в контекст. Особое внимание разработчики уделили безопасности: все сгенерированные изображения имеют метаданные C2PA для прозрачности происхождения, а система имеет строгие ограничения на создание контента, нарушающего этические нормы.
Новый инструмент доступен пользователям всех тарифов, включая бесплатный, через ChatGPT. Время создания одного изображения может достигать одной минуты из-за большого числа шагов генерации. В ближайшие недели планируется также выпуск API для разработчиков.
Пользователи могут последовательно дорабатывать изображение, а алгоритм сохранит визуальную целостность картинки. Модель точно следует инструкциям, включая специфические параметры вроде соотношения сторон или использования конкретных цветовых кодов.