Google представила новую модель для редактирования изображений от DeepMind, интегрированную в приложение Gemini. Модель, получившая неофициальное прозвище nano-banana и уже названная лучшей в мире в ходе ранних тестов, решает одну из главных проблем ИИ-генераторов: сохранение внешности человека или животного при внесении изменений в исходную картинку.
Google
Проблема многих ИИ-редакторов изображений в том, что при изменении фона, одежды или окружения, черты лица человека могут искажаться. Результат получается «похожим, но не совсем тем же», что вызывает отторжение. Обновленная модель под названием Gemini Native Image специально разработана для того, чтобы фотографии ваших друзей, семьи и даже домашних питомцев выглядели абсолютно узнаваемо после любых манипуляций.
Теперь пользователи могут загрузить фотографию и с помощью простого текстового запроса кардинально изменить ее. Можно «надеть» на себя костюм матадора, «поставить» зеленый бархатный диван в комнату, «перенестись» в любую точку мира или даже «примерить» прическу из 60-х — и при этом остаться собой. Модель точно сохраняет уникальные черты внешности.
Среди новых возможностей — смешивание нескольких фотографий в одну сцену. Например, можно объединить свое фото и фото собаки, чтобы создать совместный портрет. Также доступно многоэтапное редактирование: можно взять изображение пустой комнаты, «покрасить» стены, затем «добавить» книжную полку, мебель и так далее, изменяя конкретные детали и сохраняя остальное.
Сообщается, что все изображения, созданные или отредактированные в приложении, помечаются видимым водяным знаком, а также невидимым цифровым водяным знаком SynthID, чтобы четко указать на их происхождение. Несмотря на это, столь совершенная модель создает высокий риск злоупотребления — например, она может использоваться для буллинга в учебных заведениях.