Подразделение Google DeepMind анонсировало свою новейшую экспериментальную исследовательскую модель под названием Gemini Diffusion. Эта разработка знаменует собой важный шаг в повышении эффективности и производительности генеративных ИИ-моделей.
Суть Gemini Diffusion заключается в использовании передовой модели текстовой диффузии. Этот метод позволяет генерировать осмысленный текст или программный код путем преобразования случайного шума в структурированный вывод. Аналогичный принцип уже успешно применяется в нейросетях для генерации изображений и видео. Перенос этой технологии на текстовые данные открывает новые перспективы для создания контента.
Главным преимуществом Gemini Diffusion является высочайшая скорость ее работы. Модель генерирует контент в пять раз быстрее самой быстрой модели в текущей линейке Google — Gemini 2.0 Flash-Lite. При этом она сохраняет тот же высокий уровень качества при генерации программного кода.
Для заинтересованных пользователей и исследователей Google DeepMind открыла возможность записаться в лист ожидания для получения доступа к демонстрационной версии Gemini Diffusion. Это позволит им одними из первых оценить возможности новой модели и внести свой вклад в ее дальнейшее тестирование и совершенствование.
В Google DeepMind заявляют, что работа над снижением задержек и повышением скорости всех моделей семейства Gemini будет продолжена. В ближайшем будущем планируется выпуск еще более быстрой версии — 2.5 Flash Lite.