Новости

Google запустил Gemini Omni Flash для генерации видео по тексту, фото и аудио

Google DeepMind представил на I/O 2026 модель Gemini Omni Flash — первую в новом семействе Omni для генерации и редактирования видео по тексту, изображениям и аудио. Позже модель также должна получить возможность создавать изображения. Omni Flash уже начала распространяться среди подписчиков Google AI Plus, Pro и Ultra, а также бесплатно для пользователей YouTube Shorts и приложения YouTube Create.

Google

Главная особенность Omni Flash — редактирование видео через последовательные команды. Модель учитывает предыдущие инструкции и сохраняет персонажей, физику сцены и общий контекст. Пользователь может менять окружение, угол съемки, стиль или отдельные элементы кадра, не пересобирая ролик с нуля. Модель поддерживает мультимодальный ввод: в качестве референсов для итогового видео можно одновременно использовать изображение, фрагмент ролика и аудиодорожку.

По словам технического директора Google DeepMind Корая Кавукчуоглу, Omni не просто создает реалистичное видео, а лучше учитывает поведение объектов в кадре — гравитацию, кинетическую энергию и динамику жидкостей. Кроме того, модель использует базу знаний Gemini, чтобы связывать язык, изображение и культурный контекст, а не только подбирать визуальные паттерны.

Для защиты от злоупотреблений Google встраивает в каждое видео, созданное Omni, невидимый цифровой водяной знак SynthID. Отдельная функция позволяет пользователю создавать ролики со своим цифровым двойником — голосом и внешностью. Возможность редактировать чужой голос и речь в видео компания пока не запустила: Google объясняет это необходимостью дополнительного тестирования безопасности.

Модель уже доступна через приложение Gemini и Google Flow. В ближайшие недели Google планирует открыть API для разработчиков и корпоративных клиентов. Параллельно компания расширяет инструменты проверки контента: пользователи смогут узнать происхождение видео через приложение Gemini, расширение Gemini в Chrome и Google Search.

Omni Flash выходит на рынок, где Google уже конкурирует с видеогенераторами OpenAI и других крупных игроков. Ставка компании — не только на качество модели, но и на дистрибуцию: Omni Flash встраивается в уже существующую экосистему Google, включая приложение Gemini с аудиторией свыше 900 млн человек в месяц и YouTube с его многомиллиардной базой пользователей.

При этом остается неясным, какую роль после запуска Omni Flash будет играть прежняя видеомодель Google — Veo.


Подпишитесь на «Инк» в Telegram. Там мы пишем нескучным языком о самом важном для предпринимателей. Подписаться.