OpenAI представила инструмент, который может генерировать видео на основе текстовых подсказок. Новая модель, получившая название Sora в честь японского слова, означающего «небо», может создавать реалистичные видеоролики продолжительностью до минуты, которые соответствуют инструкциям пользователя как по теме, так и по стилю. Согласно сообщению в блоге компании, модель также способна создавать видеоконтент на основе неподвижного изображения или добавлять новые детали в уже существующие кадры.
«Мы учим ИИ понимать и моделировать физический мир в движении с целью обучения моделей, которые помогут людям решать проблемы, требующие взаимодействия с реальным миром», — говорится в блоге компании. Одно из видео, представленных компанией в качестве примеров, было основано на запросе «трейлер фильма, показывающий приключения 30-летнего космонавта в красном шерстяном трикотажном мотоциклетном шлеме; голубое небо, пустыня, кинематографический стиль, снятый на 35-миллиметровую пленку, яркие цвета».
OpenAI объявила о том, что открыла доступ к Sora нескольким исследователям и создателям видео. Эксперты проведут тестирование продукта — проверят его на способность нарушить условия предоставления услуг OpenAI, которые запрещают «насилие, сексуальный контент, экстремистские изображения, исключают сходство с публичными людьми и защищают интеллектуальную собственность», говорится в блоге компании. На всех видео, созданных Sora есть водяной знак, указывающий на то, что они были созданы ИИ.
В 2021 году компания дебютировала на рынке с генератором неподвижных изображений Dall-E, а в ноябре 2022 года представила чат-бот с генеративным искусственным интеллектом ChatGPT, который быстро набрал 100 млн пользователей. Другие компании, занимающиеся разработкой ИИ, также представили инструменты для создания видео, однако эти модели способны создавать лишь несколько секунд видеоматериала, который зачастую не имеет никакого отношения к их подсказкам. Google и Meta* (признана в РФ экстремистской и запрещена) заявили, что находятся в процессе разработки таких инструментов, но не представили их общественности.
OpenAI не сообщила, какой объем видеоматериалов был использован для обучения Sora, а также не раскрыла их источники. Сообщалось, однако, что в их числе были как общедоступные, так и авторские видео. На компанию несколько раз подавали в суд за предполагаемое нарушение авторских прав за то, что ее инструменты генеративного искусственного интеллекта используют гигантские объемы материалов, извлеченных из Интернета, и имитируют изображения или тексты, содержащиеся в этих наборах данных.
Ранее сообщалось, что OpenAI разрабатывает программное обеспечение для автоматизации сложных задач путем эффективного управления устройством пользователя. Таким образом, можно будет, например, попросить ChatGPT перенести данные из документа в электронную таблицу или автоматически заполнить отчеты о расходах и ввести их в бухгалтерскую программу.