Новости

В Google признали, что вирусное видео с их новым ИИ Gemini отредактировано, чтобы показать его в выгодном свете

Видео, демонстрирующее возможности модели искусственного интеллекта (ИИ) Google, было «слишком хорошим, чтобы быть правдой». Демо-версия Gemini, которую просмотрели на YouTube 1,6 млн человек, демонстрирует как ИИ в режиме реального времени реагирует на голосовые запросы и видео. В описании к видео Google сообщил, что они ускорили ответы ради демо.

Компания также признала, что Gemini сейчас вообще не реагирует на голос или видео. В сообщении в блоге, опубликованном одновременно с демонстрационным видео, Google рассказывает, как на самом деле оно было снято. Впоследствии Google подтвердил, что на самом деле это было сделано путем «использования кадров неподвижных изображений из отснятого материала и подсказок с помощью текста».

«Мы сделали это, чтобы продемонстрировать диапазон возможностей Gemini и вдохновить разработчиков», — сказал представитель Google. На видео человек задает Gemini серию вопросов, показывая объекты на экране. Например, в какой-то момент он держит резиновую утку и спрашивает Gemini, будет ли она плавать. Изначально ИИ не уверен, из какого материала сделана утка, но после того, как человек сжимает ее, и это вызывает скрипящий звук, ИИ правильно идентифицирует объект.

Однако то, что происходит на видео, на первый взгляд, сильно отличается от того, что умеет Gemini на деле. ИИ фактически показали неподвижное изображение утки и спросили, из какого материала она сделана. Затем ему была предоставлена текстовая подсказка, объясняющая, что утка издает пищащий звук при сжатии, что привело к правильному ответу.

Потом человек выполняет трюк, в котором мяч прячется под одной из трех движущихся чашек и ИИ безошибочно определяет, куда он переместился. Но опять же, поскольку Gemini не реагировал на видео, на самом деле этого удалось добиться, показав ему серию неподвижных изображений.

В своем блоге Google объяснил, что на самом деле он сообщил ИИ, где мяч находится под тремя чашками, и показал ему изображения, на которых изображены меняющиеся чашки. В Google также пояснили, что демоверсия была создана на основе фрагментов видео, чтобы «проверить возможности Gemini в широком спектре задач».

Но в видео есть еще один элемент, который еще больше искажает правду. В какой-то момент пользователь кладет карту мира и спрашивает Gemini: «На основании того, что вы видите, придумайте идею игры… и используйте эмоджи». ИИ в ответ изобретает игру под названием «Угадай страну», в которой он дает подсказки (например, кенгуру и коала) и реагирует на правильное предположение пользователя, указывающего на Австралию.

Но на самом деле, если верить блогу Google, эту игру придумал вовсе не ИИ. Вместо этого Gemini получил следующие инструкции: «Давайте сыграем в игру. Подумайте о стране и дайте мне подсказку. Подсказка должна быть достаточно конкретной, чтобы существовала только одна правильная страна, а я попробую указать страну на карте», — говорилось в подсказке. Затем пользователь приводил ИИ примеры правильного и неправильного ответа. После этого Gemini смогла сгенерировать подсказки и определять, указывал ли пользователь на правильную страну или нет, по кадрам карты.

Модель искусственного интеллекта Google впечатляет, несмотря на использование неподвижных изображений и текстовых подсказок, но эти факты означают, что ее возможности очень похожи на возможности OpenAI GPT-4. Примечательно, что видео было выпущено всего через две недели после скандала в сфере искусственного интеллекта, последовавшего за увольнением и повторным назначением Сэма Альтмана на пост генерального директора OpenAI.

Мы уже писали о том, что Google представила новую разработку на базе искусственного интеллекта чат-бот Gemini, конкурента ChatGPT от OpenAl. Языковая модель Gemini подразделяется на три версии: Ultra — для выполнения сложнейших задач с применением знаний 57 дисциплин — математики, физики, юриспруденции, истории и др.; Pro — для масштабирования в широком диапазоне дел, Nano — программа для мобильных устройств.