Компания OpenAI, специализирующаяся на искусственном интеллекте, выпустила обновленную версию своей флагманской модели генеративного ИИ GPT-4 Turbo. Новая версия, GPT-4 Turbo с функцией Vision, способна обрабатывать изображения, то есть пользователи могут загружать в модель фотографии и видео. Например, можно загрузить изображение шахматной доски и попросить ИИ посоветовать следующий ход.
Компании, получившие ранний доступ к инструменту, уже продемонстрировали, как его можно использовать для решения таких задач, как написание программного кода, или для получения информации из изображений. В серии твитов на официальном аккаунте OpenAI Developers названы три компании, которые используют GPT-4 Turbo с Vision.
ИИ-стартап Cognition Labs недавно представил Devin, ИИ-чатбота, способного разрабатывать код на основе подсказок на естественном языке. В одном из примеров пользователь попросил его внести небольшое исправление в веб-страницу. Инструмент не только справился с задачей, но и открыл интернет-браузер для просмотра страницы и визуального подтверждения изменений.
OpenAI также рассказала о новом инструменте от стартапа HealthifyMe, специализирующегося на снижении веса и питании. Инструмент, получивший название Healthify Snap, позволяет пользователям сфотографировать свою еду и получить от чат-бота компании Ria, работающего на базе ИИ, советы и подробную информацию о питании. К примеру, пользователь сделал фото своей тарелки с курицей и рисом и получил от Ria ответ, что белый рис может повысить уровень сахара в крови. Пользователю было рекомендовано совершить 15-минутную прогулку и в следующий раз попробовать коричневый рис или киноа.
Еще один пример был представлен технологическим стартапом tldraw, который разработал Make Real — инструмент, позволяющий пользователям набросать концепцию веб-сайта, а затем автоматически разрабатывать и редактировать его. В одном из примеров пользователь создал страницу обратной связи для веб-сайта, простое текстовое поле, в котором клиенты могли оставить отзыв о продукте. За считанные секунды эскиз был преобразован в рабочую веб-страницу с заголовком, интерактивным текстовым полем и кнопкой «Отправить».
Тем временем Meta* (запрещена и признана в РФ экстремистской) планирует начать поэтапный запуск Llama 3, новой версии своей флагманской большой языковой модели с открытым исходным кодом, сообщает The Information. На следующей неделе компания выпустит две версии Llama 3, разработанные специально для решения простых задач, таких как перевод или генерация электронных писем.
По словам представителей компании, Meta* начнет внедрять модели следующего поколения в течение следующего месяца, а летом ожидается выпуск полной версии Llama 3. Она будет будет обладать мультимодальными возможностями, как GPT-4 Turbo с Vision.
OpenAI также намекнула, что за GPT-4 Turbo последует запуск GPT-5. В интервью Financial Times главный операционный директор OpenAI Брэд Лайткэп заявил, что будущие версии модели будут обладать расширенными возможностями, что позволит им решать более сложные задачи.
Ранее стало известно, что Microsoft и OpenAI планируют создать суперкомпьютер, ориентированный на искусственный интеллект. Как сообщает The Information, стоимость проекта может составить более $115 млрд, а суперкомпьютер, который называется Stargate, будет базироваться в США.