Новости

Alibaba представила модель ИИ, способную сравнивать изображения и вести диалоги

Она может определить этаж и расположение конкретного отделения больницы по вывеске, решить уравнение и написать историю. Также модель ИИ имеет открытый исходный код, что позволит разработчикам по всему миру использовать ее для создания своих ИИ-приложений.

Крупнейшая e-commerce-компания в Китае Alibaba представила новую модель генеративного искусственного интеллекта, которая умеет распознавать изображения и вести более сложные диалоги, чем предыдущие продукты компании, сообщает CNBC со ссылкой на компанию.

Две новые модели, Qwen-VL и Qwen-VL-Chat, предназначенная для создания ИИ-приложений, имеют открытый исходный код, поэтому другие разработчики смогут использовать их для создания собственных генеративных ИИ-приложений без необходимости обучения собственных систем, что экономит время и деньги.

По словам представителей Alibaba, Qwen-VL может отвечать на открытые вопросы пользователей, связанные с различными изображениями, и генерировать подписи к картинкам. Эта модель умеет сравнивать нескольких изображений и отвечать сразу на несколько вопросов. Кроме того, она сможет написать историю и создать изображение на основе фотографий, а также решить уравнение. Компания привела в пример, что Qwen-VL-Chat по вывеске определяет, на каком этаже здания находится конкретное отделение больницы.

В апреле компания запустила большую языковую модель (large language model) Tongyi Qianwen. LLM — это модель искусственного интеллекта, обученная на огромных объемах данных. LLM также выступает основой для генеративных ИИ-приложений, таких как ChatGPT, которые генерируют человеческие ответы на запросы пользователя.

В июле Meta (признана экстремистской и запрещена на территории России) предоставила исследователям открытый исходный код своей большой языковой модели Llama. В июле Microsoft заявила, что использует Llama 2 от Meta в службе облачных вычислений Azure.