Рубрики

О журнале

Соцсети

Напишите нам

Новости

«Яндекс» открыл исходный код своей передовой нейросети

«Яндекс» выпустил в открытый доступ новую версию модели YandexGPT 5 Lite из последнего семейства нейросетей компании. Эта версия прошла дополнительный этап настройки (alignment), благодаря чему научилась решать конкретные задачи по промптам. Модель содержит 8 млрд параметров и имеет контекстное окно всего в 32 тыс. токенов. Запустить и использовать нейросеть можно даже на ПК.

Фото: Freepik

Новая модель превосходит китайскую Qwen-2.5-7B и американскую Llama-3.1-8B в русскоязычных бенчмарках IFEvalRU (следование инструкциям), (ya)SchoolMath 5-9 и (ya)Crowd v2 (классификация).

Однако новая нейросеть проигрывает GPT-4o-mini в тестах на извлечение информации (TriviaQA), решении сложных математических задач (GSM8K), программировании (HUMAN_EVAL) и работе с длинным контекстом на английском языке (QUALITY).

«Яндекс» обновил лицензию для YandexGPT 5 Lite, теперь ее можно использовать в любых целях, включая коммерческие, — если объем выходных токенов не превышает 10 млн в месяц. Этого достаточно для создания чат-ботов на сайтах среднего размера, генерации описаний товаров в интернет-магазинах с ограниченным ассортиментом или автоматизации ответов клиентам.

Сообщается, что новый алгоритм уже можно протестировать в чате с «Алисой» (до пяти бесплатных запросов в день, а с опцией «Про» — неограниченно). Бизнес-клиентам модель доступна через API в Yandex Cloud, где ее можно дообучить для своих задач.