Команда Qwen, входящая в состав компании Alibaba, представила новую «рассуждающую» языковую модель QwQ-32B. В тестах она достигает производительности DeepSeek-R1, которая имеет в 20 раз больше параметров.
Фото: Qwen
Разработчики для создания QwQ-32B использовали методику двухэтапного обучения с подкреплением. На первом этапе модель тренировали решать математические задачи и генерировать код. На втором этапе исследователи сосредоточились на улучшении других навыков — написании текстов, распознавании изображений и так далее.
QwQ-32B обладает способностями AI-агента, которые позволяют нейросети мыслить критически, использовать сторонние инструменты (например, интерпретатор кода или генераторы изображений) и адаптировать свои рассуждения на основе обратной связи.
Модель доступна под лицензией Apache 2.0 — разработчики уже могут интегрировать нейросеть в свои приложения. Команда Qwen видит в QwQ-32B первый шаг к масштабированию обучения с подкреплением и работает над следующим поколением моделей, которое позволит приблизиться к общему искусственному интеллекту (AGI).
Ранее Alibaba объявила о своих планах вложить в строительство облачной инфраструктуры и разработку искусственного интеллекта в ближайшие три года не менее 380 млрд юаней ($52,44 млрд). Это больше совокупных инвестиций компании в ИИ за последние 10 лет.