Новости

Китайская GLM-5.2 заняла второе место в рейтинге моделей для фронтенд-разработки

Пекинская Zhipu AI, работающая за пределами Китая под брендом Z.ai, 13 июня открыла подписчикам доступ к флагманской языковой модели GLM-5.2, а спустя три дня опубликовала ее веса. Модель поднялась на второе место в рейтинге Code Arena по фронтенд-разработке, уступив только Anthropic Fable 5. Некоторые исследователи сравнили реакцию на релиз с новым «моментом DeepSeek», когда китайская разработка приблизилась к решениям крупнейших американских ИИ-лабораторий.

Unsplash

GLM-5.2 распространяется с открытыми весами под лицензией MIT. Компании и разработчики могут развернуть ее на собственной или арендованной инфраструктуре, изменить под свои задачи и не зависеть от облачной платформы Zhipu AI. Однако модель насчитывает около 750 млрд параметров, поэтому для ее самостоятельного запуска потребуются значительные вычислительные ресурсы.

Контекстное окно GLM-5.2 достигает 1 млн токенов, что позволяет модели работать с крупными массивами текста и программного кода в рамках одной задачи. Первоначальный доступ к ней появился на следующий день после того, как Anthropic отключила Fable 5 для иностранных пользователей, выполняя требования американских властей.

Бывший вице-президент Meta Platforms* и Google DeepMind Мэтт Веллозо написал в X, что тестировал GLM-5.2 в течение всего дня и назвал ее первой открытой моделью, подходящей для повседневной работы. По его наблюдениям, она отвечает по существу, не перегружает результат объяснениями и реже начинает повторять собственные рассуждения.

Исследователь в области ИИ Натан Ламберт назвал GLM-5.2 первой из будущих моделей с открытыми весами, способных стать реальной альтернативой закрытым системам. Он сравнил релиз с выходом DeepSeek R1, который показал, что лаборатории с меньшими ресурсами могут приблизиться к передовым американским разработкам в отдельных классах задач.

Исследователь Brookings Institution Кайл Чан также увидел в релизе признак сокращения технологического разрыва. По его оценке, ведущие китайские разработчики отставали от американских лабораторий лишь на несколько месяцев, хотя располагали более ограниченным доступом к передовым чипам и вычислительным мощностям.

При этом GLM-5.2 все еще уступает лучшим американским системам в наиболее сложных и продолжительных задачах. В тесте NL2Repo модель набрала 48,9 балла против 69,7 у Claude Opus 4.8, а в SWE-Marathon получила 13 баллов против 26. На таких задачах, где требуется долго работать с крупными репозиториями и доводить проект до результата, разрыв остается заметным.

Глава Snowflake Шридхар Рамасвами опубликовал результаты теста, который команда Coco провела на 103 задачах dbt. При трех попытках GLM-5.2 справилась с 66% заданий, а Claude Opus 4.7 — с 67%. При первой попытке разрыв оказался заметнее и составил 47,6% против 53,7% в пользу Opus. При этом китайская модель использовала 860 млн токенов против 439 млн и в среднем выполняла 99 итераций вместо 80.

Более высокий расход токенов не сделал GLM-5.2 дороже в этом конкретном тесте. При расчетной доле кэшированных запросов в 90% одна сессия обходилась в $1,12 против $2,14 у Opus 4.7, то есть примерно на 48% дешевле. Однако результат зависит от поставщика инфраструктуры, тарифа и эффективности кэширования, поэтому его нельзя переносить на любые сценарии использования. Основатель Zhipu AI Тан Цзе тем временем сообщил, что компания рассчитывает выпустить еще более сильную открытую модель до конца года.

Аналитики Jefferies отнесли GLM-5.2 к моделям мирового уровня, но усомнились, что ее успех быстро принесет Zhipu значительную выручку. Компании не хватает передовых вычислительных мощностей для запуска длинных контекстов и сложных агентных сценариев, из-за чего ей будет труднее обеспечить крупным корпоративным клиентам необходимый масштаб и стабильность работы.

По совокупности характеристик GLM-5.2 пока не превзошла лучшие модели Anthropic, однако заметно сократила разрыв с ними в программировании и агентных задачах. Финансовое положение самой Zhipu при этом остается сложным. В 2025 году ее выручка выросла на 132%, до 724,3 млн юаней, или примерно $105 млн, а чистый убыток увеличился почти на 60%, до 4,72 млрд юаней, или около $686 млн. JPMorgan ожидает резкого роста выручки компании в 2026 году и выхода на прибыль в 2028-м, но этот прогноз будет зависеть от спроса и доступности вычислительных ресурсов.


Подпишитесь на «Инк» в Telegram. Там мы пишем нескучным языком о самом важном для предпринимателей. Подписаться.