Обзор нейросети GLM-5.2: справедливо ли ее называют китайским «убийцей» Claude
На просторах интернета заговорили о появлении китайского конкурента Claude. Речь идет о нейросети GLM-5.2 от компании Z.ai. Энтузиасты сравнивают новинку с топовыми продуктами Anthropic. Например, криптоблогер 0xMarioNawfal заявил, что GLM-5.2 превосходит Claude в ряде сценариев при цене в десять раз ниже. По его словам, пользователи начали массово переключаться на нее уже через сутки после релиза.
Редакция BeInCrypto собрала в одном обзоре информацию о возможностях нейросети и отзывы пользователей. Рассказываем, действительно ли новая китайская модель лучше Claude.
Хотите еще эксклюзивных новостей и аналитики? Подписывайтесь на наш телеграм-канал, обсуждайте новости и делитесь мнениями о последних событиях рынка в чате!
Что такое GLM-5.2 и чем она интересна
Разработчики создавали GLM-5.2 как флагманскую модель, заточенную под продолжительные рабочие сессии. ИИ-агент способен часами выполнять сложный проект без потери качества. Главное отличие от предшественника GLM-5.1 заключается в стабильном контекстном окне на 1 млн токенов вместо прежних 200 тысяч. Именно объем контекста определяет, сколько текста и кода модель удерживает в поле зрения одновременно.
Ключевые особенности модели:
- Контекст 1 млн токенов, который не деградирует при сверхдлинных сессиях, благодаря чему вся кодовая база помещается в один цикл рассуждения.
- Два уровня усилия рассуждения: High для баланса производительности и расхода токенов, а также Max для максимума возможностей ценой большего расхода.
- Открытая лицензия MIT без региональных ограничений, позволяющая реализовать self-hosting, то есть запуск на собственном оборудовании.
- Цена обращения к модели через API, которая осталась на уровне предыдущей версии GLM-5.1.
Параметры модели выложены на платформах HuggingFace и ModelScope. Локальный запуск поддерживают фреймворки transformers, vLLM, SGLang, xLLM и ktransformers. Доступ также открыт через подписку GLM Coding Plan, десктопный агент ZCode, а также среды Claude Code и OpenCode.
Что показывают бенчмарки
По собственным тестам Z.ai, GLM-5.2 признана сильнейшей открытой моделью на рынке. Однако до Anthropic Claude Opus 4.8 она в большинстве случаев не дотягивает.
На стандартных тестах по программированию разрыв с GLM-5.1 заметный: 81,0 против 63,5 на Terminal-Bench 2.1 и 62,1 против 58,4 на SWE-bench Pro. При этом на Terminal-Bench 2.1 результат 81,0 вплотную подходит к Opus 4.8 с его 85,0 и обгоняет Gemini 3.1 Pro с 74,0.
Сравнение с конкурентами на ключевых тестах в максимальном режиме рассуждения:
| Бенчмарк | GLM-5.2 | GLM-5.1 | Opus 4.8 | GPT-5.5 | Gemini 3.1 Pro |
| SWE-bench Pro | 62,1 | 58,4 | 69,2 | 58,6 | 54,2 |
| Terminal-Bench 2.1 | 81,0 | 63,5 | 85,0 | 84,0 | 74,0 |
| NL2Repo | 48,9 | 42,7 | 69,7 | 50,7 | 33,4 |
| DeepSWE | 46,2 | 18,0 | 58,0 | 70,0 | 10,0 |
| ProgramBench | 63,7 | 50,9 | 71,9 | 70,8 | 39,5 |
| MCP-Atlas | 76,8 | 71,8 | 77,8 | 75,3 | 69,2 |
| Tool-Decathlon | 48,2 | 40,7 | 59,9 | 55,6 | 48,8 |
Что измеряет каждый тест: SWE-bench Pro и DeepSWE оценивают решение реальных задач из репозиториев на GitHub. Тест Terminal-Bench 2.1 проверяет работу в командной строке, а NL2Repo исследует генерацию целого проекта по текстовому описанию.
ProgramBench измеряет программирование сложных задач. MCP-Atlas и Tool-Decathlon проверяют использование внешних инструментов и сервисов через протокол MCP (Model Context Protocol) в режиме автономного агента.
На продолжительных задачах (long-horizon tasks) картина схожая. На тесте FrontierSWE, где модель ведет открытые технические проекты длительностью в десятки часов, GLM-5.2 отстает от Opus 4.8 всего на 1%. Зато она обходит GPT-5.5 и предыдущую версию Opus 4.7. На PostTrainBench, который оценивает улучшение других моделей через дообучение, GLM-5.2 опережает Opus 4.7 и GPT-5.5, уступая лишь Opus 4.8.
На сверхдлинном SWE-Marathon с задачами вроде создания компиляторов отставание от Opus 4.8 составляет 13%. Таким образом, на всех трех тестах GLM-5.2 показывает лучший результат среди открытых моделей.
Сколько стоит ИИ и в чем подвох
Подписка GLM Coding Plan делится на три тарифа, причем цены указаны при годовой оплате со скидкой 30%. Тариф Lite обходится в $12,6 в месяц вместо $18, Pro стоит $50,4 вместо $72, а Max обойдется в $112 вместо $160. План Pro дает в пять раз больший лимит, чем Lite, а Max — в двадцать раз больший. Старшие планы получают приоритетный доступ к флагманским моделям, набор дополнительных инструментов и выделенные ресурсы в часы пик.
Внутри подписки расход квоты зависит от нагрузки: коэффициент 3x в часы пик и 2x вне пика. До конца сентября действует акция, поэтому внепиковое использование тарифицируется как 1x. Пиковыми считаются часы с 14:00 до 18:00 по пекинскому времени.
Что говорят пользователи
Часть пользователей встретила модель восторженно, но другие раскритиковали инфраструктуру и поведение алгоритма.
Сильные стороны по отзывам:
- Модель называют сильнейшей открытой нейросетью из опробованных на данный момент.
- Базовая логика кажется заметно лучше, чем у версии 5.1, а в программировании модель сопоставима с GPT-5.5 на высоком уровне рассуждения.
- ИИ автономно выполняет сложные задачи через вспомогательных агентов и сам предлагает исправить замеченные нестыковки.
- Пользователи описывают ее как медленную и дорогую, но при этом крайне упорную в достижении поставленной цели.
Критика касается в первую очередь сервиса и стабильности:
- Облачную инфраструктуру при хорошей математической модели называют крайне слабой.
- Разработчики жалуются на дорогую тарификацию и слабую поддержку, отмечая, что проще платить за Claude или GPT.
- Нейросеть критикуют за склонность застревать в бесконечных циклах и игнорировать команды. По мнению пользователей, модель заточенна исключительно под бенчмарки.
Резюме: по бенчмаркам перед нами флагман, но по реальному коду — ИИ бюджетного плана.
Отдельно пользователи отмечают режимы работы. Раскрывается модель, по их словам, только в режиме Max, который расходует в разы больше токенов, чем High.
Так это «убийца» Claude или нет
Однозначного ответа на этот вопрос нет. GLM-5.2 признана лучшей на сегодня открытой моделью для программирования и автономных задач. В отдельных длинных сценариях она вплотную подбирается к флагману Anthropic. Открытая лицензия MIT, запуск на собственном оборудовании и низкий порог входа делают ее заметным игроком.
Вместе с тем «убийцей» Claude новинку называют блогеры, а не бенчмарки. По большинству тестов Z.ai сама ставит свою модель ниже Opus 4.8. Кроме того, пользователи жалуются на нестабильную облачную инфраструктуру, высокий расход токенов в режиме Max и слабую поддержку. Новая ИИ сокращает разрыв с лидерами, но пока не обгоняет их.
The post Обзор нейросети GLM-5.2: справедливо ли ее называют китайским «убийцей» Claude appeared first on BeInCrypto.