本博客日IP超过2000,PV 3000 左右,急需赞助商。
极客时间所有课程通过我的二维码购买后返现24元微信红包,请加博主新的微信号:xttblog2,之前的微信号好友位已满,备注:返现
受密码保护的文章请关注“业余草”公众号,回复关键字“0”获得密码
所有面试题(java、前端、数据库、springboot等)一网打尽,请关注文末小程序
【腾讯云】1核2G5M轻量应用服务器50元首年,高性价比,助您轻松上云
智谱 GLM 5.2 是如何做到参数最小 coding 比肩 Claude 和 ChatGPT 的?
昨天智谱大涨,市值首次突破了万亿港元。要知道,今年以来智谱股价涨幅超 2000%,市值超过不少国内的优秀互联网公司,包括小米、京东、美团等。
与智谱形成鲜明对比的是腾讯,今天市值再次跌破了 4 万亿港元。自开启这一轮下跌以来,腾讯的市值跌没了一个智谱。同为港股上市的 Minimax 就没这么幸运了,市值被智谱反超了。
面对这种情况,不少人可能就会问了,智谱股价为何上涨?智谱 GLM 5.2 是如何做到参数最小 coding 比肩 Claude 和 ChatGPT 的?接下来,我们就一起来看看智谱的真实成色如何。
参数不大,Coding 更强
2026 年 6 月,智谱 AI 开源 GLM-5.2,以 744B 总参数、40B 激活参数的 MoE 架构,在 Coding 能力上实现了对 GPT-5.5 的部分超越,并在 FrontierSWE 长程任务上逼近 Claude Opus 4.8。智谱 GLM-5.2 的技术创新包括,IndexShare 架构、1M 无损上下文、Slime 训练框架等,并与 Qwen、DeepSeek 等国产开源模型进行横向对比,有着“小参数、强代码”背后的工程哲学,由此智谱 GLM-5.2 的带来了技术上的突围与开源模型格局之变。
反直觉,参数没涨,能力暴涨
2026 年 6 月 17 日,智谱 AI 发布并开源 GLM-5.2。一个值得注意的细节是,它的参数量与 GLM-5.1 完全一致,总参数 744B,每次推理激活约 40B。但能力跃升却是代际级的。
在权威基准测试平台 Artificial Analysis 的 Intelligence Index v4.1 中,GLM-5.2 以 51 分登顶所有开源权重模型,较 GLM-5.1 的 40 分提升了 11 分,大幅领先 MiniMax-M3(44 分)、DeepSeek V4 Pro(44 分)和 Kimi K2.6(43 分)。
更关键的是开发者核心场景的表现:
| 基准测试 | GLM-5.2 | GPT-5.5 | Claude Opus 4.8 | GLM-5.1 |
|---|---|---|---|---|
| SWE-bench Pro | 62.1% | 58.6% | 69.2% | 58.4% |
| FrontierSWE | 74.4% | 72.6% | 75.1% | 67.1% |
| Terminal-Bench 2.1 | 81.0% | — | 85.0% | 63.5% |
| Code Arena 前端 | 开源第一 | — | — | — |
注意,上面的数据来源于 Artificial Analysis、智谱官方 Blog 以及其它社区大佬的实测。
这意味着什么呢?
很明显,GLM-5.2 在 SWE-bench Pro(真实软件工程任务)上超越了 GPT-5.5,在 FrontierSWE(数小时尺度的复杂技术项目)上仅比 Claude Opus 4.8 低 0.7 个百分点,却超过了 GPT-5.5 1.8 个百分点。这是开源权重模型首次在代码能力维度上系统性进入与最昂贵闭源前沿模型对齐的区间。
但参数没变。这说明参数量的规模并非限制因素,架构效率和训练方法才是。
GLM-5.2 的核心技术创新
IndexShare
大模型上下文窗口的军备竞赛已经持续了一年多,但行业内的共识是:上下文大不等于有用。很多模型在超过数百 K 后性能就开始劣化,原因是没有同步增强 Coding Agent 环境和训练数据。
而 GLM-5.2 自研的 IndexShare 架构解决了这个问题。其设计思路是在每四个稀疏注意力层(DSA Block)之间共享一个轻量级索引器(Indexer),复用 top-k 索引和 KV Cache。
文章配图参见 https://mp.weixin.qq.com/s/WcSy3R_DyGkXZJZA47qe2Q。
效果是惊人的。在 1M 上下文长度下,单位 token 的 FLOPs 降低至原来的约 1/3(2.9 倍减少)。这意味着 GLM-5.2 可以在实际推理中真正承载 1M token 的完整代码仓库,而不是像某些模型那样“能放进来但读不懂”。这也让 1M 上下文从“纸面参数”变成“工程能力”。
智谱官方提供了一个极具说服力的实测案例,GLM-5.2 在一次长程任务中,累计处理 88 万 tokens,完成了覆盖 Web、移动端与小程序的多端应用开发——从开发、联调、测试到打包上线的完整流程。过去需要团队协作数周的工程,现在由模型在一次推理链路中跑完。
改进 MTP 投机解码
GLM-5.2 在推理侧的另一项优化是改进了用于投机解码(Speculative Decoding)的 MTP(Multi-Token Prediction)层。通过 IndexShare + KV Share、Rejection Sampling 和 End-to-end TV Loss 的组合优化,MTP 的接受长度(Acceptance Length)提升了 20%,让“思考”更快被接受。
这直接转化为开发者的体感,模型在生成长代码时的“卡顿感”降低,复杂多步推理的响应更流畅。对于需要 131072 token 最大输出的长程任务来说,这种效率提升至关重要。
Slime 框架 + 异步 Agentic RL
GLM-5.2 的训练基础设施是其 Coding 能力跃升的根本保障。智谱自研的 Slime 框架支持大规模 Agentic 强化学习(Agentic RL)和 OPD(Online Preference Distillation)训练。
关键创新在于异步智能体强化学习算法,模型能够持续从长程交互中学习,而不是仅在静态数据集上微调。这使得 GLM-5.2 的能力从“写代码”升级为“写工程”,前者是生成几行代码、修几个 Bug,后者是完成复杂系统工程和长程 Agent 任务。
智谱将这一转变定义为从 Vibe Coding 到 Agentic Engineering 的跨越。
群里有网友让对国产开源模型 Coding 能力横评,GLM、Qwen、DeepSeek 谁更强?
我只能说各有优势,各有优劣,各自的侧重点不同。这里我就不在细评与拉踩了,但 coding 能力这方面,智谱确实很强,得到了不少老外的赞美,吐槽最多的是抢不到。
Effort Level 控制
GLM-5.2 引入了一个对开发者非常友好的设计 Effort Level(思考档位)控制。用户可以在能力、速度、成本之间做出显式权衡。
从智谱官方发布的对比图可以看出:
- Non-Thinking 模式:低 token 消耗,适合简单代码补全;
- High 模式:中等消耗,平衡质量与速度;
- Max 模式:最高质量,适合复杂系统工程。
在相近的 token 预算下,GLM-5.2 的 Coding 能力大致位于 Claude Opus 4.7 与 Claude Opus 4.8 之间。这种“可调控的智能”对于企业级应用至关重要,不是所有任务都需要“满血运行”。
MIT 开源 + 国产算力适配
GLM-5.2 采用 MIT 许可证开源,这是当前最宽松的开源协议。无版权限制、无地域限制、可自由商用和修改。模型权重已上线 Hugging Face 和 ModelScope,vLLM、SGLang、transformers 等主流推理框架均已支持。
更具战略意义的是国产算力 Day 0 适配。GLM-5.2 在发布当天即完成了与华为昇腾、平头哥、摩尔线程、寒武纪、昆仑芯、沐曦、海光、壁仞等国产算力平台的推理适配。这意味着企业可以在完全自主可控的硬件基础设施上部署前沿 Coding 模型。
从参数效率图可以看出,GLM-5.2 位于“高总参数、中等激活参数、高 Coding 分数”的甜蜜点,在性能与部署成本之间取得了精妙平衡。
GLM-5.2 的发布标志着一个重要转折,开源权重模型不再是闭源模型的“廉价替代品”,而是在核心能力上与之对等、在成本和自由度上显著领先的独立选项。
智谱给出了一个清晰的答案,你可以用 MIT 许可获得一个在编码和 Agent 任务上与 GPT-5.5 旗鼓相当的模型,以六分之一的成本调用它,部署在自己选择的任何基础设施上,不受供应商锁定。
但竞争远未结束。DeepSeek 在万亿参数上的“暴力美学”、Qwen 在极致性价比上的“四两拨千斤”、Kimi 在多模态 Agent 上的全面布局,都在推动开源生态快速进化。
AI 进步实在是太快了,我们既希望它们变好变便宜,又希望它创造更多工作岗位,实际上好像是个奢望。

最后,欢迎关注我的个人微信公众号:业余草(yyucao)!可加作者微信号:xttblog2。备注:“1”,添加博主微信拉你进微信群。备注错误不会同意好友申请。再次感谢您的关注!后续有精彩内容会第一时间发给您!原创文章投稿请发送至532009913@qq.com邮箱。商务合作也可添加作者微信进行联系!
本文原文出处:业余草: » 智谱 GLM 5.2 是如何做到参数最小 coding 比肩 Claude 和 ChatGPT 的?