深度解析:GLM-5.2 发布——智谱首个百万上下文、MIT 开源的编程模型

近日,智谱旗下 Z.ai 发布了旗舰模型 GLM-5.2(论文发表于 June 16, 2026),这是 GLM-5 系列的第三次重大迭代,也是该系列迄今最强的一次飞跃。与同日发布 Claude Fable 5 的 Anthropic 相比,GLM-5.2 走了一条不同的路:开放权重 + 百万上下文 + 编程优先——这三者组合在一起,使得它成为目前开源界最值得关注的新模型之一。

100 万 Token 上下文:不只是数字游戏

6 月 13 日,GLM-5.2 正式发布,号称首个在"实际工程压力下保持质量稳定"的百万上下文模型。官方强调,声称支持 1M 上下文很容易,但在真实的编程代理轨迹中保持稳定却困难得多——这确实道出了当前行业的一个痛点:许多模型的长上下文能力在 benchmark 中表现优异,却在真实场景下迅速衰减。

为了支撑这一目标,GLM-5.2 在训练阶段大幅扩充了 1M 上下文的代码代理相关数据,覆盖了大规模工程实现、自动化研究、性能优化和复杂调试等多种场景。官方称其结果是一个"不仅广而且稳"的长上下文系统。

IndexShare:架构层面的创新突破

GLM-5.2 在技术层面最引人注目的贡献是提出了 IndexShare——一种针对稀疏注意力(DSA)的创新机制。

具体来说,GLM-5.2 中每四个 Transformer 层共享一个轻量级索引器:索引器放置在第一个层上,而 topk 索引会被这四个层复用。这一设计减少了后续三层中索引点积和 top-k 操作的成本,将百万上下文下的单 Token FLOPs 降低了 2.9 倍

IndexShare 的巧妙之处在于训练-推理一致性:它从中期训练阶段(128K 序列长度)就开始引入,使得 GLM-5.2 在比 GLM-5.1 更少的计算量下实现了更好的长上下文基准表现。

此外,GLM-5.2 还改进了多步 MTP(Multi-Token Prediction)层用于推测解码——通过 IndexShare + KVShare 的组合优化,使得推测解码的接受长度最高提升了 20%。这意味着在相同 token 预算下可以获得更长的有效输出。

Effort Level Control:推理效率的革命性设计

GLM-5.2 还引入了**推理层级控制(Effort Level Control)**机制,允许用户显式地在模型能力、执行速度和计算成本之间进行权衡。官方展示的数据显示,在相似的 token 预算下,GLM-5.2 的编程代理性能显著强于 GLM-5.1,其能力大致介于 Claude Opus 4.7 和 Opus 4.8 之间;而 Max 层级则允许用户在挑战任务中分配更多计算资源。

这一设计看似简单,却触及了当前 LLM 使用中的一个核心矛盾:同一个模型在不同场景下需要不同深度的推理——日常问答只需轻度思考,解决复杂 bug 则需要全力推理。GLM-5.2 的 effort level 让这种灵活度从"社区 hack"变成了官方一等公民的功能。

Benchmark 表现:开源界最强

BenchmarkGLM-5.2GLM-5.1Claude Opus 4.8GPT-5.5
FrontierSWE--baseline+1% vs GLM-5.2
Terminal-Bench 2.181.063.585.0N/A
SWE-bench Pro62.158.4--

在 FrontierSWE(衡量代理完成数小时至数十小时的开放式技术项目的能力)上,GLM-5.2 仅以 1% 之差落后于 Claude Opus 4.8,同时领先 GPT-5.5 约 1%、Opus 4.7 超过 10%。在 SWE-Marathon(超长期软件工程基准)中,尽管仍以 13% 差距落于 Opus 4.8 之后,但在所有三个基准测试中均位列最高排名开源模型。

MIT 协议:技术获取无边界

GLM-5.2 的另一个重要特征是采用了 MIT 开源许可证——这意味着没有地区限制,任何人都可以自由使用、修改和分发。这对于全球开发者社区来说意义重大:过去许多高性能模型受限于出口管制或地域许可,而 GLM-5.2 通过 MIT 协议打破了这一壁垒。

目前 GLM-5.2 已在 Z.ai Coding Plan(Lite / Pro / Max / Team)中可用,并支持 Claude Code、OpenClaw、Cline 等主流编程工具。独立 API、Z.ai Chatbot 和开源权重版本计划在发布后一周内陆续上线。

总结与展望

GLM-5.2 的发布标志着开源大模型在"长上下文 + 编程代理"赛道上的一次重要突破。IndexShare 架构创新为百万上下文的高效推理提供了新的思路,而 effort level control 则为实际使用场景下的性能调优打开了新空间。更重要的是,MIT 协议让这一前沿能力真正走向了全球开发者社区。

当然,GLM-5.2 距离完全超越 Opus 系列还有差距(SWE-Marathon 落后 13%),但作为首个以百万上下文为核心卖点的开源编程模型,它已经为整个行业树立了新的标杆。对于正在评估编程代理模型的团队来说,GLM-5.2 值得列入重点关注名单。


信息来源:


深度解析:GLM-5.2 发布——智谱首个百万上下文、MIT 开源的编程模型
http://coderedeng.github.io/2026/06/20/GLM-5.2-智谱百万上下文开源编程模型深度解析/
作者
Evan Deng
发布于
2026年6月20日
许可协议