智谱GLM-5.2发布:长上下文与国产算力生态双突破,跻身全球大模型前列?

2026-06-17 19:22:22未知 作者:徽声在线

《徽声在线》6月17日讯(记者 王晓晨)6月17日,智谱科技正式对外发布并开源了其最新一代旗舰大模型——GLM-5.2,这一举措迅速在科技界引发了广泛关注。

在备受瞩目的Artificial Analysis综合评测榜单上,GLM-5.2凭借出色的表现斩获了51分的高分,一举跻身开源模型领域的顶尖行列,成为新的SOTA(State-of-the-Art)标杆。

据智谱科技内部人士向《徽声在线》记者透露,GLM-5.2是他们迄今为止推出的能力最为强大的开源模型。该模型的核心突破主要体现在两个方面:一是成功将1M token的上下文处理能力从理论参数转化为实际生产可用;二是在长程Coding能力上实现了进一步的飞跃。

《徽声在线》记者在第一时间对GLM-5.2 Max进行了长达数小时的连续实测,测试任务涵盖了长上下文检索与生成、Long Horizon长程Agent编码,以及一次性完成近百万token复合型行业调研全链路交付等多个复杂场景。

深度实测GLM-5.2:百万级上下文窗口的工程化突破

智谱科技方面强调,GLM-5.2的最大亮点在于其成功将百万级上下文窗口的处理能力实现了工程化应用。

以实际案例为例,该模型能够在一轮连续任务中轻松处理超过88万的token,自主完成从软件开发、联调、测试到最终打包上线的完整流程,仅需数小时便能产出一个涵盖网页端、移动端以及小程序的全方位应用。相比之下,过去完成类似规模的项目往往需要一支专业团队耗费数周时间。

尽管目前市场上已有不少模型宣称支持百万级上下文处理,但一个不争的事实是,许多模型在处理超过30万token后便开始出现信息丢失,长文本下的推理质量急剧下降。而智谱科技则通过一组创新的注意力结构方案——KV8量化、LayerSplit、IndexShare 4和HiSparse稀疏注意力机制的有机结合,有效解决了这一问题。

从工程实现的角度来看,这组技术改进的目标十分明确:即在保持1M长度上下文处理能力的同时,尽可能降低效果衰减和推理成本。智谱科技官方公布的数据显示,在1M上下文长度下,单位token的FLOPs(浮点运算次数)降低至传统方案的2.9倍,即计算量减少了约66%。

智谱科技在技术博客中进一步披露了该模型的实测成果:在一次完整的应用开发交付任务中,模型累计处理了88万tokens,几乎充分利用了1M的上下文窗口。这意味着在真实的超长工程任务中,模型能够始终保持对项目状态的完整记忆,而不会出现传统长文本模型在连续对话中遗忘早期约束的情况。

《徽声在线》记者也亲自参与了GLM-5.2的实测。在测试中,记者要求模型基于海量公开素材完成对K12在线编程教育竞品的深度调研,横向对比15家主流品牌,并从课程、师资、定价、家长评价四大核心维度进行拆解分析。最终,模型在半小时内便交付了包含溯源索引的XLSX数据库、20页PDF完整分析报告、6张可视化对比图表以及可复用的数据处理脚本等全套成果。整个过程中,模型完整保留了804条家长评价,输出的标准化Excel包含12个数据分表,且全程未出现品牌混淆、数据维度丢失或统计口径错乱等常见问题。不过,在1M上下文的极端场景下,模型仍有进一步优化的空间。



为了更全面地验证模型的深度分析研究能力,《徽声在线》记者又向模型下达了一个更为复杂的实测指令:基于国家统计局及可公开核验的宏观数据,对2018-2024年中国县域消费升级进行系统化研究,构建覆盖200多个县域的可溯源数据库,并交付数据底表、研究报告、汇报PPT及配套可视化图表。

实测结果显示,GLM-5.2 Max能够单轮承载近百万的宏观统计素材,一次性完成全国四百余县域的量化数据库搭建、深度分析报告撰写以及成套可视化图表的制作,完美适配金融咨询级长周期大数据研究任务的需求。



那么,将GLM-5.2的编程能力置于全球最顶尖模型之中进行定位,又会有怎样的发现呢?

北京计算机学会AI专委会秘书长、北京大学特聘研究员张有鱼在接受《徽声在线》记者采访时表示,智谱GLM-5.2的发布标志着国产模型在编程细分领域取得了关键性的突破。

他指出,GLM-5.2的发布打破了以往双寡头垄断的局面。凭借其登顶全球编程基准的实测表现以及高性价比优势,GLM-5.2在长上下文编程场景下展现出了显著的优势,正在重塑行业格局,有望形成智谱、OpenAI、Anthropic三方鼎立的“新御三家”态势。

同时,张有鱼也客观地指出,虽然GLM-5.2尚未实现全维度的超越,但在目前多数中高频的实际开发场景下,该模型已经完全可以作为海外头部模型的替代方案。然而,他也强调,GLM-5.2在深度的数理逻辑推理与跨领域知识的复杂融合方面,与海外最顶尖水平相比仍存在一定的技术差距,这是下一步需要重点攻坚的方向。

国产算力Day 0适配:构建自主可控的算力生态

除了性能上的突破外,GLM-5.2还以最宽松的MIT协议开放源代码,允许免费商用,且模型训练与线上推理均未依赖海外算力资源。

上线首日,GLM-5.2的线上推理便完成了与八大国产算力平台的深度适配。这一“开源国模+国产算力”的组合模式迅速引起了行业的广泛关注。

智谱科技方面向《徽声在线》记者透露,预计下半年昇腾950超节点上市后,将成为GLM-5.2重要的算力底座之一。

所谓“Day 0适配”,并非简单地指模型能够在国产芯片上运行,而是意味着在模型发布当天,就已经完成了与国产算力平台的深度推理适配与算子级优化。这标志着国产芯片不再仅仅是作为“备胎”存在,而是与海外算力平台同等对待的第一梯队底座。

智谱科技的适配名单涵盖了国产算力的多家头部企业,包括华为昇腾、寒武纪、摩尔线程、海光、壁仞、沐曦、昆仑芯以及平头哥等。这一举措既是为了分散供应链风险,也是为了最大化地满足不同行业的国产化替代需求。

从商业逻辑的角度来看,当前国内大模型公司的算力成本中,GPU采购和租赁占据了绝大部分比例,且高度依赖英伟达H100/H200等海外高端芯片。然而,在中美科技博弈持续升级的背景下,算力供应链的自主可控已经从“战略储备”转变为“生存必需”。

对于开发者而言,国产算力适配意味着两件事:一是企业用户可以在纯国产环境中私有化部署GLM-5.2,从而满足数据安全和合规要求;二是当海外算力供应出现波动时,国产替代方案已经准备就绪,无需从头开始进行适配工作。

从技术角度来看,在多个架构差异显著的国产芯片上完成推理适配,要求模型在算子兼容性、内存管理和推理效率方面进行大量的工程调优。智谱科技能够做到Day 0同步适配,充分表明其底层工程团队在异构计算方面已经积累了深厚的经验。

(徽声在线记者 王晓晨)

点击展开全文
你关注的
从“几年一遇”到“一年几遇”,AI时代网络攻防失衡加剧 奇安信齐向东:主战场转向制造业与服务业从“几年一遇”到“一年几遇”,AI时代网络攻防失衡加剧 奇安信齐向东:主战场转向制造业与服务业 微信电脑端重大更新:可滚动截长图与支持发语音功能上线微信电脑端重大更新:可滚动截长图与支持发语音功能上线 上海布局太空算力新赛道,全球首颗光计算卫星研制正式启动上海布局太空算力新赛道,全球首颗光计算卫星研制正式启动
相关文章
智谱GLM-5.2发布:长上下文与国产算力生态双突破,跻身全球大模型前列?智谱GLM-5.2发布:长上下文与国产算力生态双突破,跻身全球大模型前列? 京东方第8.6代AMOLED生产线量产 引领中国显示产业迈向新高度京东方第8.6代AMOLED生产线量产 引领中国显示产业迈向新高度 15元购数百万Token,一句“你好”耗5万!运营商“低价”算力套餐为何遭开发者吐槽“用不起”15元购数百万Token,一句“你好”耗5万!运营商“低价”算力套餐为何遭开发者吐槽“用不起” VIP机会日报:市场探底回升 玻璃基板概念持续走强 栏目追踪产业动态 核心标的集体涨停VIP机会日报:市场探底回升 玻璃基板概念持续走强 栏目追踪产业动态 核心标的集体涨停 国务院力推“人工智能+”战略,开创人机协同就业新篇章国务院力推“人工智能+”战略,开创人机协同就业新篇章 苹果官网新推手柄兼支架,售价398元引关注苹果官网新推手柄兼支架,售价398元引关注