智谱CEO张鹏揭秘:GLM-5-Turbo“龙虾”模型Token用量激增,低价竞争非长久之计
2026-03-27 19:09:05未知 作者:徽声在线
3月27日,2026中关村论坛年会迎来了一场备受瞩目的“人工智能主题日·主题论坛”,该活动在北京盛大举行。
在以“OpenClaw与AI开源”为主题的圆桌论坛环节,智谱CEO张鹏谈到了公司近期发布的GLM-5-Turbo(智谱龙虾基座模型)。他介绍道,此次更新的核心目标,是推动产品能力从基础的“简单对话”迈向更为实用的“真正干活”阶段。
针对智谱近期将新模型API(应用程序编程接口)价格上调近20%的举措,张鹏解释称,这实际上是成本变化的必然结果。随着模型规模的扩大和能力的增强,对应的服务成本也水涨船高。在他看来,长期依赖低价竞争策略并不利于整个行业的健康发展。
张鹏 图片来源:主办方供图
算力:未来一年AI领域的核心挑战
近日,智谱公司正式推出了GLM-5-Turbo基础大模型。据透露,该模型在训练阶段就针对龙虾任务的核心需求进行了专项优化,显著提升了工具调用、指令遵循、定时与持续性任务、长链路执行等关键能力。
张鹏强调,此次大模型更新的最主要目标,是让产品能力从“简单对话”升级为“真正干活”。他表示:“OpenClaw的出现让大家意识到,大模型不再仅仅是能够聊天的工具,而是真正能够助力我们完成工作的得力助手。然而,这背后所隐含的能力需求却极高。”
张鹏进一步阐释道,在“干活”过程中,OpenClaw等智能体需要自主进行任务规划,同时不断重试、压缩上下文,涉及大量信息处理。这对模型本身的能力提出了极高要求,与对话类场景中使用的通用、泛用模型有所不同。这也是GLM-5-Turbo应运而生的原因。
谈及近期备受关注的Token(词元)消耗量问题,张鹏指出,让“聪明”的模型执行复杂任务时,Token消耗量是巨大的。他幽默地表示:“可能一般人体会不到,只会看到自己账单上的金额在不断减少。”
张鹏透露,智谱针对此问题也进行了一些优化。例如,在面临复杂任务时,会让模型以更高效的Token效率去完成任务。但本质上,其模型架构仍是一种多任务协同的通用模型架构,只是在能力上有所偏向性的加强。
在谈及未来一年人工智能发展的关键问题时,张鹏认为算力仍是重中之重。他表示,无论是模型能力还是智能体框架,都在显著提升创造力和生产效率,甚至在某些场景下能带来十倍级的效率提升。但前提是,用户得用得起、用得上。不能因为算力不足,导致用户提出问题后模型长时间无法给出答案。
“前两年业界有句话叫‘讲卡伤感情,没卡没感情’。我觉得,今天某种程度上又回到了这个阶段,只不过背景已经发生了变化。”张鹏感慨道。
“龙虾”任务Token用量远超简单问答
值得注意的是,智谱在发布模型时还同步上调了GLM-5-Turbo的API调用价格,涨幅约为20%。这已是智谱近期第二次涨价。
谈及涨价原因,张鹏解释称,现在已经不再是“简单地问一个问题、模型给出一个回答”的时代。大模型背后的思考和推理链路变得很长,还会通过写代码的方式与底层基础设施交互,不断调试并修正自己的错误。
“这意味着整体消耗量会非常大。完成一个任务所需要的Token量,可能是回答一个简单问题时的十倍甚至百倍。因此,价格上相应做一些调整,本质上是成本变化的自然结果。”张鹏表示。
他进一步强调,随着模型规模的扩大和能力的增强,对应的服务成本也提高了。“我们希望将其逐步拉回到一个正常的商业价值区间。”
张鹏还指出,长期依赖低价竞争并不利于整个行业的长远发展。“这也是我们的一个重要考量。我们希望通过这样的方式,在商业化路径上形成一个更健康的闭环,持续优化模型能力,并更长期、稳定地为大家提供更好的模型和相应的Token服务。”
无问芯穹联合创始人兼CEO夏立雪也表达了类似观点。他指出,当前最现实、最紧迫的问题是类似OpenClaw的这类Agent(智能体)产品带动了整个Token需求的暴增,而这种暴增对系统效率提出了更高要求。
“从某种意义上说,价格上涨也是在这种需求压力之下形成的一种应对方式。”夏立雪称。
