智谱CEO张鹏揭秘：GLM-5-Turbo“龙虾”模型Token用量激增，低价竞争非长久之计

2026-03-27 19:09:05未知作者:徽声在线

3月27日，2026中关村论坛年会迎来了一场备受瞩目的“人工智能主题日·主题论坛”，该活动在北京盛大举行。

在以“OpenClaw与AI开源”为主题的圆桌论坛环节，智谱CEO张鹏谈到了公司近期发布的GLM-5-Turbo（智谱龙虾基座模型）。他介绍道，此次更新的核心目标，是推动产品能力从基础的“简单对话”迈向更为实用的“真正干活”阶段。

针对智谱近期将新模型API（应用程序编程接口）价格上调近20%的举措，张鹏解释称，这实际上是成本变化的必然结果。随着模型规模的扩大和能力的增强，对应的服务成本也水涨船高。在他看来，长期依赖低价竞争策略并不利于整个行业的健康发展。

张鹏图片来源：主办方供图

算力：未来一年AI领域的核心挑战

近日，智谱公司正式推出了GLM-5-Turbo基础大模型。据透露，该模型在训练阶段就针对龙虾任务的核心需求进行了专项优化，显著提升了工具调用、指令遵循、定时与持续性任务、长链路执行等关键能力。

张鹏强调，此次大模型更新的最主要目标，是让产品能力从“简单对话”升级为“真正干活”。他表示：“OpenClaw的出现让大家意识到，大模型不再仅仅是能够聊天的工具，而是真正能够助力我们完成工作的得力助手。然而，这背后所隐含的能力需求却极高。”

张鹏进一步阐释道，在“干活”过程中，OpenClaw等智能体需要自主进行任务规划，同时不断重试、压缩上下文，涉及大量信息处理。这对模型本身的能力提出了极高要求，与对话类场景中使用的通用、泛用模型有所不同。这也是GLM-5-Turbo应运而生的原因。

谈及近期备受关注的Token（词元）消耗量问题，张鹏指出，让“聪明”的模型执行复杂任务时，Token消耗量是巨大的。他幽默地表示：“可能一般人体会不到，只会看到自己账单上的金额在不断减少。”

张鹏透露，智谱针对此问题也进行了一些优化。例如，在面临复杂任务时，会让模型以更高效的Token效率去完成任务。但本质上，其模型架构仍是一种多任务协同的通用模型架构，只是在能力上有所偏向性的加强。

在谈及未来一年人工智能发展的关键问题时，张鹏认为算力仍是重中之重。他表示，无论是模型能力还是智能体框架，都在显著提升创造力和生产效率，甚至在某些场景下能带来十倍级的效率提升。但前提是，用户得用得起、用得上。不能因为算力不足，导致用户提出问题后模型长时间无法给出答案。

“前两年业界有句话叫‘讲卡伤感情，没卡没感情’。我觉得，今天某种程度上又回到了这个阶段，只不过背景已经发生了变化。”张鹏感慨道。

“龙虾”任务Token用量远超简单问答

值得注意的是，智谱在发布模型时还同步上调了GLM-5-Turbo的API调用价格，涨幅约为20%。这已是智谱近期第二次涨价。

谈及涨价原因，张鹏解释称，现在已经不再是“简单地问一个问题、模型给出一个回答”的时代。大模型背后的思考和推理链路变得很长，还会通过写代码的方式与底层基础设施交互，不断调试并修正自己的错误。

“这意味着整体消耗量会非常大。完成一个任务所需要的Token量，可能是回答一个简单问题时的十倍甚至百倍。因此，价格上相应做一些调整，本质上是成本变化的自然结果。”张鹏表示。

他进一步强调，随着模型规模的扩大和能力的增强，对应的服务成本也提高了。“我们希望将其逐步拉回到一个正常的商业价值区间。”

张鹏还指出，长期依赖低价竞争并不利于整个行业的长远发展。“这也是我们的一个重要考量。我们希望通过这样的方式，在商业化路径上形成一个更健康的闭环，持续优化模型能力，并更长期、稳定地为大家提供更好的模型和相应的Token服务。”

无问芯穹联合创始人兼CEO夏立雪也表达了类似观点。他指出，当前最现实、最紧迫的问题是类似OpenClaw的这类Agent（智能体）产品带动了整个Token需求的暴增，而这种暴增对系统效率提出了更高要求。

“从某种意义上说，价格上涨也是在这种需求压力之下形成的一种应对方式。”夏立雪称。