Token成AI产业核心要素 成本优化成落地关键突破口
2026-06-18 16:17:29未知 作者:徽声在线
徽声在线6月18日讯(记者 郭松峤)“当前,人工智能的发展已从训练阶段全面迈向推理阶段,Token调用量呈现出指数级增长态势,这无疑是AI实现规模化应用最为直观的量化体现。”国家信息中心信息化和产业发展部主任单志广在人工智能 + 生态大会(AIEC 2026)上如此表示。
此次大会由清华大学全球产业研究院主办,中关村科学城管委会给予支持。来自国家信息中心、IDC、阿里云、腾讯、月之暗面、浪潮信息、美的、上海人工智能实验室、阶跃星辰、百川智能等众多知名机构和行业领先企业的专家代表齐聚一堂,围绕“人工智能 +”从战略规划部署迈向产业实践落地的关键路径展开了深入且全面的研讨。
超级周期来临,中国AI步入规模应用关键节点
国家信息中心信息化和产业发展部主任单志广在主论坛发言中指出,Token不再仅仅是大模型处理文本时的技术单位,它已然成为贯通电力、算力、模型服务以及应用价值的新型经济单元。这一转变促使AI基础设施评价标准发生重大改变,从过去单纯追求算力峰值,转变为更加注重单位能效、成本效益以及场景服务能力。
单志广针对发展Token经济提出的主要建议
单志广强调,凭借在算力和能源基础设施方面的坚实基础、丰富多样的产业场景以及活跃开放的生态等综合优势,随着“人工智能 +”行动的持续深化,中国有望率先实现AI从技术突破到规模化落地的重大跨越,进而构建起全链条的产业竞争优势。例如,在一些制造业发达地区,丰富的产业场景为AI技术的应用提供了广阔空间,众多企业积极引入AI技术进行生产流程优化,形成了良好的产业生态。
IDC中国区总裁霍锦洁从全球产业趋势的角度进一步分析指出,全球人工智能产业正步入自互联网浪潮以来最为强劲的IT增长超级周期。本轮增长并非单一技术的扩张,而是由AI算力建设和应用落地同步驱动。一端是数据中心、GPU等基础设施不断扩张,以满足大规模推理的需求;另一端是企业AI应用从试验阶段逐步走向生产阶段,智能体开始跨系统调用数据、规则、API和工作流,推动企业软件从“人的操作界面”向“智能体可调用的业务能力集合”转变。以金融行业为例,一些银行利用智能体实现跨系统的数据调用和分析,为客户提供更加个性化的金融服务。
IDC预计,到2029年,中国生成式AI市场规模将接近千亿美元,2024 - 2029年复合增长率达68%,中国将成为全球最活跃的AI应用市场之一。这一预测数据反映出中国AI市场巨大的发展潜力和广阔前景,众多企业纷纷加大在AI领域的投入,抢占市场先机。
然而,当AI从试验走向生产,真正的挑战并非在于技术本身,而在于组织层面。浪潮信息董事长彭震在主题演讲中表示,AI产业革命不仅改变了工具,更重新定义了“劳动者”的概念。随着Agent成为企业生产力的重要组成部分,AI原生转型的重点正从个人提效转向组织进化。智能体进入生产系统后,企业面临的将不再是某个流程的效率提升问题,而是如何对这种新的数字化劳动者进行管理、调度和治理。比如在一些电商企业,智能体负责处理大量的客户咨询和订单处理工作,企业需要建立相应的管理体系来确保智能体的高效运行。
围绕这一变化,彭震提出了Humagent(Human + Agent)组织概念,即企业要从管理Human进化到管理Humagent。他认为,企业需要将智能体正式纳入组织管理体系,推动管理对象从传统的人、财、物,扩展到人、数字员工、数据和智能能力。通过重新定义岗位、角色、权限、责任边界和绩效评价,最大限度地释放AI的智力贡献,同时保障运营的稳健、高效与低成本。例如,企业可以设立专门的智能体管理岗位,负责智能体的日常维护和优化。
彭震强调,Humagent概念的提出旨在帮助企业跳出“AI只是工具”的认知局限,真正将Agent纳入组织运营体系。在这一框架下,企业的终极目标不仅是追求Agent的智力成果,更是构建具备自主进化能力的AI原生组织。他展望,随着人类智慧与机器智能的深度交融,将共同定义一种更具韧性、更具创造力的商业文明新形态。未来,我们或许会看到企业之间的竞争更多地体现在AI原生组织的构建和运营能力上。
算力服务加速向Token服务转型
从推理需求的爆发,到Token服务能力的形成以及企业级应用的加速落地,人工智能领域的竞争正在从单一模型能力竞争转向生态能力竞争。一个完善的AI生态需要包括模型提供商、算力服务商、应用开发者等多个环节的协同合作。
“智算中心与Token服务”主题分论坛同期举行。来自九章云极、积算科技、并行科技、昆仑万维、太初元碁、提尔科技等企业的技术负责人齐聚一堂,围绕Token服务的商业化实践、多元算力落地、智能体(Agent)规模化应用等议题展开了深入探讨。这些企业在Token服务领域都有着各自的技术优势和实践经验,他们的交流将为行业的发展提供新的思路和方向。
随着AI Agent的爆发式增长,全球Token调用量持续攀升,算力服务正加速向Token服务转型。这一转型趋势将促使企业更加注重Token的成本和效率,推动相关技术的不断创新和发展。
九章云极AI首席科学家缪旭表示,智能体任务正变得越来越复杂和漫长,导致上下文窗口和Token成本急剧增长。企业落地长时运行Agent必须考量效率与ROI(投资回报率)。他提出“自进化的Token工厂”概念,通过强化学习和模型蒸馏技术,在保证质量的前提下动态选择最优模型路径,可将Token成本降低70%以上。这一技术的应用将为企业节省大量的成本,提高AI应用的经济效益。
积算科技首席架构工程师郑彬玙分享了构建企业级Token工厂的实践。他表示,企业在构建Token工厂时面临模型适配、性能指标、运维管理等多重挑战。积算科技通过自有算力资源池和统一的API接口,帮助企业解决模型选型与部署难题,实现Token服务的统一管理与成本管控。例如,一些中小企业可能缺乏专业的技术团队来进行模型选型和部署,积算科技的服务可以为他们提供便利。
并行科技MaaS业务技术总监梁奇元指出,当前Token市场存在API质量不稳定、定价不透明、渠道混杂等问题。并行科技通过MaaS平台实现算力直连、计费透明、智能路由,帮助企业解决模型选择困难与供给碎片化难题。目前,该平台已接入近百款主流模型,为企业提供了丰富的选择。企业在选择模型时可以根据自身需求和预算进行灵活选择。
太初元碁技术总监及首席架构师夏忠谋表示,国产算力在超大规模集群稳定性上仍有挑战,但在推理场景已具备替代能力。太初元碁基于申威异构众核架构,通过片上CPU + GPU通信提升计算效率,目前已能满足80% - 90%的推理场景需求。他强调,国产算力落地需算力厂商、ISV(独立软件开发商)与客户三方联合,以业务效果为导向。例如,在一些特定的行业应用中,三方可以共同合作,根据业务需求进行算力的优化和配置。
提尔科技技术经理刘迎森表示,能耗占Token生产成本的40%,液冷技术可将智算中心PUE(电源使用效率)降至1.08,大幅降低Token能耗成本。提尔科技通过全浸没式液冷方案,实现单机柜120千瓦高密度部署,并可通过余热回收为办公区供暖或为工业提供热水,实现“算力 + 热力”双收益。这一方案不仅降低了成本,还实现了能源的循环利用,符合可持续发展的理念。
(徽声在线记者 郭松峤)


