疯狂扩产的“Token工厂”:营收激增下的资本狂欢与盈利困局,API价格战与端侧分流双重挑战
2026-06-18 19:28:02未知 作者:徽声在线
每经记者:赵雯琪 徽声在线编辑:余婷婷
随着大模型竞赛的焦点从“参数规模”转向“应用落地”,一个隐秘但极具增长潜力的底层产业逐渐浮出水面——“Token工厂”。这一模式将人工智能能力拆解为最基础的计量单位“Token词元”,以类似自来水厂的方式按需供应,成为AI应用落地的关键支撑。
6月16日,国内AI推理服务企业“硅基流动”宣布完成超20亿元B轮融资,创下2026年以来国内第三方MaaS(模型即服务)赛道最大单笔融资纪录。据《徽声在线》了解,这家成立不足三年的企业,过去一年日均Token吞吐量达数万亿量级,营收同比激增超十倍,更在11个月内连续获得三轮融资,成为一级市场备受瞩目的标的。
无独有偶,5月同赛道企业无问芯穹、魔形智能也相继宣布融资。其中,无问芯穹再获超7亿元融资,累计融资额超22亿元。截至4月底,其Agentic MaaS大模型服务平台的日均Token调用量较去年底增长超20倍,显示出赛道强劲的增长势头。
然而,资本狂热加码的背后,头部互联网大厂全面布局自研推理算力与MaaS服务、全行业API定价陷入激烈竞争、端侧轻量化模型持续分流云端需求,多重压力下,“Token工厂”普遍面临业务规模扩张与盈利空间收窄的矛盾。如何突破“增收不增利”的困局,成为赛道核心议题。
产业资本扎堆入局,“Token工厂”成AI落地核心赛道
一笔20亿元级融资,将“Token工厂”赛道再次推至聚光灯下。
据硅基流动官方披露,本轮融资由携程战投、晶科能源控股、金蝶股份、联通新沃、盛奕资本(润泽集团产业资本)、壁仞战投、蔚来资本、商汤战投、巨人网络等二十余家机构联合投资。至此,硅基流动已获得能源、芯片、算力基础设施、云服务、大模型及场景应用等AI全产业链企业投资,产业资本占比显著提升,显示出赛道对产业链协同的强烈需求。
图片来源:硅基流动公众号
这并非赛道首笔大额融资。今年5月,无问芯穹完成超7亿元融资;海外市场中,Fireworks AI成立四年目标估值达150亿美元,日处理Token规模15万亿。短短一年,“Token工厂”已从AI产业链边缘环节跃升为一级市场核心赛道,资本热度可见一斑。
资本热捧的底层逻辑,源于AI需求结构的根本性切换。
大模型能力每提升一个台阶,便解锁一类新应用,而应用又反过来推动底层Token消耗量激增。据国家数据局数据,2024年初中国日均Token调用量为1000亿;至2025年底跃升至100万亿;今年3月已突破140万亿,两年增长超千倍。这一趋势表明,Token已成为AI时代的关键“基础设施”。
全球知名咨询机构IDC最新发布的《中国AI软件市场半年度追踪,2025H2》数据显示:2024年中国企业级MaaS市场调用量仅114万亿Token,2025年跃升至1944万亿Token,同比增长约16倍;2025年公有云MaaS市场规模达30.7亿元,增速远超AI行业整体水平。Agent智能体普及、多模态应用落地、行业数字化转型三大趋势,仍在持续推高Token消耗规模,为“Token工厂”提供广阔市场空间。
图片来源:IDC官方公众号
IDC预测,2026年中国MaaS市场的Token消耗量将达到40000万亿,较2025年再增约20倍。这一预测进一步印证了“Token工厂”赛道的长期增长潜力。
从商业模式本质看,“Token工厂”并非简单的算力转售,而是将芯片适配、模型部署、推理引擎调优、异构算力调度等复杂工程能力,封装为标准化API接口。客户按需调用、按量付费,省去了自建集群、组建运维团队的重投入,大幅降低了AI落地的技术门槛与成本周期,成为AI技术普及的关键推动力。
面对海量市场需求爆发,大规模、高性价比Token的稳定供应,正成为影响AI技术规模化落地的核心能力。谁能提供更稳定、更经济的Token服务,谁就能在竞争中占据优势。
天使投资人、资深人工智能专家郭涛接受《徽声在线》记者采访时表示,从“卖模型”到“卖Token”是AI产业商业化的重要演进。Token作为大模型处理信息的最小单元,具备可计量、可定价、可交易的特性,将AI智能能力转化为可标准化交易的大宗商品,解决了AI能力难以量化的行业痛点,推动行业从定制化服务模式转向标准化、规模化变现模式。长期来看,这门生意具备较好的可持续性。
中金公司研报显示,“Token工厂”模式已成为全球大模型厂商的主流商业化路径,海外头部企业Anthropic年度经常性收入突破300亿美元。盈利层面,当前海外头部大模型API业务毛利率普遍在40%至50%,国内大模型厂商MaaS API业务毛利略低于海外,预计今年将达到20%至40%,随着规模效应释放与技术优化,长期仍有上行空间,为赛道企业提供盈利信心。
大厂下场、API价格战白热化、端侧AI快速普及⋯⋯“Token工厂”盈利承压
然而,头部企业营收十倍增长的亮眼数据背后,赛道隐忧始终存在。随着互联网大厂下场布局、API价格战白热化,“Token工厂”的商业模式边界与增长天花板正被重新审视,盈利压力日益凸显。
大厂亲自下场是最直接的行业变量。
图片来源:每经记者 张涵 摄
6月8日,阿里巴巴宣布组织架构调整,将通义大模型事业部与未来生活实验室整合,成立全新Token Foundry事业部,由集团CEO吴泳铭直接负责。此前3月,阿里成立ATH(Alibaba Token Hub)事业群,已喊出“创造Token、输送Token、应用Token”的核心目标,显示出大厂对Token业务的战略重视。
将Token生产提升至集团战略级,背后是大厂对推理服务入口价值的重估:Token产能既是支撑自身电商、云服务、本地生活等业务AI化的基础,也是阿里云对外输出MaaS服务的核心产能,对大厂生态布局至关重要。
郭涛认为,大厂全面入场后,独立第三方“Token工厂”仍有生存空间。他向记者表示,大厂虽有技术、资源和生态优势,但市场需求多样且复杂,难以覆盖所有领域和场景。独立第三方可聚焦特定垂直领域提供个性化、定制化服务,或深耕特定技术优化,针对某类模型或场景提升Token生成效率与质量。此外,部分企业出于数据安全、避免过度依赖单一厂商的考量,也会选择与独立第三方合作,为独立“Token工厂”提供市场机会。
API价格战持续白热化,则是当前“Token工厂们”面临的最直接盈利压力。
自2023年以来,头部大模型厂商已累计十余次下调API价格,部分主流模型千Token价格从最初的数毛钱降至几分钱,累计降幅超90%。缺乏核心优化能力、仅靠算力差价盈利的中间商型玩家已率先陷入亏损,行业洗牌加速。
今年5月,DeepSeek官方宣布V4-Pro模型API永久降价,整体降幅75%,百万Token输出价格为6元。随后,小米、腾讯云纷纷跟进,小米旗下MiMo-V2.5系列API永久降价,最高降幅达99%,Pro版定价与DeepSeek V4-Pro完全对齐。腾讯云自6月3日0时起,对DeepSeek-V4系列模型调用价格进行大幅下调,最高降幅达到97.5%,调整后价格全面持平DeepSeek官方售价,价格战愈演愈烈。
图片来源:IDC官方公众号
业内普遍认为,若“Token工厂”效率提升的速度跟不上价格下降速度,商业模式的可持续性将直接面临挑战,企业需加快技术优化与成本控制步伐。
此外,端侧AI的快速普及,则从需求端分流市场。随着手机、PC等终端设备的端侧大模型能力升级,大量轻量级推理任务向端侧迁移,无需调用云端Token。行业普遍预测,未来30%至50%的推理需求将在端侧完成,尽管高复杂度、多模态、长上下文的核心推理需求仍依赖云端,但端侧分流无疑收窄了云端“Token工厂”的整体增长天花板,迫使企业调整市场策略。
与此同时,头部客户自建推理集群的趋势也在蚕食第三方市场份额。金融、能源、政务等数据敏感型行业出于合规考量,更倾向私有化部署;头部互联网企业随着业务规模扩大,自建算力集群的单位成本已低于第三方采购,纷纷转向自建。第三方“Token工厂”的核心客群,可能逐步向中小企业、长尾应用与弹性需求场景集中,市场定位面临重构,需寻找新的增长点。
对于“Token工厂”赛道的泡沫争议,郭涛向记者表示,目前市场确实存在一定泡沫迹象。大量资本涌入下,部分企业为追求规模盲目扩张,忽视实际成本与盈利情况。但整体而言,AI发展是大势所趋,Token经济作为其商业化关键模式有着真实需求支撑,只是市场需要经历调整与整合,优胜劣汰后赛道将更健康。
谈及破局路径与行业终局,郭涛认为,“Token工厂”可通过提升算力利用效率、优化能耗降低运营成本,通过分级服务实现差异化定价获取溢价,还可配套模型优化建议、技术支持等增值服务拓展收入来源,增强盈利能力。
“长期来看,市场更可能形成多层次、差异化的竞争格局:头部大厂凭借实力占据通用型大规模市场,中小‘Token工厂’凭借特色服务深耕细分领域,形成错位竞争,共同构成多元的市场生态。”郭涛表示,这一格局将为赛道带来更稳定的发展环境。

