疯狂扩产的“Token工厂”:营收飙升背后的资本狂欢与盈利挑战
2026-06-18 19:25:09未知 作者:徽声在线
每经记者:赵雯琪 徽声在线编辑:余婷婷
当大模型竞争从“参数比拼”转向“应用落地”,一个隐藏在幕后却高速增长的底层产业——“Token工厂”(将人工智能能力分解为最基础的计量单位“Token词元”,如同自来水厂般按需供应)正逐渐浮出水面,成为行业关注的焦点。
6月16日,国内AI推理服务领域的佼佼者“硅基流动”宣布完成超过20亿元的B轮融资,这一数字创下了自2026年以来国内第三方MaaS(模型即服务)赛道单笔融资的新高。《徽声在线》记者了解到,这家成立不到三年的企业,在过去一年中日均Token吞吐量达到了数万亿级别,营收同比激增超过十倍,更在短短11个月内连续获得三轮融资,成为一级市场上的热门投资标的。
无独有偶,5月份,同赛道的企业无问芯穹和魔形智能也纷纷宣布获得融资。其中,无问芯穹再次获得超过7亿元的融资,累计融资额已超过22亿元。截至4月底,无问芯穹Agentic MaaS大模型服务平台的日均Token调用量相较于去年底已增长超过20倍,显示出强劲的增长势头。
然而,在资本狂热加码的背后,头部互联网大厂全面布局自研推理算力与MaaS服务、全行业API定价陷入激烈竞争、端侧轻量化模型持续分流云端Token调用需求等多重因素叠加,使得“Token工厂”普遍面临着业务规模高速扩张但盈利空间不断收窄的困境。如何突破这一困局,实现盈利增长,成为赛道内的核心议题。
产业资本扎堆入局,“Token工厂”成AI落地关键赛道
一笔20亿元级的融资,再次将“Token工厂”赛道推向了聚光灯下。
据硅基流动官方披露,本轮融资由携程战投、晶科能源控股、金蝶股份、联通新沃、盛奕资本(润泽集团产业资本)、壁仞战投、蔚来资本、商汤战投、巨人网络等二十余家机构联合投资。至此,硅基流动已获得了能源、芯片、算力基础设施、云服务、大模型及场景应用等AI全产业链企业的投资,产业资本在本轮融资中的占比显著提升,显示出产业界对“Token工厂”赛道的广泛认可和高度期待。
图片来源:硅基流动公众号
这并非赛道内的首笔大额融资。今年5月,同赛道玩家无问芯穹刚完成超过7亿元的融资;而在海外市场中,Fireworks AI成立仅四年目标估值便已达到150亿美元,日处理Token规模高达15万亿。短短一年时间,“Token工厂”已从AI产业链的边缘环节,跃升为一级市场的核心赛道,吸引了众多资本的关注和布局。
资本热捧的背后,是AI需求结构的根本性切换。
大模型能力的每一次提升,都解锁了一大类新的应用场景,而这些应用又反过来提升了底层的Token消耗量。据国家数据局相关数据,2024年初中国日均Token调用量为1000亿;而至2025年底,这一数字已跃升至100万亿;今年3月更是突破了140万亿,两年内增长超过千倍。这一惊人的增长速度,充分展示了AI应用的广泛普及和底层需求的爆发式增长。
全球知名咨询机构IDC最新发布的《中国AI软件市场半年度追踪,2025H2》数据显示:2024年中国企业级MaaS市场调用量仅为114万亿Token,而到了2025年,这一数字已跃升至1944万亿Token,同比增长约16倍;同时,2025年公有云MaaS市场规模达到30.7亿元,增速远超AI行业整体水平。Agent智能体的普及、多模态应用的落地以及行业数字化转型的三大趋势,仍在持续推高Token的消耗规模,为“Token工厂”提供了广阔的发展空间。
图片来源:IDC官方公众号
IDC预测,到2026年,中国MaaS市场的Token消耗量将达到40000万亿,较2025年再增约20倍。这一预测数据进一步印证了“Token工厂”赛道的巨大潜力和广阔前景。
从商业模式本质来看,“Token工厂”并非简单的算力转售,而是将芯片适配、模型部署、推理引擎调优、异构算力调度等复杂工程能力,封装为标准化的API接口。客户可以按需调用、按量付费,省去了自建集群、组建运维团队的重投入,大幅降低了AI落地的技术门槛与成本周期。这种商业模式不仅提高了AI技术的普及率和应用效率,也为“Token工厂”自身带来了稳定的收入来源。
面对海量的市场需求爆发,大规模、高性价比Token的稳定供应,正成为影响AI技术规模化落地的关键能力。谁能提供更稳定、更高性价比的Token供应,谁就能在激烈的市场竞争中脱颖而出。
天使投资人、资深人工智能专家郭涛在接受《徽声在线》记者采访时表示,从“卖模型”到“卖Token”是AI产业商业化的重要演进。Token作为大模型处理信息的最小单元,具备可计量、可定价、可交易的特性,将AI智能能力转化为可标准化交易的大宗商品,解决了AI能力难以量化的行业痛点。这一变革推动了行业从定制化服务模式转向标准化、规模化变现模式,长期来看,这门生意具备较好的可持续性。
中金公司研报显示,“Token工厂”模式已成为全球大模型厂商的主流商业化路径。海外头部企业Anthropic的年度经常性收入已突破300亿美元,显示出强大的盈利能力。在盈利层面,当前海外头部大模型API业务的毛利率普遍在40%至50%之间,而国内大模型厂商的MaaS API业务毛利略低于海外,但预计今年将达到20%至40%,随着规模效应的释放和技术的不断优化,长期仍有上行空间。
大厂下场、API价格战白热化、端侧AI快速普及⋯⋯“Token工厂”盈利承压
然而,在头部企业营收十倍增长的亮眼数据背后,赛道隐忧始终存在。随着互联网大厂的纷纷下场布局和API价格战的白热化,“Token工厂”的商业模式边界与增长天花板正被重新审视。
大厂亲自下场是最直接的行业变量。
图片来源:每经记者 张涵 摄
6月8日,阿里巴巴宣布进行组织架构调整,将通义大模型事业部与未来生活实验室整合,成立全新的Token Foundry事业部,由集团CEO吴泳铭直接负责。此前3月,阿里已成立ATH(Alibaba Token Hub)事业群,并喊出了“创造Token、输送Token、应用Token”的核心目标。这一系列举措显示出阿里对推理服务入口价值的重估和战略布局。
将Token生产提升至集团战略级,背后是大厂对推理服务入口价值的深刻认识:Token产能既是支撑自身电商、云服务、本地生活等业务AI化的基础,也是阿里云对外输出MaaS服务的核心产能。因此,大厂纷纷加大在“Token工厂”领域的投入和布局,以期在未来的市场竞争中占据有利地位。
郭涛认为,尽管大厂全面入场,但独立第三方“Token工厂”仍有生存空间。他向记者表示,大厂虽有技术、资源和生态优势,但市场需求多样且复杂,难以覆盖所有领域和场景。独立第三方可以聚焦特定垂直领域提供个性化、定制化服务,或深耕特定技术优化,针对某类模型或场景提升Token生成效率与质量。此外,部分企业出于数据安全、避免过度依赖单一厂商的考量,也会选择与独立第三方合作。因此,独立第三方“Token工厂”在市场中仍具有独特的竞争力和发展潜力。
API价格战持续白热化,则是当前“Token工厂们”面临的最直接盈利压力。
自2023年以来,头部大模型厂商已累计十余次下调API价格,部分主流模型千Token价格从最初的数毛钱降至几分钱,累计降幅超过90%。这一价格战使得缺乏核心优化能力、仅靠算力差价盈利的中间商型玩家率先陷入亏损境地。他们面临着成本上升、利润下降的双重压力,生存空间受到严重挤压。
今年5月,DeepSeek官方宣布V4-Pro模型API永久降价,整体降幅达75%,百万Token输出价格为6元。随后,小米、腾讯云纷纷跟进降价策略。小米旗下MiMo-V2.5系列API永久降价,最高降幅达99%,Pro版定价与DeepSeek V4-Pro完全对齐。腾讯云自6月3日0时起,对DeepSeek-V4系列模型调用价格进行大幅下调,最高降幅达到97.5%,调整后价格全面持平DeepSeek官方售价。这一系列降价举措进一步加剧了API价格战的白热化程度。
图片来源:IDC官方公众号
业内普遍认为,若“Token工厂”效率提升的速度跟不上价格下降的速度,其商业模式的可持续性将直接面临挑战。因此,“Token工厂”需要不断提升自身的技术实力和运营效率,以降低成本、提高盈利能力。同时,他们也需要积极寻找新的市场机会和增长点,以应对日益激烈的市场竞争。
此外,端侧AI的快速普及也从需求端分流了市场。随着手机、PC等终端设备的端侧大模型能力升级,大量轻量级推理任务向端侧迁移,无需调用云端Token。行业普遍预测,未来30%至50%的推理需求将在端侧完成。尽管高复杂度、多模态、长上下文的核心推理需求仍依赖云端处理,但端侧分流无疑收窄了云端“Token工厂”的整体增长天花板。因此,“Token工厂”需要积极调整战略方向,拓展新的应用领域和市场空间。
与此同时,头部客户自建推理集群的趋势也在蚕食第三方市场份额。金融、能源、政务等数据敏感型行业出于合规考量更倾向私有化部署;头部互联网企业随着业务规模扩大自建算力集群的单位成本已低于第三方采购成本纷纷转向自建。这使得第三方“Token工厂”的核心客群可能逐步向中小企业、长尾应用与弹性需求场景集中市场定位面临重构。因此,“Token工厂”需要更加精准地定位目标客户群体并提供个性化的解决方案和服务以满足不同客户的需求。
对于“Token工厂”赛道的泡沫争议,郭涛向记者表示目前市场确实存在一定泡沫迹象。大量资本涌入下部分企业为追求规模盲目扩张忽视实际成本与盈利情况。但整体而言AI发展是大势所趋Token经济作为其商业化关键模式有着真实需求支撑。只是市场需要经历调整与整合以去除泡沫、实现健康发展。
谈及破局路径与行业终局郭涛认为“Token工厂”可通过提升算力利用效率、优化能耗降低运营成本;通过分级服务实现差异化定价获取溢价;还可配套模型优化建议、技术支持等增值服务拓展收入来源。这些措施将有助于“Token工厂”在激烈的市场竞争中脱颖而出实现可持续发展。
“长期来看市场更可能形成多层次、差异化的竞争格局:头部大厂凭借实力占据通用型大规模市场;中小‘Token工厂’凭借特色服务深耕细分领域形成错位竞争共同构成多元的市场生态。”郭涛表示。这一预测为“Token工厂”赛道的未来发展指明了方向也为其提供了广阔的发展空间和机遇。

