互联网用户规模效应在AI领域失效?深度剖析成本与盈利新逻辑
2026-06-09 14:06:39未知 作者:徽声在线
近期,徽声在线发布了一篇题为《谁能持续支撑AI的巨额开支?》的文章,其中一组数据引发了广泛关注与深思。
根据安邦智库的最新统计,至2025年,国内四家互联网与科技领域的领军企业,在AI领域的资本投入累计已突破5500亿元大关,然而,令人遗憾的是,这些巨头中竟无一实现AI业务的全面盈利。以其中一家头部平台为例,其去年在AI推理方面的成本飙升至80亿元以上,这一数字竟是其AI业务营收增量的2.3倍——换言之,每获得1元的收入,就需先承担2.3元的刚性成本支出。
若将此账本置于过去十年的互联网发展逻辑中审视,本不应引发如此大的焦虑。
在移动互联网时代,“烧钱换规模、规模换利润”几乎成为了一条不可动摇的法则。初期的基础设施建设虽成本高昂,但后续的服务分发却近乎零成本:一套应用程序、一套推荐系统,无论服务一万个用户还是一个用户,其边际成本都微乎其微。先亏损后盈利,时间与规模最终会帮助企业摊平成本。
然而,在这个夏天,整个行业不得不面对一个残酷的现实:AI,或许并不遵循这一传统逻辑。
1. 互联网复制模式与AI计算模式的本质差异
传统互联网的核心在于“复制”(Copy),而大模型则依赖于“计算”(Compute)。
训练大模型需要巨额的固定资产投入,而推理过程则绝非免费的无限复制。用户每一次的深入对话、每一轮复杂的工具调用、每一次多步骤执行的Agent拆解,背后都伴随着算力、电力、带宽以及GPU折旧的实实在在消耗。
这意味着,随着用户规模的扩大,推理成本并不会自动消失,反而会与日活跃用户数(DAU)同步增长。
规模扩大,未必能先摊薄成本,反而可能加剧亏损。用更直白的商业语言来说就是:DAU上升,边际投入产出比(ROI)未必随之提升。
只有当收费模式能够完全覆盖每一次推理的单位成本时,规模扩张才是有益的;否则,规模只会成为一张数额更大的亏损账单。随着AI进入下半场,行业开始从流量至上的思维中觉醒。先实现盈利,才有资格继续投入巨资。
颇具讽刺意味的是,就在行业因这一共识而陷入集体焦虑之际,6月8日,阿里巴巴宣布将通义大模型事业部与未来生活实验室合并,成立了一个极具特色的新部门:Token Foundry,由集团CEO吴泳铭亲自领衔。
Foundry(铸造厂),这一名称源自半导体行业,如台积电那样为全球提供芯片代工服务的“重工业”模式。
将大模型业务命名为“Token的铸造厂”,并由一把手亲自挂帅,这一举动释放的信号再明确不过:当Token(每一次推理的计量单位)成为AI时代的核心成本与收入来源时,即便是最顶级的玩家,也开始采用“制造硬科技”的工业思维,去探索如何更高效、更低成本地生产Token。
这门生意的底层逻辑,已经彻底转变为一道关于单位经济学(Unit Economics)的残酷算术题。AI的竞争焦点,正从“模型参数规模有多大”转向“每一个Token的价值与成本如何平衡”。
2. 云端与端侧:降低成本的双轨策略
要解开这道算术题,行业主要采取两种策略:要么将单位推理成本降至最低,要么找到用户真正愿意付费的场景,确保收入稳定。
在降低成本方面,行业正分化出两条截然不同的路径。
一条是阿里的“重工业路线”,通过Token Foundry在云端扩大规模,依靠强大的供应链体系和技术优化来降低云端成本;另一条则是将目光从遥远的云端算力集群转向用户身边的物理设备,即端侧AI。
这正是以明略科技为代表的厂商在过去一年中深耕的领域。
云端推理的痛点在于其“结构性高昂”,按用量计费,账单随用户粘性线性增长。而如果将AI模型直接部署在用户自己的Mac、PC或手机等本地设备上,情况则大不相同:硬件资产已由用户一次性购买,后续的每一次对话、每一次Agent调用,其边际推理成本几乎可以忽略不计,且数据无需离开本地。
阿里在云端努力降低Token的生产成本,明略则在端侧提升Token的输出效率。这不仅是技术路线的差异,更是对同一问题的不同解决方案:谁能率先将单次推理的刚性成本“隐形化”,谁就能获得下一阶段的竞争资格。
3. 微观付费:从“娱乐工具”到“生产力助手”的转变
然而,成本只是问题的一面,更难的挑战在于另一面:你的收费模式能否覆盖单位成本?
这个问题无法仅凭精彩的商业故事来回答,必须看是否有用户真正愿意掏钱购买。而答案,往往隐藏在那些最微观、最真实的场景中。
在明略旗下的DOMO平台上,有一个被反复提及的真实案例。一位独立博主在缺乏专业运营指导时,开始频繁使用平台上的AI经纪人——帮助她锁定对标账号、分析数据差距、甚至直接提供内容优化建议。
在后续的用户回访中,这位博主留下了一句令人印象深刻的话:“即使不接商单,我也愿意为这个AI经纪人单独付费。”
这句话在当下这个“既要DAU又要ROI”的清算时代显得尤为珍贵。它表明,用户付费的驱动力已不再是贪图便宜、薅羊毛或一时的好奇,而是产品真正融入了生产力场景,实现了实打实的“价值交换”。
只有当AI从用于聊天的“娱乐工具”(Toy)转变为能够帮助用户节省成本或增加收入的“生产力助手”(Tool)时,用户才愿意为单次推理产生的Token买单。
回到那句“先赚钱才有资格继续烧钱”,在这场漫长的马拉松中,决定胜负的未必是谁的模型在评测榜单上名列前茅,也未必是谁通过免费策略吸引了更高的DAU,而是谁的单位经济学(Unit Economics)能够率先实现盈利。
一边在供给侧和端侧压缩成本,一边在真实场景中挖掘收入来源,确保每一个产出的Token都能带来收益——这才是AI时代持续发展的正确姿态。
能够养得起AI的,或许不是账上融资最多的企业,而是那些能够先算清底层账目的企业。


