字节跳动大幅增加国产芯片采购量

2026-06-18 09:04:05未知作者:徽声在线

2026年6月17日

本文篇幅：3033字，预计阅读时间约5分钟

撰稿人 |徽声在线吕倩陈杨园

字节跳动在数据中心建设领域又有新动作，据行业内部人士透露，字节跳动正与天数智芯就采购至少5万颗AI芯片展开深入洽谈，这些芯片将主要应用于推理任务。

记者通过多方渠道了解到，此次洽谈的供货芯片主要面向大模型的推理负载需求，对应的是天数智芯的智铠系列云端推理GPU，而训练场景则使用天垓系列。若此次交易顺利达成，天数智芯将成为继华为和寒武纪之后，字节跳动的第三家GPU供应商。

截至目前，字节跳动与天数智芯方面均未对此事发表正式回应。

以字节跳动为代表的互联网巨头纷纷加大自建数据中心的投入，这一举措并非仅仅为了短期应急补充算力缺口，而是深刻反映了产业的深层变革：AI算力需求正迎来结构性转变，企业算力自主可控战略持续升级，训推硬件分线布局与国产算力规模化替代同步进入实质性落地阶段。

大力投入独立数据中心建设

近年来，字节跳动在算力领域的投入动态不断更新。

字节跳动明确将训练和推理两套芯片供应链完全拆分：大规模模型训练采用华为昇腾、寒武纪的高端训练卡；而线上C端的豆包、企业MaaS的海量并发推理则引入天数智芯的智铠系列等专用推理GPU。

若此次洽谈成功落地，天数智芯将正式进入字节跳动的算力版图。其中，华为昇腾将聚焦于集群训练和超大规模模型预训练底座；寒武纪则兼顾部分中高端推理和垂直行业私有化部署；天数智芯的智铠系列则侧重于线上流量型海量推理的主力供给。

除了字节跳动，其他互联网大厂也在密集布局数据中心。例如，百度在全国范围内布局了万卡级的AI算力集群；阿里巴巴在2026财年单季度资本开支超过380亿元，预估未来三年将投入超过3800亿元加码云和智算硬件；腾讯则在全国多地建设腾讯云HCC高性能AI集群，并计划在2026年下半年大规模导入国产算力，同时对外提供混元大模型MaaS、游戏AIGC、视频生成推理等服务。

面壁智能AI Infra技术负责人李宇轩对徽声在线记者分析称，互联网大厂密集构建多供应商算力体系主要基于供给确定性、议价权和成本结构的考虑。在大厂的算力需求中，推理体量远大于训练，而推理对芯片的要求（如互联、显存带宽、生态成熟度）比训练低一个层次。国产芯片在推理侧已经达到可用水平，这使得更多供应商成为能够落地的工程选择，而不仅仅是纸面战略。

同时，信创国产化是面向政企、央国企业务无法回避的硬性合规要求。多条技术路线并行布局，能够让企业保留技术选择空间，不至于被单一厂商的硬件、生态迭代节奏所束缚。沂景资本董事总经理谢思远认为，部分互联网厂商的重要客户来自国企及关键行业，在算力体系建设过程中，通常会更加重视国产化能力与信创适配要求。从生态匹配角度来看，目前互联网大厂与国产芯片厂商之间仍然存在不少关键障碍需要解决，双方还处于持续磨合和博弈的过程中。

清微智能高级副总裁卢强对记者表示，互联网厂商推进算力供应链多元化，核心原因并非单一的国产替代，而是需求、供给和供应链安全等多维度因素的叠加。大模型推理需求增长迅速，而海外高端芯片供给受出口管制影响存在不确定性，企业必须建立多供应商体系。同时，国产芯片在推理场景的性价比、交付可控性和本地化服务能力提升后，已经从PoC验证阶段进入规模化部署窗口。

竞争焦点在于“谁的Token成本更低”

从市场经济逻辑的角度来看，国内大规模数据中心的投建本质上是下游AI算力真实需求持续释放带来的市场驱动结果。

曦望Sunrise联席CEO王湛对记者表示，2026年国内大模型进入应用爆发期，DeepSeek V4等模型带来的Token市场爆发，Agent快速普及。行业竞争的关键变成了“谁的Token成本更低”。国产推理芯片在特定场景下的性价比和每瓦性能已经表现出色。

具体场景包括大厂的高并发推理集群，如搜索推荐、智能客服、短视频多模态生成等场景，以及智能体应用，每天产生数万亿次Token消耗，是目前国产推理芯片采购的最大需求方；另一大场景是大模型头部企业与MoE架构的常态化训练与微调，随着MoE架构的普及，行业对算力的调度与局部推理能力要求急剧增加。

据灼识咨询全球AI推理芯片行业报告，AI芯片行业正从以训练为核心向以推理为核心的范式发生根本性转变，AI推理芯片的需求正急剧增长。预计到2030年，全球AI推理芯片行业规模将达到30696亿元人民币，其中中国AI推理芯片行业规模将达到11664亿元人民币。

优刻得新兴事业部副总经理刘华判断，接下来办公场景、业务AI化等需求仍会不断增长，推动算力需求持续旺盛，且AI行业在未来3-5年内仍将处于高速发展期。

多重因素刺激下的推理需求激增，造成了暂时的供需失衡。王湛提到，市场出现“一卡难求”的现象，行业头部企业疯狂“抢”GPU卡、买内存、租数据中心、扩建推理算力等，导致整个供应链承压。今年一季度，算力租赁成本上涨近30%至40%，预计全年AI推理的算力需求将达到训练的4-5倍。

卢强判断，短缺现象确实存在，尤其集中在高端AI加速卡、HBM、先进封装、整机服务器等环节。目前行业交付周期拉长、热门型号排产紧张、整机报价随供需和内存价格波动上行。

谢思远预估，下半年随着行业竞争加剧，同质化现象将越来越明显，聚焦Token领域的价格战将出现，整体价格反而可能呈下降趋势。

国产算力生态正在追赶中

据香港理工大学研究能耗推算，在超大规模云端设置中，由于“十亿级别”的用户高频请求，推理能耗已占AI总能耗的约60%—90%。另外，中国工程院指出，2026年一季度中国推理需求已达到训练需求的8倍。

交银国际研报分析认为，这一结构性变化意味着，对于数据中心运营商而言，支撑大规模推理任务的高密度、低延迟算力需求将成为增长主力。随着国产GPU扩产在即，叠加超大型云厂商订单滚动释放，预计2026年下半年项目落地节奏将较上半年进一步加快。

预计今年二季度新模型开发与存量模型迭代仍将支撑需求韧性。同时，企业端和客户端推理逻辑需求不断提升，正成为行业中长期驱动力。可作为即时供应补充的数据中心运营商有望凭借资源和客户粘性提升市场份额。

刘华认为，尽管存在短期压力，但中长期看，英伟达供应压力会促进国产算力的成长。“目前国产卡由于产能和适配问题供货一时上不来，但会逐渐放量，这是一个此消彼长的过程”，他表示。

受地缘出口管制约束，国内产业虽短期内仍需采购英伟达高端算力作为补充，但具备替代能力的国产算力生态已进入规模化建设落地阶段。

包括字节跳动在内的国内互联网厂商，短期靠采购解决需求，中期靠国产多供应商降低风险和成本，长期靠自研将利润留在自己手里。类似谷歌TPU的逻辑，自研芯片的核心目的不是卖给他人，而是尽可能摆脱被动境地。

大厂内部业务多元、场景丰富，因此训练、精调、高并发推理、图像处理对算力的要求各不相同。多供应商体系允许他们用A芯片做大规模训练，用B芯片做长文本推理，用C芯片做轻量级边缘计算，有利于实现总拥有成本（TCO）的最优化。

谢思远对记者表示，互联网大厂构建多供应商算力体系的核心考量是性价比。大厂们本质上希望以尽可能低的成本获得更多可用算力资源。对于互联网大厂而言，无论采用哪家供应商的产品，最终都要回到成本、性能和稳定性的综合比较上。在供给受限的背景下，降低对单一厂商的依赖风险是必要的，但这更多是一种风险管理需求。真正决定采购规模和采购比例的，仍是实际部署后的经济性表现。

相较而言，传统智算中心承担了产业培育和基础设施建设的功能角色，相比实际使用率，带动国产芯片企业营收增长和产业发展更加重要。互联网云厂商建设算力网络本质上属于市场化行为。

在此趋势下，行业正处于从“可用验证”走向“规模使用”的阶段性节点。过去客户更多关注单卡指标，现在则更看重千卡、万卡集群的稳定性与单位成本。大订单会明显改善厂商收入、现金流和供应链议价能力，但行业格局不会只靠一两个订单决定，最终仍由产品迭代、生态、交付和客户复购决定。从算力市场角度来看，互联网厂商大规模布局数据中心仍将是一个关键节点。

微信编辑| 雨林

：bianjibu@yicai.com

：business@yicai.com

点击展开全文