英伟达Vera CPU震撼交付:专为智能体AI打造 甲骨文计划大规模部署
2026-05-19 11:07:37未知 作者:徽声在线
徽声在线5月19日讯(记者 李思源) 美国当地时间5月18日,全球AI芯片领军企业英伟达正式对外宣布,其首款专为Agentic AI(智能体AI)量身打造的CPU——Vera,已顺利完成向Anthropic、OpenAI、SpaceX AI以及甲骨文云等科技巨头的首批交付工作。
这款于今年3月GTC大会上惊艳亮相的芯片,如今已正式从英伟达的研发实验室迈向了实际生产应用的前线。首批交付过程不仅彰显了英伟达对客户的重视,更充满了硅谷特有的创新仪式感。
上周五,英伟达副总裁伊恩•巴克亲自驾驶车辆进行“送货上门”服务。他的第一站是Anthropic位于旧金山SoMa区的办公室,计算负责人詹姆斯•布拉德伯里热情接待并接收了服务器。随后,巴克一行来到OpenAI总部,他甚至亲自掏出螺丝刀,现场打开机箱盖,向OpenAI团队展示了Vera的内部结构。当天行程的最后一站是帕洛阿尔托的SpaceX AI办公室,埃隆•马斯克亲自签收,并详细询问了Vera的核心数量、内存布局以及散热方案等关键技术参数。据悉,SpaceX AI正计划将Vera应用于强化学习工作负载与智能体仿真管线,以进一步提升其AI技术的实力。
本周一,甲骨文产品管理负责人卡兰•巴塔在接收现场透露了一个重大消息:“甲骨文云基础设施(OCI)计划从2026年开始,大规模部署数十万颗英伟达Vera CPU。Agentic AI需要在大规模应用中保持持续稳定的性能,而Vera的架构专为高吞吐推理设计,这正是我们为下一代企业AI提供强大动力所需的效率保障。”
值得注意的是,Agent AI的实现并非仅依赖GPU。在代理沙箱、工具调用、编排层以及长上下文检索等关键环节,都需要CPU的强力支持。因此,Vera的推出,无疑为Agent AI的发展提供了更为坚实的硬件基础。
Vera的研发旨在精准满足Agent AI对CPU的严苛需求。英伟达CEO黄仁勋在本届GTC大会上更是将其定位为公司未来“下一个数十亿美元级业务”的核心产品。这一战略定位,无疑彰显了英伟达对Vera的信心与期待。
与传统CPU设计追求“核心数量”最大化不同,Vera在设计上更加注重高吞吐推理、工具调用及代码生成等实际应用场景的需求。它搭载了88个英伟达自研的奥林巴斯(Olympus)核心,满载情况下单核性能较前代Grace提升高达50%,内存带宽更是达到了惊人的1.2 TB/s。同时,Vera还支持FP8精度,可直接承接AI推理与强化学习任务,无需通过GPU进行数据中转,从而大幅提升了AI流水线的整体效率。
黄仁勋曾指出,当企业拥有价值500亿美元的GPU时,绝不能让它们因为CPU处理速度慢而闲置。Vera的推出,正是为了解决这一问题。它能够在AI智能体需要同时处理规划任务、检索长上下文或调用API时,以极致的单线程性能和能效,确保昂贵的GPU能够满负荷运转,从而充分发挥其计算潜力。
此外,Vera不仅是一款独立的CPU产品,它还将作为即将发布的Vera Rubin超级芯片平台的主机处理器,通过NVLink-C2C技术与两颗Rubin GPU进行配对,形成统一内存架构。这种“CPU+GPU”异构协同的全栈AI算力方案,有望推动英伟达从单一GPU厂商向全栈AI计算平台提供商实现华丽转型。
英伟达方面表示,Vera的高速核心与互连设计,使其能够以传统基础设施两倍的能效,完成向GPU馈送数据所需的调度、控制与数据搬移工作。这一优势,无疑将进一步提升英伟达在AI芯片市场的竞争力。

