刚刚!华为重磅发布Agentic AI新品,千卡集群吞吐量惊人达500万Tokens

2026-06-05 16:16:50未知 作者:徽声在线

《徽声在线》6月5日消息(记者 黄心怡)今日,在华为云INSPIRE创想者大会的现场,华为云震撼发布了一系列Agentic AI新品,包括Agentic Infra通智一体化基础设施、新一代模型训推平台以及企业级智能体平台等。同时,大会还宣布“行业AI梦工厂”正式上线,涵盖智慧医疗、具身智能、智能制造、科学计算四大核心专区。

▍AICS灵衢智算集群:千卡级集群每秒处理能力高达500万Tokens

在此次大会上,华为云一口气推出了四大Agentic Infra新品,其中AICS灵衢智算集群尤为引人注目。

AICS灵衢智算集群依托于超大带宽的灵衢网络,支持高达10万卡级的集群规模,总算力更是突破了200EFLOPS大关。该集群不仅将Tokens生成的时延大幅降低至10毫秒以内,更实现了千卡每秒吞吐量高达500万Tokens的惊人成绩,同时在线服务可用性也高达99.95%,堪称极致效率的Token生产工厂。

据悉,这一成果是基于灵衢网络与昇腾950芯片的智算集群服务实现的。而千卡每秒吞吐500万Tokens的指标,则是在DeepSeek大模型的服务吞吐量测试中得出的。

此前,DeepSeek方面曾透露,由于高端算力的限制,其V4-Pro版本的服务吞吐量仍受到一定影响。不过,随着下半年昇腾950超节点的批量上市,预计Pro版本的价格将迎来大幅下调。

华为公司董事、华为云CEO周跃峰在接受《徽声在线》等媒体采访时表示,华为云始终坚定走自主自强的发展道路,以独立自主的算力芯片为基础,不断推进国产化进程。


华为公司董事、华为云CEO周跃峰

他进一步指出,算力成本是当前面临的一大挑战。“随着大模型参数规模的不断扩大,从万亿到明年的2T、3T,甚至可能达到10T(10万亿),打造这些模型所需的算力资源也将成倍增长。因此,不可能每个机构和公司都自行打造万卡集群,而是需要通过公有云来承载通用大模型,并借助机密推理和训练来实现资源的高效安全共享。”

在技术创新方面,华为云同样不遗余力。AMS Agentic记忆存储解决方案通过NPU直通CMS硬件,打造了PB级的超大记忆空间,并支持KV Cache分层池化,有效降低了推理成本,同时支持天级长程任务,打破了Agent的记忆瓶颈。CCE Volcano Next通智一体化调度引擎则通过“训推共池+碎片整合”的方式,实现了通智混合算力负载调度的革新,将资源利用率提升了30%以上。而AgentSphere则用于构建Agent运行环境,凭借羽量级沙箱技术实现了100毫秒级的极速启动与每分钟十万级的批创能力。

此外,华为云还发布了新一代ModelArtsNext模型训推平台,该平台构建了RL强化学习服务、机密推理、模型路由、模型矩阵四大核心能力。其中,MaaS模型路由支持成本优先、效果优先、均衡模式三种策略,能够根据请求特征动态智能择优调度最佳模型。截至目前,该平台已提供15余款SOTA模型服务,模型调度精准率超过95%,调用成本平均降低了20%。

在智能体平台方面,华为云正式公测了智果(AgentArts)企业级智能体平台,该平台采用了Harness工程体系。同时,智果开源版openJiuwen也已经上线。此外,华为云还发布了全新Agentic华为云入口“智果园”,该入口提供了Agentic云服务、智能体、大模型等能力,并将这些能力全面Skill化、CLI化,完成了从意图理解、功能开发、资源发放到应用部署的智能体化全流程,为用户提供了便捷的Tokens服务。

在生态合作方面,华为云联合了智谱、DeepSeek、Minimax、Kimi、阶跃星辰、百度、美团LongCat、讯飞星火、爱诗科技、生数科技等20余家TOP模型厂商,共同发布了“百模千态,云聚共赢”生态合作计划。

周跃峰表示,希望通过“百模千态”行动计划,进一步提升华为云服务的token效率。未来几年的重点方向是面向智能体,打造硅基黑土地以及相关的软件和硬件基础设施。

▍全球首个全流程具身智能开发平台CloudRobo惊艳亮相

在行业AI梦工厂的四大专区中,智慧医疗专区无疑是一大亮点。华为云医疗AI使能平台将于6月30日迎来升级并公测,而华为云智慧病理方案也已在全国范围内实现了规模复制,覆盖了顶级三甲、地市级、县域医院等多个层级。大会现场,包括上海交通大学医学院附属瑞金医院、邯郸市中心医院、河北工程大学附属医院、瑞安市人民医院、黔西南州兴义市人民医院、武安市第一人民医院等20余家医院正式入驻了智慧医疗专区。

具身智能专区则提供了一站式的具身智能数据合成、模型开发、仿真验证平台,帮助具身智能企业加速场景落地。同时,华为云还发布了全球首个全流程具身智能开发平台CloudRobo,该平台提供了PB级数据底座及开发管线、业界首个云原生具身模型生产引擎以及首个全国产Real-Sim数据生产及模型评测体系,能够帮助机器人实现小时级上云、模型分钟级部署。该平台也将于6月30日正式公测。

记者在现场了解到,新松机器人、乐聚机器人、深朴智能、亿嘉和、凌云光旗下元客视界、上海交大、拓斯达、优艾智合、枢途科技、前海宝安具身智能产业创新中心、国地共建人形机器人创新中心、东北亚具身智能创新中心、广东省具身智能训练场、千寻智能、无锡数据集团、清华大学、自变量、华沿机器人、五八智能、智身科技等众多企业和机构已经成为了该专区的首批入驻成员。

除了智慧医疗和具身智能专区外,本次大会还发布了智能制造专区和科学计算专区。智能制造专区提供了一站式的工业智能体创新创业环境,助力工业智能体创新落地;而科学计算专区则面向AI4S行业客户提供了统一丰富的模型、智能体使用体验,为科研创新提供了有力支持。

周跃峰透露,与其他云计算厂商不同,华为云将重点深耕行业应用领域,下半年还将推出更多专区以满足不同行业的需求。

“AI技术为国计民生相关行业带来了生产力的显著提升,这是华为云的根本目标。我们不太关注token总量或收入总量等表面指标,而是更加关注国产化算力系统所产出的token背后所带来的价值提升能否真正匹配各行业的需求实现善政、惠民、兴业的目标。”周跃峰如是说。

他认为不能单纯以使用量来评判token的价值,更应该看重token背后对生产力带来的实际贡献。“以金融行业为例我们更加关注的是防范了多少金融风险、提升了多少信贷业务效率等实际效果。”

在谈及AI是否存在泡沫时周跃峰表示AI的发展方向无疑是正确的但投资需要有回报而回报的核心正是生产力的提升。医疗、金融等行业的数字化进程相对较快因此也应率先推动这些行业的发展以实现更大的社会价值。

点击展开全文
你关注的
从“几年一遇”到“一年几遇”,AI时代网络攻防失衡加剧 奇安信齐向东:主战场转向制造业与服务业从“几年一遇”到“一年几遇”,AI时代网络攻防失衡加剧 奇安信齐向东:主战场转向制造业与服务业 微信电脑端重大更新:可滚动截长图与支持发语音功能上线微信电脑端重大更新:可滚动截长图与支持发语音功能上线 上海布局太空算力新赛道,全球首颗光计算卫星研制正式启动上海布局太空算力新赛道,全球首颗光计算卫星研制正式启动
相关文章
刚刚!华为重磅发布Agentic AI新品,千卡集群吞吐量惊人达500万Tokens刚刚!华为重磅发布Agentic AI新品,千卡集群吞吐量惊人达500万Tokens 对谈实录 | 腾讯姚顺雨:AI是长期征程,下半场正拉开帷幕对谈实录 | 腾讯姚顺雨:AI是长期征程,下半场正拉开帷幕 黄仁勋访韩引关注,行程丰富涉及多领域,股市却现波动黄仁勋访韩引关注,行程丰富涉及多领域,股市却现波动 丰田暂停雷克萨斯LF-ZC量产,强调未放弃纯电车!2025财年混动车型销量首破500万,纯电动车增长显著丰田暂停雷克萨斯LF-ZC量产,强调未放弃纯电车!2025财年混动车型销量首破500万,纯电动车增长显著 黄仁勋确认三大芯片商获HBM4供应资格,AI存储市场迎来新格局黄仁勋确认三大芯片商获HBM4供应资格,AI存储市场迎来新格局 腾讯高管回应AI发展质疑:马拉松式竞赛,速度与成败皆未定腾讯高管回应AI发展质疑:马拉松式竞赛,速度与成败皆未定