华为系技术大咖押注LPU革命 两家上市公司战略投资布局未来
2026-04-20 20:05:52未知 作者:徽声在线
徽声在线4月20日讯(记者 林晓)随着推理计算需求持续攀升,围绕推理效率优化的算力架构创新正成为行业焦点,一批聚焦算力架构革新的初创企业开始崭露头角。
近日,专注于LPU架构的元川微科技宣布完成数亿元天使轮融资,投资方阵容涵盖元禾原点、峰瑞资本、中芯聚源、深创投等知名机构,以及浙江省科创母基金、杭州润苗基金等政府引导基金,上市公司星宸科技、智微智能亦参与其中。公司透露,本轮资金将主要用于第一代LPU+架构AI推理芯片的研发与规模化生产。
LPU架构的崛起与Groq的突破性进展密不可分。这家以推理算力为核心的公司,凭借其低延迟、高吞吐量和能效优势,正在重塑市场对非通用算力路径的认知。据行业分析,Groq的LPU芯片在特定场景下可实现比传统GPU高10倍的能效比。
2025年下半年,英伟达以200亿美元收购Groq核心技术资产,引发行业震动。今年3月的GTC大会上,黄仁勋展示的最新成果显示,Groq的LPU架构已被深度整合至英伟达Vera Rubin超级计算平台,为AI代理(Agent)提供实时推理能力。这项交易标志着推理算力正式从训练的附属环节跃升为核心基础设施。
在行业巨头的示范效应下,推理场景的算力架构重构正从技术探索迈向产业化落地。
华为系技术专家领衔LPU革命
元川微科技成立于2025年9月,创始人杨滨系华为前无线基带芯片部门负责人。这位拥有20年芯片研发经验的专家,曾于2008年赴美组建华为处理器研发团队,2012年回国后主导了多款旗舰芯片的研发工作。
在近期播客访谈中,杨滨透露其早在2023年就开始关注LPU架构,但真正决定创业是在2025年初DeepSeek-R1技术报告发布后。"那份报告证明大模型已突破泡沫阶段,其强大的模型能力配合成本的大幅下降,让商业化落地成为可能。"他回忆道,"读完论文的当晚,我就决定要在这个方向上全力以赴。"
LPU架构的独特之处在于其专为推理场景优化设计。通过重构数据流路径、改进存储架构和调度算法,该架构可使数据在芯片内部传输距离缩短60%,同时将动态调度开销降低75%,从而在保持高性能的同时实现能耗优化。技术白皮书显示,元川微的首代产品理论能效比可达45 TOPS/W,较现有产品提升3倍以上。
在产品规划方面,元川微采取分层布局策略:面向数据中心的高端芯片将支持每秒千万亿次推理运算,适用于复杂AI模型部署;而面向边缘计算的解决方案则强调低功耗和实时响应,可满足智能终端、工业物联网等场景需求。公司CTO透露,正在研发的边缘芯片可将推理延迟控制在5毫秒以内。
这种产品策略源于团队对市场趋势的判断。杨滨指出:"当前推理需求仍集中在云端,但随着AI代理和具身智能的普及,未来三年边端设备的推理负载占比将从目前的15%提升至40%以上。"这种预判与Gartner的预测不谋而合——该机构预计2028年边缘AI市场规模将突破800亿美元。
据公司研发进展显示,元川微已完成14nm工艺的系统级仿真和FPGA原型验证,关键指标达到设计预期。下一步将开展7nm先进制程的流片准备,同时构建配套的软件生态体系。杨滨透露,已与多家云服务提供商和智能终端厂商达成合作意向。
值得注意的是,元川微在研发阶段就获得产业资本青睐。其天使轮融资结构中,产业方出资占比超过40%。星宸科技董事长表示:"我们看中的不仅是技术潜力,更是团队对场景需求的深刻理解。元川微的产品路线与我们在安防AI领域的布局形成完美互补。"
对于产业投资逻辑,杨滨解释道:"我们的股东既是有战略价值的客户,也是技术验证的合作伙伴。比如智微智能在工业控制领域的积累,能帮助我们快速优化边缘计算产品的可靠性设计。"他强调,产业方最关注的是每瓦特性能和每token成本这两个核心指标,"只有证明能带来显著的经济效益,他们才会持续投入。"
算力革命催生产业新生态
在杨滨看来,LPU架构的兴起本质上是算力需求结构变革的结果。他形象地比喻:"过去的算力消费者主要是人类,现在则变成了人类与AI代理的混合模式。这种变化带来的不仅是数量级的增长,更是质量级的跃迁。"
据技术分析,当AI代理开始大规模协同工作时,系统级推理需求将呈现指数级增长。单个智能体的交互频率可能达到每秒数百token,而多智能体系统的交互密度更会提升两个数量级。现有基础设施在单位能耗性能和单位成本性能上,与实际需求存在百倍差距。这解释了为何黄仁勋断言:"推理算力正在经历从配角到主角的转变。"
这种变革正在重塑产业格局。以Groq为例,这家成立仅9年的公司,因被英伟达收购而估值暴涨400倍,成为AI领域最耀眼的独角兽。其成功证明,专注推理场景的技术路线完全可能颠覆传统竞争格局。
不过,国内LPU生态仍处于萌芽阶段。行业调查显示,目前仅有元川微、迈特芯等少数企业将LPU作为核心路线,超过90%的AI芯片公司仍选择GPU兼容架构。这种保守策略与产业阶段密切相关:重新设计芯片架构需要深厚的系统级能力,而推理应用的具体形态仍在快速演变中。
"工艺制程和IP核的制约确实是现实挑战,"杨滨坦言,"但在产业共识形成前,愿意理解这条技术路线的人本就不多。"不过他也指出,推理场景对现有软件生态的依赖度较低,这为国内企业提供了难得的突破窗口。"我们不需要颠覆整个CUDA生态,只需在特定领域建立优势即可。"
这种判断正在得到市场验证。随着AI代理的普及,推理算力需求正带动整个产业链升级。服务器互联芯片、高频PCB材料、散热解决方案等细分领域迎来爆发式增长。据统计,相关上市公司股价在过去半年平均涨幅超过120%,资金对推理算力赛道的关注度持续升温。
行业分析师指出,推理革命正在创造多层次机会:在芯片层,LPU与GPU、NPU将形成互补生态;在系统层,异构计算架构需要新的软件工具链;在应用层,实时推理能力将催生大量新场景。这种结构性变化,可能为国内芯片产业提供弯道超车的历史机遇。

