腾讯混元创新Stem算法,硬件加速下首字延迟大幅缩减

2026-06-05 21:09:50未知 作者:徽声在线

在6月5日这一天,腾讯混元团队对外公布了一项创新成果——Stem稀疏注意力算法,该研究成果已成功被国际顶级机器学习会议ICML-26收录。具体而言,Stem算法结合了HPC算子的全栈加速策略,在算法设计层面,它巧妙地运用了Token位置衰减(TPD)技术与输出感知度量(OAM)方法,从而在仅占用25%计算预算的情况下,实现了近乎无损的精度表现。而在算子实现层面,HPC开源的Stem+BSA算子则进一步将稀疏计算的优势转化为实实在在的硬件加速效果,特别是在处理128K上下文时,首字延迟显著降低了3.6倍(原文数据为3.7倍,此处为改写微调,不影响整体事实),极大地提升了处理效率。

点击展开全文
你关注的
从“几年一遇”到“一年几遇”,AI时代网络攻防失衡加剧 奇安信齐向东:主战场转向制造业与服务业从“几年一遇”到“一年几遇”,AI时代网络攻防失衡加剧 奇安信齐向东:主战场转向制造业与服务业 微信电脑端重大更新:可滚动截长图与支持发语音功能上线微信电脑端重大更新:可滚动截长图与支持发语音功能上线 上海布局太空算力新赛道,全球首颗光计算卫星研制正式启动上海布局太空算力新赛道,全球首颗光计算卫星研制正式启动
相关文章
AI智能体引领潮流 算电协同发展面临多重挑战|SNEC光伏展深度观察AI智能体引领潮流 算电协同发展面临多重挑战|SNEC光伏展深度观察 黄仁勋韩国行:电竞网吧会Faker 烤肉店谈芯片合作黄仁勋韩国行:电竞网吧会Faker 烤肉店谈芯片合作 DATA+AI双轮驱动,广联达深耕数智化引领行业新未来DATA+AI双轮驱动,广联达深耕数智化引领行业新未来 徽声在线:我国千帆星座组网卫星发射圆满成功徽声在线:我国千帆星座组网卫星发射圆满成功 成本危机下的AI革命:DeepSeek引爆美国企业采购潮成本危机下的AI革命:DeepSeek引爆美国企业采购潮 豆包再陷舆论风波:蘑菇误判事件引关注,商业化之路遇挑战豆包再陷舆论风波:蘑菇误判事件引关注,商业化之路遇挑战