小米MiMo-V2.5推理系统全链路优化揭秘,API价格大幅下调

2026-05-31 11:40:31未知 作者:徽声在线

在5月30日这一天,小米公司正式对外披露了其MiMo-V2.5系列模型推理系统的全链路优化技术细节。据小米官方透露,该团队基于Hybrid SWA+MoE+多模态的复合架构,对推理系统进行了全面而深入的革新。这一革新涵盖了从KVCache管理、分级缓存策略、前缀缓存优化,到调度策略与Prefill/Decode链路的整个推理栈。经过优化,KVCache的存储空间被压缩至同级别方案的约七分之一,特别是在处理长序列场景时,推理成本实现了显著降低,这无疑为本次MiMo-V2.5系列API价格的大幅下调奠定了坚实的技术基石。值得一提的是,就在5月27日,MiMo-V2.5系列API已经完成了永久性的价格调整,最高降幅高达99%,且这一优惠不区分输入长度,为广大用户带来了实实在在的福利。

点击展开全文
你关注的
微信电脑端重大更新:可滚动截长图与支持发语音功能上线微信电脑端重大更新:可滚动截长图与支持发语音功能上线 上海布局太空算力新赛道,全球首颗光计算卫星研制正式启动上海布局太空算力新赛道,全球首颗光计算卫星研制正式启动 全球最大比特币资管公司战略转向:或启动大规模抛售计划全球最大比特币资管公司战略转向:或启动大规模抛售计划
相关文章
营收230亿、现金储备近千亿,理想成功穿越产品换代艰难期营收230亿、现金储备近千亿,理想成功穿越产品换代艰难期 一个月烧掉5亿美元!科技巨头“AI Token消耗赛”踩下急刹一个月烧掉5亿美元!科技巨头“AI Token消耗赛”踩下急刹 丰田调整电动车战略:暂停雷克萨斯LF-ZC开发引关注丰田调整电动车战略:暂停雷克萨斯LF-ZC开发引关注 全国科技工作者日,宇树科技王兴兴荣获创新争先奖全国科技工作者日,宇树科技王兴兴荣获创新争先奖 AI突破次元壁:物理世界落地战打响|BEYOND Expo 2026全景解析AI突破次元壁:物理世界落地战打响|BEYOND Expo 2026全景解析 环球下周焦点:英伟达芯片布局深化 博通、慧与科技财报来袭环球下周焦点:英伟达芯片布局深化 博通、慧与科技财报来袭