国家战略布局物理AI数据基建 高质量数据集开启智能新时代

2026-06-08 20:05:35未知 作者:徽声在线

《徽声在线》6月8日消息(记者 林晓晨)今日,国家数据局正式印发《关于推进行业高质量数据集建设行动的实施方案》,标志着我国首次在国家战略层面针对数据赋能人工智能发展实施系统性布局。该方案明确提出构建支撑人工智能创新发展的数据基础设施,为物理AI时代提供关键生产要素。


根据《实施方案》定义,行业高质量数据集需经过标准化采集、清洗、标注等全流程处理,形成可直接用于模型训练的标准化数据资源。这类数据集包含通用知识图谱和垂直领域专业知识库两大类别,其中医疗影像、工业质检、自动驾驶等场景对数据精度要求尤为严苛。

方案设定明确发展路线图:至2028年末将完成三大核心目标:建成30个以上国家级行业数据资源库,形成50个数据驱动的AI示范应用场景,培育100家掌握数据治理核心技术的创新企业。同步建立数据质量评估、安全防护等12项行业标准体系。

具体实施层面推出六大专项行动:包括构建多模态数据工厂、建设智能体训练专用数据集、突破具身智能数据采集技术等。特别针对机器人操作、数字孪生等场景,要求建立包含力反馈、空间感知等维度的特种数据集。方案鼓励长三角、珠三角等地区建设数据标注产业园区,形成年处理千亿级tokens的标注能力。


数据要素价值在AI领域持续凸显。当前训练前沿大模型需处理海量结构化数据:GPT-4训练集包含13万亿tokens(约合6.5万亿汉字),而最新发布的Qwen3-Max更将规模提升至25万亿tokens。国际科技巨头正通过数据垄断构建技术护城河,我国亟需建立自主可控的数据供给体系。

数据短缺已成为制约物理AI发展的核心矛盾。据工信部调研,我国智能体研发所需的高精度操作数据获取成本是文本数据的200倍以上,具身智能领域90%企业面临数据饥荒问题。

在2026年世界智能产业博览会上,国家数据局局长刘烈宏强调:"具身智能的突破依赖于三维空间感知数据的规模化供给"。以机器人抓取场景为例,现有数据集缺乏力度反馈、物体形变等关键参数,导致模型训练效果大打折扣。行业专家指出,具身数据采集需要专用传感器阵列,单套设备成本超百万元,制约了数据积累速度。

这一判断与斯坦福大学教授李飞飞的研究结论高度一致。其团队开发的WorldLabs项目显示,构建物理世界模型所需的数据量是语言模型的1000倍以上。李飞飞在最新访谈中指出:"当前AI发展的最大瓶颈不是芯片算力,而是缺乏符合物理规律的多维数据",这一论断在自动驾驶、工业仿真等领域得到广泛验证。

物理世界数据采集面临特殊挑战。相比文本数据的确定性,传感器获取的原始数据存在30%以上的噪声干扰。李飞飞团队研究发现,4D动态数据(含时间维度)的标注准确率较静态数据下降40%,这直接导致模型训练效率降低60%。如何建立高效的数据清洗算法成为行业关键课题。

2024年成为高质量数据集建设爆发元年

政策层面持续加码:4月15日发布的征求意见稿经过60天社会公示,吸纳了327条行业建议。与工信部联合推出的"模数共振"行动明确,到2026年要实现数据供给与模型需求的动态匹配,在10个重点行业建立数据-模型闭环优化机制。

基础设施建设取得突破:国家数据集管理服务平台上线三个月即接入516家机构,发布的数据集涵盖智能制造、智慧城市等28个领域。平台采用的区块链存证技术,确保了数据溯源和版权保护,已处理数据交易额超12亿元。

市场数据显示,我国数据要素市场呈现爆发式增长:截至一季度末,高质量数据集存量突破11.6万个,较去年同期增长320%。日均词元调用量达140万亿次,支撑起万亿级AI产业生态。专家预测,随着《实施方案》落地,2025年我国将建成全球最大的物理AI数据资源库。

点击展开全文
你关注的
从“几年一遇”到“一年几遇”,AI时代网络攻防失衡加剧 奇安信齐向东:主战场转向制造业与服务业从“几年一遇”到“一年几遇”,AI时代网络攻防失衡加剧 奇安信齐向东:主战场转向制造业与服务业 微信电脑端重大更新:可滚动截长图与支持发语音功能上线微信电脑端重大更新:可滚动截长图与支持发语音功能上线 上海布局太空算力新赛道,全球首颗光计算卫星研制正式启动上海布局太空算力新赛道,全球首颗光计算卫星研制正式启动
相关文章
国家战略布局物理AI数据基建 高质量数据集开启智能新时代国家战略布局物理AI数据基建 高质量数据集开启智能新时代 为何汽车企业纷纷投身自研智驾芯片浪潮?为何汽车企业纷纷投身自研智驾芯片浪潮? 国产减肥药埃诺格鲁肽挑战司美格鲁肽,中期数据亮眼国产减肥药埃诺格鲁肽挑战司美格鲁肽,中期数据亮眼 AI大模型首秀恒生科技港股,AI时代全面开启?AI大模型首秀恒生科技港股,AI时代全面开启? 爷叔亲身体验AI外骨骼机器人,徽声在线直击2026老博会科技新风尚爷叔亲身体验AI外骨骼机器人,徽声在线直击2026老博会科技新风尚 小鹏机器人核心高管施晓鑫离职,官方确认:个人规划调整,量产计划稳步推进小鹏机器人核心高管施晓鑫离职,官方确认:个人规划调整,量产计划稳步推进