国家数据局:2025年底高质量数据集超10万,Token调用量激增彰显AI发展势头
2026-03-24 16:03:59未知 作者:徽声在线
3月24日,国务院新闻办公室召开新闻发布会,就第九届数字中国建设峰会的相关筹备情况向公众进行介绍。
在发布会上,国家数据局局长刘烈宏透露,截至今年3月,我国人工智能领域日均Token(词元)的调用量已突破140万亿大关。这一数字相较于2024年初的1000亿,实现了惊人的1000多倍增长;而与2025年底预计的100万亿相比,仅在三个月内就又增长了40%有余。日均Token调用量的迅猛攀升,无疑是中国人工智能产业步入快速发展轨道的有力证明。
图片来源:每经记者周逸斐 现场拍摄
数据显示,至今年3月,我国日均Token调用量较2024年初的1000亿激增1000多倍
智能助手在日常生活中的广泛应用,以及产业端智能分析技术的不断进步,都离不开海量高质量数据的坚实支撑。那么,国家数据局在推动高质量数据集助力人工智能发展方面,究竟采取了哪些举措?未来又有何规划呢?
刘烈宏局长表示,国家数据局对数据要素赋能人工智能创新发展给予了高度重视。针对高质量数据集建设过程中存在的“规模小、分布散”等问题,国家数据局联合26个相关部门,共同遴选了72家高质量数据集建设的链主单位、140个先行先试工作单位,以及104个典型案例。通过构建链主引领、多方参与、联合攻关、共建共享、合作共赢的高质量数据集建设生态,持续推动高质量数据集的建设与发展。
为促进数据标注产业的蓬勃发展,国家数据局还精心布局了成都、沈阳、合肥、长沙、海口、保定、大同等7个城市,作为数据标注先行先试的建设基地。同时,出台了《关于促进数据标注产业高质量发展的实施意见》,遴选出47个数据标注优秀案例,并指导举办了7次数据标注供需对接会。展望未来,国家数据局将面向科技创新实力强、发展基础扎实、产业特色鲜明的地区,聚焦“知识密集型”和“技术驱动型”两大方向,梯次布局一批技术先进、特色鲜明、高效赋能的数据标注产业创新试验区。
刘烈宏进一步指出,国家数据局还致力于培育“为高质量数据付费”的市场共识,推动行业高质量数据集在数据交易所挂牌、上架、交易。同时,支持数据流通服务平台、数据商等机构提供流通交易服务,鼓励各类数据流通服务机构探索多样化的高质量数据集流通利用模式,以促进高质量数据集供需双方的有序对接,支持行业高质量数据集的流动与共享。
经过不懈努力,我国高质量数据集建设工作已取得阶段性显著成效。截至2025年年底,全国已建成的高质量数据集数量已超过10万个,总体量超过890PB(计算机存储容量单位),相当于中国国家图书馆数字资源总量的310倍左右。而日均Token调用量的迅猛增长,更是彰显了中国人工智能产业的强劲发展势头。
“日均Token调用量的大幅增加,充分表明中国的人工智能发展已进入快速增长阶段,应用场景不断深化拓展,从简单的对话交流到能够决策执行的智能体,中国人工智能产业的竞争力显著提升。如今热议的Token出海现象,正是产业竞争力增强的一个鲜明标志。从数据维度来看,这也意味着数据集的供给在大幅增加,数据要素的价值在不断释放,数据要素赋能人工智能创新发展已进入良性互动阶段。”刘烈宏如此介绍道。
刘烈宏强调,下一步,国家数据局将继续推进数据赋能人工智能创新发展,协同各方深入实施新一轮的高质量数据集建设行动计划。该计划包括强基扩容、标注攻坚、提质增效、应用赋能、管理服务、价值释放六大专项行动,旨在以场景需求为牵引,加快推进先行先试工作,打造技术可行、实用便捷、质量保障的AI-Ready(AI就绪度)高质量数据集,实现高质量数据集供给的量质双提升。
此外,还将推动出台数据要素赋能新型工业化的相关政策文件
《每日经济新闻》记者还关注到,近日,工业和信息化部已印发通知,正式启动工业数据筑基行动,开展面向人工智能赋能的高质量行业数据集建设先行先试工作。那么,后续将如何进一步推进呢?
工业和信息化部信息技术发展司司长王彦青表示,为做好先行先试工作,工业和信息化部将从三个方面着手。一是加强支撑保障,联合地方工信及数据主管部门,为先行先试联合体提供资源保障和指导支持,及时跟进解决遇到的问题,汇聚经验,加快形成可推广的成果。
二是强化政策引导,推动出台数据要素赋能新型工业化的政策文件,印发工业场景数据要素应用参考指引,加强发展引导和模式宣介。
三是培育良好生态,加快推动工业数据标准的研制工作,发展壮大数据咨询、数据治理、数据标注等数据服务企业。同时,支持举办一批技术研讨会、供需对接会等活动,做强做优人工智能开源社区,打造高质量开源数据资源聚集的高地。特别是在即将举办的峰会上,工业和信息化部也将主办数据要素赋能新型工业化的专题会议,邀请先行先试单位的代表分享经验,并启动2026年数据要素赋能新型工业化的大赛。
