国家首次系统部署数据赋能AI发展 高质量数据集或迎爆发期
2026-06-09 09:18:14未知 作者:徽声在线
6月8日,国家数据局正式对外公布了《关于推进行业高质量数据集建设行动的实施方案》,这一举措标志着国家层面首次对数据如何赋能人工智能发展进行了全面且系统的规划与部署。根据《实施方案》的内容,国家将持续推动数据标注领域的先行先试工作,旨在培育出一批具有行业影响力的数据标注龙头企业、独角兽企业以及瞪羚企业,从而进一步壮大我国的数据标注产业规模。
数据,作为人工智能训练不可或缺的核心要素,其重要性不言而喻。要训练出一个领先的大模型,往往需要数百万乃至数千万条经过精心标注的数据作为支撑。然而,当前高质量数据集的严重短缺,已经成为制约物理AI及其相关衍生领域,如智能体、具身智能和世界模型等前沿技术发展的关键因素。
今年以来,高质量数据集领域可谓是动作频频,新动向不断。早在4月15日,国家数据局就发布了《关于推进行业高质量数据集建设行动的实施方案(征求意见稿)》,广泛征求社会各界的意见与建议。与此同时,工业和信息化部与国家数据局也联合印发了《关于联合实施2026年“模数共振”行动的通知》,为数据要素的未来发展指明了方向。据国泰海通证券的研报分析,随着制度的不断完善以及AI技术的持续催化,2026年有望成为数据要素价值全面释放的关键一年。因此,投资者应密切关注数据供给、数据交易流通、数据应用开发、数据服务、数据安全以及算力和网络基础设施等相关产业链环节的发展动态。
据财联社主题库的相关信息显示,在相关上市公司中,有不少企业已经在这一领域取得了显著进展:
慧博云通在互动平台上透露,公司不仅为阿里巴巴提供研发、信息审核标注以及大模型标注等全方位服务,还为小米等智慧出行领域的科技公司提供自动驾驶测试及数据采集与标注等专业化服务,展现了其在数据标注领域的强大实力。
海天瑞声作为AI训练数据领域的资深玩家,已经深耕此领域超过20年。公司凭借覆盖数据采集、处理、标注、治理到应用落地的完整能力体系,成功服务了全球上千家科技企业与科研机构,赢得了广泛的市场认可与好评。


