国家数据局全面解读:完善数据工程如何驱动具身智能发展路径与方法
摘要
近期,国家数据局在2026世界智能产业博览会上释放了一系列关键信号。局长刘烈宏明确指
近期,国家数据局在2026世界智能产业博览会上释放了一系列关键信号。局长刘烈宏明确指出,高质量数据集是具身智能“感知-决策-执行”循环的基石,围绕这一核心,国家数据局将启动一系列系统性工程。简而言之,数据工程正成为推动人工智能落地应用的核心驱动力。
今年以来,针对高质量数据集的政策密集落地,产业生态也在加速成型。业内专家判断:高质量数据集建设已从“倡导阶段”正式跨入“按标准建设、按机制试点、按体系推进”的新纪元。这意味着,相关产业发展将迎来实质性提速。
以产业需求拉动数据供给
刘烈宏透露,2026年已被确定为“数据要素价值释放年”。国家数据局将发布《关于推进行业高质量数据集建设行动的实施方案》,部署强基扩容、标注攻坚、提质增效、应用赋能、管理服务、价值释放六大专项行动,全面对接人工智能赋能产业发展的真实需求。核心逻辑十分清晰:以产业应用拉动数据供给,以数据驱动产业智能升级,推动各行业“数据飞轮”高效运转。
具体而言,高质量数据集对先进制造业的智能化转型,既是基础资源,更是创新引擎。只有将真实产线数据、设备运行日志、质量检测记录等系统性采集、治理与利用,才能支撑行业大模型与智能体理解工业机理、适配工业场景、优化工业流程。加大行业高质量数据集投入,促进“模数共振”,推动数据、模型、装备、场景深度融合——这才是破局关键。
再看具身智能。其在真实环境中的自主适应与任务执行能力,高度依赖视觉、触觉、音频等多模态高质量训练数据。因此,必须用完善的数据工程驱动具身智能发展,并深入开展系统性实践。
高质量数据集同样是加速AI for Science的关键支撑。科学研究对数据的准确性、规范性、可信性要求极高,高质量数据集不仅是支撑科学领域模型训练、规律发现与成果验证的基础底座,更是推动基础研究走向产业应用、实现AI for Science真正落地的核心环节。
从政策层面看,今年密集发力。4月15日,国家数据局发布了相关实施方案的征求意见稿;工业和信息化部与国家数据局近期联合印发《关于联合实施2026年“模数共振”行动的通知》,目标到2026年底基本形成“数据-模型-场景应用”良性互促循环,推动人工智能高水平赋能新型工业化。
行业平台层面也取得实质性进展。4月29日,国家数据集管理服务平台正式发布并启动试运行,提供覆盖数据集全生命周期的公共服务能力。截至5月31日,已认证机构516家,发布数据集1350个,覆盖农业、工业制造、交通、文旅等重点领域。
数据规模也在快速膨胀。截至今年一季度,全国已建成高质量数据集超过11.6万个,总体量超过960PB;截至今年3月,我国日均词元(Token)调用量已超过140万亿。这些数字背后,是产业需求的真实爆发。
各地加速部署高质量数据集建设
今年以来,多个省份积极响应,陆续出台高质量数据集建设专项方案。
山东省大数据局印发的《山东省行业高质量数据集建设专项行动方案》明确提出:到2026年年底,在工业制造、交通运输等16个重点行业分别建成2个左右专业化数据集;到2027年年底,累计建成50个高质量数据集。方案还细化了加强公共数据供给、加快企业数据开发、强化数据供需对接、发展数据标注产业等具体要求。
广东省同样迅速行动起来。广东省政务服务和数据管理局联合省国资委正式启动广东省国企高质量数据质效提升行动,旨在贯彻国家关于国有企业数据效能提升的部署。
长江证券计算机行业首席分析师宗建树认为,当前我国大模型产业持续高速发展,数据集作为训练和优化大模型的基础资源,其质量与多样性直接影响大模型性能与效果。高质量数据集作为人工智能产业化落地的关键生产资料,有望成为连接行业场景、模型训练、智能体应用与数据价值释放的核心枢纽。从“倡导建设”转向“按标准建设、按机制试点、按体系推进”,产业发展将显著提速。
计世资讯的研究报告则指出更具体的产业机会:高质量数据集的规模化建设,将带动高质量行业数据集构建与服务、行业知识图谱与智能体知识库、合成数据生成与数据隐私保护平台三个百亿级软件细分赛道快速增长,为我国软件产业注入新增长动力。

来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。