破解“最后一公里”:无锡启动“千企百万小时”工业具身智能数据采集计划

荔枝新闻 2026-05-16 10:15

5月15日,无锡数据集团正式发布“千企百万小时”工业具身智能高质量数据采集行动计划,旨在深入工业生产一线,为具身智能基座模型提供丰富、真实且具备高价值的“训练燃料”,着力破解具身智能走向工厂车间的“最后一公里”障碍。

2026年5月,江苏省工业和信息化厅正式公布《工业和信息化领域行业高质量数据集建设先行先试联合体及项目名单》,无锡数据集团联合其子公司华智(无锡)人工智能科技有限公司成功入选。无锡数据集团相关负责人介绍,具身智能在迈向工厂车间过程中,面临环境复杂、专业门槛极高等现实挑战,导致高质量多模态数据极度稀缺,严重制约了模型的泛化能力。此次发布的行动计划紧扣无锡“465”现代产业集群布局,通过吸纳本土多元产业合作伙伴,计划深入上百个典型操作工位,联动万余名一线作业人员,力争在2026年率先实现累计超万小时的有效数据突破。

在数据采集的技术路径上,该计划严格遵循“真实场景、真实设备、真人操作”的“三真”原则,创新采用“无本体”数采模式。在贝斯特涡轮增压器装配产线和新日电动车组装车间等实地场景中,轻量化、非侵入式的采集设备将资深技工积累数十年的“独门手法”实时解算为高频运动轨迹,在不影响企业正常生产节拍的前提下,实现单日百GB级高质量数据的精准捕捉。

值得关注的是,无锡数据集团在深耕行业过程中首创提出了“具身数据光谱”概念,并已成功入选江苏省工业和信息化厅的先行先试项目名单。这一理念构建起一套从硬件感知到数据沉淀的完整链路:通过“设备光谱”实现从低成本便携端到高精度真机的全域覆盖,打破了传统数据采集对昂贵硬件的依赖;依托“数采光谱”验证并开启了社会化大规模采集的可行路径;最终通过对“数据光谱”的深度解析,将碎片化的工业经验精准转化为“类人逻辑”语料,为具身智能的进化提供核心支撑。

为保障数据规模与质量,无锡数据集团联合产业链上下游企业组建了“具身智能高质量数据创新联合体”,华智公司作为市级牵头单位,联合各方力量共同推进数据采集工作。在数据治理环节,原始数据进入华智AI数据治理平台后,会经历隐私脱敏、视角评估及专业核查等严格流程,确保输出的每一份语料具备极高的“工业纯度”,同时满足安全合规要求。

从数据采集到产业应用的全链条打通,还需要关键的平台支撑。无锡数据集团、锡山经济技术开发区与穹彻智能达成深度战略合作,共同落地“穹彻智能工业交付能力中心项目”。三方通过强强联手,打通了从一线数据采集、模型训练到场景交付的全产业链条,共同构建起能够深度理解工业语义的“具身大脑”,确保原始数据能够有效转化为产业新动能。

在推动产业集聚的同时,一套完整的数据要素市场化价值回馈机制也同步建立。据无锡数据集团介绍,参与数据采集的企业不仅能够在短期内通过数据资产化获得经济分润,并优先享有行业大模型的使用权;长期合作伙伴还将获得本体设备采购抵扣及算力资源等深度政策支持。目前,首批大规模采集计划已面向全市工业企业开放申报,计划于2026年上半年正式启动,推动企业产线经验从“隐形资产”向“可计量、可流通、可增值”的数字生产力跃迁。未来,无锡将依托高质量工业具身数据集的建设,吸引更多产业链尖端企业集聚,致力于打造全国具身智能产业创新高地,为制造业高端化、智能化、绿色化转型注入持续动能。

江苏广电无锡中心站记者 | 王哲平

编辑 | 周芃