维度网讯,韩国政府近期宣布将建设国家制造数据库(National Manufacturing Data Library),并对熟练工人的隐性知识进行数据化,但物理AI(Physical AI)企业指出,需要同步考虑工业现场原始数据的收集方式、整理标准以及使用权限等关键问题。

制造AI政策的成败最终取决于能否建立“数据循环结构”。物理AI数据如果只是简单存放在存储库中,很难应用于工业现场。需要构建一套体系:收集工人的动作和工艺数据,经过清洗和验证后用于仿真和模型训练,再将机器人实证结果反馈为数据。因此,未来的关键是如何将政府主导的制造AX(Manufacturing AX)数据库与物理AI行业所需的数据利用体系相连接。只有打造从数据收集到模型开发、机器人现场应用、再到实证反馈的生态系统,才能使制造数据库成为物理AI行业的公共基础设施,而非单纯的存储库。
在6月29日于青瓦台迎宾馆举行的“韩国大腾飞三大超级项目国民报告会”上,政府表示将把制造AI和物理AI培育为国家战略产业。核心措施包括建设国家制造数据库、对熟练工人隐性知识进行数据化,以及开发物理AI基础模型(Physical AI Foundation Model)。其中,将熟练工人隐性知识转换为数据的项目已在2026年追加预算中预先安排480亿韩元。
物理AI企业普遍认为,数据是当前最主要的瓶颈。尽管图形处理器(GPU)和计算基础设施很重要,但要让机器人在工业现场实际运行,必须首先获得包含工人动作和工艺条件的高质量原始数据。与大型语言模型(LLM)不同,物理AI需要处理现实世界中的力、摩擦、接触、失败和安全性等问题。机器人要在工厂中抓取零件、拧螺丝、搬运物品,就需要针对不同现场和行业的动作数据。
AIRobot代表廉云卨(Yeom Woon-seol)表示:“对于初创企业来说,GPU固然重要,但最大的瓶颈是数据。没有数据就无法为机器人创建动作模型,没有动作模型机器人就无法按客户要求行动。”他补充说,这最终会导致机器人难以销售。
问题在于制造现场工作因行业而异。钢铁、汽车零部件、食品、物流、组装等各行业所需动作看似相似,实则不同。例如,仅面包制作工艺就包括分割面团、在烘焙纸上挤成型、操作机器等不同动作。一家机器人企业或AI数据企业很难直接获取所有行业的动作数据。数据收集方式也不尽相同,有的基于视觉,有的采用主从结构或远程操作方式,容易产生针对特定机器人手或特定平台优化的数据。
廉云卨代表解释:“用特定机器人手获取的数据是针对该机器人优化的,其他公司要使用就需要重新标注和加工,相当于做两遍工作。”他认为,在工人身上安装摄像头、以第一人称视角拍摄人手动作的自我中心(Egocentric)方式可能是一种替代方案。如果获得制鞋匠、厨师、熟练工的手部动作视频,多家机器人企业可以各自根据自身机器人进行再加工和利用。
Tomorrow Robotics副代表张俊贤(Jang Jun-hyun)强调了数据标准的重要性。“数据标准虽然已有多种,但尚未统一。如果企业和机构以不同格式创建数据,相互兼容会很困难,因此需要可共同使用的数据标准。”他解释,第一人称视角数据有时有效但成本可能较高,而某些任务用第三人称视角数据也足够。关键在于需要以何种单位和格式组合角度、长度、关节信息、力信息、视频信息和工作背景。
Wirobotics认为核心在于数据质量与设计,而非数量。相关人士表示:“制造现场数据对物理AI开发非常有用且必不可少。但重要的不是单纯收集大量数据,而是从一开始就根据工作内容精心设计收集数据类型、收集标准和数据格式,将其标准化为有意义的高质量数据。”
可访问性同样是一个问题。如果数据集中在大企业制造现场或数据工厂,可能因安全和知识产权问题导致初创企业和机器人专业企业难以利用。Wirobotics相关人士指出:“拥有制造设施的大企业或它们建设的数据工厂中的数据,由于安全和IP问题,初创企业或机器人专业企业可能难以访问。国家制造数据库应当对机器人专业企业实质性开放。”Tomorrow Robotics也强调了数据共享结构的重要性,张俊贤副代表说:“虽然创建能够大量生产数据的空间或机构以生成高质量数据很重要,但更重要的是让这些数据能够被共同使用。”
过去AI学习用数据构建项目的教训也值得参考。政府通过AI Hub等构建了大规模学习用数据,但业界一直指出“即使有数据,实际企业也难以直接使用”。物理AI数据比单纯图像或文本更为复杂,因为它必须同时包含工人动作、机器人关节值、力/接触信息、工作环境以及失败案例。
业界对政府提出的“3年内开发自主物理AI基础模型”的目标普遍持积极态度。Wirobotics相关人士表示:“我认为3年内开发出在特定领域具有有意义性能的第一代物理AI模型是可能的。”MindAI相关人士也表示:“3年内开发自主物理AI基础模型完全可能,从今年开始就会看到成果。”张俊贤副代表则从主权AI(Sovereign AI)角度指出:“机器人基础模型相当于类人机器人的大脑。在韩国工厂工作的类人机器人的大脑不能只使用中国或美国的模型。如果使用国外的‘大脑’,当前的工艺数据可能外流。”
近期Anthropic的Mythos5和Fable5访问限制争议加剧了这种意识。美国政府以国家安全和出口管制为由限制先进AI模型访问,后续虽有所放宽,但仍表明了对海外前沿模型依赖的风险。在制造、国防、安全、公共等核心数据流动的领域,AI模型主权已不再只是技术自立的口号。AIRobot代表廉云卨也认同自主基础模型的必要性,他表示:“即使为了打破垄断性生态系统地位,也绝对需要自主基础模型。”









