물리 법칙 적용한 ‘합성 데이터’. 피지컬 AI 새로운 연료
엑셀의 바다 속 ‘지도’ 역할… 파편화된 데이터 98% 정규화
‘IP 라이프사이클 관리’로 보안 장벽 넘고 데이터 공유 활성화

모건 짐머만(Morgan ZIMMERMAN) 다쏘시스템 3D익스피리언스 CEO는 피지컬 AI가 직면한 데이터 가뭄 해법으로 버추얼 환경에서 생성하는 ‘물리 기반 합성 데이터’ 방식을 제시했다. /김동원 기자

인공지능(AI)이 발전해야 하는데 데이터가 없다. 모건 짐머만(Morgan ZIMMERMAN) 다쏘시스템 3D익스피리언스 부문 최고경영자(CEO)의 진단이다.

그는 3일(현지시각) 미국 휴스턴에서 열린 ‘3D익스피리언스 월드 2026’ 미디어 세션에 “AI 시대 가장 중요한 데이터는 오히려 줄어들고 있다”며 “지적재산권(IP) 보호로 인해 공용 데이터는 고갈되고, 제조 현장의 데이터는 여전히 파편화돼 있다”고 말했다.

현실 세계에서 물리적으로 작동하는 피지컬 AI 데이터는 훨씬 부족하다. 챗GPT나 클로드 같은 챗봇은 인터넷에서 데이터를 구할 수 있지만, 로봇을 움직이는 관절 센서 데이터, 액추에이터 데이터, 접촉력, 관성 등 물리적 상호작용을 이해할 수 있는 데이터는 인터넷에도 없기 때문이다.

짐머만 CEO는 피지컬 AI가 직면한 데이터 가뭄 해법으로 버추얼 환경에서 생성하는 ‘물리 기반 합성 데이터’ 방식을 제시했다. 또 이를 가능하게 하는 3D익스피리언스 플랫폼이 AI 시대 새로운 데이터 인프라가 될 것으로 전망했다.

◇ “세상에 없던 엔진도 학습”… 물리 법칙이 빚어낸 ‘합성 데이터’

피지컬 AI가 가진 최대 숙제는 데이터다. 제조 현장의 실제 고장 데이터, 공정 파라미터, 설비 운용 이력 같은 물리 세계 데이터는 인터넷에 공개되지 않는다. 신제품은 고장 사례 자체가 없고, 기존 제품 데이터는 기업들이 영업비밀로 보호한다.

짐머만 CEO는 그 해법으로 가상 세계에서 물리적으로 현실적인 합성 데이터를 생성하는 방식을 제시했다. 신형 항공기 엔진이 출시 전이라도 버추얼 트윈 환경에서 수만 시간의 운용 시뮬레이션을 돌려 고장 패턴 데이터를 생성하고, 이를 AI에게 학습시킬 수 있다는 것이다.

단순한 3D 그래픽으로는 불가능하다. 중력, 마찰, 열역학 등 물리 법칙이 적용된 시뮬레이션이 필요하다. 짐머만 CEO는 “3D 모델은 카메라로도 만들 수 있지만 우리가 만드는 것은 버추얼 트윈”이라며 “형상뿐 아니라 동작 방식, 물리적 속성, 구성 정보가 모두 포함된 깊은 행동 모델링”이라고 설명했다.

이는 젠슨 황 엔비디아 CEO가 2일 기조연설에서 강조한 ‘리얼 월드 AI’ 개념과 연결된다. 엔비디아가 옴니버스로 가상 공장의 틀을 제공한다면, 다쏘시스템은 수십 년간 축적한 제조 엔지니어링 지식과 물리 시뮬레이션 역량을 결합한다.

다쏘시스템의 한 제조 고객사는 레거시 CAD 시스템의 30년치 설계 데이터를 학습해 자체 생성형 AI 모델을 구축했다고 한다. 이 모델은 해당 기업 전용으로만 사용되며, 다쏘시스템조차 접근할 수 없다.

◇ 파편화된 ‘엑셀의 바다’ 구하는 버추얼 트윈

데이터 부족보다 심각한 문제는 데이터 파편화다. 짐머만 CEO는 한 자동차 제조사 사례를 공개했다. 이 회사는 ‘알루미늄’이라는 단일 소재를 9만7653개의 서로 다른 명칭으로 관리하고 있었다. 엔지니어에게는 ‘부품번호’, 구매팀에게는 ‘자재번호’, 규제팀에게는 ‘안전장치’로 불리는 동일 부품이 각 시스템(ERP, PLM, MES)에 다른 형식으로 저장돼 있었다.

알루미늄 가격 급등의 사업 영향을 계산하려 했을 때 명확한 자재 데이터는 단 2%에 불과했다. 나머지 98%는 PDF나 이메일에 흩어져 있었다.

3D익스피리언스 플랫폼은 서로 다른 시스템의 데이터를 버추얼 트윈 위에 투영해 자동으로 상호 연관성을 찾아낸다. 그가 보여준 중국·인도 관세 충격 시나리오 시연 영상에선 AI 버추얼 동반자는 제품 구성, 생산 시스템, 공급망 데이터를 통합 분석해 즉시 “330만 달러 영향”이라는 결과를 제시했다. 과거에는 수십 명이 며칠간 엑셀 스프레드시트를 조작해야 했던 작업이다.

해당 자동차 제조사는 AI와 데이터 정규화를 통해 자재 데이터 명확도를 2%에서 98%까지 끌어올렸다. PDF에서 텍스트를 추출하고, 부품 번호 패턴을 분석하고, 누락된 데이터를 재구성하는 과정에 AI가 투입됐다.

짐머만 CEO는 “레스토랑 위치와 꽃집 위치가 각각 다른 엑셀에 있으면 ‘꽃집 근처 레스토랑’을 찾기 어렵지만, 지도에 표시하면 즉시 보인다”며 “버추얼 트윈이 바로 그 지도”라고 설명했다.

◇ IP 보호 체계로 데이터 공유 환경 선사

기업들이 데이터를 공유하지 않는 이유는 기술 탈취 우려 때문이다. 짐머만 CEO는 ‘IP 라이프사이클 매니지먼트’ 기능으로 이 문제를 해결한다고 밝혔다.

자동차 제조사가 협력업체에 헤드램프 설계 데이터를 요청하면 쉽게 제공했다. 데이터를 통합 설계용으로만 사용했기 때문이다. 하지만 AI 시대에는 그 데이터로 협력사의 기술을 학습할 수 있다. 이 때문에 협력사들은 점차 데이터를 제공하는 것에 부담을 느끼고 있다.

IP 라이프사이클 관리는 협력업체 데이터를 AI ‘학습’에 사용할 수 있는지, ‘통합 설계 운용’에만 써야 하는지를 추적하고 관리한다. 데이터가 학습에 사용될 때마다 이력이 기록되고, AI 모델 생성 시 투입된 데이터가 추적된다.

짐머만 CEO는 “고객사가 협력사의 IP를 보호할 수 있어야 협력사들이 안심하고 데이터를 공유한다”며 “보안이 담보되면 데이터 공유가 활성화되고 전체 AI 성능이 올라가는 선순환이 만들어진다”고 설명했다.

홈으로 이동 상단으로 이동