S 연구 동향

Artificial Intelligence Report

현실보다 더 진짜 같은 AI:
'미분 가능한 월드 모델'의 세계

로봇이 미지의 환경을 안전하게 탐사하기 위해 필요한 핵심 기술, 생성형 AI의 한계를 넘어 물리적 법칙을 이해하는 'Differentiable World Models(DWM)'를 소개합니다.

1 생성형 AI '가짜 물리'의 한계

구글의 제미나이(Gemini)와 같은 최신 비디오 생성 AI는 시각적으로 놀라운 결과물을 내놓지만, 공학적으로는 치명적인 물리적 오류를 포함하곤 합니다.

  • 시각적 장관 vs 물리적 실재: 달 탐사선의 삽이 뒤쪽에서 마법처럼 채워지거나 진공 상태에서 소리가 발생하는 등의 오류.
  • 데이터 기반 학습의 한계: 비디오 데이터의 패턴은 학습하지만, 물체가 "왜" 그렇게 움직이는지에 대한 인과관계 이해가 부족합니다.
"단순히 '눈'이 좋은 AI를 넘어, 물리학이라는 '뇌'를 이식한 고충실도(High-Fidelity) 시뮬레이션 기능의 월드 모델이 필요합니다."
Step 1: Sense

Gaussian Splatting: 3D 지각의 혁명

AI가 물리를 배우기 위해서는 세상을 정확한 3D로 인식해야 합니다. 이를 가능하게 하는 혁신 기술이 바로 **Gaussian Splatting**입니다.

특징 전통적 3D 모델링 Gaussian Splatting
표현 방식 딱딱한 표면/단순 점 500만 개의 '가우시안 덩어리' (부피/투명도)
시각적 품질 거친 질감, 불연속적 사진과 구분이 불가능한 극사실적 렌더링
처리 속도 해상도 비례 기하급수적 증가 500만 개 스플랫 8초 이내 렌더링 (A100)
핵심 장점 구조 수정/최적화 난해 미분 가능 (Differentiable)

💡 Engineering Insight: Perception as Data Chunks

AI는 사물을 점이 아닌 위치, 형태(공분산), 색상 정보를 가진 '데이터 덩어리'로 인식합니다. 이 '미분 가능성' 덕분에 여러 장의 사진에서 완벽한 3D 모델을 구축하는 역문제(Inverse Problem)를 효율적으로 해결합니다.

Step 2: Predict

Material Point Method (MPM): 물리적 성질 부여

형태를 잡았다면 이제 각 입자에 '성질'을 주어 움직임을 예측합니다. **MPM(물질 점 방법)**은 복잡한 변형을 계산하는 데 최적화되어 있습니다.

모래 (Sand)

입자 간 마찰력을 계산하여 쌓이는 각도를 결정합니다.

반죽 (Dough)

점탄성을 부여해 끈적임과 형태 변화를 재현합니다.

구조물 (Structure)

강성을 계산하여 충격 시 균열 위치를 파악합니다.

💡 Engineering Insight: System Identification

Gaussian Splatting의 '형태'와 MPM의 '물성'이 결합되면, AI는 영상만 보고도 물체의 재질을 스스로 파악(System ID)하고 물리 법칙에 따른 미래 움직임을 예측합니다.

핵심 원리: '미분 가능성'의 학습 지름길

이 기술 명칭에 '미분 가능'이 붙은 이유는 **자동 미분(Auto-Diff)** 때문입니다.

전통적 방식 (Finite Difference)

수천 번의 시뮬레이션을 돌려보며 '찍어서' 답을 찾는 비효율적 방식.

미분 가능 방식 (Auto-Diff)

모든 계산을 그래프로 연결해 결과가 틀렸을 때 즉시 '어떻게 고칠지' 수학적 처방전(Gradient)을 제공합니다. 이는 학습 속도와 정밀도를 극대화합니다.

Step 3: Accelerate

GNN: 시간의 장벽을 허물다

MPM은 정확하지만 계산에 시간이 많이 걸립니다(약 3시간). **그래프 신경망(GNN)**은 이를 **약 5초**로 단축합니다.

1

Encoding: 물리 상태를 입자(노드)와 상호작용(엣지)의 그래프로 변환.

2

Message Passing: 전체 시스템이 아닌 이웃한 입자끼리의 '국소적 상호작용'만 학습.

3

Decoding: 학습된 데이터를 다시 실제 물리적 가속도와 속도로 변환.

💡 Engineering Insight: FiLM-based Adaptation

GNN은 '확장성'이 뛰어납니다. 작은 모래더미에서 배운 원리를 거대한 사막에 즉시 적용할 수 있으며, FiLM 기법을 통해 새로운 재질(예: 찰흙)에 대한 최적화를 단 15분 만에 끝낼 수 있습니다.

Step 4: Act

DPC: 안전한 제어를 향한 수학적 최적화

예측이 가능하다면 이제 로봇이 어떻게 '행동'할지 결정해야 합니다. 이를 **Differentiable Predictive Control (DPC)**이라 합니다.

드론(Quadrotor) 제어

강풍과 같은 외부 방해 속에서도 단 몇 초 만에 수학적으로 평형을 유지하는 법을 배웁니다.

빙판길 RC카 드리프트

시시각각 변하는 마찰력 환경에서 시속 80km로 안전하게 드리프트하는 고난도 제어를 구현합니다.

※ 기존 강화학습(RL)이 수백만 번의 시행착오를 겪는다면, DPC는 단 1만~5만 번의 반복으로 최적의 궤적을 찾아냅/니다.

활용 사례: 가상 센서로서의 AI

사람이 가기 어렵거나 센서 설치가 힘든 극한 환경에서 이 기술은 진가를 발휘합니다.

NASA

달 탐사선 가상 센서

나사는 탐사선의 삽에 센서를 다는 것을 잊었습니다. 연구진은 '미분 가능한 월드 모델'을 이용해 카메라 영상만으로 토양의 마찰력을 역추적하여 AI를 하드웨어 센서처럼 활용했습니다.

BRIDGE

런던 브릿지 구조 건전성 모니터링

수십 년 된 교량을 지나는 기차의 진동 영상만 분석하여 미세 균열을 찾아내고, 구조적 강성(System ID)을 진단하여 붕괴 사고를 미연에 방지합니다.

결론: 물리를 배우는 AI, 미래를 열다

단순한 '데이터 기반 AI'에서 '물리 인지형 AI'로의 패러다임 전환은 자율주행, 우주 탐사, 재난 구조의 필수 전제 조건입니다. 가상과 현실의 경계가 허물어지는 월드 모델의 세계에 오신 것을 환영합니다.

Sense
세상을 500만 개의 데이터 덩어리로 정밀 지각
Predict
미분과 GNN으로 물리 미래를 광속 예측
Act
수학적 최적화로 로봇을 안전하게 제어