인공지능의 진화: 생성형 AI를 넘어 JEPA와 월드 모델로
인간 수준의 지능(AGI)을 향한 새로운 설계도
AI의 현주소와 모라벡의 역설
모라벡의 역설 (Moravec's Paradox)
고도의 추론(수학, 코딩)은 AI에게 쉬우나, 어린아이도 하는 기초적인 감각-운동 능력(가구 피하기 등)은 구현하기가 매우 어렵다는 역설입니다.
학습 효율성 비교
생성형 모델의 함정
자기회귀(Autoregressive) 예측의 한계
- 고차원 데이터의 불가능성: 비디오 프레임처럼 복잡한 데이터에서 나뭇잎의 흔들림 같은 미세한 움직임을 모두 예측하는 것은 물리적으로 불가능합니다.
- 흐릿한 결과(Blurry Results): 모든 가능성을 평균화하여 예측하려다 보니 결과물이 모호하거나 비현실적으로 변합니다.
- 정보의 낭비: 불필요한 픽셀 정보에 집착하느라 사건의 진짜 '맥락'을 놓치게 됩니다.
지능의 새로운 엔진: 월드 모델 (World Models)
행동하기 전 마음속에서 결과를 시뮬레이션하는 엔진입니다. 이는 인간의 System 2(느린 생각) 사고방식과 유사합니다.
즉각적 반응
고정된 신경망을 통과하여 즉각적으로 답을 내놓는 구조입니다. 깊은 추론이나 시뮬레이션이 부족합니다.
시뮬레이션 및 계획
대안을 탐색하고 최적의 경로를 설계합니다. "바람과 돛의 관계"라는 멘탈 모델을 사용하는 항해사와 같습니다.
JEPA: '추상화'를 통한 예측의 혁명
JEPA (Joint Embedding Predictive Architecture)는 픽셀을 복원하는 대신 '표현 공간(Representation Space)'에서 미래를 예측합니다.
예측 불가능한 세부 사항은 버리고 핵심적인 의미만 남깁니다.
중력, 관성 같은 물리 법칙을 관찰만으로 스스로 학습합니다.
픽셀 하나하나를 그리지 않아 연산 자원을 획기적으로 줄입니다.
핵심 기술 요소
- SigReg: 정보 엔트로피를 극대화하여 모델 붕괴를 방지
- Gaussian Blob: 데이터 포인트를 넓게 퍼뜨려 정보 추출 효율 증대
지능의 완성: 계층적 계획 (Hierarchical Planning)
복잡한 목표를 실행 가능한 작은 단위로 쪼개는 능력이 지능의 정점입니다.
상위 계층 (High-level)
목적지 결정 및 주요 이동 수단 선택 (예: 뉴욕에서 튀니지로 이동)
중간 계층 (Mid-level)
공항까지 가기 위한 하위 행동 설정 (예: 택시 잡기)
하위 계층 (Low-level)
실시간 근육 및 모터 제어 (예: 손을 들어 택시 부르기)
산업적 응용
단순한 챗봇을 넘어 로보틱스, SMR(소형 모듈 원자로), 화학 공정 등 복잡한 물리 시스템 제어에 활용될 것입니다.
결론: 지능의 본질을 향한 지도
자율 지도 학습
정답 없이 세상의 구조를 스스로 학습
월드 모델
상상과 계획을 위한 판단 엔진
JEPA
본질적 가치를 추출하는 아키텍처
단순한 "말하는 로봇"에서 물리 월드를 이해하고 상호작용하는
"진정한 지능적 에이전트"로의 진화가 시작되었습니다.
단어의 조합을 넘어 지능의 본질에 닿는 새로운 시대가 열립니다.