연구 배경 및 방법론
본 보고서는 Cosmos 3 아키텍처를 기반으로 한 차세대 물리적 AI의 가능성을 탐구합니다. 연구진은 방대한 멀티모달 데이터를 처리하기 위해 Mixture-of-Transformers 방식을 채택하였으며, 이를 통해 시각-언어 모델과 물리 시뮬레이터의 장점을 극대화했습니다.
특히 주목할 점은 합성 데이터의 활용입니다. 실제 환경에서의 물리적 상호작용 데이터는 수집의 제한이 따르나, SDG(Synthetic Data Generation) 기법을 도입함으로써 복잡한 주행 시나리오와 로봇 조작 과제를 효과적으로 일반화할 수 있었습니다.
이 모델은 단순한 생성을 넘어, 세계의 물리 법칙을 내재적으로 학습하여 제어 신호로 변환하는 데 성공했으며, 이는 향후 범용 로봇 지능 개발에 있어 중요한 이정표가 될 것입니다.