Research Trends

AI World Models

프로젝트 지니: 생성형 AI의 새로운 지평

프로젝트 지니는 생성형 AI의 새로운 지평을 여는 월드 모델 기술의 이정표입니다. 이 기술은 기존의 비디오 생성을 넘어 사용자가 실시간으로 상호작용하고 탐험할 수 있는 동적 세계를 창조하는 패러다임 전환을 의미합니다. 기존 비디오 생성 모델인 Veo와 달리, 월드 모델인 Genie 3는 능동적 상호작용 경험을 제공하는 핵심입니다. 이는 사용자를 수동적 미디어 소비자가 아닌 이야기의 공동 창작자로 만드는 새로운 가능성입니다.

"Genie 3는 사용자 아이디어를 실시간 상호작용 가능한 세계로 변환하는 고유한 기술입니다."

프롬프트나 이미지 입력 후 Nano Banana Pro 모델을 활용하여 2D 캔버스를 생성하고, 이를 기반으로 상호작용 가능한 환경을 렌더링하는 독창적인 과정을 거칩니다. 실시간 지연 시간과 높은 액션 빈도를 충족하는 것이 주요 기술적 과제이며, 메모리, 속도, 비용의 균형을 통해 현재 약 60초의 세션 길이를 제공하는 성공적인 구현을 이루어냈습니다. 특히 명시적인 물리 엔진 없이도 환경의 물리 법칙을 내재적으로 학습하는 놀라운 능력을 보여줍니다.

교육 및 엔터테인먼트 분야에서 개인화된 경험을 제공하는 혁신적 잠재력을 지니며, 로보틱스 및 체화된 AI 훈련에 무한한 다양성의 환경을 제공하는 강력한 도구가 될 것입니다. Gemini 기반 Simmer 프로젝트는 Genie 3 환경에서 에이전트의 일반화 능력을 테스트한 실제 사례입니다.

궁극적인 비전은 '원하는 것은 무엇이든 할 수 있는 우주의 복사본'을 만드는 것입니다. Genie 3는 물리적 현실과 생성된 현실의 경계를 허무는 중요한 첫걸음입니다.