Introduction
2025년 이후의 연구는 시간 데이터베이스(Temporal Databases)를 현실 세계의 시간적 변화를 정확하게 모델링하는 필수 도구로 정의합니다. 특히 LLM의 확산과 함께, 과거의 사실에 기반한 질문에 답하는 Time-Sensitive Question Answering (TSQA)의 정확한 평가와 처리가 중요해졌습니다.
기본적인 DB가 현재 상태만을 유지하는 것과 달리, 시간 데이터베이스는 전체 이력을 보존하여 효율적인 쿼리를 가능하게 합니다. 2026년의 TDBench는 이를 통해 LLM의 시간적 사실성을 평가하며, LiveVectorLake는 RAG 시스템을 위한 실시간 지식 베이스로 이를 확장하고 있습니다.
Definition & Core Concepts
Valid Time (유효 시간)
실세계에서 해당 사실이 진실인 기간
Transaction Time (거래 시간)
데이터가 데이터베이스에 기록된 시점
- ✦ Temporal SQL & Allen’s Interval Algebra: 13가지 시간 관계(before, overlap, contain 등)를 활용한 정교한 쿼리 제어.
- ✦ Time-Travel: 과거의 임의 시점으로 데이터 상태를 되돌려 쿼리하는 기능 (e.g. Delta Lake).
- ✦ Temporal Joins: 겹치는 시간 간격을 기반으로 한 복합 분석 지원.
Key Challenges
지능적 추론의 한계
LLM이 '겹침'이나 '포함'과 같은 미묘한 시간적 관계를 처리할 때 할루시네이션(Hallucination) 발생.
데이터 통합 이슈
벡터 DB에는 버전 이력이 부족하고, 시간 DB는 벡터 검색에 최적화되어 있지 않음.
확장성 문제
수십억 개의 이벤트가 포함된 대규모 시공간 데이터셋의 효율적인 저장 및 쿼리 처리.
Methodological Approaches
TDBench Framework (ICLR 2026)
TFD를 사용하여 사실을 선택하고, Allen의 13개 관계를 통해 복잡한 시간 조건을 생성하여 벤치마크 생성을 자동화합니다.
LiveVectorLake Architecture
Chunk-level CDC와 해싱을 사용하여 수정된 부분만 효율적으로 재임베딩하며, Hot-index와 Cold-history의 이중 계층 구조를 가집니다.
Agentic LLM Pipeline
ReAct 에이전트를 활용하여 시공간 SQL 생성 시 스키마 검사 및 오류 복구를 수행합니다.
Future Directions
-
01
Temporal RAG 강화: 시간 인식 재랭킹, 쿼리 재작성 및 시간적 사고 사슬(CoT) 도입.
-
02
하이브리드 시스템: 시간 DB, 벡터 DB, Agentic LLM이 통합된 통합 아키텍처 구축.
-
03
시공간 확장: MobilityDB 및 PostGIS와 결합하여 실시간 도시/환경 분석으로 영역 확장.
"2025년 이후의 연구는 시간 데이터베이스를 단순한 틈새 기술에서 필수적인 AI 인프라로 재정의합니다. 시간적 정확성은 이제 AI 신뢰의 핵심이며, 이를 마스터하는 것이 2026년 연구자와 개발자에게 큰 경쟁 우위가 될 것입니다."