IEEE ICDE 2025 INSIGHTS

The New Era of
Data & Intelligence

차세대 데이터베이스 시스템을 위한 RAG와 LLM의 역할: 연구 동향 및 미래 데이터 관리 패러다임의 혁신적 전환

데이터베이스 연구의
새로운 지평

LLM의 정적 지식과 환각 현상(Hallucination)은 한계이자 기회입니다. RAG는 외부 지식을 동적으로 수혈하여 데이터베이스를 지능형 에이전트로 변모시킵니다.

검색 증강 생성 (RAG)

인텍스트 학습(In-context learning)을 통해 투명하고 정확한 정보 생성의 핵심 동력

1B+ Vector Scale
LLM Foundation

패러다임 혁신: Synergy & Challenges

장문 컨텍스트 & RAG

Gemini 1.5 Pro와 같은 대규모 컨텍스트 처리는 전역적 의미 관계를 보존합니다. 하지만 TTFT(첫 토큰 시간)와 GPU 비용 최적화가 미래 연구의 핵심 병목으로 작용합니다.

GLOBAL SEMANTICS TTFT OPTIMIZATION

벡터 데이터 관리

  • 초저비트 양자화 및 계층적 스토리지 도입
  • 실시간 고속 증분 업데이트 지원 (HNSW/DiskANN)
  • 집합 수준 및 하이브리드 검색의 복잡도 해결

Natural Interface

Text-to-SQL
고도화

Automation

ETL & Query
Optimizer

RAG 프레임워크의 진화

01

GraphRAG / KG-RAG

개체 간의 관계와 구조적 정보를 보존하여 다단계 추론의 정확성을 극대화합니다.

02

Agentic RAG

LLM에 자율성을 부여하여 스스로 도구를 호출하고 반복 검색을 수행합니다.

03

Multimodal RAG

텍스트를 넘어 이미지, 오디오 등 다양한 현실 데이터를 통합 검색합니다.

Integrated Orchestrator

Agent Planner

미래 데이터베이스의 정의

데이터의 완벽한 융합

정형(SQL)과 비정형(Vector) 데이터를 구분 없이 처리하는 단일 검색 레이어가 표준이 됩니다.

자연어 인터페이스

SQL을 몰라도 누구나 데이터베이스와 대화할 수 있는 자연어 표준 쿼리 시대가 도래합니다.

시스템 자율성

기계 중심의 자가 적응, 최적화, 추론을 통해 스스로 진화하는 데이터베이스로 거듭납니다.

보안 및 개인정보보호

Granular Access Control

신뢰와 투명성

Provenance-based Explanations

For Academia

  • 01

    트렌드에만 매몰되지 않는 엄격한 실험과 핵심 원리(효율성, 확장성) 집중

  • 02

    AI 도구에 의존하기보다 비판적 사고와 깊이 있는 탐구 능력 유지

For Industry

  • 01

    LLM 파인튜닝, RAG, 벡터 DB, GPU 최적화 기술 스택 확보 필수

  • 02

    오픈소스와 고성능 데이터 인프라 결합을 통한 AI 민주화 주도

Research Insights