Research Insight 2026

Biomedical Knowledge Graphs with
Multi-Modal Graph Construction

TxGemma와 Agentic-Tx를 활용한 차세대 바이오메디컬 지식 그래프 구축 전략 및 최신 연구 동향 분석

Executive Summary

본 리포트는 2025년 이후의 최신 연구(PrimeKG++, M3KG, AMG-RAG 등)를 바탕으로, 텍스트를 넘어선 멀티모달 바이오메디컬 지식 그래프(Multi-Modal BKG)의 부상과 TxGemma, Agentic-Tx와 같은 에이전트 기반 시스템이 어떻게 지식 추출 및 융합 과정을 혁신하고 있는지 분석합니다.

핵심 기술: TxGemma 및 Agentic-Tx

TxGemma (Google DeepMind)

2025년 발표된 치료제 특화 경량 LLM. 분자 독성, 결합 친화도 등 특성 예측 및 대화형 추론 지원. 멀티모달 노드에 실시간 속성 주입.

Agentic-Tx (Gemini 2.5 기반)

18가지 전문 도구를 활용한 에이전트 시스템. 분자, 유전자, 단백질 및 PubMed 데이터를 자동으로 오케스트레이션하여 지식 그래프를 실시간 업데이트.

1. 정의 (Definition)

Multi-Modal Biomedical Knowledge Graph (MKG)는 바이오메디컬 개체(유전자, 단백질, 약물, 질병, 이미지 패치)와 그들 간의 관계를 G = (E, R, F) 구조로 체계화한 지식 베이스입니다.

2. 핵심 개념 (Core Concepts)

멀티모달 BKG의 핵심은 이질적인 데이터를 하나의 통합된 임베딩 공간으로 정렬하는 데 있습니다.

3. 도입 배경 (Introduction & Background)

2025년 이후 바이오 데이터가 폭발적으로 증가함에 따라, 기존 텍스트 중심의 지식 그래프는 할루시네이션(Hallucination)과 모달리티 간 정렬 불일치라는 한계에 직면했습니다.

4. 주요 도전 과제 (Challenges)

멀티모달 통합은 강력하지만 기술적인 난관이 존재합니다.

5. 연구 방법론 (Approaches)

최신 연구들은 단순한 매칭을 넘어 지능형 에이전트를 도입하고 있습니다.

PrimeKG++ (2025.01) ProtBERT를 통한 서열 인코딩 및 GRACE 기반 그래프 대조 학습 활용.
M3KG / R2GenKG (2025.08) GPT-4o 어노테이션과 Swin-Transformer + Q-former를 결합한 계층적 R-GCN 샘플링.
AMG-RAG (2025.02) LLM 에이전트가 PubMed에서 실시간으로 지식을 추출하여 Neo4j에 업데이트.

6. 주요 응용 (Key Applications)

멀티모달 BKG는 다음과 같은 임상 및 연구 분야에서 혁신을 일으키고 있습니다.

7. 미래 방향 (Future Directions)

미래의 BKG는 단순한 지식 저장소를 넘어 "스스로 진화하는 치료 발견 엔진"이 될 것입니다.