Biomedical Knowledge Graphs (BKGs) and Agentic AI
TxGemma와 Agentic-Tx를 활용한 2025년 이후의 바이오메디컬 지식 그래프의 구조와 미래 전망.
TxGemma
Google DeepMind가 2025년 출시한 치료법 특화 경량 LLM (2B-27B). 분자, 단백질, 질병 특성 예측 및 대화형 추론 지원.
Agentic-Tx
Gemini 기반 에이전트 시스템. 18가지 도구를 활용해 복잡한 바이오/화학 추론 워크플로우를 자동화하며 SOTA 달성.
1. 정의 (Definition)
- Biomedical Knowledge Graph (BKG/MKG): 생물학적 개체(유전자, 단백질, 약물, 질병 등)와 그들 간의 관계를 사실적 트리플(factual triples) 형태로 구조화한 그래프 G = (E, R, F).
- 사실적 트리플: (Head, Relation, Tail) 형식의 데이터 표현 (예: "약물 A는 질병 B를 표적으로 한다").
- TxGemma/Agentic-Tx 관점: 단순한 데이터베이스를 넘어, TxGemma는 속성을 예측하고 Agentic-Tx는 실시간으로 외부 지식을 통합하여 그래프를 풍부하게 만드는 역동적 지식 네트워크입니다.
2. 핵심 개념 (Core Concepts)
Entities & Relations
유전자-단백질, 약물-타겟, 질병-증상 간의 다각적 관계 모델링.
Dynamic Evolution
LLM 에이전트가 PubMed 등에서 실시간으로 지식을 추출하여 신뢰도 점수와 함께 업데이트.
3. 서론 및 배경 (Introduction)
2025년 이후 바이오메디컬 데이터는 폭발적으로 증가했습니다. 기존의 RDBMS나 단순한 RAG 시스템은 복잡한 관계 모델링에 한계가 있어 환각(Hallucination) 현상이 발생하거나 지식의 업데이트가 늦어지는 문제가 있습니다.
BKGs는 이러한 문제를 해결할 구조화된 지식 기반으로 부상했습니다. 특히 TxGemma와 Agentic-Tx는 에이전트 기반 워크플로우를 통해 BKG의 자동 구축과 실시간 업데이트를 가능하게 하는 정점에 서 있습니다.
4. 도전 과제 (Challenges)
이질성 및 통합 (Heterogeneity)
논문, EHR, 오믹스 등 상이한 구조의 데이터를 통합하는 데 따르는 어려움.
의미론적 모호성 (Semantic Ambiguity)
UMLS 등의 표준 용어집을 사용하더라도 여전히 존재하는 용어 불일치와 불확실한 관계.
5. 연구 질문 (Research Questions)
"어떻게 하면 지식 그래프 구조를 활용해 LLM의 환각을 억제하고 다중 홉(multi-hop) 추론 능력을 강화할 것인가?"
6. 접근법 및 방법 (Methods)
2025년 최신 동향은 Agentic + LLM의 결합입니다.
- AMG-RAG (Agentic Medical Graph-RAG): PubMed에서 개체와 관계를 추출하고 Neo4j를 동적으로 업데이트하며 CoT(Chain of Thought) 추론을 사용합니다.
- MedKGent: Qwen2.5 기반의 추출/구축 에이전트를 통해 매일 업데이트되는 시계열 BKG를 구축합니다.
- TxGemma + Agentic-Tx: TxGemma-Predict로 노드 속성을 예측하고, Agentic-Tx는 18가지 도구로 BKG를 관리하는 오케스트레이션 역할을 수행합니다.
7. 주요 응용 (Key Applications)
신약 개발 및 재창출
TxGNN 방식의 BKG와 TxGemma 예측을 결합하여 희귀 질환 치료제 발견 가속화.
임상 의사 결정 지원 (CDSS)
최신 BKG를 기반으로 설명 가능하고 정확한 의료 Q&A 제공.
8. 미해결 문제 (Open Problems)
수억 개의 트리플을 관리하는 확장성(Scalability) 문제, 실시간 검색 시 발생하는 지연 시간(Latency), 그리고 편향성 감지 및 윤리적 가이드라인 준수 등이 주요 과제로 남아 있습니다.
9. 미래 방향 (Future Directions)
미래에는 TxGemma가 임베딩 및 예측 도구로, Agentic-Tx가 오케스트레이션 에이전트로 작동하는 '자가 업데이트 치료 지식 그래프'가 실현될 것입니다. 이는 단순한 저장소를 넘어 스스로 학습하고 성장하는 지능형 엔진이 될 것입니다.
Key Source URLs
결론: 지능형 치료 발견 엔진
TxGemma와 Agentic-Tx는 BKG를 지능적인 엔진으로 탈바꿈시킵니다. 2025년 이후의 연구는 에이전트 기반 LLM이 BKG 관리의 미래이며, 연구 효율성을 10배 이상 향상시킬 것임을 보여줍니다.