Executive Summary
2026-03-18 KST 기준. 모델 성능을 넘어선 '팀(Agents) + 도구 + 메모리' 생태계로의 진화.
- 수동형 모델 → 자율형 오케스트레이터
- 파편화된 도구 → MCP 기반 통합 생태계
- 정적 벤치마크 → 전략적 의사결정 평가
도구 및 데이터 파편화 통합
LLM 에이전트가 자연어 인터페이스와 MCP(Model Context Protocol)를 통해 방대한 생물학적 도구들을 자율적으로 연결합니다.
RAG + 멀티에이전트 시스템
최신 생의학 지식을 실시간으로 검색하고(RAG), 역할이 분담된 전문 에이전트들이 협력하여 신뢰성 있는 근거를 마련합니다.
Autonomous Workflow Engine
신약개발을 단순한 '예측'의 영역이 아닌, Perception-Computation-Action-Memory 루프를 반복하는 자율형 워크플로 엔진으로 정의합니다. Seal et al.(2025)에 따르면 이는 'Think/Act/Observe/Reflect'를 구현하는 인공지능의 새로운 거대한 물결입니다.
"AI 에이전트는 복잡한 연구 워크플로를 통해 자율적으로 추론, 행동 및 학습을 수행합니다."
AstraZeneca의 ChatInvent 사례: PoC에서 실제 R&D 파이프라인으로의 성공적인 확장 사례.
Core Challenges & RQs
환각 및 근거 전파 오류
생화학 데이터의 이질성과 모호성으로 인해 단순 검색으로는 충분하지 않은 환각(Hallucination) 리스크가 존재합니다.
대규모 도구 공간의 계획
GenieAgent가 지적하듯, 거대한 툴 생태계 내에서 의도(Intention)를 실제 행동으로 매핑하는 내비게이션 능력이 부족합니다.
평가 및 재현성 부재
DO Challenge는 에이전트의 전략적 의사결정을 평가할 때, 여전히 전문가 수준에 미치지 못하는 불안정성을 보고했습니다.
Comparative Analysis
| Method | Core Idea | Agentic Logic | Strengths |
|---|---|---|---|
| GenieAgent | 의도→행동 매핑 | 힌트 라우팅, 스킬별 분할 | 대규모 툴 공간 내비게이션 |
| FROGENT | MCP 기반 통합 설계 | 분산 에이전트, 코드 실행 | 엔드 투 엔드 풀 프로세스 통합 |
| DrugPilot | 파라미터화 메모리(PMP) | 실시간 에러 피드백(Fe-Fo) | 도구 호출 성능 정량화 및 최적화 |
| CLADD | 멀티에이전트 RAG | Planning/KG/Molecule 팀 | 신물질 일반화 및 제로샷 성능 |
| ChatInvent | 실무 파이프라인 통합 | GUI + 자동 테스트/벤치마킹 | 실제 제약사(AstraZeneca) 적용 |
Milestones: 2025 - 2026
CLADD & LIDDIA 발표
RAG 멀티에이전트와 자율 약물 발굴 에이전트의 초기 기틀 마련.
DO Challenge 벤치마크
전략적 의사결정 및 자율 파이프라인 설계 능력 정량 평가 시작.
Science: DrugReflector
Active learning + Lab-in-the-loop를 통한 폐루프 최적화 성과 보고.
ChatInvent Actualization
실제 제약 R&D 현업 배치 수준의 완성도와 교훈 공유.
Key Applications
End-to-End In Silico 워크플로
표적 식별부터 레트로 합성까지 풀 프로세스를 단일 에이전틱 프레임워크 내에서 수행 (예: FROGENT).
Phenotypic 스크리닝 자동화
오믹스/이미징 데이터를 활용하여 약물 반응 시그니처를 요약하고 MoA를 자율적으로 추론 (예: SigSpace).
폐루프(Closed-loop) 최적화
시뮬레이션과 Wet-lab 실험 피드백을 결합하여 히트율을 최대 17배까지 향상시키는 폐루프 시스템.
기업형 파이프라인 통합
연구원들이 GUI를 통해 복잡한 AI 에이전트를 조작하고 사내 데이터와 연동하는 대화형 도구 (예: ChatInvent).
Future Horizons
"모델을 더 크게 만드는 것보다, 에이전트 시스템을 어떻게 안전하게 업데이트하고 검증할지가 핵심 질문이 될 것입니다."
에이전트 팀 표준화
ACP, A2A 등 에이전트 간 통신 표준 및 MCP를 통한 상호운용성 강화
검증 가능한 제약 확대
합성 가능성, 안전성, 규제 요건 등 실질적 제약을 에이전트 계획 단계에 포함