TxGemma: Efficient and Agentic LLMs for Therapeutics
Google DeepMind가 발표한 치료제 개발을 위한 차세대 제너럴리스트 언어 모델 수트, TxGemma의 핵심 개념과 기술적 성과를 분석합니다.
Google DeepMind가 발표한 치료제 개발을 위한 차세대 제너럴리스트 언어 모델 수트, TxGemma의 핵심 개념과 기술적 성과를 분석합니다.
SMILES, 아미노산 서열, 뉴클레오타이드 서열 및 텍스트 기반 질병 데이터를 단일 모델에서 처리하여 교차 작업 일반화를 달성합니다.
ReAct 프레임워크와 PubMed, 화합물 변환기 등의 외부 도구를 결합하여 다단계 추론 및 지식 컷오프 이슈를 해결합니다.
2024년 Tx-LLM 출시 이후, 신약 개발 과정에서의 막대한 비용과 높은 실패율(임상 1상 후 90% 이상 실패)을 극복하기 위한 인실리코(In-silico) 우선순위 결정에 대한 수요가 급증했습니다.
2025년 3-4월 Google DeepMind가 발표한 TxGemma는 TDC(Therapeutics Data Commons)에서 미세 조정되어, 타깃 발굴부터 리드 최적화 및 임상 시험 결과 예측까지 전 과정을 지원합니다.
Gemma-2를 TDC의 7M+ 명령어 튜닝 데이터셋으로 미세 조정 (70% Zero-shot, 30% Few-shot).
항체 가용성, 안정성 등 다중 속성 프롬프트를 동시에 처리하기 위한 잠재 변수 컨디셔닝.
AMES AUROC 0.816, BBB 0.907의 고성능 안전성 프로파일링 제공.
BindingDB PCC 0.538의 결합 친화도 추론 능력.
임상 시험 승인 확률 및 결과 예측 고도화.
커뮤니티 주도의 LoRA 미세 조정을 통한 전용 데이터 적응 가속화. AlphaFold 3 통합을 통한 3D 구조 하이브리드 에이전트 개발.
항체를 넘어 효소 설계, 비계 단백질 공학 및 다중 오믹스 통합 프레임워크로의 진화.
• “TxGemma: Efficient and Agentic LLMs for Therapeutics” (Eric Wang et al., arXiv:2504.06196, 2025)
• “Tx-LLM: A Large Language Model for Therapeutics” (Juan Manuel Zambrano Chaves et al., arXiv:2406.06316, 2024)
• “Introducing TxGemma: Open models to improve therapeutics development” (Google Developers Blog, 2025)