Research Report 2026

TxGemma: Efficient and Agentic LLMs for Therapeutics

Google DeepMind가 발표한 치료제 개발을 위한 차세대 제너럴리스트 언어 모델 수트, TxGemma의 핵심 개념과 기술적 성과를 분석합니다.

Author: Eric Wang et al. (2025)

Keywords: Drug Discovery, Gemma-2, Agentic-Tx, ADMET

1 Definition (정의)

● TxGemma (Therapeutic Gemma): 2025년 4월 Google DeepMind에서 출시한 Gemma-2 아키텍처 기반의 효율적인 범용 대규모 언어 모델(LLM) 수트입니다.
● 모델 규모: 2B, 9B, 27B 파라미터의 세 가지 크기로 제공되어 연구 목적에 따른 최적의 선택을 지원합니다.
● 주요 목적: 저분자 화합물, 단백질, 핵산, 질병 및 세포주와 같은 치료 엔티티의 특성 예측, 대화형 추론 및 설명 가능성에 최적화되었습니다.
● 모델 변형:
- - TxGemma-Predict: TDC 기반의 정밀한 물성 예측 특화.
- - TxGemma-Chat: 메커니즘 중심의 대화형 추론 지원.

SMILES, 아미노산 서열, 뉴클레오타이드 서열 및 텍스트 기반 질병 데이터를 단일 모델에서 처리하여 교차 작업 일반화를 달성합니다.

ReAct 프레임워크와 PubMed, 화합물 변환기 등의 외부 도구를 결합하여 다단계 추론 및 지식 컷오프 이슈를 해결합니다.

2024년 Tx-LLM 출시 이후, 신약 개발 과정에서의 막대한 비용과 높은 실패율(임상 1상 후 90% 이상 실패)을 극복하기 위한 인실리코(In-silico) 우선순위 결정에 대한 수요가 급증했습니다.

2025년 3-4월 Google DeepMind가 발표한 TxGemma는 TDC(Therapeutics Data Commons)에서 미세 조정되어, 타깃 발굴부터 리드 최적화 및 임상 시험 결과 예측까지 전 과정을 지원합니다.

Gemma-2를 TDC의 7M+ 명령어 튜닝 데이터셋으로 미세 조정 (70% Zero-shot, 30% Few-shot).

항체 가용성, 안정성 등 다중 속성 프롬프트를 동시에 처리하기 위한 잠재 변수 컨디셔닝.

ADMET

AMES AUROC 0.816, BBB 0.907의 고성능 안전성 프로파일링 제공.

Drug-Target

BindingDB PCC 0.538의 결합 친화도 추론 능력.

Clinical

임상 시험 승인 확률 및 결과 예측 고도화.

커뮤니티 주도의 LoRA 미세 조정을 통한 전용 데이터 적응 가속화. AlphaFold 3 통합을 통한 3D 구조 하이브리드 에이전트 개발.

항체를 넘어 효소 설계, 비계 단백질 공학 및 다중 오믹스 통합 프레임워크로의 진화.

TxGemma represents the cost-effective generalist foundation for precision medicine.

• “TxGemma: Efficient and Agentic LLMs for Therapeutics” (Eric Wang et al., arXiv:2504.06196, 2025)

• “Tx-LLM: A Large Language Model for Therapeutics” (Juan Manuel Zambrano Chaves et al., arXiv:2406.06316, 2024)

• “Introducing TxGemma: Open models to improve therapeutics development” (Google Developers Blog, 2025)