DTI/DTA Research Trends 2025+

개요 및 핵심 정의

DTI (Drug-Target Interaction)

약물이 특정 표적 단백질에 결합하는지 여부를 예측하는 이진 분류 모델입니다. 신약 후보 물질의 유무를 판별하는 첫 단계입니다.

DTA (Drug-Target Affinity)

약물과 표적 간의 결합 강도를 Kd, Ki, IC50 등의 수치로 예측하는 회귀 문제입니다. 약효의 정량적 평가를 가능하게 합니다.

핵심 벤치마크 데이터셋

DAVIS

키나아제 단백질 442개와 68개 억제제 간의 Kd 기반 데이터. 30,056건의 고품질 상호작용 포함.

Kinase Focus

KIBA

IC50, Kd, Ki 통합 스코어링. 118,254건 상호작용 제공.

Multi-Metric

BindingDB

290만 건 이상의 대규모 데이터베이스. ChEMBL, PubChem 통합.

Large Scale

ChEMBL

BindingDB 및 KIBA의 주요 원천 데이터 공급원. 수백만 건의 생체 활성 기록.

Primary Data Source

핵심 기술과 연구 배경

전통적인 신약 개발은 15년 이상의 긴 시간과 막대한 비용이 소요됩니다. AI는 SMILES 문자열이나 분자 그래프, AlphaFold 구조 정보를 활용하여 이 과정을 획기적으로 단축하고 있습니다.

다중 모달리티 (Multi-modal) 서열(1D)과 3D 구조 정보의 지능적 융합
사전 학습 모델 (Foundation Models) ESM-2, ChemBERTa 등 대규모 모델 도입
Cold-start 문제 해결 신규 약물/단백질에 대한 제로샷 예측 성능 강화

카테고리	대표 모델	KIBA MSE
Sequence-based	DeepDTA	0.143
Graph-based	GraphDTA	0.124
Multi-modal	3DProt-DTA	0.117

* 2025년 기준 최고 수준(SOTA) 달성 모델 통계

현재의 도전 과제 Challenges

데이터 편향성 (Data Bias)

대부분의 데이터가 키나아제에 편중되어 있어 GPCR 등 타 단백질군 적용 시 성능 저하가 발생합니다.

동적 결합 모사 부족

분자의 유연성(Conformation) 및 실제 생체 내 동적 환경을 정확하게 반영하는 데 한계가 존재합니다.

음성 샘플 문제

"결합하지 않음"을 나타내는 데이터의 품질과 임계값 설정 문제로 모델 신뢰도가 저하될 수 있습니다.

해석 가능성 (Interpretability)

모델의 Attention 가중치가 실제 생물학적 결합 부위를 얼마나 정확히 설명하는지에 대한 검증이 필요합니다.

미래 연구 방향 Roadmap 2025+

파운데이션 모델 (Foundation Models)

AlphaFold3, ESM-3와 Graph Transformer를 결합한 범용 생명과학 AI 구축.

고품질 데이터 큐레이션

3D 도킹 기반 데이터 증강 및 자동 필터링을 통한 데이터 품질 극대화 (DrugForm-DTA).

실세계 통합 (Real-world Integration)

ADMET 예측 및 합성 가능성 연계, FDA 규제 준수 AI 모델 개발.

대규모 벤치마크 확장

GPCR, 이온 채널 등 광범위한 단백질을 포함하는 SCOPE 데이터셋 확대.

실전 응용 분야

가상 스크리닝

수백만 개의 화합물 라이브러리에서 잠재적 후보 약물을 광속으로 선별합니다.

약물 재창출

이미 승인된 약물을 암, 알츠하이머 등 신규 질병 치료에 활용하는 경로 탐색.

키나아제 억제제 설계

특정 키나아제 선택성을 예측하여 부작용을 최소화하는 정밀 설계 지원.

정밀 의료

환자 맞춤형 질병 모델 데이터를 활용한 개인화된 약물 발굴 지원.

다중 약리 작용

하나의 약물이 여러 표적에 미치는 복합적인 영향을 예측하여 신약 가치 증대.

미세 조정 (Fine-tuning)

KIBA 사전 학습 후 특정 암 세포주(GDSC) 데이터로 튜닝하여 선도 화합물 도출.

주요 출처 및 논문

A survey on deep learning for drug-target binding prediction DRUG-TARGET INTERACTION/AFFINITY PREDICTION review (arXiv) Binding Affinity Prediction: From Conventional to ML DrugForm-DTA (2025) - bioRxiv

결론: 신약 개발의 새로운 패러다임

2025년 이후, AI 모델은 키나아제 영역에서 실험 데이터에 필적하는 정확도를 확보했습니다. 이제는 일반화(Generalization)와 해석 가능성(Interpretability)을 확보하여 실제 임상 및 신약 개발 현장에 통합되는 것이 핵심 과제입니다.

#ArtificialIntelligence #Bioinformatics #DrugDiscovery