S

Research Trends

2025-2026 Trend Report

신약 후보 물질 발굴 가속화를 위한
3D 분자 구조 기반 언어 모델링

최근 신약 개발 분야에서 3차원 분자 구조 기반 언어 모델(Mol-LLM)의 중요성이 급부상하고 있습니다. 2025-2026년 트렌드는 3차원 분자 구조를 1차원 이산 토큰 시퀀스로 '언어화'하는 혁신적인 접근법을 통해, 분자 공간을 거대 언어 모델(LLM)이 이해할 수 있는 형태로 재정의하고 있습니다.

이는 기존 2차원 토폴로지 중심의 분자 표현(SMILES, SELFIES)에서 벗어나, 약물 결합 친화도 및 선택성에 결정적인 3차원 입체 구조를 활용하는 데 중점을 둡니다.

주요 연구 논문 및 모델

BioMedGPT

BioMedGPT: A Large Language Model for Biomedical Knowledge Acquisition and Applications

Published

바이오메드GPT는 단백질, 분자, 텍스트 정보를 통합하는 멀티모달 LLM으로, 바이오 의학 지식 습득 및 다양한 응용 분야에서 활용됩니다. 이는 분자 언어 모델이 단순한 특성 예측을 넘어 단백질-리간드 상호작용 및 신규 3D 분자 설계로 확장되는 경향을 보여줍니다.

논문 보기

AlphaFold3

Accurate and comprehensive prediction of protein structures and interactions with AlphaFold 3

Published

딥마인드와 아이소모픽 랩스에서 개발한 AlphaFold3는 단백질 구조와 상호작용을 포괄적으로 예측하는 정확한 모델입니다. 이 모델은 단백질 구조 예측의 정확도를 혁신적으로 향상시켜, AI 기반 신약 개발 파이프라인 전반에 걸쳐 타겟 식별부터 선도 물질 최적화까지 통합하는 데 핵심적인 역할을 합니다.

논문 보기

MaSIF

Learning protein-protein interfaces from shape and chemical properties

Published

MaSIF는 기하학적 딥러닝 방법을 활용하여 단백질-단백질 인터페이스를 형상 및 화학적 특성으로부터 학습하는 모델입니다. 이는 3차원 기하학적 정보를 이산 토큰화하는 과정에서 발생할 수 있는 정보 손실 문제를 완화하고, 단백질 표면 기반의 표적 탐색을 가능하게 합니다.

논문 보기

미래 지향적 모델 (2025-2026)

"세미나 콘텐츠에서는 2025-2026년 최신 트렌드를 반영하며, 미래 발전 방향을 제시하는 가상의 또는 발표 예정인 모델들이 언급되었습니다."

Published 2025
Geo2Seq (ICML 2025)

3D 기하학적 구조를 SE(3) 불변성을 유지하며 1D 시퀀스로 인코딩하는 혁신적 방법론

Preprint 2025
ConfSeq (bioRxiv 2025)

3D 구조를 1D 시퀀스로 인코딩하는 컨포메이션 기반 시퀀스 모델링

Published 2025
Token-Mol (Nature Comm.)

순수 토큰 방식의 3D 분자 생성 파이프라인, Nature Comm. 게재 예정

Expected 2025
NExT-Mol (arXiv 2025)

확산 모델과 LLM의 하이브리드 접근법을 통한 3D 컨포머 예측 고도화

3DSMILES-GPT

3D 포켓 기반 생성에 특화된 신약 후보 물질 설계 목표 모델

PocketXMol

특정 타겟 포켓에 최적화된 원자 수준의 통합 설계 모델

MorganBERT

SMILES와 특성 토큰화를 결합하여 ADMET 예측 성능 강화

전망 및 결론

이러한 연구 동향은 3D Mol-LLM이 신약 개발의 병목 현상을 해소하고, 새로운 골격 발굴, 멀티모달 정보 통합, 자율적인 설계 파이프라인 구축 등 혁신적인 발전을 주도할 것임을 시사합니다.