PhD LEVEL ROADMAP

CS/AI 연구자를 위한
AI 신약 개발 마스터 플랜

컴퓨터 사이언스 배경지식을 활용하여 6-12개월 내에 바이오/제약 도메인의 경쟁력 있는 AI 연구자로 거듭나기 위한 체계적인 학습 경로입니다.

로드맵 핵심 철학

CS 역량 극대화

기존의 알고리즘, 데이터 구조 역량을 바이오 데이터(그래프, 시퀀스) 해석에 그대로 투영합니다.

도메인 융합적 해석

분자 생물학을 '데이터 흐름'으로, 약동학을 '입출력 함수'로 재정의하여 공학적 접근을 취합니다.

Open-Access 우선

MOOC, GitHub, Arxiv 등 누구나 접근 가능한 고품질 무료 리소스를 중심으로 학습합니다.

01

입문 단계
(1-2개월)

생물학적/화학적 언어를 이해하고 AI 모델의 입력값으로 변환하는 기초 능력을 배양합니다.

CS적 재해석

Central Dogma = 데이터 파이프라인
타겟 발굴 = 그래프 탐색 및 네트워크 분석

A 핵심 학습 내용

Molecular Biology

유전자, 단백질 구조를 "데이터 흐름 그래프"로 이해

Cheminformatics

SMILES, 분자 구조를 문자열/그래프 데이터로 처리

MOOC

UCSD Drug Discovery

코스 바로가기
Textbook

Molecular Biology of the Cell

무료 PDF 보기
Tools

PDB & PubChem

3D 구조 시각화 및 분자 검색 기초

02

중급 단계
(2-3개월)

실제 데이터셋을 활용하여 SAR 분석 및 ADMET 예측 모델을 직접 구축합니다.

CS적 재해석

SAR 분석 = 유사도 기반 검색 및 회귀/분류 모델링
ADMET = 약물 적합성에 대한 피처 임계치 최적화

B 핵심 학습 내용

QSAR 모델링

Molecular Fingerprint와 Tanimoto 계수를 활용한 검색

약동학(PD) 모델링

Dose-response 커브 피팅을 통한 데이터 모델링

Python Library

RDKit 실무 튜토리얼

SMILES 파싱 및 분자 지표 계산의 정석

GitHub 튜토리얼
Database

ChEMBL

방대한 타겟-화합물 데이터 활용 API

데이터 탐색
Seminal Paper

Lipinski's Rule of Five (1997)

신약 개발의 가장 기초가 되는 화합물 투과성 규칙

논문 전문 읽기
03

심화 단계
(3-6개월)

최신 AI 기법(GNN, Diffusion)을 신약 워크플로우에 통합하고 독립적인 프로젝트를 수행합니다.

CS적 재해석

De novo design = 생성 모델 및 강화학습 최적화
Target assessment = 멀티오믹스 네트워크 분석

C 핵심 학습 내용

AlphaFold 워크플로우

예측 구조 기반 타겟 검증 및 Docking 파이프라인 구축

Graph Transformer

GNN 기반의 고도화된 ADMET 예측 및 화합물 최적화

Deep Learning

PyTorch Geometric

분자 그래프 처리를 위한 필수 라이브러리

Docking Tools

DiffDock / AutoDock

단백질-화합물 결합력 예측 실무

Pharmacology

Goodman & Gilman's

약리학의 바이블, 기초 매커니즘 학습

상세 정보

추천 학습 순서 및 팁

1

데일리 연습

매일 30분씩 PDB 구조를 시각화하고 단백질의 구조적 특징을 익히세요.

2

포트폴리오 중심

각 단계별로 Jupyter Notebook 결과물을 GitHub에 정리하여 CS-Bio 융합 역량을 증명하세요.

3

독립 프로젝트

관심 있는 특정 타겟(예: EGFR)을 선정하여 타겟 발굴부터 후보 물질 생성까지의 End-to-End 파이프라인을 구축해 보세요.

6개월 후 기대 효과 Kaggle 신약 개발 대회 상위권 도약
12개월 후 기대 효과 ArXiv 논문 수준의 AI+AIDD 프로젝트 수행

"이 로드맵은 당신을 단순히 코딩하는 개발자가 아닌, 생명을 구하는 AI 과학자로 안내할 것입니다."