Executive Summary
2025년 이후 “합성 설계(synthesis planning)” 연구는 전구체 조합 제안부터 공정 시퀀스 레시피 생성, 그리고 자율 실험(autonomous labs)을 닫힌 루프로 결합하는 방향으로 빠르게 통합되고 있습니다. 이 흐름의 선두에는 DiffSyn(확산 기반 레시피 생성)과 LLM 기반 합성 데이터 증강 기술이 자리 잡고 있습니다.
MSP-LLM 기반의 높은 부분 과업 성능 보고
동적 유동 실험(DFE) 기반 시약 및 시간 절감
LLM 증강 데이터를 통한 고정밀 공정 예측
Definition
전구체 선택(precursor selection)은 목표 물질을 만들기 위해 필요한 출발물질 집합을 예측하는 문제이며, 최근 문헌에서는 이를 단순 1:1 매칭이 아닌 Top-k 후보군을 제안하는 방식으로 다루고 있습니다.
엔드-투-엔드 합성 공정 설계(MSP)는 전구체 집합을 넘어 공정 연산(가열/혼합/소결 등)의 순서와 조건을 포함하는 "레시피"를 생성하고 목표 성능을 최대화하는 과정으로 정의됩니다.
| 논문명 | 연도 | 소재 유형 | 방법 | 주요 결과 |
|---|---|---|---|---|
| DiffSyn: A Generative Diffusion Approach | 2025/26 | 제올라이트 | 조건부 Diffusion | VAE 대비 Wasserstein 지표 'over 25' 개선 |
| Language Models Enable Data-Augmented... | 2025 | 무기 고체 | LLM + SyntMTE | Top-5 전구체 정확도 66.1%, 온도 MAE <126°C |
| MSP-LLM: Unified Framework | 2026 | 무기 고체 | 2-stage LLM | PP Top-10 94.97%, Complete MSP Top-10 18~23% |
Introduction
전통적인 합성은 연구원의 경험에 의존해 왔으나, 대규모 생성 모델이 '무엇을 만들지'를 빠르게 제안하면서 이제는 '어떻게 만들지'가 신소재 발견의 가장 큰 병목이 되었습니다.
디지털 박막 dLab 자동화 개념도 (MaiML 표준 포맷 기반)
Source: pubs.rsc.org/en/content/articlehtml/2025/dd/d4dd00326hChallenges
데이터의 희소성
공개된 고품질 합성 데이터셋의 부족이 AI 적용의 주된 장애물입니다. MatSyn25와 같은 대규모 문헌 추출 데이터셋이 이를 해결하고자 시도하고 있습니다.
동역학 vs 열역학
실제 합성은 열역학적 안정성뿐만 아니라 상 경쟁과 같은 복잡한 동역학 경로에 의해 결정되므로, 이를 모델링에 반영하는 것이 필수적입니다.
고차원 공정 공간
온도, 시간, 압력 등 수많은 변수가 얽힌 공간에서 실험 횟수를 최소화하기 위한 MPDE-BO와 같은 효율적인 최적화 기법이 요구됩니다.
장비 표준화
실험실마다 다른 장비 사양과 데이터 포맷은 자율 실험실의 확산과 알고리즘의 일반화를 가로막는 병목입니다.
통합 합성 설계 파이프라인
A[목표 물질/물성 정의] --> B[전구체 후보 랭킹 (LLM/Transformer)] B --> C[공정 레시피 생성 (Diffusion/SOP)] C --> D[열역학 필터링 (Δ-learning DFT)] D --> E[동역학·공정 가능성 필터링] E --> F[실험 선택 엔진 (BO/Multi-stage)] F --> G[자율/반자율 실행 (SDL)] G --> H[특성평가/진단 (PXRD/RHEED)] H --> I[데이터 표준화 (MaiML)] I --> J[모델 업데이트 (Active Learning)] J --> B
Key Applications
촉매 (Catalysts) — CRESt System
Nature 2025에 보고된 CRESt는 3개월간 900+ 조성과 3,500+ 테스트를 자율적으로 수행하여 촉매 성능을 9.3배 향상시켰습니다. Reference
폴리머 (Polymers) — Self-Driving Lab
RAFT-PISA 기반 나노입자 합성에서 64회차의 DoE를 단 4일 만에 무인 수행하여 34~116nm의 입자 크기를 정밀 매핑했습니다. Reference
박막 (Thin Films) — RHEED Vision
컴퓨터 비전 기반 실시간 폐루프 제어를 통해 박막 성장에 필요한 실험 횟수를 30배 이상 획기적으로 줄였습니다. Reference
Future Directions
향후 합성 설계는 단순한 모델의 정확도를 넘어, 신뢰도(Safety), 동역학적 통찰(Kinetics-aware), 그리고 인간과의 협업(Human-in-the-loop)을 아우르는 통합 플랫폼으로 진화할 것입니다.
- Kinetics-aware Generative Models: 결정화 시간 및 상경쟁 경로를 물리 변수로 직접 학습.
- Hallucination 억제: 물리/화학적 제약식을 통해 AI가 생성한 비현실적인 레시피 필터링.
- Multi-stage BO: 중간 단계 측정값(Proxy measurements)을 활용한 온더플라이(On-the-fly) 의사결정.