"소재 과학 분야에서 대형 언어 모델(LLM) 및 멀티모달 모델 기반의 혁신 동향을 파악한 결과는 다음과 같습니다. 이 기술은 소재 데이터 마이닝, 결정 구조 생성, 실험 대행 에이전트 등 다양한 단계에서 연구 패러다임을 전환하고 있습니다."
1. Yang et al. (2025), “Large language models in materials science and the need for open-source approaches”
이 논문은 소재 과학 분야에서 LLM의 중요성과 함께 오픈소스 접근 방식의 필요성을 강조합니다. LLM이 소재의 결정 구조, 물성, 합성 지식 등 다양한 정보를 통합적으로 처리하여 과학적 추론을 수행할 수 있다고 설명합니다. 그러나 저데이터 환경에서의 문제, 환각 현상, 고차원 구조 표현의 한계, 실험 에이전트의 신뢰성 부족 등 주요 도전 과제를 지적하고, 미래에는 완전 멀티모달 모델, 안전한 자율 연구실, 오픈소스 생태계 확장이 핵심 방향이 될 것이라고 제안합니다.
2. Jiang et al. (2025), “Applications of natural language processing and large language models in materials discovery”
이 논문은 소재 발견 분야에서 자연어 처리(NLP)와 LLM의 다양한 응용 사례를 탐구합니다. LLM이 단순 텍스트 생성이나 예측을 넘어 소재의 구조, 물성, 합성 지식을 자연어, 그래프, 이미지, 수치 데이터 등 멀티 모달리티로 통합 처리하며, In-context learning과 지식 그래프 통합을 통해 저데이터 환경에서도 효과적인 과학적 추론을 가능하게 한다고 설명합니다.
3. Wang et al. (2025), “Knowledge-guided large language model for material science”
이 논문은 소재 과학 분야에서 지식 그래프 통합을 활용한 LLM의 중요성을 제시합니다. Materials Project나 PubChem과 같은 방대한 소재 지식 그래프를 RAG(검색 증강 생성) 방식으로 LLM에 통합하여, 모델의 환각 현상을 감소시키고 과학적 일관성을 높일 수 있음을 보여줍니다.
4. L2M³OF 논문 (2025), “L2M3OF: A Large Language Multimodal Model for Metal-Organic Frameworks”
이 논문은 금속-유기 골격체(MOF)에 특화된 대규모 언어 멀티모달 모델인 L2M³OF를 소개합니다. L2M³OF는 MOF의 구조, 텍스트 정보, 지식 그래프를 공동으로 학습하여 특성 예측 및 생성을 수행합니다. 특히 텍스트, 그래프, 수치 데이터를 공동 임베딩하여 End-to-end 학습을 가능하게 하며, MOF 가스 흡착제 설계와 같은 응용 분야에서 그 유용성을 입증합니다.
5. Zimmermann et al. (2025), “32 examples of LLM applications in materials science and chemistry”
이 논문은 소재 과학 및 화학 분야에서 LLM을 활용한 32가지 실제 적용 사례를 상세히 제시합니다. LLM이 소재 지식의 언어를 이해하고 멀티모달 통합을 통해 저데이터 환경에서도 강력한 일반화 성능을 발휘하여 연구 생산성을 획기적으로 높이고, 비전문가도 접근 가능한 자율 발견 시스템으로 이어질 수 있음을 강조합니다.
6. Zhang et al. (2025), “Large Language Model in Materials Science: Roles, Challenges, and Strategic Outlook”
이 논문은 소재 과학 분야에서 LLM의 역할, 당면한 도전 과제, 그리고 미래 전략적 전망을 종합적으로 분석합니다. LLM이 소재 지식을 효과적으로 이해하고 멀티모달 통합을 통해 저데이터 영역에서도 일반화 성능을 발휘하여 연구 생산성 향상과 자율 발견 시스템 구축에 기여할 수 있는 잠재력을 제시합니다.
7. Wang et al. (2026), “Accelerating materials discovery via AI-Agent integration...”
이 논문은 AI 에이전트 통합을 통한 소재 발견 가속화 방안을 논의합니다. LLM 기반의 에이전트 시스템이 문헌 마이닝, 구조 생성, 로보틱스 합성, 실험값 피드백에 이르는 자율 연구실(Self-Driving Lab)의 전 과정을 자동화하는 데 기여할 수 있음을 보여줍니다. 하지만 로보틱스와 연동 시 안전성 및 재현성 확보가 중요한 도전 과제임을 강조합니다.
8. CrysLLMGen 논문 (2025), “LLM Meets Diffusion: A Hybrid Framework for Crystal Material Generation”
이 논문은 결정 소재 생성을 위한 LLM과 Diffusion 모델의 하이브리드 프레임워크인 CrysLLMGen을 제안합니다. 이 프레임워크는 LLM이 초기 소재 후보를 생성하고, Diffusion 모델이 생성된 구조의 주기성과 안정성을 보장하는 방식으로 작동합니다. 이는 텍스트-구조 변환 과정에서 발생할 수 있는 환각을 최소화하고 물리적으로 타당하며 안정적인 결정 구조를 생성하는 데 기여합니다.
9. MatAgent 논문 (2025), “Accelerated inorganic materials design with generative AI agents”
이 논문은 생성형 AI 에이전트를 활용하여 무기 소재 설계를 가속화하는 MatAgent 시스템을 소개합니다. MatAgent는 LLM이 연구 계획을 수립하고, 필요한 도구를 호출하며, 로보틱스를 제어하여 자율 연구실을 구현할 수 있음을 보여줍니다. 특히, 텍스트 조건만으로 CO₂ 환원 촉매와 같은 무기 결정 구조를 제안하고 합성하는 데 적용되어, 실험 대행 에이전트와 로보틱스를 연동한 폐쇄 루프 자율 연구실 실현 가능성을 탐색합니다.
이 논문은 GNN(Graph Neural Network)과 LLM을 결합한 Hybrid-LLM-GNN 모델을 제시합니다. 이 하이브리드 접근법은 GNN으로 소재의 구조적 특성을 임베딩하고, LLM으로 텍스트 형태의 소재 지식을 통합하여 물성 예측 정확도를 25% 향상시킬 수 있음을 보여줍니다. 이는 소재 물성 예측의 한계를 극복하는 효과적인 방법론으로 제시됩니다.