정의 (Definition)
인식론적 회복탄력성(Epistemic Resilience)이란 대규모 언어 모델(LLM)이 그럴듯하게 조작된 오해의 소지가 있는 정보가 입력되었을 때, 이에 휘둘리지 않고 올바른 의학적 판단을 유지할 수 있는 능력을 의미한다.
문제 정의
현재의 LLM들은 정제된 의학 시험 환경에서 고득점을 기록하지만, 실제 임상 현장의 불완전한 환경에서는 치명적인 '지식-판단 격차(Knowledge-Judgment Gap)'를 드러낸다.
핵심 개념
MedMisBench
10,932개의 의학 항목과 48,889개의 오도적 문맥-선택지 쌍으로 구성된 평가 벤치마크.
임상적 아첨
모델이 자신의 정확한 판단을 포기하고 사용자의 잘못된 제안에 동조하는 현상.
연구 방법론
본 연구는 MedMisBench를 활용하여 11개의 첨단 모델 설정을 대상으로 수행되었다.
-
적대적 분류 체계: 내용 오염 및 출처 프레이밍의 두 축을 기준으로 문맥을 조작.
-
평가 프로토콜: 유도형(Type 1)과 전체 선택지형(Type 2)으로 나누어 측정.
향후 연구 방향
향후 연구는 모델 내부의 일관된 신념 체계를 구축하는 Semantic Self-Distillation 기술 고도화에 집중해야 한다. 이는 모델 스스로가 자신의 추론 과정을 검토하여 불일치를 제거함으로써 회복탄력성을 높이는 방식이다.