Artificial Intelligence & Science

SIMPLETES:
AI 과학적 발견의 전략적 스케일링

단순한 추론을 넘어 실험과 피드백의 반복을 통해 과학적 미지를 정복하는 새로운 프레임워크를 제안합니다.

AI 과학적 발견의 가속화: SIMPLETES 프레임워크

진정한 과학적 혁신은 우연한 영감이 아닙니다. 그것은 '평가 기반의 발견 루프(Evaluation-driven discovery loop)'의 끈질긴 반복입니다.

패러다임 전환: TES(Test-time Evaluation-driven Scaling) 도입
핵심 전략: 외부 피드백을 통해 정답을 정교화하는 '전략적 시행착오' 시스템

"AI는 단순히 데이터를 암기하는 도구를 넘어, 인간 과학자의 사고 과정을 모방하는 체계적인 스케일링 파트너로 진화하고 있습니다."

MATH

핵심 공식: $$N = C \times L \times K$$

한정된 평가 예산($N$)을 세 가지 차원에 걸쳐 어떻게 전략적으로 배분하느냐가 성능의 핵심입니다.

N = C × L × K

C (Global Width)

전역적 탐색의 폭. 얼마나 많은 탐험가를 동시에 보낼 것인가?

L (Refinement Depth)

피드백 기반의 정교화 깊이. 한 조각가가 돌을 얼마나 깎을 것인가?

K (Local Sample Size)

국소적 샘플링 크기. 각 단계에서 얼마나 많은 후보군을 검증할 것인가?

🌐

변수 C: 다양성

국소 최적해(Local Optima)에 빠지는 것을 방지합니다. 초기 편향을 깨고 전역적인 탐색 범위를 확장하여 다양한 가능성을 확보합니다.

🔨

변수 L: 정교화

실행 오류나 성능 제약과 같은 피드백을 통해 답안을 수정합니다. 이 과정에서 축적된 궤적(Trajectory)은 모델의 학습 데이터가 됩니다.

🛡️

변수 K: 신뢰도

무작위 노이즈를 차단하는 필터입니다. 각 단계에서 최상의 결과만을 선택하여 탐색 과정의 순도를 유지하는 안전장치 역할을 합니다.

균형의 미학: RPUCG와 전략적 시너지

단순히 모델 크기만 키우는 '추론 중심 스케일링'은 임계치($R=0.9438$)에서 정체됩니다. SIMPLETES는 RPUCG(Graph-based PUCT Extension)를 통해 탐색과 활용 사이의 최적점을 찾아냅니다.

SOTA R = 0.9627

RISK Imbalance

불균형의 위험성

• C 부족: 발견 경로 유실
• L 부족: 최적화 통찰력 결여
• K 부족: 판단 흐림 (노이즈 오염)

과학적 승리: 주요 SOTA 성과

⚛️

Quantum Computing

Q20 라우팅 오버헤드 24.5% 감소, 실행 시간 33.2% 개선

🧬

Algorithm Engineering

Lasso Path 하이브리드 알고리즘 발견 (실행속도 약 40% 향상)

📊

Data Science

Scaling Law Discovery 지표 0.712 (GPT-5 능가)

🏆

Insight

오픈소스 gpt-oss-120b 모델로 상용 프런티어 모델 압도

결론: 인류와 AI가 함께 여는 발견의 시대

미래의 과학적 발견은 AI가 내뱉는 '우연한 정답'이 아니라, 인간과 AI가 함께 설계한 '균형 잡힌 시행착오'에서 탄생할 것입니다. 피드백을 해석하는 능력과 탐색-정교화의 조화로운 확장이 새로운 과학의 지평을 열 것입니다.

연구 더보기

SIMPLETES: AI 과학적 발견의 전략적 스케일링