Annual Analysis Report 2025-2026

AI Scientist 및
AI Co-Scientist

Sakana AI와 Google DeepMind의 에이전트 기반 과학 연구 자동화 및 협업 시스템의 기술적 진보와 한계에 대한 비판적 분석

Senior AI Researcher
2026-05-28
LLM • Agentic AI

01 정의 (Definition)

Autonomous Agent

AI Scientist

기초 모델을 활용하여 연구 아이디어 도출, 문헌 검토, 실험 설계, 코드 작성, 결과 분석, 논문 작성 및 피어 리뷰까지 전 주기를 자율적으로 수행하는 "자동화된 연구자"입니다.

Collaborative Agent

AI Co-Scientist

인간과의 협력을 전제로 설계된 멀티 에이전트 시스템입니다. "생성-토론-진화" 루프를 통해 새롭고 검증 가능한 가설을 산출하는 "가상 협력자"의 역할을 수행합니다.

"연구 인지 과정 자체를 구현하는 방향으로의 진화"

핵심 개념 (Core Concepts)

에이전틱 트리 탐색 (Agentic Tree Search)

Sakana AI의 개방형 탐색 방법론입니다. 거대한 가설 공간에서 유망한 아이디어를 노드로 삼아 분기하고, 자체 평가를 통해 불필요한 가지를 쳐내며 최적의 경로를 탐색합니다.

수학적 정의

$$ P(D) = 1 - \prod_{i=1}^{N} (1 - p_i) $$

\(N\): 총 탐색 노드 수, \(p_i\): 발견 확률

멀티 에이전트 토너먼트

Google DeepMind의 핵심 구조입니다. 다수 특화 에이전트가 가설을 생성-비판(Reflection)-방어(Debate)하며 엘로 레이팅(Elo rating) 기반으로 가설을 진화시킵니다.

테스트 타임 연산 스케일링

추론 과정에서 연산량을 유연하게 늘려 과학적 발견의 품질을 극대화합니다. 탐색 깊이와 분기 계수가 늘어날수록 발견 확률 \(P(D)\)는 기하급수적으로 최적화됩니다.

서론 (Introduction)

2025년과 2026년은 인공지능이 과학적 발견의 단순한 "보조 도구"를 넘어 연구의 "주체"로 격상된 역사적 전환점입니다.

2024년 말 등장한 AI Scientist-v1을 거쳐 v2 모델은 인간의 개입 없이 생성한 논문이 ICLR 2025 워크숍에서 인간의 더블 블라인드 피어 리뷰를 통과하는 파격적인 성과를 달성했습니다.

연구 배경 및 동기 (Motivation)

  • 1

    연구 생산성 가속: 기하급수적 문헌 증가와 재현성 위기를 해결하기 위한 "저비용 창의성(Affordable Creativity)" 구현.

  • 2

    패러다임 전환: AI가 광범위한 가설 탐색 공간을 대규모로 탐색하고, 인간은 최종 방향성을 조율(Steering)하는 구조.

Objective Function

$$ h^* = \arg\max_{h \in \mathcal{H}} \left( \alpha \cdot \text{Novelty}(h) + \beta \cdot \text{Feasibility}(h) - \gamma \cdot \text{Cost}(h) \right) $$

가설의 신규성(\(\alpha\))과 타당성(\(\beta\))을 극대화하고 비용(\(\gamma\))을 최소화하는 최적의 가설 \(h^*\) 탐색

기술적 도전 과제

진정한 신규성 vs 환각

확률적 앵무새의 한계를 넘어선 패러다임 전환적 직관의 생성 여부.

Sim-to-Reality Gap

물리적 웻랩(Wet-lab) 환경에서의 무분별한 "가설 슬롭(Slop)" 위험성.

안전성 및 윤리

이중 용도 연구(Dual-use) 위험 및 AI 생성 논문의 저자성 문제.

핵심 연구 질문

  1. Q1. AI 가설의 "진정한 신규성"을 어떻게 정량화하는가?
  2. Q2. 테스트 타임 연산 확장이 발견 품질에 미치는 인과적 영향은?
  3. Q3. 개방형 탐색에서 탐색-활용(Exploration-Exploitation) 트레이드오프의 최적화 방안은?
  4. Q4. 인간-AI 혼합 팀에서 IP 및 저자성 할당을 위한 프로토콜은?

주요 방법론 및 접근 방식

Sakana AI Scientist

폐쇄 루프 자동화 파이프라인: 템플릿 없는 아이디어 도출, 코드 작성, 실험 실행, 시각화, 자체 LLM 기반 피어 리뷰까지 이어지는 완전 자동화된 프로세스를 구현합니다.

[Ideation] → [Code/Exp] → [Analysis] → [Write-up] → [Review]

DeepMind Co-Scientist

$$ R_{new} = R_{old} + K \cdot \left( S - E \right) $$

Elo Rating 기반 가설 진화 메커니즘

멀티 에이전트 연합: Generator, Reflector, Ranker 등 특화 에이전트들이 비동기적으로 작업을 수행합니다. 과학을 다윈주의적 진화 메커니즘의 최적화 문제로 다룹니다.

주요 적용 분야 (Key Applications)

기계 학습 (ML)

확산 모델, 트랜스포머 아키텍처 개선, 학습 동역학(Grokking) 등 즉각적인 코드 검증이 가능한 영역에서 가시적 성과 도출.

생물의학 (Biomedicine)

AML 약물 재창출 타겟 제안, 간 섬유화 후성유전학적 표적 발견, 세균 유전자 전달 메커니즘 인실리코 규명.

재료 과학 및 화학

A-Lab 등 로보틱스 기반 자동화 실험실과 연계하여 신소재 합성을 위한 자율 실험 계획 및 실행 최적화.

향후 발전 방향

2026년 이후의 과학적 발견 파이프라인은 인간과 AI가 공존하는 "하이브리드 공생 지능"으로 수렴할 것입니다.

나아가 클라우드 실험실 및 로보틱스와 통합된 '교차 학제간 과학 공장(Science Factories)'이 구축되어 인실리코와 웻랩의 경계가 허물어질 전망입니다. 메타 에이전트가 자체 탐색 전략을 자율 개선하는 'Self-Improving Meta-Scientists' 시대는 인류의 지능을 비약적으로 증강시킬 것입니다.

"Ethical-by-Design: 엄격한 검증과 윤리적 정렬은 필수적이다."

참고 문헌 (References)

추가 자료: Google Research Blog (2025), ICML 2026 Workshop on AI Scientists.
Scroll