S Research Trends
Special Report 2026

AI 아키텍처의 패러다임 시프트:
Team-of-Thoughts

단일 모델의 한계를 넘어, 이질적 모델들의 협력과 테스트 시간 스케일링(TTS)을 통한 새로운 지능의 지평을 탐구합니다.

AI 아키텍처는 '더 큰 모델'을 만드는 훈련 시간 스케일링에서 추론 과정에 더 많은 자원을 투입하는 테스트 시간 스케일링(TTS)으로 패러다임이 급변하고 있다. 본 보고서는 단일 모델의 한계를 극복하고 이질적인 모델들이 협력하는 'Team-of-Thoughts(ToT)' 프레임워크를 아키텍처 관점에서 분석하며, 이것이 미래 추론 시스템의 표준이 될 것임을 제시한다.

TTS는 인간의 '시스템 2' 사고처럼 중간 사고 단계를 생성하여 정답 확률 분포를 정교하게 보정한다. 이는 AI에게 '생각할 시간'을 할당함으로써 모델 내 잠재적 능력을 깨우고 복잡한 추론 문제에서 논리적 궤적을 형성하여 정답 근처의 확률 밀도를 높이는 핵심 방법이다. 그러나 단일 모델의 TTS는 고정된 파라미터의 한계에 부딪히며, 특정 영역의 지식이 없거나 편향된 모델은 아무리 오래 숙고해도 정답 공간에 도달할 수 없는 문제가 있다.

이질적 프라이어(Heterogeneous Priors)의 결합

Team-of-Thoughts(ToT)는 서로 다른 학습 배경을 가진 모델들의 전략적 결합을 통해 사각지대를 제거합니다. 복잡한 기하학적 사고, 엄밀한 산술 계산, 코드 구조화 등 각기 다른 강점을 지닌 모델들이 정답 확률을 극대화합니다.

ToT 프레임워크는 효율적인 TTS를 위해 '오케스트레이터-툴' 패러다임을 채택한다. 첫째, 오케스트레이터 보정을 통해 고정된 비용 제약 하에서 최적의 오케스트레이터를 선발한다. 둘째, 각 도구 에이전트가 자신의 능력을 스스로 감사하는 '자가 진단 프로토콜'을 수행한다. 셋째, 오케스트레이터는 이 프로필을 바탕으로 전략적 토큰 할당을 수행하여 지연 시간을 단축하고 효율을 극대화한다.

성능 분석 결과, ToT는 AIME24 벤치마크에서 96.67%라는 최고 수준의 정확도를 기록했으며, 다수결 투표 방식보다 훨씬 적은 토큰 소모만으로 더 높은 성과를 거두는 '파레토 효율성'을 입증하였다.

Core Research Papers

Foundational

Chain-of-Thought (CoT)

Chain-of-Thought Prompting Elicits Reasoning in Large Language Models. 사고의 연쇄를 통해 LLM의 추론 능력을 극대화하는 기초 연구.

View Paper
Primary focus

Team-of-Thoughts (ToT)

Efficient Test-time Scaling of Agentic Systems through Orchestrated Tool Calling. 이질적인 에이전트 시스템을 통한 고효율 추론 확장.

View Paper
Structural

Graph-of-Thoughts (GoT)

Solving Elaborate Problems with Large Language Models. 그래프 구조를 활용한 비선형적 사고 전개와 복잡한 문제 해결.

View Paper
Collaboration

AgentVerse

Facilitating Multi-Agent Collaboration and Exploring Emergent Behaviors. 멀티 에이전트 간의 협업 및 창발적 행동 분석 연구.

View Paper
"지능의 다양성이 확률적 사각지대를 메우고, 오케스트레이터가 성능과 비용의 조율자 역할을 하는 것이 미래 AI 추론 시스템의 핵심입니다."
Final Insight