S Research Trends
AI Architecture Evolution

AI 협업의 새로운 지평: Team-of-Thoughts (ToT) 혁신

단일 모델의 한계를 넘어선 지능적 오케스트레이션과 이질적 모델 간의 시너지 연구 요약

AI 기술 발전의 패러다임이 단일 대규모 모델 구축을 넘어, 추론 과정에 더 많은 계산 자원을 투입하여 성능을 극대화하는 '테스트 시간 스케일링(TTS)'으로 변화하고 있다. 그러나 아무리 강력한 단일 모델이라 할지라도 '고정된 파라미터'라는 근본적 한계를 지니며, 이는 복잡한 문제에 직면했을 때 논리적 비약이나 환각(Hallucination)으로 이어질 수 있다. 기존의 '생각의 사슬(CoT)' 방식은 모델의 추론 단계를 심화했지만, 여전히 '한 명의 전문가가 홀로 고민하는' 수준을 벗어나지 못했다. 이러한 한계를 극복하기 위해 'AI들의 팀'을 조직하는 새로운 접근법, 바로 ' Team-of-Thoughts (ToT)'가 등장하였다.

ToT는 서로 다른 학습 배경을 가진 '이질적(Heterogeneous) 모델'들을 하나의 팀으로 묶는 혁신적인 프레임워크이다. 이는 각 모델이 고유한 사전 지식(Priors)을 통해 다른 모델의 사각지대를 보완하며, 마치 오케스트라처럼 지휘자(Orchestrator)와 전문가(Tool Agents)의 역할을 분담한다. 지휘자는 문제 분석, 최적 전문가 선발, 논리 합성을 담당하고, 전문가는 할당된 영역에서 전문 추론을 수행한다. ToT는 다양한 Prior를 활용하여 솔루션 공간의 커버리지를 극대화하며, 지휘자가 필요한 전문가만 호출하여 동적으로 예산을 배분하고, 단순 투표가 아닌 지능적인 합성으로 최종 결과의 정확도를 높인다.

ToT 시스템의 작동 원리는 크게 두 단계로 나뉜다. 첫째, '오케스트레이터 캘리브레이션'을 통해 문제 유형에 가장 적합한 지휘자를 선발한다. 흥미롭게도 가장 큰 모델이 항상 최고의 지휘자가 되는 것은 아니며, 특정 과업에 최적화된 지휘 능력이 중요하게 평가된다. 둘째, 전문가들은 '자기 평가 프로토콜'을 통해 자신의 강점과 약점, 즉 숙련도(Proficiency)를 스스로 평가한다. 이 오디션 과정을 통해 지휘자는 전문가를 적재적소에 배치하고, 불필요한 토큰 비용을 절감하는 '경제적 예산 배분'을 실현한다.

"실제 문제 해결 단계에서 ToT는 지휘자의 문제 분석 및 전문가 호출, 전문가들의 '병렬 사고(Parallelism)'를 통한 동시 추론을 거쳐 최종 답안을 도출한다."

이러한 체계적인 협업은 주요 벤치마크에서 놀라운 성과를 보여주었다. 고난도 수학 과업인 AIME24에서 96.67%의 정확도를 달성하며 동질적 모델을 사용한 AgentVerse의 80%를 압도했고, 실전 코딩 과업인 LiveCodeBench에서도 72.53%의 높은 정확도를 기록했다. 이는 단순 다수결 방식이나 단일 모델의 한계를 뛰어넘어, 비용 대비 지능 효율성을 극대화한 '파레토 최전선'을 구축했음을 의미한다.

결론적으로 Team-of-Thoughts는 AI 지능의 발전이 단순히 모델 크기를 키우는 '수직적 확장'을 넘어, 다양한 전문 모델들이 조화롭게 협력하는 '수평적 조화'를 통해 완성될 수 있음을 강력히 시사한다. 이질성의 승리, 지능적 지휘, 그리고 TTS의 완성이라는 핵심 원리를 통해 ToT는 AI 오케스트레이션이라는 새로운 시대를 열고 있으며, 이는 인류의 난제 해결을 위한 AI의 역할에 대한 우리의 시각을 근본적으로 변화시킬 것이다.

관련 연구 논문

Tree of Thoughts: Deliberate Problem Solving with Large Language Models

Shunyu Yao, Dian Yu, Jeffrey Zhao, Izhak Shafran, Kevin Lin, John Gu, et al.

논문 보기

AgentVerse: Facilitating Multi-Agent Collaboration and Exploring Emergent Behaviors

Weize Chen, Yusheng Su, Xufeng Zhao, et al.

논문 보기