스탠퍼드 연구진, LLM 최적화 오픈소스 프레임워크 ‘OctoTools’ 공개

LLM의 한계를 극복하는 새로운 접근법

스탠퍼드 대학교 연구진이 새로운 오픈소스 프레임워크인 OctoTools를 공개했어요. 이 플랫폼은 대형 언어 모델(LLM)의 추론 능력을 향상시키는 데 초점을 맞추고 있으며, 작업을 세부 단위로 나누고 다양한 도구를 활용하는 방식으로 작동합니다. 기존에도 LLM이 외부 도구를 활용하는 방식이 연구되어 왔지만, OctoTools는 이 과정을 보다 쉽게 구현할 수 있도록 도와줍니다. 개발자와 기업이 자신만의 도구와 워크플로우를 추가할 수 있어 확장성이 뛰어난 점도 특징이에요. 실험 결과, OctoTools는 기존의 프롬프트 기법이나 다른 LLM 프레임워크보다 우수한 성능을 보였다고 합니다.

LLM과 도구 활용의 필요성

대형 언어 모델은 논리적인 사고나 여러 단계를 거쳐야 하는 문제 해결에 어려움을 겪는 경우가 많아요. 특히, 수학적 계산, 코드 실행, 웹 검색, 이미지 처리 등 특정 도메인의 전문적인 작업에서는 한계를 보이죠. 이를 해결하기 위해 LLM이 외부 도구와 협력하는 방식이 연구되고 있습니다. 예를 들어, LLM이 복잡한 수학 문제를 풀어야 한다면 자체적인 계산이 아니라 별도의 계산기 도구를 활용하는 방식이 가능하죠. 이렇게 하면 모델은 고차원적인 계획을 세우는 역할을 하고, 실제 연산은 전문 도구가 수행하는 형태가 됩니다. 하지만 도구 활용에는 몇 가지 문제점이 있어요. LLM이 새로운 도구에 적응하려면 많은 훈련 데이터가 필요하고, 특정 도메인에만 최적화되는 경우가 많습니다. 또한, 여러 개의 도구를 동시에 사용할 때 선택 과정에서 혼란이 발생하기도 하죠.

OctoTools의 핵심 기능

OctoTools는 이러한 문제를 해결하기 위해 별도의 훈련 없이도 다양한 도구를 효과적으로 조합해 사용할 수 있는 모듈형 프레임워크를 제공합니다. 어떤 일반적인 LLM이든 OctoTools의 백엔드로 활용할 수 있어 유연성도 뛰어나요. 주요 구성 요소는 다음과 같습니다.

  • 도구 카드 (Tool Cards) – 시스템이 사용할 수 있는 도구를 감싸는 역할을 하며, 입력·출력 형식, 제한 사항, 최적의 사용법 등의 메타데이터를 포함합니다.
  • 플래너 (Planner) – 입력된 프롬프트를 분석하여 목표를 설정하고, 필요한 도구를 선택한 후, 해결 과정을 계획합니다.
  • 액션 예측기 (Action Predictor) – 각 세부 목표에 적합한 도구를 매칭하여 실행 가능하고 검증 가능한 방식으로 변환합니다.
  • 명령 생성기 (Command Generator) – 계획을 Python 코드로 변환하여 실행할 수 있도록 합니다.
  • 명령 실행기 (Command Executor) – 생성된 명령을 실행하고, 단계별 결과를 반환합니다.
  • 컨텍스트 검증기 (Context Verifier) – 실행된 결과를 검토하고, 오류를 방지합니다.
  • 솔루션 요약기 (Solution Summarizer) – 최종 결과를 요약하여 사용자에게 제공합니다.

이처럼 OctoTools는 계획과 명령 실행을 분리하여 오류를 줄이고, 투명성을 높이는 방식으로 설계되었습니다. 연구진은 이를 통해 유지보수가 쉬운 시스템을 만들 수 있다고 설명합니다. 또한, OctoTools는 최적화 알고리즘을 적용해 각 작업에 필요한 도구만 선별하여 모델이 불필요한 도구를 사용하지 않도록 합니다.

다른 프레임워크와의 비교

현재 여러 기업과 연구기관에서 LLM을 활용한 프레임워크를 개발하고 있어요. 대표적으로 마이크로소프트의 AutoGen, LangChain, 그리고 OpenAI의 Function Calling 기능이 있죠. 연구진이 OctoTools와 기존 프레임워크를 비교한 결과, 시각적 문제 해결, 수학적·과학적 추론, 의학 지식 분석 등 다양한 분야에서 OctoTools가 더 높은 정확도를 기록했다고 해요. 동일한 도구를 사용했을 때, OctoTools는 AutoGen보다 평균 10.6%, GPT-Functions보다 7.5%, LangChain보다 7.3% 높은 성능을 보였다고 합니다. 이러한 성능 향상의 비결은 도구 사용의 최적화문제 해결 과정을 세부 목표로 잘 나누는 구조 때문이라고 연구진은 설명합니다.

OctoTools의 미래

OctoTools는 기업들이 복잡한 문제를 해결하는 데 LLM을 보다 효과적으로 활용할 수 있도록 돕는 실용적인 솔루션이 될 가능성이 커요. 또한, 개방형 구조를 채택해 개발자들이 원하는 도구를 쉽게 추가할 수 있다는 점도 큰 장점이죠. 현재 OctoTools의 소스코드는 GitHub에서 공개되어 있으며, 누구나 사용할 수 있도록 되어 있습니다. 앞으로 더 많은 연구와 개발이 이루어진다면 LLM 기반의 AI가 더욱 강력한 도구로 자리 잡을 것으로 기대됩니다.

위로 스크롤