OpenAI, 개발자를 위한 AI 에이전트 구축 도구 공개

OpenAI, 개발자를 위한 새로운 도구 공개

OpenAI가 개발자와 기업이 인공지능(AI) 에이전트를 더 효율적으로 구축할 수 있도록 설계된 새로운 API 및 도구 세트를 출시했습니다. 이 도구들은 OpenAI의 자체 AI 에이전트인 딥 리서치(Deep Research)와 오퍼레이터(Operator)를 구동하는 기술과 동일한 기반 위에 구축되었어요.

딥 리서치와 오퍼레이터

딥 리서치 (Deep Research): 인터넷을 독립적으로 검색하여 풍부하게 연구되고 체계적으로 정리된 인용 보고서를 개발하는 AI 에이전트입니다.
오퍼레이터 (Operator): 사용자의 텍스트 지침에 따라 웹 브라우저 커서를 자율적으로 제어하고 스포츠 티켓을 찾거나 예약을 하는 등의 작업을 수행하는 도구입니다.

이제 개발자들은 OpenAI의 강력한 AI 에이전트의 기반이 되는 구성 요소에 접근하여 자체적인 타사 경쟁 제품이나 특정 사용 사례 및 대상에 특화된 제품 및 서비스를 구축할 수 있게 되었습니다.

OpenAI의 발전과 새로운 도구

OpenAI의 추론, 멀티모달 처리 및 안전 메커니즘 분야의 최근 발전은 이러한 기능의 토대를 마련했습니다. 특히 “o” 계열의 추론 모델(o1 및 o3)이 중요한 역할을 했습니다.

OpenAI 플랫폼 제품 책임자인 올리비에 고드망(Olivier Godement)은 “추론 모델이 AI 에이전트를 활성화하는 데 얼마나 중요한지 아무리 강조해도 지나치지 않습니다. 이전의 가장 큰 제약 중 하나는 계획과 같은 장기적인 작업을 처리하는 것이었습니다.”라고 말했습니다.

하지만 OpenAI는 개발자들이 기업과 고객을 위한 생산 준비가 완료된 애플리케이션에 이러한 기능을 쉽게 구축하는 데 필요한 도구를 아직 갖추지 못했다고 판단했고, 이번에 새로운 도구를 출시하게 된 것입니다.

이러한 어려움을 해결하기 위해 OpenAI는 Responses API, 웹 및 파일 검색을 위한 내장 도구, 컴퓨터 사용 도구 및 오픈 소스 Agents SDK를 도입합니다. Responses API를 통해 개발자는 OpenAI 기술을 기반으로 에이전트를 구축할 수 있으며, Agents SDK는 에이전트를 다른 웹 도구 및 프로세스와 연결하여 사용자가 원하는 “워크플로”를 자율적으로 수행할 수 있도록 지원합니다.

이러한 도구는 광범위한 프롬프트 엔지니어링 및 사용자 지정 오케스트레이션 로직의 필요성을 줄여 AI 에이전트 개발을 간소화하는 것을 목표로 합니다. 또한 Manus, Alibaba의 Qwen, DeepSeek와 같은 중국 경쟁업체와 Anthropic 및 Google과 같은 국내 경쟁업체의 부상에도 불구하고 OpenAI의 플랫폼을 계속 구축하는 매력적인 제안이 될 것입니다.

Agents SDK: 오픈 소스 도구

OpenAI는 Agents SDK를 출시하여 오픈 소스 분야로 복귀합니다. Agents SDK는 개발자가 에이전트 워크플로를 관리, 조정 및 최적화하는 데 도움이 되도록 설계된 툴킷입니다. 경쟁업체인 Anthropic 및 Google의 모델 또는 DeepSeek, Qwen, Mistral 및 Meta의 Llama 제품군의 오픈 소스 모델과 같은 OpenAI 이외의 모델로 구동되는 에이전트도 구축할 수 있습니다.

고드망은 “Agent SDK는 오픈 소스이므로 기업은 다양한 모델을 혼합하여 사용할 수 있습니다. 우리는 누구에게도 OpenAI 모델만 사용하도록 강요하고 싶지 않습니다.”라고 말했습니다.

SDK는 다음과 같은 주요 기능을 제공합니다.

구성 가능한 에이전트: 사전 정의된 지침 및 도구 액세스 권한이 있는 AI 모델
지능형 핸드오프: 컨텍스트를 기반으로 에이전트 간에 작업을 전송하는 메커니즘
내장된 보호 장치: 입력 유효성 검사 및 콘텐츠 조정을 위한 안전 조치
추적 및 관찰 가능성: 에이전트 성능을 디버깅하고 최적화하는 도구

OpenAI의 API 팀 PM인 니쿤지 한다(Nikunj Handa)는 “Agents SDK를 사용하면 개발자는 에이전트가 수행하는 작업, 생성하는 작업, 수집하는 데이터 및 응답을 생성하는 방법을 정확하게 추적할 수 있습니다.”라고 말했습니다.

새로운 Responses API의 기능

이번 업데이트의 중심에는 OpenAI의 Chat Completions API의 기능과 Assistants API의 도구 사용 기능이 결합된 Responses API가 있습니다. Assistants API는 2026년 중반에 더 이상 사용되지 않을 예정입니다.

이 통합을 통해 개발자는 단일 API 호출 내에서 여러 내장 도구를 활용하여 복잡한 다단계 상호 작용이 필요한 애플리케이션을 더 쉽게 구축할 수 있습니다.

Responses API는 처음에는 다음과 같은 세 가지 내장 도구를 지원합니다.

웹 검색: 웹에서 정보를 가져와 실시간으로 인용된 답변을 제공합니다.
파일 검색: 메타데이터 필터링 및 최적화된 쿼리 처리를 사용하여 대규모 문서 저장소에서 관련 정보를 검색합니다.
컴퓨터 사용 도구: AI 에이전트가 검색, 데이터 입력 및 소프트웨어 인터페이스 탐색과 같은 컴퓨터에서 작업을 수행할 수 있도록 합니다.

한다(Handa)는 “Responses API를 통해 개발자는 모델이 수행하는 작업, 호출하는 도구, 호출하는 이유, 호출 전후에 내리는 결정에 대해 더 많은 가시성을 확보할 수 있습니다.”라고 말했습니다.

이러한 기능을 통해 OpenAI는 Responses API가 에이전트 애플리케이션의 기반 역할을 하여 여러 외부 통합의 필요성을 없앨 수 있다고 예상합니다. API는 오늘부터 모든 개발자가 사용할 수 있으며 사용량은 OpenAI의 표준 토큰 및 도구 요금으로 청구됩니다.

또한 OpenAI는 Chat Completions API가 계속 업데이트되지만 Responses API는 해당 상위 집합으로 간주된다고 언급합니다. 내장 도구 또는 다단계 모델 상호 작용이 필요한 개발자는 새로운 통합을 위해 Responses API를 사용해야 합니다.

OpenAI는 또한 웹 검색, 파일 검색 및 컴퓨터 사용 도구를 Responses API를 통해 직접 사용할 수 있도록 합니다. 이러한 도구를 통해 AI 에이전트는 실제 정보에 액세스하고, 문서에서 컨텍스트를 검색하고, 디지털 환경과 보다 효과적으로 상호 작용할 수 있습니다.

웹 검색: 인용과 함께 실시간 정보 제공

웹 검색 도구를 통해 개발자는 실시간 검색 기능을 애플리케이션에 통합할 수 있으므로 연구 보조원, 쇼핑 가이드 및 콘텐츠 집계 도구에 유용합니다. 응답에 대한 출처를 제공하여 사용자가 정보의 정확성을 확인할 수 있도록 합니다.

한다(Handa)는 “가장 먼저 출시하는 것은 모델이 실시간 정보에 액세스할 수 있도록 하는 웹 검색과 같은 내장 도구입니다. ChatGPT의 검색 기능을 제공하는 것과 동일한 도구이며 이제 API에 제공합니다.”라고 말했습니다.

OpenAI는 또한 API의 웹 검색 결과에 원본 소스를 클릭할 수 있는 명확한 인용문이 포함될 것이라고 확인했습니다. 개발자는 독점 데이터 소스를 포함하는 광범위한 검색 시스템의 일부로 웹 검색을 구현할 수 있습니다.

파일 검색: 개인 클라우드에서 지능형 문서 검색

파일 검색 도구를 사용하면 AI 에이전트가 대규모 문서 컬렉션에서 관련 정보를 빠르게 검색할 수 있습니다. 이 도구는 여러 파일 형식을 지원하며 보다 정확한 결과를 위해 쿼리 최적화, 메타데이터 필터링 및 사용자 지정 순위 지정과 같은 기능이 포함되어 있습니다.

한다(Handa)는 “세 번째로 출시하는 도구는 파일 검색으로, 개발자가 모든 데이터를 가져와 시스템에 저장하고 높은 정확도로 올바른 정보를 쉽게 추출할 수 있도록 합니다.”라고 설명했습니다.

파일 검색 도구의 가격은 쿼리당 1,000개당 2.50달러이며 스토리지 요금은 GB당 하루에 0.10달러입니다(첫 번째 GB는 무료).

컴퓨터 사용: OpenAI의 오퍼레이터 구동 기술

컴퓨터 사용 도구는 AI가 컴퓨터 인터페이스와 상호 작용할 수 있도록 하여 간단한 텍스트 기반 작업을 넘어 에이전트 기능을 확장합니다.

OpenAI의 컴퓨터 사용 에이전트(CUA) 모델로 구동되는 이 도구는 AI에서 생성된 작업을 실행 가능한 명령으로 변환하여 데이터 입력 및 웹 탐색과 같은 작업의 자동화를 지원합니다.

한다(Handa)는 “또한 작업에 대한 기존 API가 없는 경우 모델이 그래픽 사용자 인터페이스와 상호 작용할 수 있도록 하는 컴퓨터 사용 도구를 출시합니다.”라고 언급했습니다.

컴퓨터 사용 도구는 현재 사용량 계층 3-5의 일부 개발자를 위한 연구 미리보기로 제공됩니다. 가격은 입력 토큰 100만 개당 3달러, 출력 토큰 100만 개당 12달러로 설정됩니다.

기업 리더에게 미치는 영향

IT 팀 리더, CTO 및 워크플로 최적화를 원하는 중간 관리자의 경우 OpenAI의 새로운 도구는 광범위한 사용자 지정 개발 없이 AI 기반 프로세스를 자동화하고 확장할 수 있는 명확한 경로를 제공합니다.

내장된 웹 검색 및 파일 검색 기능을 통해 기업은 AI 기반 정보 검색을 기존 시스템에 빠르게 통합할 수 있으며, 컴퓨터 사용 도구를 통해 API 액세스가 없는 레거시 애플리케이션과의 자동화된 상호 작용이 가능합니다.

오픈 소스 Agents SDK는 조직이 팀 간에 AI 기반 워크플로를 조정할 수 있도록 지원하여 고객 지원, 문서 처리 및 시장 조사와 같은 영역에서 효율성을 향상시키는 에이전트를 더 쉽게 배포할 수 있도록 합니다.

엔터프라이즈 보안 및 관찰 가능성이 이러한 도구에 내장되어 있으므로 의사 결정자는 투명성과 제어력이 향상된 AI 솔루션을 채택하여 대규모로 규정 준수 및 성능 모니터링을 보장할 수 있습니다.

다음 단계는?

OpenAI는 이러한 새로운 릴리스를 AI 에이전트를 위한 포괄적인 플랫폼을 구축하는 첫 번째 단계로 보고 있습니다. OpenAI는 개발자가 에이전트 애플리케이션을 보다 효과적으로 배포, 평가 및 확장할 수 있도록 돕기 위해 앞으로 몇 달 안에 추가 도구 및 통합을 출시할 계획입니다.

고드망은 “앞으로 몇 달이 점점 더 많은 에이전트를 대규모로 배포하는 데 매우 중요할 것이라고 생각합니다. 우리는 이미 딥 리서치와 같은 자사 에이전트로 이를 수행했지만 OpenAI는 모든 에이전트를 구축하지 않을 것입니다. 이것이 바로 개발자 플랫폼이 있는 이유입니다.”라고 말했습니다.

OpenAI는 또한 프롬프트 주입 및 무단 데이터 액세스에 대한 보호 장치를 포함하여 에이전트 애플리케이션의 안전 기능을 계속 개선할 것이라고 밝혔습니다.

새로운 도구로 구축하는 데 관심이 있는 개발자는 OpenAI의 설명서 및 API 플레이그라운드를 탐색하여 오늘 시작할 수 있습니다.