OpenAI, 개발자를 위한 AI 에이전트 Codex 공개

OpenAI, 개발자를 위한 새로운 AI 소프트웨어 엔지니어링 에이전트 ‘Codex’ 연구 프리뷰 출시

OpenAI가 개발자를 위한 새로운 AI 도구를 출시했다는 소식입니다. 기존의 코드 생성 모델이었던 Codex가 완전히 새로운 형태의 소프트웨어 엔지니어링(SWE) 에이전트로 돌아왔다고 해요. 이 새로운 Codex는 여러 개발 작업을 동시에 처리할 수 있는 능력을 갖췄다고 합니다.

이 연구 프리뷰 버전은 현재 ChatGPT Pro, Enterprise, Team 사용자에게 제공되며, 곧 Plus 및 Edu 사용자에게도 지원될 예정입니다.

Codex, 모델에서 에이전트로의 진화

이번 출시는 Codex 개발에 있어 중요한 진전을 의미합니다. 2021년에 처음 등장했던 Codex는 자연어를 코드로 번역하는 모델이었어요. OpenAI의 초기 API를 통해 제공되었고, 인기 있는 코드 자동 완성 도구인 GitHub Copilot의 초기 엔진으로 사용되기도 했죠.

초기 버전은 수십억 줄의 공개 소스 코드를 학습하여 코드 생성 및 완성에 초점을 맞췄습니다. 하지만 문법 오류, 보안 취약점, 학습 데이터 편향 등의 한계도 있었습니다. 때로는 표면적으로는 올바르지만 기능적으로는 실패하는 코드를 제안하거나, 특정 프롬프트에 대해 문제가 될 수 있는 연관성을 만들기도 했어요.

그럼에도 불구하고 AI 코딩 도구가 빠르게 성장하는 제품 카테고리로 자리 잡을 만큼 충분한 가능성을 보여주었습니다. OpenAI 대변인에 따르면, 이 초기 모델은 이제 사용 중단되었고 ‘Codex’라는 이름은 새로운 제품군에 사용되고 있습니다. GitHub Copilot 역시 2023년 3월 OpenAI의 Codex 모델에서 GPT-4 기반으로 전환하며 더 깊은 IDE 통합, 채팅 기능, 더 상황 인지적인 코드 제안을 가능하게 했습니다.

에이전트의 비전

새로운 Codex는 이전 모델을 훨씬 뛰어넘습니다. 이제는 더 긴 시간 동안 자율적으로 작동하도록 구축되었으며, 다음과 같은 다양한 작업을 수행할 수 있습니다.

기능 작성
버그 수정
코드베이스 관련 질문 답변
테스트 실행
풀 리퀘스트 제안

각 작업은 안전하고 격리된 클라우드 샌드박스에서 실행됩니다.

OpenAI의 에이전트 연구팀 리더인 조쉬 토빈(Josh Tobin)은 최근 브리핑에서 “에이전트는 사용자를 대신해 더 긴 시간 동안 실제 세계와 상호작용하며 큰 작업 단위를 수행할 수 있는 AI 시스템이라고 생각한다”고 말했습니다. Codex는 이 정의에 완벽하게 부합하죠. 그는 “우리의 비전은 ChatGPT가 단순한 빠른 질문 답변을 넘어 다양한 작업을 함께 수행하는 거의 ‘가상 동료’처럼 되는 것”이라고 덧붙였습니다.

새로운 기능, 새로운 인터페이스, 새로운 워크플로우

Codex 작업은 ChatGPT의 사이드바 인터페이스를 통해 시작됩니다. 사용자는 에이전트에게 작업이나 질문을 지시할 수 있어요.

에이전트는 각 요청을 사용자의 저장소가 로드되고 개발 환경을 미러링하도록 구성된 격리된 환경에서 처리합니다. 작업 로그를 기록하고, 테스트 결과를 인용하며, 변경 사항을 요약하여 작업 과정을 추적하고 검토할 수 있게 합니다.

OpenAI의 데스크톱 및 에이전트 팀 책임자인 알렉산더 엠비리코스(Alexander Embiricos)는 브리핑에서 “Codex 에이전트는 안전하고 독립적으로 실행될 수 있는 자체 컴퓨터를 가진 클라우드 기반 소프트웨어 엔지니어링 에이전트이며, 여러 작업을 병렬로 처리할 수 있다”고 설명했습니다. 내부적으로 엔지니어들은 이미 이를 “아침 할 일 목록처럼 사용한다. Codex에 작업을 지시하고, 검토하거나 병합할 준비가 된 초안 솔루션 묶음을 확인한다”고 합니다.

Codex는 AGENTS.md 파일을 통한 구성도 지원합니다. 이는 에이전트에게 코드베이스 탐색 방법, 특정 테스트 실행 방법, 사내 코딩 스타일 규칙 등을 가르치는 프로젝트 수준의 가이드입니다. 엠비리코스는 “코드 스타일이 정확성만큼 중요하기 때문에 모델이 코드를 읽고 스타일(예: 옥스퍼드 콤마 사용 여부)을 추론하도록 훈련시켰다”고 말했습니다.

보안 및 실제 사용

Codex는 인터넷 접속 없이 사용자 제공 코드와 종속성만으로 작업을 실행합니다. 이 설계는 안전한 작동을 보장하고 잠재적 오용을 최소화합니다. 엠비리코스는 “이는 단순한 모델 API 이상이다”라며 “인간 검토가 가능한 격리된 환경에서 실행되기 때문에 모델에게 더 많은 자유를 안전하게 줄 수 있다”고 언급했습니다.

OpenAI는 초기 외부 사용 사례도 보고했습니다. 시스코(Cisco)는 제품 라인 전반의 엔지니어링 작업 가속화를 위해 Codex를 평가하고 있습니다. 템포럴(Temporal)은 디버깅 및 테스트 작성과 같은 백그라운드 작업을 실행하는 데 사용합니다. 슈퍼휴먼(Superhuman)은 테스트 커버리지를 개선하고 비엔지니어가 가벼운 코드 변경을 제안할 수 있도록 Codex를 활용합니다. 자율주행 기업 코디악(Kodiak)은 코드 신뢰성 향상 및 익숙하지 않은 스택 구성 요소에 대한 통찰력을 얻는 데 적용하고 있습니다.

OpenAI는 로컬 개발을 위한 경량 터미널 에이전트인 Codex CLI 업데이트도 함께 출시하고 있습니다. 새로운 CLI는 저지연 편집 및 Q&A에 최적화된 더 작은 모델인 codex-mini-latest를 사용합니다.

가격은 입력 토큰 100만 개당 1.50달러, 출력 토큰 100만 개당 6달러이며, 캐싱 할인 75%가 적용됩니다. Codex는 현재 출시 기간 동안 무료로 사용할 수 있으며, 향후 사용량 제한 및 온디맨드 가격 옵션이 계획되어 있습니다.

이것은 OpenAI가 Windsurf를 인수하지 않는다는 의미일까요? 🤔

Codex 출시는 AI 코딩 도구 시장의 경쟁이 심화되는 가운데 이루어졌으며, OpenAI가 다음 단계 제품을 구매하기보다는 구축하려는 의도를 보여줍니다. 최근 데이터에 따르면 개발자 대상 AI 도구 트래픽이 지난 12주 동안 75% 급증하며 코딩 어시스턴트가 실험적인 부가 기능이 아닌 필수 인프라로 자리 잡고 있음을 보여줍니다.

테크크런치와 블룸버그 보도에 따르면 OpenAI는 빠르게 성장하는 AI 개발 도구 스타트업인 커서(Cursor) 및 윈드서프(Windsurf)와 인수 협상을 진행했습니다. 커서는 협상에서 철수했고, 윈드서프는 30억 달러에 OpenAI에 인수될 것이라는 원칙적 합의에 도달했다는 보도가 있었지만, OpenAI나 윈드서프 모두 공식적으로 거래를 확인하지는 않았습니다.

실제로 바로 전날, 윈드서프는 자체 코딩 특화 기반 모델인 SWE-1 제품군을 발표했습니다. 이는 디버깅부터 장기 프로젝트 유지보수까지 전체 소프트웨어 엔지니어링 라이프사이클을 지원하도록 특별히 구축된 모델입니다.

두 회사 사이에 많은 일이 벌어지고 있을 수 있지만, 윈드서프가 자체 코딩 기반 모델을 출시한 타이밍(기존에는 Llama 변형 모델을 사용하고 OpenAI 및 Anthropic 모델을 선택적으로 사용할 수 있도록 했음)과 바로 다음 날 OpenAI가 자체 윈드서프 경쟁자로 보이는 Codex 에이전트를 출시한 타이밍은 두 회사가 곧 정렬되지 않을 수 있음을 시사하는 것처럼 보입니다. 하지만 다른 한편으로는, 이 새로운 Codex AI SWE 에이전트가 ‘연구 프리뷰’로 시작한다는 사실이 OpenAI가 윈드서프나 커서 또는 다른 회사들에게 협상 테이블로 나오도록 압력을 가하는 형태일 수도 있습니다. 윈드서프 인수 가능성 및 관련 보도에 대해 질문받았을 때, OpenAI 대변인은 그 부분에 대해 공유할 내용이 없다고 밝혔습니다.

어떤 상황이든, 엠비리코스는 Codex를 단순한 코드 도구나 어시스턴트 이상으로 보고 있습니다. 그는 “개발자들이 에이전트와 함께 일하는 방식에 지각 변동이 일어날 것이다. 실시간으로 페어링하는 것을 넘어 작업을 완전히 위임하게 될 것”이라고 말했습니다. “첫 실험은 터미널 접근 권한을 가진 추론 모델에 불과했지만, 그 경험은 마법 같았다. 그들이 우리를 위해 일을 하기 시작했다.”고 덧붙였습니다.

개인 개발자뿐만 아니라 개발팀을 위해 구축

Codex는 전문 개발자를 염두에 두고 설계되었지만, 엠비리코스는 제품 관리자조차도 인간 SWE를 투입하기 전에 변경 사항을 제안하거나 검증하는 데 유용하다는 것을 발견했다고 언급했습니다. 이러한 다재다능함은 기술 팀 전반의 생산성을 향상시키는 도구를 구축하려는 OpenAI의 전략을 반영합니다.

프로젝트 엔지니어링 리더인 트리니(Trini)는 Codex의 더 넓은 야망을 요약했습니다. “이는 소프트웨어 엔지니어가 AI 및 컴퓨터와 상호작용하는 방식에 있어 변혁적인 변화이다. 각 개인의 잠재력을 증폭시킨다.”

OpenAI는 Codex를 엔지니어가 에이전트에게 고수준 작업을 할당하고 비동기적으로 협업하는 새로운 개발 워크플로우의 중심축으로 envision하고 있습니다. 회사는 GitHub, ChatGPT 데스크톱, 이슈 트래커, CI 시스템 등과의 더 깊은 통합을 향해 나아가고 있습니다. 장기적인 목표는 실시간 페어링과 장기 작업 위임을 매끄러운 개발 경험으로 통합하는 것입니다.

조쉬 토빈이 말했듯이, “코딩은 경제 전반에 걸쳐 수많은 유용한 것들의 기반이 된다. 코딩 속도를 높이는 것은 AI의 혜택을 인류에게, 그리고 우리 자신에게 분배하는 데 특히 효과적인 방법이다.”

OpenAI가 경쟁사를 인수하든 안 하든, 메시지는 분명합니다. Codex가 등장했고, OpenAI는 자체 에이전트가 개발자 생산성의 다음 장을 이끌 것이라고 확신하고 있습니다.