오픈AI 아드바크: AI 보안의 새로운 해결사

AI, 보안 위협의 주범에서 해결사로 변신? 오픈AI의 ‘아드바크’ 등장

인공지능(AI) 기술이 현대 소프트웨어의 공격 표면을 넓히는 데 일조했다는 평가가 많습니다. 데이터 오염이나 프롬프트 인젝션(prompt injection)과 같은 AI 서비스의 취약점들이 끊임없이 제기되어 왔기 때문이죠. 그런데 최근 챗GPT(ChatGPT)를 만든 오픈AI(OpenAI)가 사이버 보안 전문가들에게 희소식을 전했습니다. 바로 GPT-5(GPT-5) 기반의 에이전트 보안 시스템인 ‘아드바크(Aardvark)’를 비공개 테스트 중이라고 발표한 것입니다.

아드바크, 소프트웨어 취약점 탐지 및 수정의 새로운 지평을 열다

오픈AI는 아드바크를 “AI 및 보안 연구의 획기적인 발전”이라고 소개했어요. 이 자율 에이전트는 개발자와 보안 팀이 대규모로 보안 취약점을 발견하고 수정하는 데 도움을 줄 수 있다고 합니다. 현재 아드바크는 현장에서 그 기능을 검증하고 개선하기 위해 비공개 베타 버전으로 제공되고 있습니다.

그렇다면 ‘소프트웨어 에이전트’란 무엇일까요? 이는 특정 작업을 해결하기 위해 다른 소프트웨어 도구에 접근할 수 있는 AI 모델을 의미합니다. 대규모 언어 모델(LLM)이 야기하는 보안 위험에 대한 수많은 연구 논문과 AI 보안 스타트업들이 등장하는 가운데, 아드바크는 이러한 문제의 일부를 해결할 수 있는 잠재력을 가지고 있습니다.

아드바크의 핵심 기능과 작동 방식

아드바크는 단순히 인간이 작성한 소프트웨어의 결함을 찾아내는 것을 넘어, 다음과 같은 다양한 기능을 수행할 수 있습니다.

지속적인 코드 저장소 스캔: 소스 코드 저장소를 지속적으로 스캔하여 취약점을 찾아냅니다.
코드 악용 가능성 테스트: 코드의 악용 가능성을 직접 테스트합니다.
심각도에 따른 버그 우선순위 지정: 발견된 버그의 심각도에 따라 우선순위를 정합니다.
수정 방안 제안: 취약점에 대한 수정 방안을 제시합니다.

오픈AI에 따르면, 아드바크는 퍼징(fuzzing)이나 소프트웨어 구성 분석(software composition analysis)과 같은 전통적인 프로그램 분석 기술에 의존하지 않는다고 해요. 대신, LLM 기반의 추론과 도구 사용을 통해 코드 동작을 이해하고 취약점을 식별합니다. 마치 인간 보안 연구원이 코드를 읽고, 분석하고, 테스트를 작성 및 실행하며, 도구를 사용하는 방식과 유사하게 버그를 찾아낸다고 설명합니다.

하지만 인간과 다른 점은, 아드바크는 멈추지 않고 계속해서 작동한다는 것입니다. 오픈AI API(Application Programming Interface) 예산 한도를 설정하거나 신용카드가 만료되지 않는 한, 끊임없이 보안 취약점을 파고들 것이라고 합니다.

놀라운 성과와 앞으로의 과제

오픈AI는 아드바크가 이미 상당한 효과를 보였다고 밝혔습니다. 몇 달 동안 오픈AI의 내부 코드베이스와 외부 알파 테스트 파트너들의 코드에서 활동하며 “의미 있는 취약점을 발견하고 오픈AI의 방어 태세에 기여했다”고 해요. 또한, ‘골든(golden)’ 저장소에 대한 벤치마크 테스트에서는 알려진 취약점과 인위적으로 삽입된 취약점의 92%를 탐지했다고 합니다.

더 나아가, 아드바크는 오픈소스 프로젝트에서 최소 10개의 CVE(Common Vulnerabilities and Exposures) 식별자에 해당하는 취약점을 찾아냈습니다. 이는 구글(Google)의 코드멘더(CodeMender) AI 시스템이 72개의 보안 수정 사항을 처리했다고 주장하거나, 구글의 OSS-퍼즈(OSS-Fuzz) 프로젝트가 1년 전 26개의 결함을 발견한 것과 비교해 볼 수 있는 수치입니다.

아드바크가 과연 “획기적인 발전”인지는 대중에게 공개되어 제로패스(ZeroPath), 소켓(Socket)과 같은 기존의 다양한 AI 기반 보안 도구들과 비교 평가될 때 더 명확해질 것입니다. AI가 소프트웨어 보안에 새로운 위협을 가져왔지만, 이제는 그 AI가 스스로 문제를 해결하려는 시도를 하고 있다는 점이 매우 흥미롭습니다. 앞으로 아드바크가 소프트웨어 보안 분야에 어떤 변화를 가져올지 기대됩니다.