OpenAI, 더 저렴하지만 느린 AI 작업 위한 Flex Processing 출시

OpenAI, 더 저렴하지만 느린 AI 작업을 위한 Flex Processing 출시

OpenAI가 구글과 같은 경쟁 AI 회사들과 더욱 적극적으로 경쟁하기 위해 “Flex processing”이라는 새로운 API 옵션을 출시했습니다. Flex processing은 응답 시간이 느리고 리소스 가용성이 간헐적으로 제한되는 대신 AI 모델 사용 가격을 낮춰주는 서비스입니다.

Flex Processing이란 무엇일까요?

Flex processing은 OpenAI에서 최근 출시한 o3 및 o4-mini 추론 모델에서 베타 버전으로 사용할 수 있습니다. 이 서비스는 모델 평가, 데이터 보강 및 비동기 워크로드와 같이 우선순위가 낮은 “비프로덕션” 작업을 대상으로 합니다.

가격은 얼마나 저렴해질까요?

Flex processing은 API 비용을 정확히 절반으로 줄여줍니다.

o3 모델: Flex processing은 입력 토큰당 5달러/M, 출력 토큰당 20달러/M입니다. (기존 가격은 입력 토큰당 10달러/M, 출력 토큰당 40달러/M)
o4-mini 모델: Flex processing은 입력 토큰당 0.55달러/M, 출력 토큰당 2.20달러/M입니다. (기존 가격은 입력 토큰당 1.10달러/M, 출력 토큰당 4.40달러/M)

경쟁 심화와 가격 경쟁

Flex processing의 출시는 AI 기술 경쟁이 심화되면서 나타난 결과입니다. 경쟁사들이 더 저렴하고 효율적인 예산 중심 모델을 출시함에 따라, OpenAI도 가격 경쟁력을 확보하기 위해 노력하고 있습니다. 구글은 최근 Gemini 2.5 Flash를 출시하여 더 낮은 입력 토큰 비용으로 DeepSeek의 R1과 동등하거나 더 나은 성능을 제공합니다.

ID 인증 요구

OpenAI는 Flex pricing 출시를 발표하면서, 사용량 계층 구조에서 1~3단계 개발자는 o3에 액세스하려면 새로 도입된 ID 인증 프로세스를 완료해야 한다고 밝혔습니다. (계층은 OpenAI 서비스에 지출한 금액에 따라 결정됩니다.) o3의 추론 요약 및 스트리밍 API 지원도 인증을 거쳐야 사용할 수 있습니다. OpenAI는 이전에 ID 인증이 자사 사용 정책을 위반하는 악성 행위자를 막기 위한 것이라고 설명했습니다.