구글 제미나이 2.5 프로, 코딩 성능에서 경쟁 모델 압도하다
최근 구글(Google)이 자사의 ‘가장 지능적인’ 모델로 불리는 제미나이 2.5 프로(Gemini 2.5 Pro)의 업데이트된 프리뷰 버전을 공개했습니다. 지난 3월 처음 발표되고 5월에 업그레이드된 이 모델은 몇 주 안에 정식 출시될 예정이라고 해요. 특히 이번 프리뷰 버전은 코딩 및 추론 능력에서 다른 모델들을 능가하는 성능을 보여주며 많은 기대를 모으고 있습니다.
더욱 강력해진 제미나이 2.5 프로의 성능
구글은 이번 제미나이 2.5 프로의 업데이트된 버전이 이전 ‘I/O 에디션(I/O edition)’보다 훨씬 뛰어나다고 밝혔습니다. 구글의 블로그 게시물에 따르면, 이 모델은 응답에서 더욱 창의적이며 코딩 및 추론에서 다른 모델들을 능가하는 성능을 자랑한다고 해요.
구글 딥마인드(DeepMind)의 CEO 데미스 하사비스(Demis Hassabis)는 이전 I/O 에디션이 구글의 역대 최고의 코딩 모델이라고 언급했지만, 이번에 공개된 ‘제미나이 2.5 프로 프리뷰 06-05 씽킹(Gemini 2.5 Pro Preview 06-05 Thinking)’은 그보다도 더 개선된 성능을 보여준다고 합니다. 이 안정적인 버전은 기업 규모의 역량을 지원할 준비가 되어 있다고 구글은 강조하고 있어요.
벤치마크 테스트 결과는?
새로운 제미나이 2.5 프로는 첫 출시 버전보다 훨씬 더 나은 성능을 보여주었습니다. 구글은 이 새 버전이 LMArena에서 24점, WebDevArena에서 35점 향상되어 현재 리더보드에서 1위를 차지하고 있다고 밝혔습니다.
구글의 자체 벤치마크 테스트 결과, 이 모델은 다음과 같은 경쟁 모델들을 능가하는 점수를 기록했습니다.
- 오픈AI(OpenAI)의 o3, o3-mini, o4-mini
- 앤트로픽(Anthropic)의 클로드 4 오푸스(Claude 4 Opus)
- xAI의 그록 3 베타(Grok 3 Beta)
- 딥시크(DeepSeek) R1
또한 구글은 이전 2.5 프로 버전에서 받은 피드백을 반영하여 스타일과 구조를 개선했다고 덧붙였습니다. 이제 모델은 더 창의적이고 더 나은 형식의 응답을 제공할 수 있다고 해요.
기업과 개발자를 위한 제미나이 2.5 프로
구글은 제미나이 2.5 프로의 지속적인 개선이 다소 혼란스러울 수 있지만, 이는 커뮤니티 피드백에 대한 응답이라고 설명합니다. 새로운 버전의 가격은 입력 토큰 100만 개당 1.25달러(캐싱 없음), 출력 토큰 100만 개당 10달러로 책정되었습니다.
제미나이 2.5 프로의 첫 버전이 3월에 출시되었을 때, 벤처비트(VentureBeat)의 맷 마샬(Matt Marshall)은 이를 “사용하지 않는 가장 똑똑한 모델”이라고 평가하기도 했습니다. 이후 구글은 이 모델을 ‘딥 싱크(Deep Think)’와 같은 다양한 새로운 애플리케이션 및 서비스에 통합하여, 제미나이가 응답하기 전에 여러 가설을 고려하도록 만들었습니다.
제미나이 2.5 프로와 그 두 가지 업그레이드 버전의 출시는 딥시크나 오픈AI와 같은 경쟁사들이 추론 모델로 업계의 관심을 돌린 후, 구글이 대규모 언어 모델(LLM) 분야에서 다시금 입지를 다지는 계기가 되었습니다.
개발자들의 초기 반응은?
업데이트된 제미나이 2.5 프로가 발표된 지 불과 몇 시간 만에 개발자들은 이미 이 모델을 시험해보기 시작했습니다. 많은 개발자들이 구글의 약속대로 더 빨라졌다는 점을 확인했지만, 이 최신 제미나이 2.5 프로가 실제로 더 나은 성능을 발휘하는지에 대한 최종 평가는 아직 진행 중입니다.
일부 개발자들은 다음과 같은 긍정적인 반응을 보였습니다.
- 속도 향상: 이전보다 더 빠르다고 평가합니다.
- 더 많은 출력: 생성되는 결과물의 양이 늘어났다고 합니다.
- 향상된 매크로 플레이: 여러 파일 편집이나 전반적인 개요 파악 능력이 개선되었다고 해요.
- 더 나은 출력 구조: 결과물이 더 읽기 좋게 구성된다고 합니다.
- 간결하고 덜 사과하는 태도: 이전 버전보다 더 간결하고 불필요한 사과 표현이 줄었다는 점도 긍정적인 변화로 꼽힙니다.
어떤 개발자는 앱 빌더를 사용해 게임을 만들고 테스트했는데, 이미지 생성 AI를 활용해 실시간으로 에셋을 구축하고 호스팅까지 쉽게 할 수 있었다며 “경험이 없는 사람도 사용할 수 있는 최고의 노코드 빌더”라고 극찬하기도 했습니다. 또 다른 개발자는 깊이 있는 연구에 사용했을 때 “일부 유명 모델보다 결과가 더 좋았다”고 언급했습니다.
이처럼 구글의 제미나이 2.5 프로는 지속적인 개선을 통해 AI 모델 시장에서 강력한 경쟁력을 보여주고 있습니다. 앞으로 정식 출시될 버전이 어떤 파급력을 가져올지 귀추가 주목됩니다.