일론 머스크 xAI, 최신 AI 모델 Grok 3 공개

일론 머스크의 xAI, 최신 AI 모델 Grok 3 공개

일론 머스크의 인공지능 회사인 xAI에서 최신 AI 모델인 Grok 3를 공개했습니다. iOS와 웹용 Grok 앱에도 새로운 기능이 추가되었다고 해요.

Grok 3, 어떤 모델인가?

Grok은 OpenAI의 GPT나 구글의 Gemini와 같은 모델에 대응하기 위해 xAI에서 개발한 모델입니다. 이미지 분석 및 질문 응답이 가능하며, 머스크의 소셜 네트워크 X의 여러 기능을 지원하고 있습니다. Grok 3는 몇 달 동안 개발되어 왔으며, 원래 2024년에 출시될 예정이었지만, 일정이 지연되었어요.

Grok 3, 어떻게 학습했을까?

xAI는 20만 개의 GPU를 갖춘 멤피스의 거대한 데이터 센터를 사용하여 Grok 3를 훈련했습니다. 머스크는 X에 올린 글에서 Grok 3가 이전 모델인 Grok 2보다 “10배” 더 많은 컴퓨팅 성능으로 개발되었으며, 위키피디아를 포함한 확장된 훈련 데이터 세트를 사용했다고 주장했습니다.

Grok 3의 특징

머스크는 월요일 라이브 스트리밍 프레젠테이션에서 “Grok 3는 Grok 2보다 훨씬 더 강력합니다. [그것은] 진실이 때로는 정치적으로 올바른 것과 상충되더라도 최대한 진실을 추구하는 AI입니다.”라고 말했습니다.

Grok 3는 정확히 말하면 하나의 모델이 아니라 모델 군입니다. Grok 3의 작은 버전인 Grok 3 mini는 정확도가 약간 떨어지는 대신 질문에 더 빠르게 응답합니다. 모든 모델이 아직 제공되는 것은 아니지만, 월요일부터 출시가 시작되었어요.

Grok 3의 성능

xAI는 Grok 3가 수학 문제 샘플링에서 모델의 성능을 평가하는 AIME와 박사 수준의 물리학, 생물학 및 화학 문제로 모델을 테스트하는 GPQA를 포함한 벤치마크에서 GPT-4o를 능가한다고 주장합니다. xAI에 따르면 Grok 3의 초기 버전은 Chatbot Arena에서도 경쟁력 있는 점수를 얻었습니다. Chatbot Arena는 다양한 AI 모델을 서로 경쟁시키고 사용자가 선호하는 응답에 투표하는 크라우드 소싱 테스트입니다.

Grok 3 Reasoning 모델

Grok 3의 두 가지 변형인 Grok 3 Reasoning과 Grok 3 mini Reasoning은 OpenAI의 o3-mini나 중국 AI 회사 DeepSeek의 R1과 같은 “추론” 모델과 유사하게 문제를 신중하게 “생각”할 수 있습니다. 추론 모델은 결과를 제공하기 전에 스스로 사실을 철저히 확인하여 모델을 일반적으로 곤경에 빠뜨리는 환각을 피하는 데 도움이 됩니다.

xAI는 Grok 3 Reasoning이 AIME 2025라는 최신 수학 벤치마크를 포함하여 여러 인기 벤치마크에서 o3-mini의 최고 버전인 o3-mini high를 능가한다고 주장합니다.

Grok 앱에서 Reasoning 모델 사용하기

추론 모델은 Grok 앱을 통해 액세스할 수 있습니다. 사용자는 Grok 3에게 “생각”하도록 요청하거나, 더 어려운 질문의 경우 추가적이고 신중한 추론을 위해 “Big Brain” 모드를 활용할 수 있습니다. xAI는 이러한 모드가 수학, 과학 및 코딩 관련 질문에 가장 적합하다고 설명합니다.

머스크는 AI 모델 개발자가 다른 모델에서 지식을 추출하는 데 사용하는 방법인 증류를 방지하기 위해 추론 프로세스의 일부가 가려지고 있다고 말했습니다. 최근 중국 AI 회사 DeepSeek가 자체 모델을 만들기 위해 o3-mini를 증류했다는 주장이 제기되었어요.

DeepSearch 기능

Grok의 추론 모드는 OpenAI의 Deep Research와 같은 AI 기반 “심층 연구” 도구에 대한 xAI의 답변인 DeepSearch라는 또 다른 새로운 기능과 결합됩니다. DeepSearch는 인터넷과 X를 스캔하여 정보를 분석하고 쿼리에 대한 요약을 제공합니다.

Grok 3 사용 방법 및 가격

X의 Premium+ 구독자는 Grok 3를 먼저 사용할 수 있으며, 다른 기능은 xAI가 SuperGrok이라고 부르는 구독 뒤에 숨겨져 있습니다. 월 30달러 또는 연간 300달러인 SuperGrok은 추가 추론 및 DeepSearch 쿼리를 잠금 해제하고 무제한 이미지 생성을 제공합니다.

머스크는 앞으로 약 1주일 안에 Grok이 음성 모드를 갖게 될 것이라고 말했습니다. 몇 주 후 Grok 3 모델이 xAI의 API에 도착할 예정입니다.

Grok의 과거와 미래

머스크는 약 2년 전에 Grok을 발표했을 때 AI를 엣지 있고, 필터링되지 않고, 반 “깨어 있는” 것으로 제시했습니다. 즉, 다른 AI 시스템이 답변하지 않는 논란의 여지가 있는 질문에 기꺼이 답변할 의향이 있다는 것입니다. 그는 그 약속의 일부를 이행했습니다. 예를 들어, Grok과 Grok 2는 저속하게 말하라는 지시를 받으면 기꺼이 응하여 다른 챗봇에서는 들을 수 없는 다채로운 언어를 쏟아냈습니다.

그러나 Grok 3 이전의 Grok 모델은 정치적 주제에 대해 환각을 일으키고 선을 넘지 않았습니다. 실제로 스탠포드 대학 연구원들은 Grok이 트랜스젠더 권리, 다양성 프로그램 및 불평등과 같은 주제에 대해 정치적으로 좌파 성향을 보인다는 사실을 발견했습니다.

머스크는 Grok의 행동을 Grok의 훈련 데이터인 공개 웹 페이지 때문이라고 비난하며 “Grok을 정치적으로 중립에 더 가깝게 이동”시키겠다고 약속했습니다. xAI가 그 목표를 달성했는지는 아직 명확하지 않아요.