인공지능 모델, 무엇을 하고 어떻게 사용할까?
최근 인공지능(AI, Artificial Intelligence) 모델이 정말 빠른 속도로 쏟아져 나오고 있어요. 구글(Google) 같은 대기업부터 오픈AI(OpenAI), 앤트로픽(Anthropic) 같은 스타트업까지, 모두가 AI 모델 개발에 열을 올리고 있죠. 이렇게 쏟아지는 최신 모델들을 따라잡기가 쉽지 않아요.
더 혼란스러운 건, AI 모델들이 업계 벤치마크를 기준으로 홍보되는 경우가 많다는 점이에요. 하지만 이런 기술적인 지표들은 실제 사용자들이 어떻게 사용하는지에 대해선 별로 알려주지 않아요.
그래서 테크크런치(TechCrunch)에서 2024년 이후에 출시된 가장 발전된 AI 모델들을 모아서, 사용 방법과 가장 잘하는 것들에 대한 정보를 정리했어요. 이 리스트는 계속 업데이트될 예정이라고 하니 참고하면 좋을 것 같아요.
사실 세상에는 수백만 개의 AI 모델이 존재해요. 예를 들어, 허깅 페이스(Hugging Face)에는 140만 개가 넘는 모델이 있다고 하네요. 그래서 이 리스트가 모든 모델을 다루지는 못할 수도 있고, 어떤 면에서는 더 뛰어난 모델이 있을 수도 있다는 점을 감안해야 해요.
2025년에 출시된 AI 모델
코히어의 아야 비전 (Cohere’s Aya Vision)
코히어(Cohere)는 아야 비전(Aya Vision)이라는 멀티모달 모델을 출시했는데, 이미지 캡셔닝이나 사진에 대한 질문에 답하는 데 최고라고 주장하고 있어요. 다른 모델들과는 달리 영어 외의 다른 언어에도 뛰어나다고 하네요. 왓츠앱(WhatsApp)에서 무료로 사용할 수 있다고 합니다.
오픈AI의 GPT 4.5 ‘오리온’ (OpenAI’s GPT 4.5 ‘Orion’)
오픈AI는 오리온(Orion)을 현재까지 가장 큰 모델이라고 부르며, 강력한 “세계 지식”과 “감성 지능”을 자랑하고 있어요. 하지만 최신 추론 모델에 비해 특정 벤치마크에서는 성능이 떨어진다고 합니다. 오리온은 오픈AI의 월 200달러 요금제 가입자에게 제공됩니다.
클로드 소넷 3.7 (Claude Sonnet 3.7)
앤트로픽은 이것이 업계 최초의 ‘하이브리드’ 추론 모델이라고 말하는데, 빠른 답변과 깊이 있는 사고가 모두 가능하기 때문이라고 해요. 또한 사용자가 모델이 얼마나 오래 생각할 수 있는지 제어할 수 있다고 합니다. 소넷 3.7은 모든 클로드 사용자에게 제공되지만, 더 많은 사용자는 월 20달러의 프로 요금제가 필요합니다.
xAI의 그록 3 (xAI’s Grok 3)
그록 3은 일론 머스크(Elon Musk)가 설립한 스타트업 xAI의 최신 플래그십 모델이에요. 수학, 과학, 코딩에서 다른 주요 모델보다 성능이 뛰어나다고 주장하고 있습니다. 이 모델을 사용하려면 X 프리미엄(월 50달러)이 필요해요. 한 연구에서 그록 2가 좌파 성향을 보인다는 결과가 나온 후, 머스크는 그록을 더 “정치적으로 중립적”으로 만들겠다고 약속했지만, 아직 달성되었는지는 불분명합니다.
오픈AI o3-미니 (OpenAI o3-mini)
이것은 오픈AI의 최신 추론 모델이며, 코딩, 수학, 과학과 같은 STEM 관련 작업에 최적화되어 있어요. 오픈AI의 가장 강력한 모델은 아니지만, 크기가 작기 때문에 비용이 훨씬 저렴하다고 합니다. 무료로 사용할 수 있지만, 많은 사용자는 구독이 필요합니다.
오픈AI 딥 리서치 (OpenAI Deep Research)
오픈AI의 딥 리서치(Deep Research)는 명확한 출처와 함께 특정 주제에 대한 심층적인 연구를 수행하도록 설계되었어요. 이 서비스는 ChatGPT의 월 200달러 프로 구독에서만 사용할 수 있습니다. 오픈AI는 과학에서 쇼핑 연구에 이르기까지 모든 것에 추천하지만, AI의 환각(hallucinations) 문제가 여전히 남아 있다는 점을 주의해야 합니다.
미스트랄 르 챗 (Mistral Le Chat)
미스트랄(Mistral)은 멀티모달 AI 개인 비서인 르 챗(Le Chat)의 앱 버전을 출시했어요. 미스트랄은 르 챗이 다른 챗봇보다 더 빠르게 응답한다고 주장합니다. 또한 AFP의 최신 저널리즘을 제공하는 유료 버전도 있습니다. 르 몽드(Le Monde)의 테스트 결과 르 챗의 성능은 인상적이었지만, ChatGPT보다 오류가 더 많았습니다.
오픈AI 오퍼레이터 (OpenAI Operator)
오픈AI의 오퍼레이터(Operator)는 식료품 구매를 돕는 것과 같이 독립적으로 작업을 수행할 수 있는 개인 인턴을 의미합니다. 월 200달러의 ChatGPT 프로 구독이 필요해요. AI 에이전트는 많은 가능성을 가지고 있지만, 여전히 실험적인 단계에 있습니다. 워싱턴 포스트(Washington Post)의 한 리뷰어는 오퍼레이터가 리뷰어의 신용카드로 31달러에 달하는 달걀 12개를 스스로 주문했다고 합니다.
구글 제미니 2.0 프로 익스페리멘탈 (Google Gemini 2.0 Pro Experimental)
구글 제미니(Google Gemini)의 많은 기대를 모으고 있는 플래그십 모델은 코딩과 일반 지식 이해에 뛰어나다고 합니다. 또한 2백만 토큰의 매우 긴 컨텍스트 창을 가지고 있어, 대량의 텍스트를 빠르게 처리해야 하는 사용자에게 도움이 됩니다. 이 서비스를 사용하려면 최소 월 19.99달러의 구글 원 AI 프리미엄 구독이 필요합니다.
2024년에 출시된 AI 모델
딥시크 R1 (DeepSeek R1)
이 중국 AI 모델은 실리콘 밸리(Silicon Valley)를 강타했어요. 딥시크(DeepSeek)의 R1은 코딩과 수학에서 뛰어난 성능을 보이며, 오픈 소스 특성상 누구나 로컬에서 실행할 수 있습니다. 게다가 무료입니다. 하지만 R1은 중국 정부의 검열을 통합하고 있으며, 사용자 데이터를 중국으로 다시 보낼 가능성 때문에 금지 조치가 증가하고 있습니다.
제미니 딥 리서치 (Gemini Deep Research)
딥 리서치(Deep Research)는 구글의 검색 결과를 간단하고 잘 인용된 문서로 요약해 줍니다. 이 서비스는 학생이나 빠른 연구 요약이 필요한 모든 사람에게 유용합니다. 하지만 그 품질은 실제 동료 평가를 거친 논문만큼 좋지는 않습니다. 딥 리서치를 사용하려면 월 19.99달러의 구글 원 AI 프리미엄 구독이 필요합니다.
메타 라마 3.3 70B (Meta Llama 3.3 70B)
이것은 메타(Meta)의 오픈 소스 라마(Llama) AI 모델의 최신이자 가장 발전된 버전입니다. 메타는 이 버전을 수학, 일반 지식, 지시 따르기에 가장 저렴하고 효율적인 버전이라고 홍보하고 있습니다. 무료이며 오픈 소스입니다.
오픈AI 소라 (OpenAI Sora)
소라(Sora)는 텍스트를 기반으로 현실적인 비디오를 만드는 모델입니다. 클립뿐만 아니라 전체 장면을 생성할 수 있지만, 오픈AI는 종종 “비현실적인 물리”를 생성한다고 인정합니다. 현재 ChatGPT의 유료 버전에서만 사용할 수 있으며, 플러스(Plus)부터 시작하여 월 20달러입니다.
알리바바 큐웬 QwQ-32B-프리뷰 (Alibaba Qwen QwQ-32B-Preview)
이 모델은 특정 산업 벤치마크에서 오픈AI의 o1에 필적하는 몇 안 되는 모델 중 하나이며, 수학과 코딩에서 뛰어난 성능을 보입니다. “추론 모델”이라는 이름과는 달리, “상식 추론에는 개선의 여지가 있다”고 알리바바(Alibaba)는 말합니다. 또한 중국 정부의 검열을 통합하고 있다고 테크크런치 테스트에서 밝혀졌습니다. 무료이며 오픈 소스입니다.
앤트로픽의 컴퓨터 사용 (Anthropic’s Computer Use)
클로드(Claude)의 컴퓨터 사용(Computer Use)은 코딩이나 비행기 티켓 예약과 같은 작업을 완료하기 위해 컴퓨터를 제어하는 것을 의미하며, 오픈AI의 오퍼레이터의 전신입니다. 그러나 컴퓨터 사용은 여전히 베타 단계에 있습니다. 가격은 API를 통해 책정되며, 입력 100만 토큰당 0.80달러, 출력 100만 토큰당 4달러입니다.
x.AI의 그록 2 (x.AI’s Grok 2)
일론 머스크의 AI 회사인 x.AI는 플래그십 챗봇인 그록 2의 향상된 버전을 출시했는데, “3배 더 빠르다”고 주장합니다. 무료 사용자는 그록에서 2시간마다 10개의 질문으로 제한되는 반면, X의 프리미엄 및 프리미엄+ 요금제 가입자는 더 높은 사용 제한을 누릴 수 있습니다. x.AI는 또한 일부 그래픽 또는 폭력적인 콘텐츠를 포함하여 매우 사실적인 이미지를 생성하는 이미지 생성기인 오로라(Aurora)를 출시했습니다.
오픈AI o1 (OpenAI o1)
오픈AI의 o1 제품군은 숨겨진 추론 기능을 통해 응답을 “생각”함으로써 더 나은 답변을 생성하는 것을 목표로 합니다. 이 모델은 코딩, 수학, 안전에서 뛰어난 성능을 보인다고 오픈AI는 주장하지만, 인간을 속이는 데에도 문제가 있습니다. o1을 사용하려면 월 20달러의 ChatGPT 플러스를 구독해야 합니다.
앤트로픽의 클로드 소넷 3.5 (Anthropic’s Claude Sonnet 3.5)
클로드 소넷 3.5는 앤트로픽이 동급 최고라고 주장하는 모델입니다. 코딩 기능으로 유명해졌으며, 기술 업계 내부자들이 선호하는 챗봇으로 여겨집니다. 이 모델은 클로드에서 무료로 액세스할 수 있지만, 많은 사용자는 월 20달러의 프로 구독이 필요합니다. 이미지를 이해할 수 있지만, 생성할 수는 없습니다.
오픈AI GPT 4o-미니 (OpenAI GPT 4o-mini)
오픈AI는 GPT 4o-미니를 작은 크기 덕분에 가장 저렴하고 빠른 모델이라고 홍보했습니다. 고객 서비스 챗봇과 같은 광범위한 작업을 지원하는 것을 목표로 합니다. 이 모델은 ChatGPT의 무료 티어에서 사용할 수 있습니다. 더 복잡한 작업에 비해 대량의 간단한 작업에 더 적합합니다.
코히어 커맨드 R+ (Cohere Command R+)
코히어의 커맨드 R+ 모델은 기업을 위한 복잡한 검색 증강 생성(Retrieval-Augmented Generation, RAG) 애플리케이션에서 뛰어난 성능을 보입니다. 즉, 특정 정보를 매우 잘 찾고 인용할 수 있습니다. (RAG의 발명가는 실제로 코히어에서 일하고 있습니다.) 그럼에도 불구하고 RAG는 AI의 환각 문제를 완전히 해결하지는 못합니다.