구글 제미나이 완벽 분석: 특징, 활용법, 경쟁 모델 비교

구글 제미나이(Gemini)에 대한 모든 것: 생성형 AI 모델 완벽 분석

구글이 야심차게 내놓은 제미나이(Gemini)는 생성형 AI 모델, 앱, 서비스의 집합체입니다. 제미나이가 무엇이고, 어떻게 활용할 수 있으며, 오픈AI(OpenAI), 메타(Meta), 마이크로소프트(Microsoft) 같은 다른 AI 도구들과 비교했을 때 어떤 차별성을 가지는지 궁금하신가요?

제미나이의 최신 동향을 쉽게 따라갈 수 있도록, 새로운 모델, 기능, 구글의 계획에 대한 소식이 나올 때마다 업데이트될 가이드를 준비했습니다.

제미나이란 무엇일까요?

제미나이는 구글의 차세대 생성형 AI 모델입니다. 구글의 AI 연구소인 딥마인드(DeepMind)와 구글 리서치(Google Research)에서 개발되었으며, 다음과 같이 네 가지 버전으로 제공됩니다.

  • 제미나이 울트라(Gemini Ultra): 매우 큰 모델입니다.
  • 제미나이 프로(Gemini Pro): 울트라보다는 작지만, 여전히 큰 모델입니다. 최신 버전인 제미나이 2.0 프로 익스페리멘탈(Gemini 2.0 Pro Experimental)은 구글의 주력 모델입니다.
  • 제미나이 플래시(Gemini Flash): 프로의 더 빠르고 “압축된” 버전입니다. 약간 더 작고 빠른 버전인 제미나이 플래시-라이트(Gemini Flash-Lite)와 추론 능력을 갖춘 제미나이 플래시 씽킹 익스페리멘탈(Gemini Flash Thinking Experimental)도 있습니다.
  • 제미나이 나노(Gemini Nano): 두 개의 작은 모델로, 나노-1(Nano-1)과 약간 더 강력한 나노-2(Nano-2)가 있으며, 오프라인에서 실행되도록 설계되었습니다.

모든 제미나이 모델은 텍스트뿐만 아니라 다양한 데이터를 다루고 분석할 수 있도록 설계되었습니다. 구글에 따르면, 다양한 공개 데이터, 독점 데이터, 라이선스된 오디오, 이미지, 비디오, 코드베이스, 다양한 언어의 텍스트로 사전 훈련 및 미세 조정되었습니다.

이는 텍스트 데이터만으로 훈련된 LaMDA와 같은 모델과 제미나이를 차별화하는 요소입니다. LaMDA는 텍스트 외에는 이해하거나 생성할 수 없지만, 제미나이 모델은 그렇지 않습니다.

공개 데이터를 모델 훈련에 사용하는 것은 논란의 여지가 있습니다. 데이터 소유자의 지식이나 동의 없이 사용되는 경우도 있기 때문입니다. 구글은 특정 구글 클라우드(Google Cloud) 고객을 소송으로부터 보호하는 정책을 가지고 있지만, 예외 조항도 있습니다. 특히 상업적으로 제미나이를 사용하려는 경우 주의해야 합니다.

제미나이 앱과 제미나이 모델의 차이점은 무엇일까요?

제미나이는 웹과 모바일에서 사용할 수 있는 제미나이 앱과는 별개입니다.

제미나이 앱은 다양한 제미나이 모델에 연결되어 챗봇과 유사한 인터페이스를 제공하는 클라이언트입니다. 챗GPT(ChatGPT)나 앤트로픽(Anthropic)의 클로드(Claude)처럼 구글의 생성형 AI를 위한 프론트엔드라고 생각하면 됩니다.

웹에서 제미나이는 gemini.google.com에서 사용할 수 있습니다. 안드로이드(Android)에서는 제미나이 앱이 기존의 구글 어시스턴트(Google Assistant) 앱을 대체합니다. iOS에서는 구글 앱(Google app)이 해당 플랫폼의 제미나이 클라이언트 역할을 합니다.

안드로이드에서는 화면에 표시된 내용에 대해 질문하기 위해 모든 앱 위에 제미나이 오버레이를 표시할 수도 있습니다. 스마트폰의 전원 버튼을 길게 누르거나 “Hey Google”이라고 말하면 오버레이가 나타납니다.

제미나이 앱은 이미지, 음성 명령, 텍스트는 물론 PDF와 같은 파일, 곧 비디오까지 업로드하거나 구글 드라이브(Google Drive)에서 가져와서 이미지를 생성할 수 있습니다. 모바일에서 제미나이 앱과 나눈 대화는 웹의 제미나이로 이어집니다.

제미나이 어드밴스드(Gemini Advanced)

제미나이 모델의 도움을 받을 수 있는 방법은 제미나이 앱뿐만이 아닙니다. 점진적으로 제미나이의 기능이 Gmail, 구글 문서(Google Docs)와 같은 주요 구글 앱과 서비스에 통합되고 있습니다.

이러한 기능을 활용하려면 구글 원 AI 프리미엄 플랜(Google One AI Premium Plan)이 필요합니다. 엄밀히 말하면 구글 원(Google One)의 일부인 AI 프리미엄 플랜은 월 20달러이며, 문서, 지도(Maps), 프레젠테이션(Slides), 스프레드시트(Sheets), 드라이브, 미트(Meet)와 같은 구글 워크스페이스(Google Workspace) 앱에서 제미나이를 사용할 수 있게 해줍니다. 또한 구글이 제미나이 어드밴스드라고 부르는 기능을 활성화하여 더 정교한 제미나이 모델을 제미나이 앱에서 사용할 수 있습니다.

제미나이 어드밴스드 사용자는 새로운 기능에 대한 우선 액세스, 제미나이에서 직접 파이썬(Python) 코드를 실행하고 편집하는 기능, 더 큰 “컨텍스트 창”과 같은 추가 혜택을 누릴 수 있습니다. 제미나이 어드밴스드는 대화에서 약 75만 단어(또는 1,500페이지 분량의 문서)의 내용을 기억하고 추론할 수 있습니다. 이는 일반 제미나이 앱이 처리할 수 있는 24,000단어(또는 48페이지)에 비해 훨씬 큰 용량입니다.

제미나이 어드밴스드는 또한 “고급 추론” 및 “긴 컨텍스트 기능”을 사용하여 연구 보고서를 생성하는 구글의 딥 리서치(Deep Research)에 대한 액세스를 제공합니다. 챗봇에 프롬프트를 입력하면 다단계 연구 계획을 수립하고 승인을 요청한 다음, 제미나이가 몇 분 동안 웹을 검색하여 쿼리를 기반으로 광범위한 보고서를 생성합니다. 이는 “주방을 재설계하는 데 도움을 줄 수 있나요?”와 같은 더 복잡한 질문에 답변하기 위한 것입니다.

구글은 또한 제미나이 어드밴스드 사용자에게 챗봇이 현재 대화에 대한 컨텍스트로 이전 제미나이와의 대화를 사용할 수 있도록 하는 “메모리(Memory)”를 제공합니다. 제미나이 어드밴스드 사용자는 또한 PDF를 AI 생성 팟캐스트로 변환하는 회사 제품인 노트북LM(NotebookLM)의 사용량이 증가합니다.

제미나이 어드밴스드 사용자는 어려운 코딩 및 수학 문제에 최적화된 회사의 주력 모델인 제미나이 2.0 프로의 실험 버전에도 액세스할 수 있습니다.

또 다른 제미나이 어드밴스드 독점 기능은 구글 검색(Google Search)의 여행 계획 기능으로, 프롬프트에서 맞춤형 여행 일정을 만듭니다. 항공편 시간(사용자의 Gmail 받은 편지함의 이메일에서), 식사 선호도, 지역 명소에 대한 정보(구글 검색 및 지도 데이터에서)와 같은 요소를 고려하여 명소 간의 거리는 물론 제미나이는 변경 사항을 반영하기 위해 자동으로 업데이트되는 일정을 생성합니다.

구글 서비스 전반의 제미나이는 또한 구글 워크스페이스용 애드온인 제미나이 비즈니스(Gemini Business)와 회의 메모 작성 및 번역된 캡션은 물론 문서 분류 및 라벨링을 추가하는 제미나이 엔터프라이즈(Gemini Enterprise)의 두 가지 플랜을 통해 기업 고객에게 제공됩니다. 제미나이 비즈니스는 사용자당 월 6달러부터 시작하며, 제미나이 엔터프라이즈는 일반적으로 더 비싸지만 비즈니스 요구 사항에 따라 가격이 책정됩니다. (두 플랜 모두 연간 약정이 필요합니다.)

Gmail, 문서, 크롬(Chrome), 개발 도구 등에서의 제미나이

Gmail에서 제미나이는 이메일을 작성하고 메시지 스레드를 요약할 수 있는 사이드 패널에 있습니다. 문서에서도 동일한 패널을 찾을 수 있으며, 콘텐츠를 작성하고 개선하며 새로운 아이디어를 브레인스토밍하는 데 도움이 됩니다. 프레젠테이션의 제미나이는 슬라이드와 맞춤 이미지를 생성합니다. 그리고 구글 스프레드시트의 제미나이는 데이터를 추적하고 구성하여 테이블과 수식을 만듭니다.

구글의 AI 챗봇은 커피숍에 대한 리뷰를 요약하거나 외국 도시를 방문하는 데 하루를 보내는 방법에 대한 추천을 제공할 수 있습니다.

제미나이의 범위는 드라이브로 확장되어 파일과 폴더를 요약하고 프로젝트에 대한 빠른 정보를 제공할 수 있습니다. 한편 미트에서는 제미나이가 캡션을 다른 언어로 번역합니다.

크롬에는 AI 글쓰기 도구 형태의 제미나이가 있습니다. 완전히 새로운 것을 작성하거나 기존 텍스트를 다시 작성하는 데 사용할 수 있습니다. 구글은 추천을 하기 위해 사용자가 있는 웹 페이지를 고려할 것이라고 말합니다.

다른 곳에서는 구글의 애드(Ads), 애널리틱스(Analytics), 클라우드(Cloud)(버텍스 AI(Vertex AI) 및 AI 스튜디오(AI Studio) 포함)는 물론 자연어 검색 쿼리를 처리하는 웨이즈(Waze), 비디오 아이디어를 브레인스토밍하는 데 도움이 되는 유튜브(YouTube), 안드로이드 스튜디오(Android Studio)와 같은 앱에서 제미나이의 힌트를 찾을 수 있습니다.

코드 완성 및 생성을 위한 구글의 AI 기반 지원 도구 모음인 프로젝트 스타라인(Project Starline)(이전에는 코드y(Codey))은 제미나이에 과도한 계산 작업을 오프로드하고 있습니다. 위협 인텔리전스(Threat Intelligence)의 제미나이와 같은 구글의 사이버 보안 도구도 마찬가지입니다. 위협 인텔리전스(Threat Intelligence)의 제미나이는 잠재적으로 악성 코드의 큰 부분을 분석하고 사용자가 진행 중인 위협 또는 손상 지표에 대한 자연어 검색을 수행할 수 있도록 합니다.

제미나이 확장 및 젬스(Gems)

구글 I/O 2024에서 발표된 젬스는 제미나이 모델로 구동되는 맞춤형 챗봇입니다. 젬스는 “당신은 저의 러닝 코치입니다. 매일 러닝 계획을 세워주세요”와 같은 자연어 설명에서 생성할 수 있으며 다른 사람과 공유하거나 비공개로 유지할 수 있습니다.

젬스는 데스크톱과 모바일에서 150개국과 대부분의 언어로 사용할 수 있습니다. 결국 구글 캘린더(Google Calendar), 작업(Tasks), 킵(Keep), 유튜브 뮤직(YouTube Music)을 포함한 확장된 구글 서비스 통합 세트를 활용하여 맞춤형 작업을 완료할 수 있습니다.

통합에 대해 말하자면, 웹 및 모바일의 제미나이 앱은 구글이 “제미나이 확장”이라고 부르는 것을 통해 구글 서비스를 활용할 수 있습니다. 제미나이는 오늘날 구글 드라이브, Gmail, 유튜브와 통합되어 “최근 3개의 이메일을 요약해 주시겠어요?”와 같은 쿼리에 응답합니다. 올해 말에는 제미나이가 구글 캘린더, 킵, 작업, 유튜브 뮤직 및 유틸리티(타이머 및 알람, 미디어 컨트롤, 손전등, 볼륨, Wi-Fi, 블루투스와 같은 장치 내 기능을 제어하는 안드로이드 전용 앱)로 추가 작업을 수행할 수 있습니다.

제미나이 라이브(Gemini Live) 심층 음성 채팅

제미나이 라이브를 통해 사용자는 제미나이와 “심층” 음성 채팅을 할 수 있습니다. 모바일의 제미나이 앱과 gemini.google.com에서 사용할 수 있으며, 휴대폰이 잠겨 있을 때도 액세스할 수 있습니다.

제미나이 라이브가 활성화되면 챗봇이 말하는 동안(여러 가지 새로운 음성 중 하나로) 제미나이를 중단하여 명확한 질문을 할 수 있으며 실시간으로 사용자의 음성 패턴에 적응합니다. 어느 시점에는 제미나이가 시각적 이해력을 얻어 스마트폰 카메라로 캡처한 사진이나 비디오를 통해 주변 환경을 보고 응답할 수 있을 것입니다.

라이브는 또한 일종의 가상 코치 역할을 하도록 설계되어 이벤트 리허설, 아이디어 브레인스토밍 등을 돕습니다. 예를 들어 라이브는 다가오는 직업 또는 인턴십 인터뷰에서 강조할 기술을 제안할 수 있으며 대중 연설 조언을 제공할 수 있습니다.

이미지3(Imagen 3)를 통한 이미지 생성

제미나이 사용자는 구글의 내장 이미지 생성 모델인 이미지3를 사용하여 아트워크와 이미지를 생성할 수 있습니다.

구글은 이미지3가 이전 모델인 이미지2(Imagen 2)에 비해 이미지를 번역하는 텍스트 프롬프트를 더 정확하게 이해할 수 있으며 세대에서 더 “창의적이고 상세하다”고 말합니다. 또한 이 모델은 더 적은 아티팩트와 시각적 오류를 생성하며(적어도 구글에 따르면) 텍스트 렌더링에 가장 적합한 이미지 모델입니다.

2024년 2월에 구글은 사용자들이 불만을 제기한 후 사람들의 이미지를 생성하는 제미나이의 기능을 중단해야 했습니다. 그러나 8월에 회사는 특정 사용자, 특히 구글의 유료 제미나이 플랜(예: 구글 원 AI 프리미엄) 중 하나에 가입한 영어 사용자에게 파일럿 프로그램의 일부로 사람 생성을 다시 도입했습니다.

10대를 위한 제미나이

6월에 구글은 학생들이 구글 워크스페이스 포 에듀케이션(Google Workspace for Education) 학교 계정을 통해 가입할 수 있도록 10대 중심의 제미나이를 도입했습니다.

10대 중심의 제미나이는 맞춤형 온보딩 프로세스 및 (구글이 표현한 대로) “10대가 AI를 책임감 있게 사용하도록 돕는” “AI 리터러시 가이드”를 포함하여 “추가 정책 및 보호 장치”를 갖추고 있습니다. 그렇지 않으면 제미나이의 응답이 정확한지 확인하기 위해 웹 전체를 살펴보는 “이중 확인” 기능에 이르기까지 표준 제미나이 경험과 거의 동일합니다.

스마트 홈 장치의 제미나이

점점 더 많은 구글 제작 장치가 향상된 기능을 위해 제미나이를 활용하고 있습니다.

구글 TV 스트리머(Google TV Streamer)에서 제미나이는 사용자의 구독 전반에 걸쳐 콘텐츠 제안을 큐레이팅하고 리뷰와 전체 TV 시즌을 요약하기 위해 사용자의 선호도를 사용합니다.

최신 네스트 온도 조절기(Nest thermostat)(네스트 스피커, 카메라 및 스마트 디스플레이)에서 제미나이는 곧 구글 어시스턴트의 대화 및 분석 기능을 강화할 것입니다.

올해 말 구글 원 AI 프리미엄 플랜 구독자는 네스트 카메라 영상에 대한 AI 설명, 자연어 비디오 검색 및 권장 자동화와 같은 새로운 제미나이 기반 경험에 대한 미리보기를 받게 됩니다. 네스트 카메라는 실시간 비디오 피드에서 무슨 일이 일어나고 있는지 이해하고(예: 개가 정원에서 파고 있을 때) 동반 구글 홈(Google Home) 앱은 비디오를 표시하고 설명이 주어지면 장치 자동화를 만듭니다(예: “아이들이 자전거를 차도에 두고 갔나요?”, “매주 화요일 퇴근하면 네스트 온도 조절기가 난방을 켜도록 하세요”).

또한 올해 말에는 구글 어시스턴트가 네스트 브랜드 및 기타 스마트 홈 장치에서 몇 가지 업그레이드를 받아 대화가 더욱 자연스럽게 느껴지도록 할 것입니다. 후속 질문을 하고 “[더] 쉽게 앞뒤로 이동”할 수 있는 기능 외에도 개선된 음성이 제공될 예정입니다.

제미나이 모델은 무엇을 할 수 있을까요?

제미나이 모델은 다중 모드이기 때문에 음성 전사에서 이미지 및 비디오 캡션 실시간 캡션에 이르기까지 다양한 다중 모드 작업을 수행할 수 있습니다. 이러한 기능 중 다수는 제품 단계에 도달했으며(이전 섹션에서 언급했듯이) 구글은 머지않아 훨씬 더 많은 것을 약속하고 있습니다.

물론 회사의 말을 그대로 받아들이기는 다소 어렵습니다. 구글은 원래 바드(Bard) 출시로 어려움을 겪었습니다. 더 최근에는 제미나이의 데모가 다소 야심적이었고 실시간이 아니라는 점이 논란이 되었습니다.

또한 구글은 오늘날 생성형 AI 기술의 일부 문제(예: 환각 및 만들어내는 경향)에 대한 해결책을 제공하지 않습니다. 경쟁사도 마찬가지이지만 제미나이를 사용하거나 비용을 지불하는 것을 고려할 때 염두에 두어야 할 사항입니다.

이 기사의 목적을 위해 구글이 최근 주장에 대해 진실하다고 가정하면 제미나이의 다양한 계층이 현재 할 수 있는 일과 잠재력을 최대한 발휘하면 할 수 있는 일은 다음과 같습니다.

제미나이 울트라로 할 수 있는 일

구글은 제미나이 울트라가 다중 모드 덕분에 물리학 숙제를 돕고 워크시트에서 단계별로 문제를 해결하고 이미 채워진 답변에서 가능한 실수를 지적하는 데 사용할 수 있다고 말합니다.

그러나 최근 몇 달 동안 제미나이 울트라를 많이 보지 못했습니다. 이 모델은 제미나이 앱에 나타나지 않으며 구글 제미나이의 API 가격 책정 페이지에 나열되어 있지 않습니다. 그러나 이는 구글이 제미나이 울트라를 미래에 제품의 최전선으로 다시 가져오지 않을 것이라는 의미는 아닙니다.

울트라는 문제와 관련된 과학 논문을 식별하는 것과 같은 작업에도 적용할 수 있다고 구글은 말합니다. 이 모델은 예를 들어 여러 논문에서 정보를 추출하고 더 시기적절한 데이터로 차트를 다시 만드는 데 필요한 공식을 생성하여 하나의 차트를 업데이트할 수 있습니다.

제미나이 울트라는 기술적으로 이미지 생성을 지원합니다. 그러나 해당 기능은 아직 모델의 제품화된 버전에 적용되지 않았습니다. 아마도 메커니즘이 ChatGPT와 같은 앱이 이미지를 생성하는 방식보다 더 복잡하기 때문일 것입니다. 프롬프트를 이미지 생성기(ChatGPT의 경우 달리(DALL-E)와 같은)에 공급하는 대신 제미나이는 중간 단계 없이 “기본적으로” 이미지를 출력합니다.

울트라는 구글의 완전 관리형 AI 개발 플랫폼인 버텍스 AI와 앱 및 플랫폼 개발자를 위한 구글의 웹 기반 도구인 AI 스튜디오를 통해 API로 사용할 수 있습니다.

제미나이 프로의 기능

구글은 최신 프로 모델인 제미나이 2.0 프로 익스페리멘탈이 코딩 성능과 복잡한 프롬프트에 가장 적합한 모델이라고 말합니다. 현재 실험 버전으로 제공되므로 예기치 않은 문제가 발생할 수 있습니다.

제미나이 2.0 프로는 코딩, 추론, 수학 및 사실 정확도를 측정하는 벤치마크에서 이전 모델인 제미나이 1.5 프로보다 성능이 뛰어납니다. 이 모델은 최대 140만 단어, 2시간 분량의 비디오 또는 22시간 분량의 오디오를 가져올 수 있으며 해당 데이터에 대해 추론하거나 질문에 답변할 수 있습니다.

그러나 제미나이 1.5 프로는 여전히 구글의 딥 리서치 기능을 지원합니다.

제미나이 2.0 프로는 모델이 생성하는 코드에서 버그를 줄이는 것을 목표로 하는 코드 실행이라는 기능과 함께 작동하여 여러 단계를 거쳐 해당 코드를 반복적으로 개선합니다. (코드 실행은 제미나이 플래시도 지원합니다.)

버텍스 AI 내에서 개발자는 미세 조정 또는 “접지” 프로세스를 통해 특정 컨텍스트 및 사용 사례에 맞게 제미나이 프로를 사용자 지정할 수 있습니다. 예를 들어 프로(다른 제미나이 모델과 함께)는 무디스(Moody’s), 톰슨 로이터(Thomson Reuters), 줌인포(ZoomInfo) 및 MSCI와 같은 타사 제공업체의 데이터를 사용하거나 더 넓은 지식 은행 대신 회사 데이터 세트 또는 구글 검색에서 정보를 가져오도록 지시할 수 있습니다. 제미나이 프로는 또한 백오피스 워크플로 자동화와 같은 특정 작업을 수행하기 위해 외부 타사 API에 연결할 수 있습니다.

AI 스튜디오는 프로를 사용하여 구조화된 채팅 프롬프트를 만들기 위한 템플릿을 제공합니다. 개발자는 모델의 창의적 범위를 제어하고 톤 및 스타일 지침을 제공하기 위한 예제를 제공할 수 있으며 프로의 안전 설정을 조정할 수도 있습니다.

버텍스 AI 내에서 제미나이 기반 “에이전트”를 구축할 수 있습니다. 예를 들어 회사는 이전 마케팅 캠페인을 분석하여 브랜드 스타일을 이해한 다음 해당 지식을 적용하여 스타일에 맞는 새로운 아이디어를 생성하는 데 도움이 되는 에이전트를 만들 수 있습니다.

제미나이 플래시는 더 가볍지만 강력합니다.

구글은 제미나이 플래시를 에이전트 시대의 AI 모델이라고 부릅니다. 이 모델은 텍스트 외에도 기본적으로 이미지와 오디오를 생성할 수 있으며 구글 검색과 같은 도구를 사용하고 외부 API와 상호 작용할 수 있습니다.

2.0 플래시 모델은 이전 세대의 제미나이 모델보다 빠르며 코딩 및 이미지 분석을 측정하는 벤치마크에서 일부 더 큰 제미나이 1.5 모델보다 성능이 뛰어납니다. 제미나이 웹 또는 모바일 앱과 구글의 AI 개발자 플랫폼을 통해 제미나이 2.0 플래시를 사용해 볼 수 있습니다.

12월에 구글은 AI 모델이 답변을 제공하기 전에 문제를 통해 몇 초 동안 역방향으로 작업하는 “추론”이 가능한 제미나이 2.0 플래시 씽킹 익스페리멘탈을 출시했습니다.

2월에 구글은 제미나이 앱에서 제미나이 2.0 플래시 씽킹을 사용할 수 있도록 했습니다. 같은 달에 구글은 제미나이 2.0 플래시-라이트라는 더 작은 버전도 출시했습니다. 회사는 이 모델이 제미나이 1.5 플래시 모델보다 성능이 뛰어나지만 동일한 가격과 속도로 실행된다고 말합니다.

좁고 고주파 생성형 AI 워크로드를 위해 구축된 작고 효율적인 제미나이 프로의 파생 제품인 플래시는 제미나이 프로와 마찬가지로 다중 모드이므로 오디오, 비디오, 이미지 및 텍스트를 분석할 수 있습니다(그러나 텍스트만 생성할 수 있음). 구글은 플래시가 요약 및 채팅 앱, 이미지 및 비디오 캡션, 긴 문서 및 테이블에서 데이터 추출과 같은 작업에 특히 적합하다고 말합니다.

플래시 및 프로를 사용하는 개발자는 선택적으로 컨텍스트 캐싱을 활용할 수 있습니다. 컨텍스트 캐싱을 사용하면 많은 양의 정보(예: 지식 기반 또는 연구 논문 데이터베이스)를 제미나이 모델이 빠르고 비교적 저렴하게 액세스할 수 있는 캐시에 저장할 수 있습니다. 그러나 컨텍스트 캐싱은 다른 제미나이 모델 사용료 외에 추가 요금이 부과됩니다.

제미나이 나노는 휴대폰에서 실행할 수 있습니다.

제미나이 나노는 제미나이 프로 및 울트라 모델의 훨씬 작은 버전이며 작업을 서버로 보내는 대신 (일부) 장치에서 직접 실행할 수 있을 만큼 효율적입니다. 지금까지 나노는 레코더의 요약 및 Gboard의 스마트 답장을 포함하여 픽셀 9 프로, 픽셀 9 및 픽셀 폴드(Pixel Fold)의 몇 가지 기능을 지원합니다.

사용자가 버튼을 눌러 오디오를 녹음하고 전사할 수 있는 레코더 앱에는 녹음된 대화, 인터뷰, 프레젠테이션 및 기타 오디오 스니펫에 대한 제미나이 기반 요약이 포함되어 있습니다. 사용자는 신호 또는 Wi-Fi 연결이 없어도 요약을 받을 수 있으며 개인 정보 보호를 위해 데이터가 처리 과정에서 휴대폰을 떠나지 않습니다.

나노는 또한 구글의 키보드 대체품인 Gboard에도 있습니다. 여기에서 스마트 답장이라는 기능을 지원하여 WhatsApp과 같은 메시징 앱에서 대화할 때 다음에 말하고 싶은 내용을 제안하는 데 도움이 됩니다.

지원되는 장치의 구글 메시지(Google Messages) 앱에서 나노는 “신남”, “정중함” 및 “서정적”과 같은 스타일로 메시지를 작성할 수 있는 매직 컴포즈(Magic Compose)를 구동합니다.

구글은 향후 안드로이드 버전이 나노를 활용하여 저시력 및 시각 장애가 있는 사용자를 위해 화면을 설명할 것이라고 말합니다. 픽셀 휴대폰의 날씨 앱은 제미나이 나노를 사용하여 맞춤형 날씨 보고서를 생성합니다. 그리고 구글의 접근성 서비스인 TalkBack은 나노를 사용하여 저시력 및 시각 장애가 있는 사용자를 위해 이미지를 설명합니다.

제미나이 모델 비용은 얼마인가요?

제미나이 1.5 프로, 1.5 플래시, 2.0 플래시 및 2.0 플래시-라이트는 앱 및 서비스 구축을 위한 구글의 제미나이 API를 통해 사용할 수 있으며 모두 무료 옵션이 있습니다. 그러나 무료 옵션은 사용량 제한을 부과하고 컨텍스트 캐싱 및 코드 실행과 같은 특정 기능을 제외합니다.

그렇지 않으면 제미나이 모델은 종량제입니다. 다음은 2024년 9월 현재 컨텍스트 캐싱과 같은 추가 기능을 제외한 기본 가격입니다.

  • 제미나이 1.5 프로: 입력 토큰 100만 개당 1.25달러(최대 128K 토큰의 프롬프트) 또는 입력 토큰 100만 개당 2.50달러(128K 토큰보다 긴 프롬프트); 출력 토큰 100만 개당 5달러(최대 128K 토큰의 프롬프트) 또는 출력 토큰 100만 개당 10달러(128K 토큰보다 긴 프롬프트)
  • 제미나이 1.5 플래시: 입력 토큰 100만 개당 7.5센트(최대 128K 토큰의 프롬프트), 입력 토큰 100만 개당 15센트(128K 토큰보다 긴 프롬프트), 출력 토큰 100만 개당 30센트(최대 128K 토큰의 프롬프트), 출력 토큰 100만 개당 60센트(128K 토큰보다 긴 프롬프트)
  • 제미나이 2.0 플래시: 입력 토큰 100만 개당 10센트, 출력 토큰 100만 개당 40센트. 특히 오디오의 경우 입력 토큰 100만 개당 70센트, 출력 토큰 100만 개당 40센트입니다.
  • 제미나이 2.0 플래시-라이트: 입력 토큰 100만 개당 7.5센트, 출력 토큰 100만 개당 30센트.

토큰은 단어 “환상적인”의 음절 “팬”, “타스” 및 “틱”과 같은 원시 데이터의 세분화된 비트입니다. 토큰 100만 개는 약 700,000단어에 해당합니다. 입력은 모델에 공급되는 토큰을 나타내고 출력은 모델이 생성하는 토큰을 나타냅니다.

2.0 프로 가격은 아직 발표되지 않았으며 나노는 여전히 개발 중입니다.

프로젝트 아스트라(Project Astra)의 최신 소식은 무엇인가요?

프로젝트 아스트라는 실시간 다중 모드 이해를 위한 AI 기반 앱 및 “에이전트”를 만들기 위한 구글 딥마인드의 노력입니다. 데모에서 구글은 AI 모델이 실시간 비디오와 오디오를 동시에 처리할 수 있는 방법을 보여주었습니다. 구글은 12월에 소수의 신뢰할 수 있는 테스터에게 프로젝트 아스트라의 앱 버전을 출시했지만 현재 더 광범위한 출시 계획은 없습니다.

회사는 또한 프로젝트 아스트라와 증강 현실 기능이 있는 일부 안경 프로토타입을 12월에 소수의 신뢰할 수 있는 테스터에게 제공했습니다. 그러나 현재 명확한 제품이 없으며 구글이 실제로 이와 같은 것을 언제 출시할지는 불분명합니다.

프로젝트 아스트라는 여전히 프로젝트일 뿐 제품이 아닙니다. 그러나 아스트라의 데모는 구글이 미래에 AI 제품이 무엇을 하기를 원하는지 보여줍니다.

제미나이가 아이폰(iPhone)에 출시될 예정인가요?

그럴 수도 있습니다.

애플은 iOS 18 제품군에서 여러 기능에 대해 구글과 협력할 가능성이 있습니다. WWDC 2024에서 기조 연설을 한 후 애플 SVP 크레이그 페더리기(Craig Federighi)는 제미나이를 포함한 여러 AI 모델과 협력할 가능성을 인정했지만 추가 세부 사항은 공개하지 않았습니다.

위로 스크롤