구글, 제미나이 기반 텍스트 임베딩 모델 공개: 특징 및 의미

구글, 새로운 제미나이 기반 텍스트 임베딩 모델 공개

구글이 새로운 실험적인 텍스트 “임베딩(embedding)” 모델인 제미나이 임베딩(Gemini Embedding)을 제미나이 개발자 API에 추가했습니다. 3월 7일에 발표된 이 소식은 AI 분야에 큰 관심을 불러일으키고 있습니다.

임베딩 모델이란 무엇일까요?

임베딩 모델은 단어나 구문과 같은 텍스트 입력을 텍스트의 의미를 담아내는 숫자 표현으로 변환하는 모델입니다. 이러한 임베딩은 문서 검색 및 분류와 같은 다양한 애플리케이션에서 사용되는데, 비용을 절감하면서 지연 시간을 개선할 수 있다는 장점이 있습니다.

제미나이 임베딩의 특징

제미나이 모델 기반: 제미나이 임베딩은 구글의 제미나이 AI 모델 제품군을 사용하여 훈련된 최초의 임베딩 모델입니다.
다양한 활용: 구글은 이 모델이 언어와 미묘한 맥락에 대한 제미나이의 이해를 상속받아 금융, 과학, 법률, 검색 등 다양한 분야에 적용할 수 있다고 밝혔습니다.
향상된 성능: 구글은 제미나이 임베딩이 이전의 최첨단 임베딩 모델인 text-embedding-004의 성능을 능가하며, 인기 있는 임베딩 벤치마크에서 경쟁력 있는 성능을 달성했다고 주장합니다.
확장된 기능: text-embedding-004와 비교했을 때, 제미나이 임베딩은 더 큰 텍스트와 코드 덩어리를 한 번에 처리할 수 있으며, 두 배 많은 언어(100개 이상)를 지원합니다.

현재는 실험 단계

구글은 제미나이 임베딩이 제한된 용량으로 “실험 단계”에 있으며 변경될 수 있다고 언급했습니다. 하지만 앞으로 몇 달 안에 안정적이고 일반적으로 사용 가능한 버전을 출시하기 위해 노력하고 있다고 합니다.

AI 분야의 경쟁

아마존(Amazon), 코히어(Cohere), 오픈AI(OpenAI)를 포함한 여러 회사들이 각자의 API를 통해 임베딩 모델을 제공하고 있습니다. 구글 역시 임베딩 모델을 보유하고 있었지만, 제미나이 임베딩은 제미나이 AI 모델을 사용하여 훈련된 첫 번째 모델이라는 점에서 의미가 있습니다.

제미나이 임베딩의 등장이 AI 텍스트 모델 시장에 어떤 변화를 가져올지 기대가 됩니다.