구글 베오 3.1, AI 비디오 생성의 진화

최근 인터넷에서 무엇이 진짜이고 무엇이 인공지능(AI)으로 만들어진 것인지 구분하기가 점점 더 어려워지고 있어요. 이런 상황에서 구글(Google)이 새로운 AI 비디오 모델인 베오 3.1(Veo 3.1)을 발표하며 또 한 번 기술의 진보를 보여주었습니다. 이 업데이트된 모델은 더욱 향상된 오디오와 사실감, 그리고 프롬프트(prompt) 정확도를 자랑한다고 해요.

베오 3.1, 무엇이 달라졌을까요?

구글은 베오 3.1이 이전 버전보다 훨씬 강력한 프롬프트 준수 능력을 갖췄다고 설명합니다. 이는 사용자가 입력한 지시에 더 정확하게 부합하는 영상을 만들어내어, 불필요한 컴퓨팅 자원 낭비를 줄이는 데 도움이 된다는 의미입니다. 또한, 베오 3 출시 당시 핵심 기능이었던 오디오 품질도 더욱 개선되었다고 해요.

이전 베오 3 모델은 720p 가로(landscape) 영상만 생성할 수 있었지만, 베오 3.1은 인터넷에 넘쳐나는 세로(portrait) 영상 트렌드를 반영하여 가로와 세로 16:9 비율의 영상을 모두 제작할 수 있게 되었습니다. 이는 유튜브 쇼츠(YouTube Shorts)나 틱톡(TikTok)과 같은 플랫폼에서 AI 생성 영상이 더욱 활발하게 활용될 수 있는 기반을 마련해 줄 것으로 보입니다.

비용에 대한 걱정도 덜 수 있게 되었어요. 구글은 베오의 ‘패스트(Fast)’ 버전을 추가하여, 토큰(token)당 비용을 지불하는 사용자들의 부담을 줄여줄 예정입니다.

영상 제작자를 위한 새로운 기능

베오 3.1 모델은 구글의 AI 생태계 전반에 걸쳐 활용될 예정입니다. 제미니(Gemini) 앱을 통해 베오 3.1과 베오 3.1 패스트 버전을 이용해 콘텐츠를 만들 수 있으며, 개발자들은 버텍스 AI(Vertex AI)와 제미니 API(Gemini API)를 통해 접근할 수 있습니다.

특히 구글의 영상 제작 도구인 플로우(Flow)는 이번 업데이트를 통해 몇 가지 새로운 기능을 얻게 되었습니다. ‘Ingredients to Video’, ‘Frames to Video’, ‘Extend’ 기능들이 이제 생성된 오디오와 호환됩니다. 즉, 여러 이미지를 참조로 업로드하거나 이미지를 시작점 또는 끝점으로 사용하면서, 동시에 맞춤형 오디오를 클립에 추가할 수 있게 된 것이죠. 이러한 기능들은 API에서도 제공되며, 제미니 앱 역시 베오 출력물에 참조 이미지를 계속해서 사용할 수 있습니다.

베오 3.1과 함께 완전히 새로운 영상 편집 기능도 추가됩니다. 구글은 베오 3.1이 영상의 전체적인 모습을 유지하면서도 ‘정밀한’ 편집을 더 잘 수행할 수 있다고 말합니다. 예를 들어, 클립에 특정 객체를 추가하면서 나머지 부분은 거의 변경하지 않거나, 장면에서 특정 요소를 제거하면서 다른 부분은 그대로 유지하는 것이 가능해졌습니다. 객체 추가 기능은 플로우와 API에서 즉시 사용할 수 있으며, 객체 제거 기능은 플로우에 곧 추가될 예정이라고 합니다.

AI 비디오의 미래와 우리의 시선

이번 베오 3.1 출시는 최근 인상적인 새 버전의 영상 생성 AI를 탑재한 소라(Sora) 아이폰(iPhone) 앱을 출시한 오픈AI(OpenAI)와의 경쟁에서 구글이 뒤처지지 않으려는 움직임으로도 해석됩니다.

베오 3.1 모델은 오늘부터 순차적으로 배포되기 시작합니다. 앞으로 세로 영상을 스크롤하며 볼 때, 어떤 영상이 AI로 만들어진 것인지 더욱 주의 깊게 살펴보아야 할 것 같아요. AI 기술의 발전이 가져올 영상 콘텐츠의 변화가 기대되면서도, 한편으로는 현실과 가상의 경계가 모호해지는 것에 대한 경계심을 늦출 수 없는 시점입니다.

위로 스크롤