중국 AI 스타트업 DeepSeek의 새로운 모델 출시
이번 주에 중국 AI 스타트업인 DeepSeek에서 AI 모델의 주요 업그레이드를 발표했는데, 이는 올해 초 처음 등장했을 때만큼이나 많은 사람들의 관심을 받고 있어요. 새로운 DeepSeek-V3-0324 모델이 현재 Hugging Face에서 공개되어 OpenAI 및 다른 AI 개발업체와의 경쟁이 더욱 치열해질 것으로 예상됩니다.
DeepSeek V3-0324 모델의 특징
DeepSeek의 테스트에 따르면 V3 모델의 새로운 버전은 추론 및 코딩 능력이 크게 향상되었다고 해요. 더 나은 사고력과 코딩 능력은 그 자체로는 혁명적으로 들리지 않을 수 있지만, 개선 속도와 DeepSeek의 계획은 이번 릴리스를 주목할 만하게 만들어요.
작년에 설립된 DeepSeek는 빠른 속도로 발전하고 있는데, 12월에 원래 V3 모델을 출시한 것을 시작으로, 한 달 후에는 보다 포괄적인 연구를 위한 R1 모델을 선보였습니다. 그리고 지금은 2024년 3월에 출시된 V3-0324가 등장했습니다.
DeepSeek의 인기 요인
이러한 개선으로 모델은 OpenAI의 GPT-4 또는 Anthropic의 Claude 2 모델과 거의 동등한 수준에 도달했습니다. 하지만 DeepSeek에 따르면 성능이 완전히 동일하지 않더라도 훨씬 저렴하게 실행할 수 있다고 합니다.
AI 사용과 그에 따른 AI 비용이 계속 증가함에 따라 이는 궁극적으로 큰 장점이 될 수 있습니다. AI 모델을 훈련하는 데는 엄청난 비용이 들고 OpenAI와 Google은 대부분의 회사가 OpenAI와 Microsoft의 파트너십 없이는 도달할 수 없는 막대한 클라우드 예산을 가지고 있습니다. DeepSeek의 저렴한 성과가 더 흔해지면 이러한 독점성은 사라질 수 있습니다.
미국 AI 모델의 지배력 약화
DeepSeek와 같은 중국 스타트업 덕분에 AI 모델에 대한 미국의 지배력은 이미 약화되기 시작했습니다. 가장 인기 있는 모델이 선전(Shenzhen)이나 항저우(Hangzhou)에서 등장하는 것은 더 이상 충격적인 일이 아닙니다. 지정학적 고려 사항과 비즈니스 문제로 인해 DeepSeek를 최소한 미국 정부에서 금지해야 한다는 요구가 있었습니다.
DeepSeek의 최신 릴리스가 당장 내일 일정에 큰 변화를 가져오지는 않을 것입니다. 하지만 차세대 AI에 연료를 공급하는 데 필요한 컴퓨팅 성능과 에너지에 대한 수요가 예상만큼 엄청나지 않을 수 있다는 것을 암시합니다.
또한 이로 인해 이력서를 다시 작성하거나 웹사이트를 디버깅하는 AI 챗봇이 북경어를 유창하게 구사할 수도 있습니다.