DeepSeek V3-0324 모델 출시: 중국 AI의 약진과 미국 AI 지배력 약화

중국 AI 스타트업 DeepSeek의 새로운 모델 출시

이번 주에 중국 AI 스타트업인 DeepSeek에서 AI 모델의 주요 업그레이드를 발표했는데, 이는 올해 초 처음 등장했을 때만큼이나 많은 사람들의 관심을 받고 있어요. 새로운 DeepSeek-V3-0324 모델이 현재 Hugging Face에서 공개되어 OpenAI 및 다른 AI 개발업체와의 경쟁이 더욱 치열해질 것으로 예상됩니다.

DeepSeek V3-0324 모델의 특징

DeepSeek의 테스트에 따르면 V3 모델의 새로운 버전은 추론 및 코딩 능력이 크게 향상되었다고 해요. 더 나은 사고력과 코딩 능력은 그 자체로는 혁명적으로 들리지 않을 수 있지만, 개선 속도와 DeepSeek의 계획은 이번 릴리스를 주목할 만하게 만들어요.

작년에 설립된 DeepSeek는 빠른 속도로 발전하고 있는데, 12월에 원래 V3 모델을 출시한 것을 시작으로, 한 달 후에는 보다 포괄적인 연구를 위한 R1 모델을 선보였습니다. 그리고 지금은 2024년 3월에 출시된 V3-0324가 등장했습니다.

DeepSeek의 인기 요인

이러한 개선으로 모델은 OpenAI의 GPT-4 또는 Anthropic의 Claude 2 모델과 거의 동등한 수준에 도달했습니다. 하지만 DeepSeek에 따르면 성능이 완전히 동일하지 않더라도 훨씬 저렴하게 실행할 수 있다고 합니다.

AI 사용과 그에 따른 AI 비용이 계속 증가함에 따라 이는 궁극적으로 큰 장점이 될 수 있습니다. AI 모델을 훈련하는 데는 엄청난 비용이 들고 OpenAI와 Google은 대부분의 회사가 OpenAI와 Microsoft의 파트너십 없이는 도달할 수 없는 막대한 클라우드 예산을 가지고 있습니다. DeepSeek의 저렴한 성과가 더 흔해지면 이러한 독점성은 사라질 수 있습니다.

미국 AI 모델의 지배력 약화

DeepSeek와 같은 중국 스타트업 덕분에 AI 모델에 대한 미국의 지배력은 이미 약화되기 시작했습니다. 가장 인기 있는 모델이 선전(Shenzhen)이나 항저우(Hangzhou)에서 등장하는 것은 더 이상 충격적인 일이 아닙니다. 지정학적 고려 사항과 비즈니스 문제로 인해 DeepSeek를 최소한 미국 정부에서 금지해야 한다는 요구가 있었습니다.

DeepSeek의 최신 릴리스가 당장 내일 일정에 큰 변화를 가져오지는 않을 것입니다. 하지만 차세대 AI에 연료를 공급하는 데 필요한 컴퓨팅 성능과 에너지에 대한 수요가 예상만큼 엄청나지 않을 수 있다는 것을 암시합니다.

또한 이로 인해 이력서를 다시 작성하거나 웹사이트를 디버깅하는 AI 챗봇이 북경어를 유창하게 구사할 수도 있습니다.

This website stores cookies on your computer. These cookies are used to provide a more personalized experience and to track your whereabouts around our website in compliance with the European General Data Protection Regulation. If you decide to to opt-out of any future tracking, a cookie will be setup in your browser to remember this choice for one year.

Accept or Deny

위로 스크롤