인텔, AMD에 맞서 Xeon 6 가속기 강화
인텔이 오랜 경쟁사인 AMD와 클라우드 시장의 맞춤형 Arm 실리콘의 위협에 맞서 새로운 Xeon 6 프로세서를 발표했습니다.
Xeon 6, 데이터센터 공략
이번에 출시된 P-코어 Xeon은 코어 수나 연산 능력에서 AMD와 직접 경쟁하기보다는 데이터센터의 핵심 워크로드, 즉 가상화, 스토리지 어레이, 대규모 멀티 소켓 데이터베이스 서버를 겨냥하고 있습니다. 인텔은 x86 경쟁사와의 코어 수 경쟁에서 우위를 확보한 후, 고객 사이에서의 명성, 컴퓨팅 가속기, 공격적인 가격 정책을 통해 데이터센터 시장에서의 점유율 하락을 막으려 하고 있습니다.
Xeon 6 축소
통합 히트 스프레더를 제거하면 익숙한 실리콘 컬렉션을 볼 수 있습니다. Xeon 6에서 인텔은 I/O 기능과 컴퓨팅 및 메모리 기능을 분리하는 이기종 칩렛 아키텍처를 완전히 채택했습니다. 최상위 모델인 6900P 시리즈는 인텔 3 프로세스 노드에서 제작된 3개의 컴퓨팅 및 메모리 다이와 인텔 7 기반의 I/O 다이 2개로 구성됩니다.
인텔의 모든 Xeon 6 부품은 대부분 동일한 I/O 다이를 공유하지만, 새로운 6700P 및 6500P Xeon은 86코어 부품에 2개의 익스트림 코어 다이, 48코어 및 16코어 칩에 고코어 또는 저코어 다이 1개 등 다양한 컴퓨팅 타일을 특징으로 합니다.
이를 통해 인텔은 특정 워크로드에 맞게 코어 수와 클럭 속도의 균형을 맞출 수 있으며, 수율 향상에도 도움이 될 것으로 예상됩니다. 하지만 메모리 컨트롤러가 I/O 다이에 통합되지 않고 컴퓨팅 다이의 일부이기 때문에 플래그십 부품의 12개 채널 대신 8개의 메모리 채널로 제한됩니다.
인텔의 최신 칩은 채널당 2개의 DIMM 구성을 지원하여 이를 보완합니다. 이는 이전 Granite Rapids (그래나이트 래피즈) 부품에는 없었던 기능입니다. 싱글 소켓 구성에서 칩은 멀티 소켓에 최적화된 프로세서의 88개 레인에 비해 최대 136개의 PCIe 5.0 연결을 지원합니다.
실리콘이 적다는 것은 이번 Xeon 6 프로세서가 작년에 살펴본 500W 부품보다 훨씬 더 시원하게 작동하고 전력 소비도 적다는 것을 의미합니다. 코어 수에 따라 150~350W 사이입니다. 즉, 이전 세대와 동일한 전력 범위에서 최대 22개의 코어를 더 사용할 수 있습니다.
멀티 소켓 시스템에 대한 인텔의 지속적인 노력
2025년 현재 인텔은 대규모 미션 크리티컬 데이터베이스 환경에서 일반적으로 사용되는 대규모 멀티 소켓 시스템용 x86 키트의 유일한 공급업체입니다. 참고로 AMD의 Epyc (에픽) 프로세서는 싱글 또는 듀얼 소켓 구성으로만 제공되었습니다.
SAP HANA와 같이 대규모 메모리 집약적인 워크로드를 실행하는 사람들에게 인텔의 6700P 시리즈 부품 출시는 노후화된 Sapphire Rapids (사파이어 래피즈) Xeon에 비해 상당한 성능 향상을 의미합니다.
CXL (Compute Express Link) 메모리 확장 장치를 사용하면 이러한 워크로드에 필요한 멀티 테라바이트 메모리 용량을 확보하기 위해 추가 CPU 소켓이 필요하지 않게 되므로 이러한 대규모 멀티 소켓 구성이 필요한지 의문이 제기됩니다.
CXL의 주요 기능 중 하나는 표준 PCIe 인터페이스에 장착되는 확장 모듈을 통해 호환 시스템에 추가 메모리 용량을 추가할 수 있다는 것입니다. 추가 메모리는 DDR5일 필요는 없으며, 또 다른 NUMA 노드로 나타납니다.
이러한 발전에도 불구하고 인텔 수석 연구원 Ronak Singhal (로나크 싱할)은 4소켓 및 8소켓 시스템에 대한 수요가 조만간 사라질 것으로 보지 않습니다. 그는 “메모리 확장을 살펴보면 CXL로 할 수 있는 일정한 양이 있지만, 4소켓 및 8소켓 이상으로 가는 사람들은 추가 코어를 원합니다.”라고 말했습니다.
인텔, 가속기 투자에 집중
인텔은 6700P 시리즈 칩이 5세대 Xeon에 비해 14~54% 더 높은 성능을 제공할 것이라고 밝혔습니다. 경쟁 제품과 비교했을 때 인텔은 칩에 내장된 통합 가속기 엔진을 활용하여 차별화하고 우위를 점하려 하고 있습니다.
생성형 AI의 부상으로 가속기의 정의가 GPU 또는 기타 전용 AI 가속기로 바뀌었지만, 인텔은 암호화, 보안, 스토리지, 분석, 네트워킹, AI와 같은 기능을 위한 맞춤형 가속기를 수년 동안 칩에 내장해 왔습니다.
인텔은 온보드 가속기를 활용하여 단일 Xeon 6 서버가 최대 10개의 2세대 Xeon 박스를 대체할 수 있다고 말합니다. 코어 수와 클럭당 명령어 수가 증가했을 뿐만 아니라 암호화 엔진과 AMX (Advanced Matrix Extensions) 덕분에 단일 Xeon 6 서버가 이미지 분류 및 TLS를 사용하는 Nginx 웹 서버와 같은 워크로드에서 최대 10개의 Cascade Lake (캐스케이드 레이크) 시스템을 대체할 수 있습니다.
AMD의 최신 5세대 Epyc과 비교했을 때 인텔은 Nginx TLS에서 62%, MongoDB에서 17%, HPCG에서 52%, OpenFOAM에서 43%, ResNet-50에서 2.17배의 성능 우위를 주장하고 있습니다.
물론 이러한 성능 주장은 특히 인텔의 플래그십 6900P 프로세서에 대한 것이고 통합 가속기 엔진 또는 MRDIMM 메모리 기술에 대한 조기 지원의 이점을 직접적으로 누리는 워크로드에 초점을 맞추고 있기 때문에 어느 정도 감안해야 합니다.
그럼에도 불구하고 워크로드가 이러한 가속기 엔진을 활용할 수 있다면 인텔의 Xeon 6 라인업을 자세히 살펴보는 것이 좋습니다.
새로운 엔트리 레벨 Xeon 및 엣지용 SoC
인텔은 주력 제품인 6700P 및 6500P 프로세서 제품군과 함께 새로운 임베디드 및 엔트리 레벨 Xeon 프로세서도 출시하고 있습니다.
스택의 맨 아래에는 4코어, 6코어, 8코어 버전으로 제공되며 최대 5.7GHz의 클럭 속도를 제공하는 인텔의 6300 시리즈 Xeon이 있습니다. 하지만 2개의 DDR5 메모리 채널만 있고 최대 128GB의 용량과 4,800MT/s의 속도로 제한되기 때문에 이러한 칩은 일반적인 데이터센터 CPU보다 작년에 살펴본 AMD의 베이비 Epyc에 더 가깝습니다.
임베디드, 엣지, 네트워킹 환경을 위해 인텔은 vRAN 부스트를 통해 4세대 Xeon의 후속 제품으로 포지셔닝하는 새로운 Xeon 6 SoC 변형도 출시하고 있습니다.
엣지 컴퓨팅, 네트워킹 또는 보안 어플라이언스에 직접 통합되도록 설계된 이 칩은 최대 42개의 코어를 가질 수 있으며 200Gbps의 집계 이더넷 대역폭을 가진 고유한 I/O 다이를 특징으로 합니다.
가상화된 무선 액세스 네트워크 (vRAN) 시스템과 같은 기능을 지원하는 것 외에도 칩에는 암호화 가속, AI 또는 미디어 트랜스코딩을 위한 가속기가 장착될 수 있습니다. 이러한 칩은 보안 어플라이언스에 배포하거나 엣지에서 데이터를 사전 처리하는 데에도 사용할 수 있습니다.
인텔의 288코어 몬스터
2023년 인텔 이노베이션에서 팻 겔싱어 전 CEO가 공개했던 288코어 E-코어 Xeon은 여전히 그림자 속에 숨어 있습니다.
하지만 작년에 출시된 인텔의 이전 Sierra Forest (시에라 포레스트) E-코어 Xeon과 달리 인텔은 클라우드 서비스 제공업체를 위해 가장 높은 코어 수 부품을 보유하고 있는 것으로 보입니다.
Singhal은 “288코어는 현재 생산 중입니다. 실제로 대규모 클라우드 고객과 함께 배포했습니다.”라고 말했습니다. “우리는 각 고객의 요구 사항에 맞게 구축하는 것을 사용자 정의하기 위해 288코어 프로세서에서 긴밀하게 협력하고 있습니다.”
이 부품은 항상 클라우드 및 관리 서비스 제공업체 시장에 서비스를 제공하도록 설계되었으며 마이크로서비스, 웹 규모 앱 및 기타 처리량 중심 프로그램을 제공하기 위한 가장 기능이 풍부하거나 성능이 뛰어난 코어가 아닌 전력 효율적인 코드를 제공합니다.
E-코어 부품에 대한 수요가 기대에 미치지 못했다는 것도 알고 있습니다.
인텔 공동 CEO Michelle Johnston Holthaus (미셸 존스턴 홀타우스)는 회사의 4분기 실적 발표에서 “우리가 본 것은 틈새 시장에 가깝고 예상만큼 빠르게 볼륨이 실현되지 않았다는 것입니다.”라고 말했습니다.
이로 인해 인텔의 18A 기반 Clearwater Forest (클리어워터 포레스트) 부품이 2025년에서 2026년으로 지연되었습니다. 하지만 출시 시기가 Sierra Forest와 어색하게 가까웠고 잠재 고객을 조기 채택자가 되거나 훨씬 더 개선되고 성능이 뛰어난 부품을 위해 조금 더 기다리는 어려운 입장에 놓이게 했습니다.
Singhal에 따르면 이 부품은 이미 연구소에서 실행 중이며 인텔 고객이 이를 사용하여 첫 번째 시스템을 가동했습니다.