인텔 팬서 레이크: 2nm 시대 개막

인텔의 2nm 시대 개막, 팬서 레이크(Panther Lake)가 온다!

인텔(Intel)이 오랫동안 기다려온 18A 공정 기술을 기반으로 한 첫 번째 칩, 팬서 레이크 프로세서를 공개하며 TSMC로부터 생산 주도권을 되찾기 시작했습니다. 애리조나(Arizona) 오코틸로(Ocotillo) 캠퍼스의 팹 52(Fab 52)에서 올여름부터 컴퓨트 타일(compute tiles)의 대량 생산에 돌입했으며, 내년 초 CES 시기에 맞춰 팬서 레이크 기반의 노트북과 컴퓨터가 출시될 예정이라고 해요.

인텔의 발표에 따르면, 팬서 레이크에 적용된 공정 및 아키텍처 개선은 기다림의 가치를 충분히 증명할 것으로 보입니다. 인텔은 이 프로세서가 이전 세대인 루나 레이크(Lunar Lake) 및 애로우 레이크(Arrow Lake) 프로세서 대비 와트당 성능에서 단일 스레드 성능은 최대 10%, 멀티 스레드 성능은 최대 50% 향상될 것이라고 주장하고 있어요.

공정 축소와 아키텍처 전면 개편의 시너지

팬서 레이크의 효율성과 성능 향상은 주로 새로운 공정 기술 덕분입니다. 인텔 3(Intel 3)에서 18A라는 2nm급 공정으로 노드(node)가 축소되었을 뿐만 아니라, 전력 공급 방식이 웨이퍼 후면으로 이동한 것이 큰 변화라고 할 수 있습니다.

인텔에 따르면, 18A 공정의 더 조밀한 리본펫(RibbonFet) 트랜지스터는 와트당 성능을 15% 이상 향상시키고, 후면 전력 공급(backside power) 기술은 트랜지스터 밀도를 최대 30%까지 높여준다고 해요.

하지만 인텔이 TSMC와의 협력을 완전히 중단한 것은 아닙니다. 팬서 레이크의 컴퓨트 다이(compute die)만 인텔의 18A 공정을 활용하고 있으며, 여기에는 CPU, NPU, 이미지 프로세서가 포함됩니다.

팬서 레이크의 이종 멀티 다이(Multi-Die) 아키텍처

인텔의 최신 클라이언트 CPU인 메테오 레이크(Meteor Lake)와 마찬가지로, 팬서 레이크도 이종 멀티 다이 칩 아키텍처를 사용합니다. 이는 다양한 웨이퍼 팹(wafer fab)과 공정 노드에서 생산된 실리콘(silicon)을 단일 패키지로 결합하는 방식인데요. 팬서 레이크는 크게 세 가지 핵심 구성 요소로 이루어져 있습니다.

  1. 18A 공정으로 제작된 컴퓨트 타일
  2. TSMC에서 제작된 플랫폼 컨트롤러 타일(Platform Controller Tile)
  3. SKU에 따라 인텔 3 또는 TSMC에서 제작된 GPU 타일

이 세 가지 칩은 몇 개의 필러 타일(filler tiles)과 함께 베이스 다이(base die) 위에 패키징됩니다. 베이스 다이는 인텔의 포베로스(Foveros) 고급 패키징 기술을 사용하여 칩들 간의 전력 공급과 통신을 원활하게 해준다고 해요.

팬서 레이크 라인업 살펴보기

인텔은 팬서 레이크를 최소 세 가지 구성으로 제공할 예정입니다. 기본 모델은 8개의 코어를 가지며, 두 가지 고급 옵션은 16개의 CPU 코어와 함께 전용 그래픽을 위한 추가 PCIe 연결 또는 더 강력한 iGPU(통합 그래픽 처리 장치)를 선택할 수 있습니다.

  • 8코어 기본 모델:

    • 컴퓨트 타일에는 8개의 CPU 코어가 탑재됩니다. 이 중 절반은 인텔의 새로운 쿠거 코브(Cougar Cove) 성능(P) 코어이며, 나머지 4개의 코어는 다크몬트(Darkmont) 마이크로아키텍처 기반의 저전력 효율(LP-E) 코어 클러스터로 구성되어 있어요.
    • 다크몬트 아키텍처는 올해 초 핫 칩스(Hot Chips)에서 공개된 데이터센터 중심의 클리어워터 포레스트(Clearwater Forest) 제온(Xeon) 프로세서의 기반 아키텍처와 동일하다고 합니다.
    • P 코어와 LP-E 코어 클러스터 옆에는 50 TOPS의 신경망 처리 장치(NPU)와 업그레이드된 이미지 처리 스택이 위치하며, 이는 모든 라인업에서 공유됩니다.
    • I/O 기능은 플랫폼 컨트롤러 타일이 담당하며, 썬더볼트 4(Thunderbolt 4) 포트 4개, USB 3.2 포트 2개, Wi-Fi 7, 블루투스 6.0, 스토리지를 위한 PCIe 5.0 레인 4개, 추가 연결 및 주변 장치를 위한 PCIe 4.0 레인 8개를 제공합니다.
    • 8코어 칩에는 인텔의 이전 인텔 3 공정 기술로 제작된 쿼드 코어 GPU 타일이 장착됩니다. Xe3는 팬서 레이크 세대에 새롭게 적용되었으며, 이전 세대 루나 레이크 프로세서의 Xe2 코어보다 작지만 의미 있는 업그레이드를 보여줍니다.
  • 16코어 모델:

    • 16코어 모델로 올라가면 더욱 흥미로운 부분이 많습니다. P 코어와 LP-E 코어 외에 8개의 E-코어가 추가되며, 이 코어들은 칩의 L3 캐시와 직접 연결됩니다.
    • 인텔은 또한 다양한 코어 유형에 걸쳐 워크로드 프로비저닝을 최적화하도록 설계된 스레드 디렉터(Thread Director)를 업그레이드했습니다. 이는 마치 폭포수처럼 작동하여, LP-E 코어가 용량 한계에 도달하면 더 강력한 E-코어로, 그리고 필요에 따라 P-코어로 작업을 푸시하는 방식입니다.
    • 이는 전력 제약이 있는 환경(예: 얇고 가벼운 노트북)에서 프로세스를 더 효율적인 코어에 유지하고, 정말 필요할 때만 강력한 P-코어를 활성화하는 것이 더 바람직할 수 있다는 아이디어에서 출발했다고 해요.
  • 그래픽 옵션:

    • 그래픽 측면에서는 두 가지 경로가 있습니다. 첫 번째는 TSMC에서 제작된 더 크고 강력한 GPU 타일로, Xe 그래픽 코어 수가 12개로 세 배 증가합니다. 인텔에 따르면 이 GPU는 이전 세대 애로우 레이크 및 루나 레이크 부품의 iGPU보다 최대 50% 빠르다고 합니다.
    • 다른 옵션으로는 쿼드 코어 GPU 타일을 유지하면서 8개의 추가 PCIe 5.0 연결 레인을 갖춘 업그레이드된 플랫폼 컨트롤러 타일을 선택하는 것입니다. 이 추가 I/O는 아크(Arc), 엔비디아(Nvidia), 또는 AMD 그래픽 카드, 심지어 외장 GPU 독(dock)을 위한 흥미로운 시스템 설계를 가능하게 할 것으로 보입니다.

AI 성능과 메모리 대역폭: 경쟁사 대비는?

향상된 CPU 및 GPU 처리 능력에도 불구하고, 팬서 레이크가 경쟁사 대비 부족한 한 가지 영역은 AI PC 성능입니다.

팬서 레이크의 새로운 NPU는 50 TOPS의 AI 컴퓨팅 성능을 달성하는데요. 이는 루나 레이크보다 정확히 2 TOPS 높은 수치이지만, 경쟁사보다는 훨씬 적습니다. 이미 출시된 AMD의 스트릭스 헤일로(Strix Halo)는 60 TOPS를 자랑하며, 퀄컴(Qualcomm)의 곧 출시될 X2 엘리트(X2 Elite)는 75 TOPS NPU를 탑재할 예정입니다.

하지만 이 세 가지 모두 마이크로소프트(Microsoft)의 40 TOPS 코파일럿+(Copilot+) PC 요구 사항을 초과하며, AI/ML 워크로드의 경우 사양표가 제시하는 것보다 소프트웨어가 성능에 더 큰 영향을 미칠 수 있다는 점을 기억해야 합니다.

TOPS에 대해 말하자면, 인텔은 최신 칩이 CPU, GPU, NPU를 합쳐 총 180 플랫폼 TOPS를 제공한다고 자랑합니다. 이 수치가 아무리 좋아 보여도, 적어도 아직까지는 이 모든 성능을 동시에 활용할 수는 없다고 해요.

AI 워크로드와 게임과 같은 그래픽 집약적인 애플리케이션에 똑같이 중요한 것은 메모리 용량과 대역폭입니다. 팬서 레이크는 최대 7,200 MT/s의 DDR5 메모리 128GB 또는 9,600 MT/s의 LPDDR5 메모리 96GB를 지원하며, 이는 112.5에서 150 GB/s 사이의 대역폭을 제공합니다.

메모리 대역폭은 게임과 같은 그래픽 집약적인 워크로드뿐만 아니라 메타(Meta)의 라마(Llama) 3.1 8B와 같은 대규모 언어 모델의 로컬 AI 추론에도 큰 영향을 미칩니다. 이것이 바로 더 느린 DRAM 대신 GDDR 또는 HBM이 전용 GPU에 사용되는 이유 중 하나입니다.

메모리 사양이 루나 레이크와 애로우 레이크에 비해 특히 용량 면에서 상당한 도약을 보여주지만, 대역폭 측면에서는 곧 출시될 모바일 프로세서 중 가장 느린 축에 속합니다. 퀄컴의 최고 사양 X2 엘리트 익스트림(X2 Elite Extreme) 부품은 228 GB/s를, AMD의 스트릭스 헤일로 프로세서는 256 GB/s를 달성합니다. 한편, 애플(Apple)의 노트북 프로세서는 최대 546 GB/s의 메모리 대역폭을 제공할 수 있다고 합니다.

아직 풀리지 않은 질문들

경쟁사에 대해 말하자면, 인텔은 아직 최신 AI PC 부품을 AMD, 애플, 퀄컴의 최고 제품과 비교할 준비가 되지 않았습니다. 따라서 인텔의 새로운 공정 기술과 CPU/GPU 아키텍처가 실제로 얼마나 큰 차이를 만들어낼지는 아직 단정하기 어렵습니다.

사실 인텔은 가격, 클럭 속도, 전력 소비와 같은 세부 정보도 아직 완전히 공개하지 않았습니다. 15와트에서 45와트 범위의 부품을 예상한다고 하는데, 이는 인텔 테크 투어(Intel Tech Tour)에서 공개된 세 가지 주요 구성보다 더 넓은 범위의 SKU가 출시될 수 있음을 시사합니다.

칩에 많은 것이 달려있는 만큼, 인텔이 CES에 가까워질 때까지 더 많은 정보를 공유하는 것을 주저하는 것은 이해할 수 있습니다. 인텔은 약속 이행에 있어 좋은 기록을 가지고 있지 않았고, 새로 임명된 CEO 립 부 탄(Lip Bu Tan)은 이러한 나쁜 습관을 없애는 것을 자신의 임무로 삼았다고 합니다.

팬서 레이크를 제대로 만드는 것은 특히 중요합니다. 왜냐하면 이 칩은 인텔의 플래그십 모바일 프로세서일 뿐만 아니라, 인텔 파운드리(Foundry) 사업부가 무엇을 할 수 있는지 보여주는 쇼케이스이기 때문입니다. 너무 많은 것을 너무 빨리 약속하면 인텔은 잠재적인 파운드리 고객들을 겁먹게 할 수도 있습니다.

CES가 가까워지면서 팬서 레이크에 대한 더 많은 정보와 경쟁사 대비 성능이 어떻게 될지 기대가 됩니다.

위로 스크롤