루나레이크 컴퓨트 타일 TSMC 3nm 공정 이용
가우디3, TSMC 5nm 생산, HBM2E 8개 탑재
엔비디아, AMD가 컴퓨텍스에서 차세대 인공지능(AI) 반도체를 발표한 가운데, 인텔은 PC 중앙처리장치(CPU), 데이터센터용 CPU, 그래픽처리장치(GPU) 등을 공개하며 전방위적 AI 반도체 포트폴리오를 소개했다.
팻 겔싱어 인텔 CEO는 4일 대만 타이베이시 난강전람관에서 열린 컴퓨텍스 2024 기조연설에서 오는 3분기 AI PC용 CPU '루나레이크'와 AI 가속기 '가우디3'를 출시한다고 발표했다. 인텔은 이번 기조연설에서도 'AI 에브리웨어'를 강조했다. AI 에브리웨어는 어디서나 AI 솔루션을 구현할 수 있도록 지원하겠다는 인텔의 캐치프레이즈로 경쟁사 대비, 폭넓은 인텔의 포트폴리오를 강조하기 위해 활용되고 있다.
루나레이크는 지난해 출시된 인텔 코어 울트라(코드명 메테오레이크)의 후속작이다. 루나레이크는 베이스 타일을 제외하고 4개 타일(SoC, GPU, I/O, CPU)로 구성됐던 이전 세대 제품과 달리 컴퓨트 타일과 플랫폼 컨트롤러 타일 2개로 구성됐다. 두 타일 모두 TSMC 파운드리에서 생산되며, 컴퓨트 타일의 경우 TSMC 3nm 공정을 이용한다.
겔싱어 CEO는 "루나레이크는 (인텔 코어 울트라 대비) 3배 향상된 AI 연산 처리 능력을 보였다"며 "AI PC에서 생성형 AI를 보다 원할하게 사용할 수 있도록 지원할 것"이라고 말했다. 시스템온칩(SoC) 전력은 인털 코어 울트라 대비 최대 40% 개선됐다.
인텔의 차세대 AI 반도체 가우디3 생산도 TSMC 파운드리를 이용한다. 5nm 공정을 통해 생산되며, 3세대 고대역폭메모리(HBM)가 8개가 탑재된다. 인텔은 8192개 가속기 클러스터를 갖춘 가우디 3는 동급 규모의 엔비디아 H100 GPU 클러스터에 비해 학습 시간이 최대 40% 빠르다.
64개 가속기 클러스터의 경우 엔비디아 H100의 라마2 700억개(Llama2-70B) 모델에 비해 최대 15% 빠른 학습처리량을 제공할 것으로 예상된다고 소개했다. 또, 인텔 가우디 3는 라마2 700억개(Llama2-70B) 및 미스트랄 70억개(Mistral-7B)와 같은 LLM을 실행할 때 엔비디아 H100 대비 평균 최대 2배 빠른 추론 성능을 가졌다고 부연했다.
이날 인텔은 가우디3 가격도 공개했다. 8개의 인텔 가우디 3 가속기와 범용 베이스보드(UBB)가 포함된 키트는 12만5000달러에 판매될 예정이다. 8개의 인텔 가우디 2 가속기와 UBB가 포함된 표준 AI 키트는 6만 5000달러에 판매되고 있다. 인텔은 이 제품들이 엔비디아 등 동급 경쟁 플랫폼 대비 각각 3분의 2, 3분의 1수준 가격이라고 설명했다.
이외에도 서버용 CPU 제온6 E-코어 프로세서(시에라포레스트)를 출시한다고 발표했다. 시에라포레스트는 인텔 3(4nm급) 공정에서 생산되며, 288개 코어가 탑재된다. 제온6 P-코어 프로세서(그래나이트래피즈)는 다음 분기에 출시될 예정이다. 시에라포레스트는 이전 세대 대비 랙당 성능이 4.2배, 와트당 성능은 2.6배 향상된 제품이다.
한편, 시에라포레스트는 컴퓨트익스프레스링크(CXL) 2.0을 지원한다.
디일렉=노태민 기자 [email protected] 《반도체·디스플레이·배터리·전장·ICT·게임·콘텐츠 전문미디어 디일렉》