코어·클럭 경쟁에서 이젠 가속기 경쟁으로...인텔 '사파이어 래피즈'의 혁신
나승주 인텔코리아 데이터센터 담당 상무 인터뷰 기존 세대 대비 15% 성능 향상된 코어 60개 탑재 12개의 가속기 내장, 고객사 필요에 따라 선택 가능 DDR5, PCIe 5.0 지원 통해 대역폭 극대화
Q. 서버용 CPU ‘사파이어 래피즈’가 드디어 나왔다. 출시일이 예상보다 많이 늦어졌다.
Q. 사파이어 래피즈에 대해 간략하게 설명해주신다면...
“이번에 출시한 사파이어 래피즈는 코드명이다. 공식적인 명칭은 4세대 인텔 제온 스케일러블 프로세스다. 인텔7 공정으로 생산됐다."
Q. 3세대와 4세대의 차이점에 대해 설명해달라. 가장 크게 바뀐 게 무엇인가?
“여러 가지가 있겠지만, 프로세서 중심으로 보자면 코어 자체가 바뀌었다. 이 프로세서와 연관되는 메모리 I/O 쪽도 다 같이 개선됐으며, 전체적인 서버 플랫폼의 성능 향상을 골고루 가져올 수 있게 됐다. 코어 자체, 동일한 클록에 동일한 수의 코어로 봤을 때 대략 15% 정도 코어의 성능이 개선됐다. 코어
Q. 또 다른 중요한 구성요소인 디코더가 4개에서 6개로 늘어난 것으로 알고있다.
“그렇다. 디코더를 4개에서 6개로 확대했다. 이를 통해 명령어를 해석할 수 있는 역량이 50% 이상 향상했다.
Q. 사파이어 래피즈의 경우 코어 개수를 최대 60개까지 증가시켰다. 코어 개수가 많으면 어떠한 장점이 있는가?
"동일한 코어일 경우 이전 세대 대비 코어 수가 많으면 많을수록 좋다. 다만, 실제 코어 자체가 다르기 때문에 성능 측면에서는 코어의 수가 같아도 성능 차이가 날 수밖에 없다."Q. 이번 신제품의 경우 4소켓 이상도 지원하고 있는 것으로 알고 있다.
“사파이어 래피즈 4세대 인텔 제온 스케일러블 프로세서는 다양한 소켓 수도 지원하고 있다. 보통 서버 시장에서 많은 비중을 차지하는 것이 2소켓으로 CPU가 2개로 구성된 것인데, 사파이어 래피즈는 싱글 소켓 기반의 서버부터 4소켓 이상도 지원한다. 그리고 별도 부가적인 회로 없이도 8개 소켓까지 지원 가능하다. 그리고 그 이상을 장착하는 경우 하드웨어 벤더가 설계하기 나름이다.”
Q. 칩 다이를 보니 4개를 이어 붙였다. 이에 대해 설명해달라.
“이번 신제품의 경우 최대 60개 코어를 지원한다. 60개 코어는 실리콘 측면에서 상당히 큰 사이즈다. 물리적으로 생산할 수 있는 크기는 벗어났다. 현재 기술에서. 또 다른 여러 가지 생산성 측면에서 봤을 때 실제 하나의 칩으로 생산하는 것보다 4개로 분리해 그것을 연결해서 전체 하나의 제품을 만드는 것이 효율이 좋다. 그리고 우리는 이것을 XCC(Extreme Core Count)라고 부른다.
※ XCC : 사파이어 래피즈 XCC는 네 개의 다이를 EMIB 등의 첨단 패키징 기술을 적용해 합친 반도체다. 60개의 코어를 구현한 모놀리식 반도체 양산은 불가능하기 때문에 인텔은 패키징 기술을 적용해 60개 코어를 탑재한 고성능 반도체를 생산했다.
Q. 4개의 칩을 이어 붙이기 때문에 레이턴시(latency)나 프로그래밍이 달라지는 것이 아닌가 하는 우려가 있다.
“물리적으로 4개의 칩이지만 EMIB(Embedded Multi-die Interconnect Bridge)라고 하는 칩과 칩을 연결하는 패키징 기술을 적용해 실제 레이턴시를 엄청나게 줄였다. (4개의 칩들은) EMIB를 통해 연결돼 논리적으로는 하나의 프로세서인 것처럼 작동한다. 또 물리적으로는 4개지만 EMIB를 통해서 실제 논리적으로는 하나의 프로세서 모놀리식인 것처럼 동작을 하기 때문에 고객들이 우려하는 그러한 상황은 없다.”
※ EMIB : EMIB는 반도체 다이를 연결하는 가교 역할로, 다이를 연결해 다양한 형태의 반도체 칩을 만들 수 있도록 한다. 기존 패키징 기술과 비교해 대역폭은 2배, 전력 효율성은 4배 개선 가능하다.
Q. 신제품의 경우 메모리 인터페이스 등 새로운 것이 많이 적용된 것으로 알고 있다.
“CPU 외에도 DDR5, HBM 등을 지원하고 있다. HBM의 경우 HBM만을 지원하는 다이 패키지가 있는데, 메모리 성능에 따라서 워크로드의 성능이 직결되는 고객의 경우 HBM 솔루션이 적합하다."
Q. 가속기 등을 지원해 고객의 작업을 도울 수 있는 건가?
“제온 스케일러블 프로세서가 너무나 다방면에 사용되기 때문에 항상 고민한 것이 ‘이 범용 프로세서를 가지고 다양한 워크로드에 어떻게 최적화할 수 있는가’에 대한 고민이다. 기존 CPU로는 한계가 있다고 생각했다. 그럼 과연 그것을 맞출 수 있는 것이 무엇인가라고 봤을 때 각각의 세그먼트 또는 각각의 워크로드에 적합한 가속기를 제공하자고 하는 것이다. 가속기의 경우 다방면의 워크로드에서 성능을 낼 수 있는 건 아니기 때문에 다양한 고객들을 위해 우리는 12개의 가속기를 CPU 안에 탑재했다.”
Q. 어떠한 가속기들이 있나?
“AI를 위한 가속기가 있다. AMX(Advanced Matrix Extensions)라고 부른다. 인공지능(AI)을 하게 된다면 기존 대비 엄청나게 많은 데이터를 우선적으로 처리를 해야 한다. 그렇기 때문에 기존에 있던 스칼라(Scalar) 또는 기존에 AVX처럼 벡터(Vector), 더 많은 데이터 처리를 해야 하는 필요성이 있다. 이럴 때 AMX가 적합하다. AMX는 매트릭스 단위로 (데이터를) 처리한다. 기존에는 실제 데이터 하나 처리했거나 또는 벡터 한 번에 32개의 데이터를 한 번에 처리했지만, 이것으로는 인공지능 연산에 부족하다. AVX를 예를 들면 32개의 데이터가 연결된 것을 매트릭스가 된다. 이론적으로 최대 8배 정도 성능 향상이 된다. 또 다른 가속기로는 QAT(Quick Assist Technology)가 있다.
Q. DSA 가속기는 무엇인가?
Q. 지금까지 3개 가속기를 대략적으로 설명해 주셨다. 그 외에 어떤 가속기가 있는가?
“DLB(Dynamic Load Balancer)가 있다. 이것은 말 그대로 로드 밸런서인데, 워크로드를 균형 있게 분배를 해주는 기능을 한다. 클라우드 환경을 사용할 일이 많은 고객에게 적합한 가속기다. 지금까지는 그런 역할을 대부분 소프트웨어로 처리했는데, DLB를 통해 처리하게 되면 많은 성능 향상을 가져올 수 가 있다. 우리는 이를 통해 최대 96% 레이턴시를 낮출 수 있을 것으로 추정하고 있다. 또 다른 가속기로는 IAA(In-Memory Analytics Accelerator)가 있다. IAA는 인메모리의 성능 향상 또는 거기서 가져온 데이터를 처리하는 성능을 가속시킬 수 있는 기술이다.”
Q. 가속기들의 특징을 들어보니 서버 환경에서 고객들이 가장 많이 쓰는 서비스에 대한 고려가 많았던 것 같다. 물론 모두 장점이 있는 가속기지만, 고객들이 12개 모두 사용할 것 같지는 않다.
“그렇다. 가속기라는 것이 모든 워크로드에서 다 좋은 것은 아니다. 고객들은 인공지능(AI), 네트워크, 스토리지, HPC, 데이터 분석 이렇게 본인에게 적합한 것을 선택할 수 있게 제공하고 있다.”
Q. 선택한 가속기 외에도 추후 가속기 선택이 가능한가?
“활성화 자체는 하드웨어 벤더 쪽에서 제공해줘야 한다. 추후, 하드웨어 벤더를 통해 바로 실제 클라우드에서 내가 쇼핑하듯이 쉽게 선택할 수 있는 기능을 제공할 것이다.”
Q. 신제품을 기다렸던 고객들이 많은 것으로 알고 있다. 이러한 대기 수요가 교체 수요로 이어지고 있는가?
“감사하게도 많은 고객분들이 지금 사파이어 래피즈에 대해서 많은 관심을 가져주고 있다. OEM과 하드웨어 벤더를 통해서 구매하려는 수요가 매우 높다. 특히 AMX 등의 가속기 등에 대한 관심이 높아 많은 고객들이 테스트를 진행하고 있는 상황이다.”
Q. 신제품의 경우 유난히 출시 일정이 늦었다. 추후 신제품에도 이러한 상황이 생길 수 있는 것 아닌가?
“이번 사파이어 래피즈는 이전 세대에 비해 변화된 것이 굉장히 많다. CPU 코어, DDR5, PCIe 5.0 등을 적용하다 보니 테스트할 부분이 상당이 많았다. 다만 차기 제품의 경우 현재 순항하고 있는 상황이다. 차기 신제품의 '에메랄드 래피즈'는 동일한 플랫폼을 사용하기에 출시까지 큰 문제없을 것으로 예상된다. '에메랄드 래피즈'는 올 연말까지 프로덕션, 출시는 시기적으로 조율을 하겠지만. 내부 생산 준비를 완료하는 것이 올 연말을 목표로 하고 있다. ‘에메랄드 래피즈’ 다음에 출시되는 것이 '그래나이트 래피즈'다. ‘그래나이트 래피즈’ 부터는 또 플랫폼이 또 달라진다. '그래나이트 래피즈'는 공정 기술도 개선된다. 해당 제품은 인텔3 기반으로 생산된다. '그래나이트 래피즈'도 이미 샘플이 나와있고, 이미 부팅까지도 완료하고 현재 테스트가 진행중이다. 앞으로 출시 예정인 '에메랄드 래피즈' 그다음에 '그래나이트 래피즈'까지 워킹 샘플이 있어서 현재 테스트가 잘 진행되고 있다.”
《반도체·디스플레이·배터리·전자부품 분야 전문미디어 디일렉》