UPDATED. 2024-10-17 17:36 (목)
코어·클럭 경쟁에서 이젠 가속기 경쟁으로...인텔 '사파이어 래피즈'의 혁신
코어·클럭 경쟁에서 이젠 가속기 경쟁으로...인텔 '사파이어 래피즈'의 혁신
  • 노태민 기자
  • 승인 2023.03.21 16:50
  • 댓글 0
이 기사를 공유합니다

나승주 인텔코리아 데이터센터 담당 상무 인터뷰
기존 세대 대비 15% 성능 향상된 코어 60개 탑재
12개의 가속기 내장, 고객사 필요에 따라 선택 가능
DDR5, PCIe 5.0 지원 통해 대역폭 극대화
나승주 인텔코리아 데이터센터 사업 담당 상무
나승주 인텔코리아 데이터센터 사업 담당 상무
인텔의 차세대 서버용 CPU '사파이어 래피즈'가 드디어 나왔다. 공식 명칭은 '4세대 제온 스케일러블 프로세서'. 사파이어 래피즈는 출시 이전부터 DDR5 시대를 열 '게임 체인저'로 불렸다. 하지만 실제 출시는 당초 계획보다 1년여가량 늦어졌다. "퀄리티를 높히기 위한 어쩔 수 없는 조치"라는 게 인텔 측 설명이다.   서버 인프라 증설이 급했던 일부 고객사들은 AMD 차세대 서버용 CPU를 탑재하기도 했다. 최근 카운터포인트리서치 자료에 따르면 서버 시장에서 AMD 점유율이 20% 가까이 상승했다. 100%에 달하던 점유율을 기록하던 인텔에는 뼈아픈 실기(失期)다. 기대보다 출시가 늦었지만, 올 1월 나온 사파이어 래피즈에 대한 시장의 관심은 크다. 서버분야 기업들도 반기는 분위기다. 마이크로소프트(MS)는 최근 생성 AI를 지원하는 새 클라우드 서비스에 사파이어래피즈를 탑재했다. 삼성전자, SK하이닉스 등의 메모리반도체 기업들의 기대감도 높다. 메모리반도체 기업들은 사파이어 래피즈가 메모리 불황기 탈출의 기점이 될 것으로 보고 있다. 인텔이 사파이어 래피즈에 담은 신기술은 어떤 게 있을까. AMD의 추격, DDR5 시대 개막이라는 '게임 체인저' 역할을 해낼 수 있을까. 나승주 인텔코리아 데이터센터 담당 상무는 최근 《디일렉》과 인터뷰에서 "(사파이어 래피즈는) 코어 자체 성능부터 디코더, 가속기 등 모든 분야에서 기존 세대 대비 획기적 성능 개선을 이뤘다"고 밝혔다.  나승주 상무는 "사파이어 래피즈는 최대 60개의 코어를 지원해 연산 속도를 극대화했다"며 "코어 숫자도 늘었지만 코어 자체도 이전 제품 대비 15% 성능 개선을 이뤄냈다"고 설명했다. CPU 내에 12개의 가속기를 내장한 것도 사파이어 래피즈의 특징이다. 나 상무는 "AI, 암호화, 데이터 스트리밍 등 고객사의 필요에 따라 선택할 수 있는 12개의 가속기를 제공한다"며 "인텔은 AMX, QAT 등을 통해 획기적인 성능 향상이 가능하다"고 전했다. 나승주 상무는 사파이어 래피즈 다음에 선보일 제품에 대한 설명도 곁들였다. 그는 "차기 신제품은 '에메랄드 래피즈'로 올 연말까지 내부적으로 생산 준비를 완료하는 게 목표"라고 말했다. 이어 "에메랄드 래피즈 다음에는 '그래나이트 래피즈'를 출시할 것"이라며 "그래나이트 래피즈는 인텔3 공정을 통해 생산할 계획"이라고 했다.  다음은 나승주 상무와 주요 질의응답 내용이다. 

Q. 서버용 CPU ‘사파이어 래피즈’가 드디어 나왔다. 출시일이 예상보다 많이 늦어졌다.

“예정보다 조금 늦었다. 이 제품이 엔터프라이즈용 프로세서다보니, 가장 중요하게 생각한 게 퀄리티다. 출시한 이후에 품질 이슈가 생기면 그게 더 커다란 문제가 될 수도 있다. 그래서 퀄리티·품질을 가장 우선순위로 생각할 수밖에 없었고, 예정보다 조금 늦게 출시를 했다.”

Q. 사파이어 래피즈에 대해 간략하게 설명해주신다면...

“이번에 출시한 사파이어 래피즈는 코드명이다. 공식적인 명칭은 4세대 인텔 제온 스케일러블 프로세스다. 인텔7 공정으로 생산됐다."

Q. 3세대와 4세대의 차이점에 대해 설명해달라. 가장 크게 바뀐 게 무엇인가?

“여러 가지가 있겠지만, 프로세서 중심으로 보자면 코어 자체가 바뀌었다. 이 프로세서와 연관되는 메모리 I/O 쪽도 다 같이 개선됐으며, 전체적인 서버 플랫폼의 성능 향상을 골고루 가져올 수 있게 됐다. 코어 자체, 동일한 클록에 동일한 수의 코어로 봤을 때 대략 15% 정도 코어의 성능이 개선됐다. 코어 숫자는 48개에서 최대 60개까지 증가했다.”

Q. 또 다른 중요한 구성요소인 디코더가 4개에서 6개로 늘어난 것으로 알고있다.

“그렇다. 디코더를 4개에서 6개로 확대했다. 이를 통해 명령어를 해석할 수 있는 역량이 50% 이상 향상했다. 디코더의 확대를 통해 명령어를 더 세밀하게 분해한다. 명령어 자체를 병렬화해서 동시에 처리하기 위해서다. 우리가 산술연산이라고 하는 AND, OR 또는 더하기, 빼기 이렇게 할 수 있는 부분도 4개에서 5개로 증가했다. 메모리 로드 하는 부분도 하나 더 추가됐다. 이것이 중간에 실행 유닛 전까지 해석하고 실행하기 전 중간 단계에서 이뤄지는 일이다. 이러한 작업을 통해 사파이어 래피즈는 전체적으로 약 15% 이상 성능을 높이는데 성공했다.”

Q. 사파이어 래피즈의 경우 코어 개수를 최대 60개까지 증가시켰다. 코어 개수가 많으면 어떠한 장점이 있는가?

"동일한 코어일 경우 이전 세대 대비 코어 수가 많으면 많을수록 좋다. 다만, 실제 코어 자체가 다르기 때문에 성능 측면에서는 코어의 수가 같아도 성능 차이가 날 수밖에 없다."

Q. 이번 신제품의 경우 4소켓 이상도 지원하고 있는 것으로 알고 있다.

“사파이어 래피즈 4세대 인텔 제온 스케일러블 프로세서는 다양한 소켓 수도 지원하고 있다. 보통 서버 시장에서 많은 비중을 차지하는 것이 2소켓으로 CPU가 2개로 구성된 것인데, 사파이어 래피즈는 싱글 소켓 기반의 서버부터 4소켓 이상도 지원한다. 그리고 별도 부가적인 회로 없이도 8개 소켓까지 지원 가능하다. 그리고 그 이상을 장착하는 경우 하드웨어 벤더가 설계하기 나름이다.”

Q. 칩 다이를 보니 4개를 이어 붙였다. 이에 대해 설명해달라.

“이번 신제품의 경우 최대 60개 코어를 지원한다. 60개 코어는 실리콘 측면에서 상당히 큰 사이즈다. 물리적으로 생산할 수 있는 크기는 벗어났다. 현재 기술에서. 또 다른 여러 가지 생산성 측면에서 봤을 때 실제 하나의 칩으로 생산하는 것보다 4개로 분리해 그것을 연결해서 전체 하나의 제품을 만드는 것이 효율이 좋다. 그리고 우리는 이것을 XCC(Extreme Core Count)라고 부른다.

XCC : 사파이어 래피즈 XCC는 네 개의 다이를 EMIB 등의 첨단 패키징 기술을 적용해 합친 반도체다. 60개의 코어를 구현한 모놀리식 반도체 양산은 불가능하기 때문에 인텔은 패키징 기술을 적용해 60개 코어를 탑재한 고성능 반도체를 생산했다.

Q. 4개의 칩을 이어 붙이기 때문에 레이턴시(latency)나 프로그래밍이 달라지는 것이 아닌가 하는 우려가 있다.

“물리적으로 4개의 칩이지만 EMIB(Embedded Multi-die Interconnect Bridge)라고 하는 칩과 칩을 연결하는 패키징 기술을 적용해 실제 레이턴시를 엄청나게 줄였다. (4개의 칩들은) EMIB를 통해 연결돼 논리적으로는 하나의 프로세서인 것처럼 작동한다. 또 물리적으로는 4개지만 EMIB를 통해서 실제 논리적으로는 하나의 프로세서 모놀리식인 것처럼 동작을 하기 때문에 고객들이 우려하는 그러한 상황은 없다.”

EMIB : EMIB는 반도체 다이를 연결하는 가교 역할로, 다이를 연결해 다양한 형태의 반도체 칩을 만들 수 있도록 한다. 기존 패키징 기술과 비교해 대역폭은 2배, 전력 효율성은 4배 개선 가능하다.

Q. 신제품의 경우 메모리 인터페이스 등 새로운 것이 많이 적용된 것으로 알고 있다.

“CPU 외에도 DDR5, HBM 등을 지원하고 있다. HBM의 경우 HBM만을 지원하는 다이 패키지가 있는데, 메모리 성능에 따라서 워크로드의 성능이 직결되는 고객의 경우 HBM 솔루션이 적합하다."

Q. 가속기 등을 지원해 고객의 작업을 도울 수 있는 건가?

“제온 스케일러블 프로세서가 너무나 다방면에 사용되기 때문에 항상 고민한 것이 ‘이 범용 프로세서를 가지고 다양한 워크로드에 어떻게 최적화할 수 있는가’에 대한 고민이다. 기존 CPU로는 한계가 있다고 생각했다. 그럼 과연 그것을 맞출 수 있는 것이 무엇인가라고 봤을 때 각각의 세그먼트 또는 각각의 워크로드에 적합한 가속기를 제공하자고 하는 것이다. 가속기의 경우 다방면의 워크로드에서 성능을 낼 수 있는 건 아니기 때문에 다양한 고객들을 위해 우리는 12개의 가속기를 CPU 안에 탑재했다.”

Q. 어떠한 가속기들이 있나?

“AI를 위한 가속기가 있다. AMX(Advanced Matrix Extensions)라고 부른다. 인공지능(AI)을 하게 된다면 기존 대비 엄청나게 많은 데이터를 우선적으로 처리를 해야 한다. 그렇기 때문에 기존에 있던 스칼라(Scalar) 또는 기존에 AVX처럼 벡터(Vector), 더 많은 데이터 처리를 해야 하는 필요성이 있다. 이럴 때 AMX가 적합하다. AMX는 매트릭스 단위로 (데이터를) 처리한다. 기존에는 실제 데이터 하나 처리했거나 또는 벡터 한 번에 32개의 데이터를 한 번에 처리했지만, 이것으로는 인공지능 연산에 부족하다. AVX를 예를 들면 32개의 데이터가 연결된 것을 매트릭스가 된다. 이론적으로 최대 8배 정도 성능 향상이 된다. 또 다른 가속기로는 QAT(Quick Assist Technology)가 있다. 암호화를 하거나 또는 압축을 하는는 데 있어서 쓰이는 가속기다. 암호화·압축은 최근 많이 사용되고 있는데 서버 클라이언트 환경에서 통신을 할 때 TLS 기반으로 하기 때문에 모두 암호화를 하고 나서 서로 통신을 하는, 모든 과정이 다 암호화됨으로써 QAT를 통해 많은 성능 향상을 가져올 수가 있다.”

Q. DSA 가속기는 무엇인가?

“DSA(Data Streaming Accelerator)는 데이터 스트리밍 가속기다. 데이터 스트리밍이라는 것이 데이터가 계속해서 흘러가는 것인데, DSA는 일련의 데이터가 계속해서 스토리지나 서버 등 이동하거나 복사하는 등을 가속화하는 기술이다. 이전에는 데이터를 하나, 한 곳에서 한쪽으로 옮길 때는 다 CPU가 관여를 했다. 하지만, 데이터 스트리밍처럼 엄청나게 많은 데이터에 관여하기엔 CPU 같이 귀중한 자원을 데이터 이동에만 사용할 순 없기 때문에 만들어진 기술이다. CPU는 DSA한테 명령만 해주고 DSA는 이러한 명령을 수행을 하면 된다.

Q. 지금까지 3개 가속기를 대략적으로 설명해 주셨다. 그 외에 어떤 가속기가 있는가?

“DLB(Dynamic Load Balancer)가 있다. 이것은 말 그대로 로드 밸런서인데, 워크로드를 균형 있게 분배를 해주는 기능을 한다. 클라우드 환경을 사용할 일이 많은 고객에게 적합한 가속기다. 지금까지는 그런 역할을 대부분 소프트웨어로 처리했는데, DLB를 통해 처리하게 되면 많은 성능 향상을 가져올 수 가 있다. 우리는 이를 통해 최대 96% 레이턴시를 낮출 수 있을 것으로 추정하고 있다. 또 다른 가속기로는 IAA(In-Memory Analytics Accelerator)가 있다. IAA는 인메모리의 성능 향상 또는 거기서 가져온 데이터를 처리하는 성능을 가속시킬 수 있는 기술이다.”

Q. 가속기들의 특징을 들어보니 서버 환경에서 고객들이 가장 많이 쓰는 서비스에 대한 고려가 많았던 것 같다. 물론 모두 장점이 있는 가속기지만, 고객들이 12개 모두 사용할 것 같지는 않다.

“그렇다. 가속기라는 것이 모든 워크로드에서 다 좋은 것은 아니다. 고객들은 인공지능(AI), 네트워크, 스토리지, HPC, 데이터 분석 이렇게 본인에게 적합한 것을 선택할 수 있게 제공하고 있다.”

Q. 선택한 가속기 외에도 추후 가속기 선택이 가능한가?

“활성화 자체는 하드웨어 벤더 쪽에서 제공해줘야 한다. 추후, 하드웨어 벤더를 통해 바로 실제 클라우드에서 내가 쇼핑하듯이 쉽게 선택할 수 있는 기능을 제공할 것이다.”

Q. 신제품을 기다렸던 고객들이 많은 것으로 알고 있다. 이러한 대기 수요가 교체 수요로 이어지고 있는가?

“감사하게도 많은 고객분들이 지금 사파이어 래피즈에 대해서 많은 관심을 가져주고 있다. OEM과 하드웨어 벤더를 통해서 구매하려는 수요가 매우 높다. 특히 AMX 등의 가속기 등에 대한 관심이 높아 많은 고객들이 테스트를 진행하고 있는 상황이다.”

Q. 신제품의 경우 유난히 출시 일정이 늦었다. 추후 신제품에도 이러한 상황이 생길 수 있는 것 아닌가?

“이번 사파이어 래피즈는 이전 세대에 비해 변화된 것이 굉장히 많다. CPU 코어, DDR5, PCIe 5.0 등을 적용하다 보니 테스트할 부분이 상당이 많았다. 다만 차기 제품의 경우 현재 순항하고 있는 상황이다. 차기 신제품의 '에메랄드 래피즈'는 동일한 플랫폼을 사용하기에 출시까지 큰 문제없을 것으로 예상된다. '에메랄드 래피즈'는 올 연말까지 프로덕션, 출시는 시기적으로 조율을 하겠지만. 내부 생산 준비를 완료하는 것이 올 연말을 목표로 하고 있다. ‘에메랄드 래피즈’ 다음에 출시되는 것이 '그래나이트 래피즈'다. ‘그래나이트 래피즈’ 부터는 또 플랫폼이 또 달라진다. '그래나이트 래피즈'는 공정 기술도 개선된다. 해당 제품은 인텔3 기반으로 생산된다. '그래나이트 래피즈'도 이미 샘플이 나와있고, 이미 부팅까지도 완료하고 현재 테스트가 진행중이다. 앞으로 출시 예정인 '에메랄드 래피즈' 그다음에 '그래나이트 래피즈'까지 워킹 샘플이 있어서 현재 테스트가 잘 진행되고 있다.”

《반도체·디스플레이·배터리·전자부품 분야 전문미디어 디일렉》


관련기사

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.

  • 서울특별시 강남구 논현로 515 (아승빌딩) 4F
  • 대표전화 : 02-2658-4707
  • 팩스 : 02-2659-4707
  • 청소년보호책임자 : 이수환
  • 법인명 : 주식회사 디일렉
  • 대표자 : 한주엽
  • 제호 : 디일렉
  • 등록번호 : 서울, 아05435
  • 사업자등록번호 : 327-86-01136
  • 등록일 : 2018-10-15
  • 발행일 : 2018-10-15
  • 발행인 : 한주엽
  • 편집인 : 장지영
  • 전자부품 전문 미디어 디일렉 모든 콘텐츠(영상,기사, 사진)는 저작권법의 보호를 받은바, 무단 전재와 복사, 배포 등을 금합니다.
  • Copyright © 2024 전자부품 전문 미디어 디일렉. All rights reserved. mail to [email protected]