AMD가 x86 서버에 10테라플롭스(FP64) 이상의 성능을 지원하는 고성능컴퓨팅(HPC) 그래픽처리장치(GPU) '인스팅트 MI100'를 17일 발표했다.
MI100 GPU는 HPC와 인공지능(AI) 기술의 가속 시스템을 지원한다. HPC에서 최대 11.5테라플롭스의 최대 FP64 성능을 지원한다. AI와 머신러닝 워크로드에서는 최대 46.1테라플롭스의 최대 FP32 매트릭스(Matrix) 성능을 보인다. AMD의 매트릭스 코어 기술이 적용된 MI100은 AI 트레이닝 워크로드에서 전작 대비 7배 향상된 FP16 최대 이론 부동소수점 성능을 제공한다.
엑사스케일 컴퓨팅 개발을 위해 ROCm 소프트웨어 플랫폼도 지원된다. ROCm은 컴파일러(compiler), 프로그래밍 API, 라이브러리로 구성된 오픈소스 툴셋이다. ROCm 4.0은 MI100 기반 시스템의 규모에 맞게 최적화됐다. 오픈MP와 HIP를 모두 지원한다. ROCm 4.0에 최적화된 파이토치와 텐서플로우 프레임워크도 함께 사용할 수 있다.
MI100은 2세대 인피니티 패브릭 링크(Links) 기술이 적용됐다. 최대 2배 높은 PCIe 4.0 이상의 P2P(peer-to-peer) 인풋아웃풋(I/O) 대역폭과 GPU당 초당 최대 340GB의 통합 대역폭을 지원한다. 서버 내에서 최대 2개의 연결된 쿼드 GPU 하이브를 구성할 수 있다. 32GB의 고대역폭 HBM2 메모리와 최신 PCIe 4.0 기술을 지원한다.
MI100은 올해 말부터 기가바이트, HPE, 슈퍼마이크로 등 주요 OEM과 ODM 파트너사를 통해 출시될 예정이다: