인텔은 2세대 '하바나 가우디2' 딥 러닝 프로세서와 엔비디아 'A100'의 AI 총 학습 시간(TTT) 성능을 MLPerf 산업 벤치마크 상에서 측정한 결과, 하바나 가우디2 딥 러닝 프로세서의 성능이 월등했다고 1일 밝혔다.
하바나 가우디2는 1세대 가우디 제품 대비 TTT 부문을 크게 향상한 프로세서다. 하바나 랩스에 따르면 지난 2022년 5월 진행한 'MLPerf' 벤치마크에서 가우디2는 8개의 가속기를 사용하는 비전 및 언어 모델에서 엔비디아 A100-80G 대비 높은 성능을 기록했다. MLPerf는 업계에서 가장 공신력 있는 AI반도체 벤치마크 대회다.
ResNet-50 모델의 경우, 가우디2는 엔비디아 A100-80G 제품 대비 학습 시간이 36% 단축됐다. 델(Dell)이 진행한 8개의 가속기 서버에서 진행한 ResNet-50 모델 및 BERT 모델 학습 테스트 결과 가우디2가 엔비디아 A100-40GB 대비 학습 시간을 45% 단축했다.
MLPerf을 통해 측정된 가우디2 제품의 성능 외에도 가우디1은 고효율 시스템 스케일링을 지원하는 128-가속기 및 256-가속기를 위한 ResNet 모델에서 강력한 성능 및 선형 스케일을 제공했다.
산드라 리베라 인텔 수석 부사장 겸 데이터센터 및 AI 그룹 총괄은 "가우디2가 출시 한 달 만에 MLPerf 벤치마크에서 뛰어난 성능을 기록해 매우 기쁘다"며 "인텔은 비전 및 언어 모델 모두에서 동급 최고의 성능을 제공해 고객에 가치를 제공하고 AI 딥러닝 솔루션 개발을 가속화하도록 지원할 것"이라고 말했다.
한편 인텔 데이터 센터 팀은 하바나 랩스의 가우디 플랫폼을 활용해 딥 러닝 프로세서 기술에 중점을 두었으며, 데이터 과학자 및 머신러닝 엔지니어가 학습을 가속화할 수 있도록 지원했다. 또한 단 몇 줄의 코드로 새로운 모델을 구축하거나 기존 모델을 이전해 생산성을 높이고 운영 비용을 절감할 수 있도록 구현했다.