IBM, 삼성과 협력 개발한 '온칩 가속 AI 프로세서 텔럼' 공개
대규모 금융 거래에 딥러닝 추론 지원 7나노 EUV 공정 적용
IBM은 인공지능(AI) 프로세서 '텔럼(Telum)'의 세부 정보를 첨단 반도체 기술 컨퍼런스 핫칩(Hot Chips)에서 24일 공개했다.
텔럼 프로세서는 거래 처리 중에 AI 추론 기술을 적용할 수 있도록 온칩 가속 기술을 적용한 IBM의 첫 번째 프로세서다. 7나노미터(nm) 극자외선(EUV) 기술 노드에서 개발됐으며, 삼성전자가 기술 개발 파트너로 참여했다. IBM은 3년의 연구 개발 기간을 거쳐 칩을 개발했다고 밝혔다.
텔럼은 기업 워크로드에 딥 러닝 추론 기술을 적용해 금융 사기에 실시간으로 대응하도록 설계된 칩이다. 온칩 하드웨어 가속 기술은 은행, 금융, 주식 매매, 보험 애플리케이션 및 고객 대응 전반에 걸쳐 활용될 수 있다. 사기 탐지, 대출 처리, 거래 승인 및 결제, 자금 세탁 방지, 위험 분석과 같은 금융 서비스 등에 이상적이다.
텔럼을 사용하면 별도 플랫폼 AI 솔루션을 호출하는 방식 대신, 미션 크리티컬 데이터 및 애플리케이션 가까운 곳에 위치한 가속기를 통해 민감한 거래에 대해 대규모 추론을 실시간으로 실행할 수 있다. 또 플랫폼 외부에서도 AI 모델을 구축하고 학습시킬 수 있다. 분석을 위해 텔럼 기반의 IBM 시스템에 해당 AI 모델을 배포하여 추론을 실행할 수 있다.
텔럼은 딥 슈퍼 스칼라 비순차 명령 파이프라인(deep super-scalar out-of-order instruction pipeline)의 구조를 갖는 8개 프로세서로 구성된다. 각 프로세서는 5GHz 이상의 클럭 속도로 수행된다. 이는 이기종 엔터프라이즈급 워크로드의 요구 사항에 최적화돼 있다.
전체적으로 재설계된 캐시 및 칩 인터커넥션 인프라는 코어당 32MB 캐시를 제공하며 32개의 텔럼 칩으로 확장할 수 있다. 듀얼 칩 모듈(DCM) 설계는 17개의 금속층 위에 220억개의 트랜지스터와 19마일의 와이어를 포함한다.
텔럼 기반의 시스템은 내년 상반기 출시 예정이다.