엣지 AI 컴퓨팅, 클라우드 AI와 공존
끊임없이 연산하고 상호작용, 즉시성·효율성 제공
[세미콘코리아 2019 AI 서밋 미리보기]
2019-01-18 이수환 기자
인공지능(AI) 반도체의 진화 방향은 크게 두 가지로 나뉜다. 하나는 엣지단(디바이스)에서 연산하는 것이고, 또 다른 하나는 클라우드를 통해 대규모 데이터를 처리하는 방법이다. 인프라 업체는 클라우드, 디바이스 업체는 엣지단에서의 경쟁력 강화를 통해 주도권을 쥐려는 전략이다. 당장 어느 하나만 가지고 AI를 완벽하게 구현하기는 어려워서 서로의 장점을 최대한 활용하고 있다.
예컨대 구글과 IBM은 클라우드 인프라 상에서 AI를 구현하겠다는 계획을 갖고 각각 TPU(Tensor Processing Unit), 트루노스(Truenorth) 칩을 개발하고 있다. 바이두, 페이스북 같은 업체는 중앙처리장치(CPU)보다 병렬연산 능력이 높은 범용 그래픽처리장치(GPU)를 활용한다. 이와 달리 인텔, 퀄컴은 사용자가 직접 사용하는 디바이스 차원에서 AI 반도체 개발에 나선 상태다.
양 진영을 연결해주는 것은 5세대(5G) 이동통신이다. 5G는 4세대(4G) 롱텀에볼루션(LTE)과 비교해 데이터 전송속도만 빠른 것이 아니라 저지연 성능을 갖췄다. 응답속도를 개선해 자율주행차와 같은 새로운 응용 분야에 접목할 수 있다. 그러나 네트워크가 갑자기 끊어지는 상황이 발생하면 곤란하다. 인텔이 자율주행차, 특히 안전에 있어 5G가 필수적인 기술은 아니라고 주장하는 이유다. 고해상도 지도를 받고 콘텐츠를 내려받는 등 데이터가 오가는 역할을 할 수 있지만 어디까지나 자율주행차가 스스로 판단해 사고를 막을 수 있어야 한다는 것.
당장 소비자가 AI를 체감할 수 있게 해야 한다는 점도 중요하다. 삼성전자, 애플, 인텔, 퀄컴, 하이실리콘 등이 애플리케이션 프로세서(AP)에 신경망처리장치(NPU)를 앞다퉈 도입하고 있는 이유다. 뇌 신경망을 모방한 NPU는 반복된 머신러닝(기계학습)에 최적화된 회로 구조로 되어 있다. NPU가 스마트폰 AP에 탑재되면 학습을 통해 영상, 이미지, 음성 인식 성능을 한 단계 높일 수 있다. 사용자경험(UX)을 한 차원 높일 수 있다는 점에서 차별화가 가능하다.
이를 위해서는 반도체를 이루고 있는 각 요소의 성능이 높아지면서도 전력소비량이 낮아져야 한다. 시스템온칩(SoC) 역량을 갖춰야 한다는 의미다. 인텔이 인수한 자회사 모비디우스는 심층신경망분석(DNN) 가속 기술을 내장한 전처리장치(VPU) 시스템온칩(SoC) 미리어드X를 내놨다. 최근에는 이 칩을 장착한 클라우드 없이 PC에 꽂아 쓰는 뉴럴 컴퓨트스틱2도 공개했다. 첫 제품인 뉴럴 컴퓨트스틱에 비해 처리 속도가 8배 향상됐고 전력소비량은 1와트(W)로 낮췄다.
삼성전자는 2월 공개할 신형 스마트폰 갤럭시S10에 장착될 엑시노스9(9820)에 성능이 강화된 NPU를 탑재했다, 기존 제품(9810) 대비 약 7배 향상됐다. 사진 촬영 시 피사체 형태나 장소, 주변 밝기 등을 순간적으로 파악하고 최적 값을 AI가 자동 설정해준다. 인물이나 사물의 특징을 빠르고 정확하게 파악해 증강현실(AR)이나 가상현실(VR) 서비스를 구현할 수 있다.
퀄컴은 스냅드래곤 855에 CPU, GPU, 디지털신호처리장치(DSP), 이미지신호처리장치(ISP)와 함께 4세대 AI 엔진을 통합적으로 운용한다. 1초에 7조번 연산이 가능하다. 이는 스냅드래곤 845보다 3배 더 빨라진 것이다.
반도체 업계에서는 클라우드 인프라에 탑재되는 대용량 고속 AI 칩과 함께 디바이스에서 AI 연산이 즉각 가능하도록 하는 엣지 AI 컴퓨팅용 칩이 공존하면서 발전할 것으로 내다보고 있다. 클라우드와 엣지단 AI 반도체가 상호 보완적 관계로 함께 발전해 나간다는 의미다.