백준호 퓨리오사AI 대표 인터뷰
"챗GPT 구동하는 전 세계에서 가장 강력한 칩"
1세대 대비 성능 8배 높여…5nm 공정 및 HBM3 기반
"엔비디아 칩 대비 성능 좋다…글로벌 CSP와 테스트할 것"
국내 AI 반도체 스타트업 퓨리오사AI가 '챗GPT'와 같은 트랜스포머 기반의 언어모델을 지원하는 차세대 칩을 조만간 선보인다. 1세대 제품인 '워보이' 대비 성능을 8배나 높인 게 특징이다. 그만큼 칩의 하드웨어적 특성도 대폭 향상시켰다. 1세대가 14nm 공정을 기반인 데 비해 2세대는 이보다 훨씬 앞선 5nm 공정을 기반으로 만들 예정이다. 최첨단 메모리반도체의 일종인 HBM3도 탑재된다.
퓨리오사AI는 이미 해당 칩의 디자인을 완성했다. 올해 중순 팹-인(칩 제조의 가장 초기 단계)에 들어가 내년 1분기부터 제품을 양산할 계획이다. 최근 글로벌 빅테크를 중심으로 대규모 언어모델이 활발히 상용화되고 있는 만큼, 관련 시장을 발빠르게 공략하겠다는 전략이다.
백준호 퓨리오사AI 대표는 지난 13일 서울 본사에서 인터뷰를 갖고 "퓨리오사AI의 2세대 AI 칩은 챗GPT를 구동하는 전세계에서 '가장 강력한' 칩이 될 것"이라며 "주요 경쟁사의 고성능 제품 비교해도 전력 대비 성능을 2배 이상 높인 제품"이라고 설명했다.
퓨리오사AI는 AMD·삼성전자 출신 백준호 대표가 지난 2017년 설립한 스타트업이다. AI 연산에 최적화된 NPU(신경망처리장치)를 전문으로 개발하는 팹리스다. AI 산업 중에서도 가장 고성능의 데이터 연산을 필요로 하는 데이터센터 시장을 타겟으로 하고 있다. 지난해 말부터 1세대 칩인 워보이 초도 물량을 생산하기 시작했으며, 올해 상반기에는 본격 양산에 들어갈 예정이다.
워보이는 양산 이전부터 전세계 반도체 업계에서 뜨거운 관심을 받은 칩이기도 하다. 지난 2021년 AI 반도체와 관련한 주요 벤치마크인 'MLPerf'에서 글로벌 업체인 엔비디아의 'T4'보다 이미지 분류, 객체 검출, 처리 속도 면에서 뛰어난 성능을 보이면서 시장의 주목을 받았다. 카카오엔터프라이즈·이팝소프트 등이 자사 컴퓨터비전 기반 서비스에 워보이를 탑재하고자 퓨리오사AI에 손을 내밀었다. 현재 퓨리오사AI는 수십 여개의 잠재 고객사와 워보이 도입을 위한 테스트를 진행 중이다.
백준호 대표는 "1세대 워보이의 초도물량 생산은 모든 테스트를 거쳐 양산으로 가기 위한 준비가 끝났다는 점에서 의미가 있다"며 "국내 스타트업이 가장 높은 성능을 요구하는 데이터센터용 AI 반도체를 과연 상용화할 수 있을지에 대한 우려도 많았지만, 퓨리오사AI는 하드웨어 칩은 물론 이를 뒷받침할 소프트웨어 스택의 성능까지 고객사의 입증을 받았다"고 말했다.
차세대 제품 역시 개발이 상당 부분 진행된 상황이다. 1세대 칩이 컴퓨터 비전에 특화돼 있다면, 2세대 칩은 챗GPT와 같은 트랜스포머 계열의 대규모 언어모델(LLM)을 주 타겟으로 한다. 트랜스포머는 문장 속 단어와 같은 순차 데이터 내의 관계를 추적해 맥락과 의미를 학습하는 신경망을 뜻한다.
미국 오픈AI가 지난해 11월 공개한 챗GPT는 트랜스포머 언어모델을 기반으로 사용자와 실시간으로 대화하는 서비스다. 출시 두 달 만에 월간 활성 사용자 수(MAU) 1억 명을 돌파한 것으로 알려져 있다. 예상보다 뜨거운 챗GPT 열풍에 글로벌 빅테크인 마이크로소프트, 구글, 바이두, 네이버, 카카오 등도 서둘러 관련 서비스를 출시하겠다는 뜻을 밝힌 바 있다.
퓨리오사AI는 막대한 컴퓨터 연산을 필요로 하는 챗GPT를 지원하기 위해 2세대 워보이 칩 성능을 대폭 향상시켰다. 2세대 칩은 1세대 대비 하드웨어적 성능은 8배, 메모리 대역폭(밴드위스; 데이터 전송 속도)은 30배가량 높다. 동시에 전력 효율성은 3배 뛰어나다. 이를 위해 2세대 칩은 5nm 공정을 활용하며, HBM3 메모리를 탑재한다. HBM은 여러 개의 D램을 수직으로 연결해 데이터 처리 속도를 높인 차세대 고대역폭메모리다.
현재 2세대 칩은 내부적으로 디자인 설계가 모두 마무리된 상황이다. 올해 6~7월을 기점으로 팹-인(특정 반도체 생산을 위한 베어 웨이퍼가 팹에 투입되는 과정)에 들어가고, 내년 1분기부터 양산에 들어갈 계획이다.
백준호 대표는 "2세대 AI 칩은 성능을 극대화한 것은 물론, 주요 경쟁사인 엔비디아의 고성능 칩과 비교해도 전력 대비 성능을 2~3배 이상 달성할 수 있다"며 "개발자로서 AI 산업에서 대규모 언어모델이 대두되는 트렌드를 파악하고 있었고, 이에 대응할 수 있는 하드웨어와 소프트웨어 개발을 최대한 빠르게 진행해온 것"이라고 말했다.
백준호 대표는 이어 "2세대 칩이 나오는 경우 글로벌 CSP(클라우드서비스사업자)들과 본격적인 테스트 과정을 거치도록 할 예정"이라며 "전 세계 탑 티어 수준의 파트너사들과 제품 개발을 위해 만전을 기해온 만큼, 글로벌 시장 공략에 자신있다"고 강조했다.
퓨리오사AI의 도전은 여기서 멈추지 않는다. 2세대 칩이 양산되기 전에 벌써 3세대 칩에 대한 밑그림을 그려나가는 중이다. 더 높은 성능의 칩 개발에 막대한 투자금과 인력이 필요한 만큼, 이에 대응하기 위한 경영 전략도 동시에 수립하고 있다.
백준호 대표는 "2세대 칩 양산 및 공격적인 비즈니스 위해 현재 2000억원 규모의 펀딩(시리즈C)을 추진하고 있는데, 3세대 칩 연구개발에만 조 단위의 금액이 필요할 것으로 판단해 추가 펀딩을 진행하려고 한다"며 "개발인력도 현재 100명 수준이지만, 내년까지 200명으로 늘리고 세계 탑 수준의 파트너들과 아웃소싱도 강화할 것"이라고 설명했다.