제조·통신·IT서비스·포털·SNS·게임, 너도나도 AI…생존자는?

AI 고도화, 양질 데이터 및 AI 데이터센터 비용 필수 성능·비용 균형 ‘초거대 AI-경량 상용화 AI’ 조합 보편화

2023-08-22     윤상호 기자
네이버
이세돌 9단이 구글 인공지능(AI) 알파고와 바둑을 둔지 7년이 지났다. ▲제조사 ▲통신사 ▲정보기술(IT)서비스사 ▲포털사 ▲게임사 ▲사회관계망서비스(SNS)사 등 너도나도 AI를 외치고 있다. 국내도 해외도 마찬가지다. 바야흐로 AI 시대다. AI는 ▲업무 효율 증대 ▲비용 절감 등 생산성과 수익성을 높일 수 있는 수단으로 주목을 받고 있다. 기대치를 만족시킬 AI를 개발하기 위해선 돈과 시간 그리고 정보가 필요하다. 이 때문에 ▲국내 기업이 이를 감당할 수 있는 체력이 있는지 ▲국내 기업이 개발한 AI가 글로벌 경쟁력이 있는지 등에 대한 의구심도 나온다. 최근 국내외 기업이 꽂힌 AI는 생성형 AI다. 창작물을 만들어낼 수 있는 AI를 일컫는다. 거대언어모델(LLM)은 말 그대로 대형 언어모델(LM)을 지칭한다. 글자를 공부해 자연스러운 언어로 응답할 수 있는 AI다. 매개변수(파라미터)가 많으면 LLM이다. 다양한 경우의 수를 학습해야 더 많은 상황을 대처할 수 있는 원리다. 멀티모달(Multi-Modal)이라는 용어도 자주 등장한다. 멀티모달은 데이터를 습득하는 방법 중 하나다. 글자·사진 등 여러 방식으로 학습하고 응답하는 AI를 멀티모달 AI라고 한다. 초거대 AI 는 사람처럼 추론할 수 있는 차세대 AI다. 매개변수 규모로 구분한다. 초거대 AI 시대를 연 오픈AI ‘챗GPT3’의 매개변수는 1750억개다. 초거대 AI는 누구나 만들 수 있는 것은 아니다. 데이터와 데이터센터가 있어야 한다. 데이터는 AI를 가르칠 기반이다. 데이터센터는 AI가 학습과 추론을 할 수 있는 자원이다. AI 데이터센터는 대량의 AI 반도체와 저장장치로 구성한 서버의 집합체다. AI 반도체는 그래픽처리장치(GPU)가 주도하고 있다. 저장장치는 낸드플래시 메모리반도체를 이용한 솔리드스테이트드라이브(SSD)를 활용한다. 구축도 운용도 돈이다. 실제 상용화는 초거대 AI를 미세조정(파인튜닝)한 경량화 AI를 쓰는 이유다. 초거대 AI는 AI 학습과 추론의 틀을 고도화하는 선생이다. 경량화 AI는 이를 바탕으로 한 특정 분야 전문가다. 제조사 중 두각을 나타내고 있는 곳은 LG다. LG AI연구원은 지난 7월 ‘엑사원2.0’을 공개했다. 3000개 매개변수를 갖췄다. 4500만건 전문 문헌과 3억6000만장 사진을 학습했다. 이중 언어 모델이다. 한국어와 영어를 이해할 수 있다. LG는 엑사원2.0을 기반으로 ▲유니버스 ▲디스커버리 ▲아틀리에 서비스를 선보였다. 유니버스는 검색 도구다. 디스커버리는 화학·바이오 분야 신물질 연구개발(R&D) 보조다. 아틀리에는 이미지를 언어로 표현하는 용도다. 통신사는 SK텔레콤과 KT가 칼을 뺐다. SK텔레콤은 회사 전체성을 통신사에서 AI사로 규정했다. ‘따로 또 같이’ 전략이다. 지난 7월 ‘글로벌 텔코 AI 얼라이언스’를 창설했다. ▲도이치텔레콤 ▲이앤(e&) ▲싱텔을 끌어들였다. 통신사가 뭉쳐 데이터와 비용을 나누기 위해서다. 지난 6월에는 ‘K-AI 얼라이언스’를 구축했다. SK텔레콤 등 11개 국내 기업이 합류했다. AI R&D와 세계 공략에 힘을 모으기로 했다. KT는 2020년부터 생성형 AI ‘믿음’을 개발 중이다. KT AI 디지털전환(DX)융합사업부문 및 융합기술원과 KT클라우드가 협업했다. 중이다. 믿음 매개변수는 2000억개로 알려졌다. 믿음을 적용한 AI컨택센터(CC) 사업을 진행하고 있다. 올해 매출액 목표는 1000억원이다. 2025년까지 연간 3000억원 수준으로 확대가 목표다. IT서비스사는 삼성SDS가 하반기 생성형 AI 사업 추진을 천명했다. 삼성SDS의 강점은 확실한 수요다. AI는 도입하고 싶지만 데이터 유출을 걱정하는 관계사를 타깃으로 했다. ‘2023년 2분기 실적발표 컨퍼런스콜’을 통해 공식화했다. 아직 성능과 규모 등 구체적 실체는 미지수다. 네이버와 카카오도 빠질 수 없다. 엔씨소프트도 이름을 올렸다. 네이버는 오는 24일 2세대 초거대 AI ‘하이퍼클로바X’를 발표한다. 1세대 초거대 AI ‘하이퍼클로바’ 매개변수는 2040억개다. 네이버는 하반기 하이퍼클로바X 생태계를 전개한다. ▲대화형 에이전트 ‘클로바X’ ▲검색 서비스 ‘큐:’ ▲블로그 창작 도구 ▲중소기업 생산성 향상 도구 ▲기업 대상 거래(B2B)용 ‘클로바 스튜디오’ ▲생성형 AI 보안 서비스 ‘뉴로클라우드’ 둥이 대기 중이다. 카카오는 한국어에 특화한 초거대 AI ‘코(ko)GPT2.0’을 4분기 내놓는다. 지난 7월에는 멀티모달 AI ‘칼로2.0’을 선보였다. 카카오는 규모보다 비용을 우선한다. 2021년 나온 ‘코GPT1.0’ 매개변수는 300억개다. 코GPT2.0 매개변수는 1.0버전보다 많지만 엑사원2.0과 하이퍼클로바X에 비해선 적을 전망이다. 엔씨소프트는 지난 16일 ‘바르코 LLM’을 내놨다. 매개변수는 ▲130억개 ▲64억개 ▲13억개 3종이다. 엔씨소프트는 AI 순차 강화 전략이다. 오는 11월 매개변수 520억개 버전 내년 3월 매개변수 1000억개 버전을 소개할 예정이다. 자체 게임 개발은 물론 외부 사업까지 확대한다. ▲교육 ▲금융 ▲바이오 등을 노리고 있다. 디일렉=윤상호 기자 crow@bestwatersport.com

《반도체·디스플레이·배터리·자동차전장·ICT부품 분야 전문미디어 디일렉》