언어모델의 성능과 수행능력을 검증하는 평가모델 'VARCO Judge LLM'
해외 학회 EMNLP에 ‘LLM 평가모델’ 논문 게재
엔씨소프트가 국내 최초로 거대언어모델(LLM)의 성능과 수행능력을 검증하는 평가모델 ‘바르코 저지 LLM’을 출시했다. 이 모델은 다른 LLM이 얼마나 빠르고 정확하게 작업을 수행하는지 검사하는 것이다.
기업들이 시장에서 서비스 중인 여러 LLM 가운데 적합한 모델을 찾기 위해 많은 시간을 소비한다. '바르코 저지 LLM'을 사용하면 AI 서비스에 적합한 모델을 검증할 수 있다. AI 모델 연구개발 기업은 자사 LLM의 성능 수준을 평가모델로 검증해 타 모델 대비 성능 우위를 증명하거나 약점을 빠르게 파악해 보강할 수 있다. 모델 허브(Model Hub) 사업자는 LLM을 선택해 최적화와 배포 프로세스를 가속화해 효과적으로 모델을 제공할 수 있다.
엔씨소프트는 올해 NLP 학회 ‘EMNLP(Empirical Methods in Natural Language Processing)‘에 LLM 평가모델 논문을 게재하며 글로벌 무대에서 기술력을 입증한 바 있다.
엔씨소프트는 국내 게임사 최초로 자체 언어모델을 개발해 게임 개발 과정과 사내 업무 효율화 전반에 AI 기술을 활용한다. 타 게임사는 응용 기술이라 다소 결이 다르다.
엔씨소프트 이연수 본부장은 “빠르게 진화하는 AI 시장에서 각자 산업에 맞는 최적의 모델을 선별하고 적용하는 서비스가 핵심”이라며 “출시한 제품은 AI 비즈니스에서 없어서는 안 될 중요한 도구로 자리매김할 것”이라고 말했다.
디일렉=김성진 전문기자 [email protected]
《반도체·디스플레이·배터리·전장·ICT·게임·콘텐츠 전문미디어 디일렉》
저작권자 © 전자부품 전문 미디어 디일렉 무단전재 및 재배포 금지