이미지 자연어 설명…5개 문장 10개 키워드 10초내 생성
LG가 생성형 인공지능(AI) 상용화에 나섰다. 첫 공략처는 ‘이미지’다.
LG는 지난 18일(현지시각) 캐나다 밴쿠버에서 진행 중인 컴퓨터 비전 학회 ‘CVPR(Computer Vision and Pattern Recognition, 컴퓨터 비전 및 패턴 인식) 2023’에서 ‘캡셔닝AI’를 공개했다고 19일 밝혔다.
캡셔닝AI는 이미지를 자연어로 설명할 수 있는 AI다. 평균 5개 문장과 10개 키워드를 10초 안에 도출한다. ‘제로샷 이미지 캡셔닝’ 기술을 적용했다. 기존에 학습한 데이터를 기반으로 이미지의 요소와 특징을 인식해 관계를 설명하는 기술이다. LG AI연구원과 셔터스톡이 협력했다.
LG는 “대량의 이미지를 관리해야 하는 기업의 업무 효율성과 생산성을 높일 수 있다”라며 “AI 윤리 검증과 저작권 투명성을 확보했다”라고 설명했다.
CVPR은 18일부터 22일까지(현지시각) 열린다. LG AI연구원은 이 기간 동안 LG 전시관에서 캡셔닝AI를 시연한다. LG AI연구원은 제로샷 이미지 캡셔닝을 주제로 워크숍도 가졌다. 상반기 개최한 ‘LG 글로벌 AI 챌린지’ 시상식도 했다.
세잘 아민 셔터스톡 최고기술책임자(CTO)는 “현재 글로벌 고객사 10곳을 대상으로 ‘얼리 액세스(앞서 해보기) 프로그램’을 진행하며 캡셔닝AI 기술을 발전시켜 나가고 있다”며 “캡셔닝AI는 고객이 반복적인 작업보다 좀 더 본질적이고 창의적인 일에 집중할 수 있도록 돕는 AI가 될 것”이라고 말했다.
김승환 LG AI연구원 비전랩장은 “이번 워크숍은 첫 번째 상용화 서비스인 캡셔닝AI 발표와 연계돼 있어 더욱 의미가 깊다”며 “이미지 캡셔닝 분야의 글로벌 연구 리더십을 확보하기 위해 다양한 파트너와 유기적인 협력체계를 구축해 새로운 평가 지표 개발과 신기술 연구를 계속 추진할 계획”이라고 전했다.
한편 LG는 이번 학회를 통해 AI 인재를 모집한다. ▲LG전자 ▲LG이노텍 ▲LG에너지솔루션 ▲LG유플러스 등이 채용 상담을 한다.
디일렉=윤상호 기자
[email protected]
《반도체·디스플레이·배터리·자동차전장·ICT부품 분야 전문미디어 디일렉》
저작권자 © 전자부품 전문 미디어 디일렉 무단전재 및 재배포 금지