[기고] 클라우드의 경계를 넘어서는 분산형 분석

2021-10-12 장경윤 기자

글: 찰스 C. 바이어스 산업 인터넷 컨소시엄 최고 기술 책임자
제공 : 마우저일렉트로닉스

분석이란 더 유용한 결과를 만들기 위해 원시 데이터를 상관화하고 집약하는 기술을 의미한다. 분석 알고리즘은 센서 판독한 데이터들을 정리해 양을 줄이거나 평균화하는 것처럼 간단할 수도 있고, 매우 정교한 인공지능(AI)이나 머신 러닝(ML) 시스템처럼 복잡할 수도 있다. 오늘날 분석은 가장 확장성이 뛰어나고 비용 효율적인 솔루션이기 때문에 클라우드에서 자주 사용된다. 하지만 앞으로 분석 기술은 클라우드, 엣지 컴퓨팅, 엔드포인트 장치들로 점점 더 분산되어 더욱 향상된 대기 시간, 네트워크 대역폭, 보안, 안정성의 이점을 누리게 될 것이다. 이 글에서는 전통적인 클라우드의 경계를 넘어서는 분산형 분석과 관련한 몇 가지 아키텍처와 절충관계에 대해 살펴본다.

분산형 분석으로 가치를 창출하는 방법

단순 분석은 데이터 절감, 상관화, 평균화 등을 통해 입력 데이터보다 훨씬 작은 출력 데이터 스트림을 생성한다. 대형 건물의 급수 시스템을 생각해보자. 펌프를 최적화하고 소비량을 모니터링하기 위해서는 다양한 지점에서 압력과 흐름을 파악하는 것이 중요하다. 이를 위해 배관 주위에 압력 및 유량 센서를 설치해서 데이터를 추출한다. 소프트웨어는 주기적으로 센서를 확인하고, 펌프를 조정해가며 관리자에게 소비량을 보고한다. 그러나 센서의 원시 측정값은 설비를 세척할 때의 순간적인 압력 강하 같은 요인들로 인해 오류가 생길 수 있다. 분석 알고리즘은 시간이 지남에 따라 주어진 센서의 판독값을 평균화하고, 여러 센서의 판독값을 결합 및 상관화하여 배관 상태에 대한 보다 정확하고 유용한 자료를 제공할 수 있다. 이 모든 판독값은 클라우드 기반 분석을 통해 처리될 수 있다. 하지만 센서가 자체적으로 평균값을 계산하고 로컬 엣지 컴퓨터가 상관화와 보고 작업을 수행한다면 보다 효율적인 아키텍처가 될 것이다. 이것이 바로 분산형 분석이며, 이를 통해 다양한 분석 시스템의 효율성과 정확성, 그리고 비용을 개선할 수 있다. AI/ML 기술을 사용할 경우 분석은 더욱 복잡해진다. AI/ML은 일반적으로 두 단계로 작동한다. - AI/ML 시스템을 위한 모델을 생성하기 위해 대량의 데이터를 걸러내는 모델 구축 단계 - 원하는 결과를 실시간으로 얻기 위해 해당 모델을 시스템 내 존재하는 데이터에 적용하는 추론 단계 오늘날의 시스템에서 이러한 모델은 거의 언제나 대규모 서버 팜이나 클라우드에 오프라인 프로세스로 구축된다. 그런 다음, AI/ML 결과 모델을 라이브 데이터 모델의 추론 단계를 실행하는 다른 시스템으로 전송해 원하는 결과를 생성한다. 추론 단계는 클라우드에서도 실행될 수 있지만 최근에는 대기 시간, 네트워크 대역폭, 안정성 및 보안을 개선하기 위해 엣지에서 더 많이 실행되는 추세다. 절충관계는 각 단계에 사용할 컴퓨팅 리소스 수준을 결정할 때 고려해볼 필요가 있다.

AI/ML의 추론 단계

AI/ML의 추론 단계는 동급 계층의 프로세서나 처리 계층의 위 또는 아래 계층에 적용되기가 쉽다. AI/ML 알고리즘이 적용된 데이터는 각 모델들을 불러오게 되면 다수의 프로세서로 분할되어 병렬로 처리될 수 있다. 동급 계층의 여러 프로세서로 작업 부하가 분할되면, 부하가 증가하더라도 더 많은 컴퓨팅 리소스를 확보할 수 있기 때문에 용량, 성능, 확장상의 이점을 얻을 수 있다. 또한 프로세서 하나에 장애가 발생하더라도 인접한 프로세서가 작업을 완료할 수 있기 때문에 시스템 신뢰성도 높일 수 있다. 추론은 다수의 계층 구조들 사이에 나누어 처리할 수도 있는데, 예컨대 서로 다른 계층의 프로세서에서 작동하는 알고리즘끼리도 처리하도록 만들 수 있다. 이를 통해 AI/ML 알고리즘은 논리적 방법으로 데이터를 분할하고, 각 계층은 알고리즘을 가장 효율적으로 수행할 수 있게 된다. 예를 들어 비디오 분석 AI/ML 시스템에서 카메라의 지능은 적응형 콘트라스트를 향상시키고, 데이터를 엣지 컴퓨터에 전달하여 특징을 추출한다. 이를 근접한 데이터 센터로 보내 객체 인식을 수행하여 결국 클라우드에서는 위협 탐지 또는 히트맵 생성과 같은 고급 기능 사용할 수 있게 된다. 이는 매우 효율적인 역할 분담이라 할 수 있다.

AI/ML 알고리즘의 학습 단계

AI/ML 알고리즘의 학습 단계는 적용이 더 어렵다. 컨텍스트의 크기가 문제다. AI/ML 시스템은 모델을 생성하기 위해 대량의 훈련 데이터를 끌어와 다양하고 복잡한 학습 단계 알고리즘으로 이를 소화하고, 추론 단계에서 비교적 실행이 쉬운 모델을 생성한다. 주어진 컴퓨팅 노드에서 훈련 데이터의 일부만 사용할 수 있는 경우, 알고리즘은 모델을 일반화하는데 어려움을 겪을 수 있다. 그렇기 때문에 훈련은 메모리와 스토리지가 거의 무제한인 클라우드에서 가장 많이 수행된다. 그러나 일부 시나리오에서는 훈련 알고리즘을 여러 동급 계층의 컴퓨팅 노드나 클라우드 대 엣지 계층 구조로 분산해야 한다. 특히 엣지에서의 학습은 학습 프로세스상 근접 센서에서 많은 훈련 데이터를 수집하고, 클라우드 개입 없이 이를 처리할 수 있도록 만드는 것이 가능하기 때문에 대기 시간이나 안정성, 보안 및 네트워크 대역폭을 향상시킬 수 있다. 이러한 과제를 해결하기 위한 고급 분산형 학습 알고리즘들도 개발 중이다.

맺음말

AI/ML은 향후 거의 모든 전자 시스템에서 중요한 기능이 될 것이다. 시스템의 추론이나 훈련 기능을 컴퓨팅 리소스 계층 사이에 얼마나 효율적으로 분할할 수 있는지가 이 기술의 성공적 활용 여부를 판가름하게 될 것이다.

▶ 저자 소개

찰스 C. 바이어스(CHARLES C. BYERS)는 현재 오픈포그를 통합한 산업 인터넷 컨소시엄(IIC)의 최고 기술 책임자이다. 그는 엣지 포그 컴퓨팅 시스템, 공통 플랫폼, 미디어 처리 시스템 및 사물 인터넷의 아키텍처 및 구현에 대해 연구하고 있다. 이전에는 시스코의 수석 엔지니어이자 플랫폼 설계자였으며, 알카텔루슨트의 벨 연구소 연구원이었다. 그는 30년 동안 통신 네트워크 업계에서 음성 전환, 광대역 접속, 융합 네트워크, VoIP, 멀티미디어, 비디오, 모듈형 플랫폼, 엣지 포그 컴퓨팅 및 IoT를 포함해 다방면에서 상당한 성과를 이루었다. 그는 또한 IIC, 오픈포그 컨소시엄의 CTO를 포함해 여러 표준 기관의 리더였으며 PICMG의 ATCA(AdvancedTCA), AMC(AdvancedMC) 및 MTCA(MicroTCA) 소위원회의 창립 멤버였다.