AIㆍML / 클라우드

퍼블릭 클라우드가 AI 부문에서 혁신을 꾀하는 방법

Isaac Sacolick | InfoWorld 2021.11.30
3대 클라우드 서비스 업체인 AWS와 마이크로소프트 애저, 구글 클라우드 플랫폼(GCP)은 개발자와 데이터 과학자가 자사 클라우드에서 머신러닝 모델을 개발, 테스트, 배포하도록 장려한다. 이는 클라우드 서비스 업체가 높은 수익을 달성하기 위한 시도라고 할 수 있다. 테스트 모델은 많은 인프라를 필요로 하고 프로덕션 모델에는 고가용성이 요구되는 경우가 많기 때문이다.
 
ⓒ Getty Images Bank

머신러닝 모델은 클라우드 서비스 업체에 수익성이 좋은 서비스이며, 고객에게도 이점을 제공한다. 하지만 클라우드 서비스 업체는 인프라와 서비스 수준, 가격 면에서만 경쟁력을 확보하고자 하는 것은 아니다. 고객이 머신러닝 기능을 더욱 쉽게 사용할 수 있도록 지원하기 위해 다목적의 온램프(On-ramp) 서비스 제공을 중점으로 두고 있다.

각 사의 퍼블릭 클라우드는 서버리스 데이터베이스와 데이터웨어하우스, 데이터 레이크, NoSQL 데이터 저장소를 비롯해 다양한 데이터 스토리지 옵션을 제공한다. 따라서 사용자는 데이터 저장 위치와 근접한 곳에서 모델을 개발할 수 있다.

또한, 클라우드 서비스 업체는 텐서플로(TensorFlow), 파이토치(PyTorch) 등 널리 사용되는 머신러닝 프레임워크를 제공하기 때문에 유연성이 필요한 데이터 과학팀을 위한 원스톱 샵(One-stop Shop)이 될 수 있다. 이 3대 클라우드 서비스 업체 모두 모델옵스(Modelops)와 ML옵스(MLops)와 함께 머신러닝 수명 주기 전반을 지원하기 위한 기능을 점점 더 많이 제공한다.

최근 레드햇(RedHat)의 연구에 따르면, 기업 AI/ML 프로젝트의 78%가 하이브리드 클라우드 인프라로 구축되고 있어 퍼블릭 클라우드 서비스 업체의 성장 가능성은 무궁무진하다. 이는 곧 퍼블릭 클라우드 서비스 업체가 새롭고 차별화된 기술로 계속 혁신되야 한다는 것을 의미한다.

이런 혁신은 기업이 더욱 다양한 서비스와 사용이 편리한 플랫폼으로 머신러닝을 실행할 수 있도록 지원하는 몇 가지 범주로 구분된다.
 

AI 칩 제공

머신러닝 실험은 방대한 양의 데이터 트레이닝이 필요한 더욱 크고 복잡한 모델로 계속 확장되고 있다. 마이크로소프트와 엔비디아는 최근 5,300억 개의 많은 매개변수가 포함된 언어 모델을 발표했다. 구글은 올해 초 1조 6,000억 개의 매개변수 모델을 훈련시켰다고 밝혔다.

이 정도의 규모와 복잡성을 가진 트레이닝 모델은 개발하는 데 시간이 오래 걸리고 비용이 많이 들기 때문에 퍼블릭 클라우드는 AI 칩과 인프라 옵션으로 혁신을 꾀하고 있다. 최근 AWS는 최신 GPU로 실행되는 EC2에 비해 40% 더 나은 가격 대비 성능을 제공하는 하바나 가우디(Habana Gaudi)를 기반으로 하는 새 EC2 인스턴스를 발표했다.

한편, 구글은 올해 초 TPU v4를 발표했다. 4세대 텐서 프로세싱 유닛은 TPU v3보다 평균 2.7배 향상된 성능을 보여줬다. 세레브라스(Cerebras)와 그래프코어(Graphcore), 엔비디아(Nvidia), 삼바노바(SambaNova)의 AI 칩과 가속기로 더 많은 하드웨어 혁신을 기대해볼 만하다.

칩 만이 AI를 구현하는 인프라 기능은 아니다. 3대 퍼블릭 클라우드 서비스 업체 모두 사물인터넷(IoT)과 기타 스트리밍 애플리케이션을 위한 머신러닝 모델 배포를 지원하는 엣지 컴퓨팅 플랫폼을 보유하고 있다.
 

AI 서비스 지원

대부분의 데이터 과학팀은 대규모 AI를 개발하지는 않지만, 첨단 머신러닝 모델을 만들고 구성하는 것을 목표로 한다. 3대 클라우드 서비스 업체 모두 머신러닝 서비스를 개발하고 있으며, 향후 몇 년 동안 크게 성장할 것으로 보인다.
 
  • 마이크로소프트 인지 서비스(Cognitive Service)는 음성 서비스와 감정 분석을 위한 언어 서비스, 챗봇에 주로 사용되는 응답 서비스를 포함한다. 인지 서비스에서 제공하는 비전 기능은 안면 인식을 포함하며, 개인화 및 이상 감지에 사용되는 의사 결정 지원 서비스를 제공한다.
  • 마이크로소프트는 최근 오픈AI(OpenAI)를 발표했다. 오픈AI는 검색, 대화, 텍스트 완성, 기타 서비스를 지원하는 GPT-3 자연어 모델과 연동된다.
  • 구글 클라우드는 일반 문서 처리를 위한 DocAI와 대출, 조달, 고객 상담, 계약 관리와 같은 수직적 업무에 사용되는 솔루션을 비롯해 문서 처리 AI 서비스를 보유하고 있다.
  • AWS 머신러닝 서비스로는 컴퓨터 비전 소프트웨어 레코그니션(Rekognition)과 문서 처리를 위한 텍스트렉트(Textract), 챗봇에 사용되는 렉스(Lex), 코드 리뷰에 쓰이는 코드 구루(CodeGuru), 웹 애플리케이션을 사용자에 맞게 설정하는 퍼스널라이즈(Personalize) 등이 있다.
  • AWS는 건강 데이터에 대해 예측할 수 있는 아마존 헬스레이크(Amazon HealthLake)와 장비의 비정상적인 동작을 감지하는 아마존 룩아웃(Amazon Lookout), 금융 서비스와 기타 산업을 지원하는 아마존 프라우드 디텍터(Amazon Fraud Detector)를 제공한다.

앞으로 퍼블릭 클라우드와 기타 경쟁 업체의 서비스형 머신러닝(MLaaS)이 더 많이 출시될까? 데이터프라임(DataPrime)의 최고 과학 책임자인 커크 보네는 그럴 것이라고 확신한다. 그 이유에 대해 보네는 “머신러닝 모델이 갈수록 정교해지고 있는 만큼, 모델을 학습시키는 데 드는 비용도 만만치 않기 때문에 향후 더 많은 MLaaS 및 서비스형 모델이 등장할 것이다. 자사의 시간과 인력을 투자해 사전에 학습된 모델의 인스턴스를 직접 구축하려는 기업은 점점 줄어들 것으로 보인다”라고 말했다.

또한, “머신러닝 및 인공지능을 개발하는 많은 중소기업은 이런 XaaS가 제공하는 기능이 시간과 예산 면에서, 그리고 전략적 요구사항에도 완전히 적합하다는 것을 알게 될 것이다. 또, MLaaS는 정교하고 강력한 알고리즘을 사용하는 서비스로 미리 학습된 모델을 활용해 보편적인 인재 격차를 해소하는 데에도 도움이 된다”라고 덧붙였다.
 

AI에 대한 접근성 향상

첨단 소프트웨어 개발 및 데이터 과학팀이 없는 기업을 대상으로 머신러닝과 AI 기능을 지원해야한다. 클라우드 서비스 업체는 머신러닝 기능이 내장된, 또는 개발자가 다른 AI 서비스와 상호작용하는 것을 돕는 로우코드(Low-code) 기술을 활용해 이를 실천하고 있다.

아마존 세이지메이커(SageMaker)의 IDE는 머신러닝 모델의 개발과 테스트, 배포를 간소화한다. IDE는 데이터 과학자가 데이터를 준비할 수 있도록 지원하는 데이터 랭글러(Wrangler)와 데이터 사이언스 팀 간의 협업 및 재사용을 촉진하는 피처 스토어(Feature Store), 원클릭 배포 기능인 데브옵스 등 몇 가지 고급 기능을 제공한다. 아마존 세이지메이커는 알터릭스(Alteryx), 다타이쿠(Dataiku), KNIME, SAS와 같은 데이터 사이언스 플랫폼과 경쟁 구도를 이룬다.

마이크로소프트는 데이터 과학자를 위해 노코드(No-code)와 코드 퍼스트(Code-first) 개발환경을 결합한 포털인 애저 머신러닝 스튜디오(Azure Machine Learning Studio)를 제공한다. 여기서 더 발전한 로우코드 AI 제품이 로우코드 개발자의 텍스트 분류와 객체 감지, 폼 처리 작업을 지원하는 파워 앱스 플랫폼용 AI 빌더(AI Builder for the Power Apps Platform)다.

구글은 오토ML(AutoML)과 유사한 학습 모델 개발에 착수했다. 앱시트(AppSheet)의 내장 인텔리전스는 트렌드 예측과 콘텐츠 분류, 감정 분석, 기타 기능을 포함한다. 퍼블릭 클라우드는 (Creatio), 아웃시스템즈(Outsystems), 씽크와이즈(Thinkwise), 반티크(Vantiq) 등 머신러닝 기능을 제공하는 다른 로우코드 플랫폼과 경쟁한다.

AL/ML 혁신에 있어 퍼블릭 클라우드 서비스 업체와 스타트업, 기업용 소프트웨어 업체, 칩 제조사, 인프라 서비스 업체, 오픈소스 플랫폼이 과연 어떤 경쟁 전략을 통해 더 많은 모델과 서비스, 그리고 애플리케이션 통합에 필요한 더 쉬운 온램프 솔루션을 지원할 지 기대된다. editor@itworld.co.kr

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.