2017.01.02

데이터만 있다면 어디서든 가능한 MLaaS 역량 구축의 비밀

BrandPost Sponsored by HPE
Bill Laberis | HPE

서비스로서의 머신러닝(MLaaS: Machine Learning as a Service)은 기술과 인력 투자라는 비용에 훌륭한 대안이 된다.

머신러닝(Machine Learning)은 비즈니스 기술 분야의 새로운 게임 체인저다. 디지털 정보량이 매 2년마다 평균 두 배씩 증가하는 세상에서, 머신러닝은 조직이 전에 없던 속도로 엄청난 양의 데이터 스토어에서 매우 가치 있는 정보를 추출할 수 있는 기술이다.

머신러닝 솔루션을 구축해서 배포하는 데는 서버와 스토리지, 네트워크 확장, 그리고 데이터 과학자고용에 대한 투자가 필수적이다. 많은 예산이 필요한 사업이다.

그러나 대신, 기업들은 앞에 언급한 그 어떤 것에도 투자하지 않고 여러 신규 MLaaS 솔루션 중 하나에 의지할 수 있다. 머신러닝을 시작하기 위해서는 기본적으로 한 가지, 현재 거의 모든 조직에서 넘쳐나는 자원이 필요하다. 바로 데이터다.

서비스로서의 머신러닝(MLaaS: Machine Learning as a Service)
여기에서 말하는 “머신”은 컴퓨터다. 역사적으로, 컴퓨터들은 입력된 프로그래밍 명령의 지시대로 결과를 뱉어냈다. 머신러닝을 이용하면, 데이터 세트에 있는 패턴과 트렌드를 규명하기 위해 복잡한 알고리즘을 사용해 컴퓨터가 스스로 문제를 해결해낸다. 그다음 머신은 보고서를 작성하고, 인간의 행태를 예측하고, 다른 유용한 작업을 수행한다.

이런 머신들은 즐기는 법도 안다. 올해 초, 구글 딥마인드(DeepMind)의 알파고(AlphaGo) 머신러닝 프로그램은 아주 오래되고 매우 복잡한 보드게임인 바둑의 세계 최고수 이세돌을 이겼다. 알파고는 바둑을 두도록 프로그램된 것이 아니라 스스로 두는 방법을 배웠다.

액센츄어의 수석 연구원인 알란 알터에 따르면 많은 조직이 비즈니스 제반에 머신러닝을 적용해 “전대미문의 개선”을 경험했다고 한다. 알터는 “머신러닝을 적용한 실제 애플리케이션은 매우 실용적이라 거의 모든 버티컬 산업으로 확산하고 있다”고 말했다.

현재 많은 공급업체가 데이터 외에 아무것도 필요로 하지 않는 머신러닝 솔루션을 판매하고 있다. 추가 인프라나 예측 분석 전문가 같은 고급 스킬 세트가 당장 필요하지도 않다.

세일스루의 데이터 과학 담당 부사장인 데이비드 글루엑은 “우리가 중요하게 여기는 것은 머신러닝 모델에 넣는 데이터의 품질이다. 시간이 지남에 따라 결과물을 개선하는 것 역시 모델 학습에 필요한 데이터의 양”이라고 강조했다.

뉴욕에 소재한 세일스루는 모든 규모의 기업이 더욱 효과적으로 이메일을 작성하고 홍보 캠페인을 진행할 수 있도록 고객 데이터를 마이닝하는 머신러닝 알고리즘을 사용한다.

또, 세일스루의 머신러닝 프로그램이 확보한 보고서와 사업적 식견을 직접 다운로드 할 수 있는 사용자 친화적 API를 중심으로 구축된 솔루션을 서비스 형태로 제공한다. 글루엑은 IT 외부의 관리자들이 빈번하게 세이스루의 개입을 주도한다고 강조했다. 이는 직접 솔루션을 구축하기 좋아하는 IT업계의 반발을 불러올 수도 있는 요인이다.

글루엑은 그러나 IT의 접근방식은 자원을 할당해야 하고 다른 중요한 일을 할 수 없다는 기회비용을 유발한다고 강조했다.

빌려 쓸 수 있는데 왜 굳이 사야 하지?
맞춤 드레스와 액세서리 렌탈 서비스를 제공하는 온라인 서비스 업체 렌트 더 런어웨이는 세일스루의 고객 중 한 곳이다. 오래된 업계에 발을 들이려 하는 신생기업인 렌트 더 런어웨이의 고객 유치팀은 자사 서비스에 대한 입소문을 퍼뜨리기 위해 세일스루를 고용했다. 다른 렌트 더 런어웨이 팀은 이메일 캠페인을 최적화하기 위해 세일스루와 함께 일했다.

회사의 고객 데이터로 무장한 세일스루의 알고리즘은 향후 30일간 옷을 빌릴 가능성이 가장 높은 고객들을 찾아냈다. 세일스루는 특정 비즈니스에 알맞은 고객 프로파일에 부합하는 후보를 물색하기 위해 페이스북의 닮은꼴 모델링 서비스를 활용해서 신규 고객 유치를 추진했다.

세일스루의 글루엑은 렌트 더 런어웨이는 모바일 가입자 유치 비용 40% 축소, 그리고 데스크톱 가입자 유치 비용 28% 감소를 포함하는 이익을 거뒀다며, “머신러닝에 대한 장벽을 낮추는 데 기여했다”고 말했다. 또 글루엑은 마지막으로 “서비스로서의 데이터 과학(DSaaS: Data Science as a Service)이 가장 중요하다. 자사의 데이터만 있으면 된다”고 요약했다.

건강관리 최전선
MLaaS가 신생업체만을 위한 것은 아니다. 21개의 병원, 4개의 의과대학 부속 병원, 그리고 2만 9,000명의 직원을 거느린 NHS 로시안은 영국에서 두 번째로 커다란 의료 법인이다. 이 의료 법인의 NICU(Neonatal Intensive Care Unit: 신생아집중치료실)는 의사, 간호사, 영양사, 환자 그 외 다른 이들이 공유해야 하는 엄청난 양의 필수 환자 데이터를 캡처하고 있다. 속도가 생명이다. NICU에서 생과 사의 차이는 흔히 몇 분 단위로 측정된다. 그러나 지금까지 NHS 로시안이 한 건의 보고서를 수작업으로 만드는 데는 2시간 이상이 소요됐다.

NHS 로시안은 환자 데이터를 신속하게 스캔해서 자동화된 보고서를 생성할 수 있는 기계 애플리케이션이 필요했다. 이 병원 체인은 서비스로서의 기계어 애플리케이션을 제공하는 런던 소재 아리아 NLG를 고용했다. 결과는 굉장했다. 보고서 작성 시간은 2시간에서 거의 실시간 수준으로 단축되어 신생아 환자들에게 적합한 치료에 필요한 정보를 의사와 간호사들에게 제공하고 있다.

아리아의 수석 과학자인 에후드 라이터는 아리아의 효율성은 얼마나 많은 데이터를 제공하는지와 그 데이터의 정확성에 의해 결정된다고 말했다. 머신러닝은 많은 데이터를 가지고 시간이 경과함에 따라 개선하는 반복적인 프로세스이므로, 시스템을 “교육”하기 위해서는 수천 개의 데이터 세트가 필요하다. 그렇지만 머신러닝 활용에 인프라나 분석 전문가가 더 여러 명 필요한 것은 아니다.

스마트 솔루션을 그리다
스타일 미 프리티 역시 비즈니스를 한 단계 더 끌어올리기 위해 서비스로서의 머신러닝의 혜택을 보고 있다. 스타일 미 프리티는 매월 2,500페이지 뷰를 기록하는, 결혼에 대한 아이디어를 제공하는 웹 사이트다.

스타일 미 프리티는 단순한 결혼 블로그에서 차별화되는 결혼용품을 선보이는 완전한 결혼 플랫폼으로 도약하기 위해 시각 인식 전문 머신러닝 업체 클래리파이의 머신러닝 시각 인식 솔루션을 활용한다.

스타일 미 프리티는 매주 수백 곳의 결혼식, 결혼용품 공급업체로부터 받은 10만 개 이상의 이미지를 활용하므로 시각적으로 매우 뛰어난 사이트다. 그러나 수작업 이미지 태깅을 통해서는 매주 날아오는 600곳의 결혼식 사진 중 겨우 50개 업체의 사진만을 분류할 수 있었다. 이제 이미지 10만 장 모두를 태그해서 업로드함에 따라 사이트 방문자들이 이용할 수 있는 이미지 수가 대폭 늘어났다.

또, 클래리파이 솔루션은 사진을 더 구분하기 쉽고 나은 방식으로 게시해서 방문자에게 더욱 세련된 이미지 콘텐츠 서비스를 제공한다. 예를 들면 ‘핫 핑크’, ‘하이 보디스’, ‘흰색 레이스’, ‘무릎길이 드레스’ 등 사진을 섬세하게 분류할 수 있다.

계획대로 구축하라
머신러닝 자원 전체를 구축하는 기업도 있고, 일부만 구축하기로 하는 기업도 있다. 이들 조직이 부딪힐 첫 번째 과제는 분석 전문가 고용이라는 격렬한 쟁탈전이다. 사실 이런 인재와 관련해 더 많이 지출하는 곳은 일반 기업이 아니라 머신러닝 업체일 것이다.

클래리파이를 창업하는데 머신러닝 분야의 박사학위를 활용한 매트 자일러는 “머신러닝 전문가에 대해 엄청난 수요가 있었다”며, 그러나 요즘은 머신러닝을 잘 활용하기 위해 그런 전문성이 필요하지 않다”고 설명했다.

인프라 측면에서, 거대한 오늘날의 머신러닝 데이터양을 처리하기 위해서는 막대한 컴퓨팅 파워가 필요하며, 이 처리능력 중 상당 부분이 솔루션 시험 단계에서 소비된다. 액센츄어의 알터는 이것이 클라우드 기술의 완벽한 적용 분야라고 말했다. 클라우드 공급업체들은 대체로 자사의 머신러닝 도구 세트를 제공한다. AWS는 최근 자사의 딥 러닝 라이브러리 오픈 소스 버전인 DSSTNE(Deep Scalable Sparse Tensor Network Engine)을 발표했다. 전문가들은 머신러닝 전체 지원을 확장 구축하는 것이 예산이 넉넉하지 않은 업체에는 적합하지 않다는 데 일반적으로 동의하고 있다.

구매, 구축, 임대 등의 결정은 결국 머신러닝 작업을 구축할 때 필요한 것을 가지고 있는가 아닌가를 결정한다. 중요한 것은 이 결정에 다양한 옵션이 많이 존재하며, 또 그 옵션이 아주 빨리 늘어나고 있다는 것이다. 비즈니스를 혁신하기 위한 머신러닝의 잠재력에 비추어 보았을 때, 매우 반가운 소식이다. 

IT 리더를 위한 교훈 : 머신러닝
- 서비스로서의 머신러닝(MLaaS) 솔루션은 기술이나 인력에 많은 투자를 해야 할 경우 적정한 가격의 대안이 될 수 있다.
- 머신러닝 공급업체와의 작업을 시작하려면, 너무 흔해서 넘쳐나는 바로 그것, 즉 데이터만 있으면 된다.
- 머신러닝은 회사 거의 모든 부서에서 상당한 운영상 개선을 가져올 수 있다.

 


2017.01.02

데이터만 있다면 어디서든 가능한 MLaaS 역량 구축의 비밀

BrandPost Sponsored by HPE
Bill Laberis | HPE

서비스로서의 머신러닝(MLaaS: Machine Learning as a Service)은 기술과 인력 투자라는 비용에 훌륭한 대안이 된다.

머신러닝(Machine Learning)은 비즈니스 기술 분야의 새로운 게임 체인저다. 디지털 정보량이 매 2년마다 평균 두 배씩 증가하는 세상에서, 머신러닝은 조직이 전에 없던 속도로 엄청난 양의 데이터 스토어에서 매우 가치 있는 정보를 추출할 수 있는 기술이다.

머신러닝 솔루션을 구축해서 배포하는 데는 서버와 스토리지, 네트워크 확장, 그리고 데이터 과학자고용에 대한 투자가 필수적이다. 많은 예산이 필요한 사업이다.

그러나 대신, 기업들은 앞에 언급한 그 어떤 것에도 투자하지 않고 여러 신규 MLaaS 솔루션 중 하나에 의지할 수 있다. 머신러닝을 시작하기 위해서는 기본적으로 한 가지, 현재 거의 모든 조직에서 넘쳐나는 자원이 필요하다. 바로 데이터다.

서비스로서의 머신러닝(MLaaS: Machine Learning as a Service)
여기에서 말하는 “머신”은 컴퓨터다. 역사적으로, 컴퓨터들은 입력된 프로그래밍 명령의 지시대로 결과를 뱉어냈다. 머신러닝을 이용하면, 데이터 세트에 있는 패턴과 트렌드를 규명하기 위해 복잡한 알고리즘을 사용해 컴퓨터가 스스로 문제를 해결해낸다. 그다음 머신은 보고서를 작성하고, 인간의 행태를 예측하고, 다른 유용한 작업을 수행한다.

이런 머신들은 즐기는 법도 안다. 올해 초, 구글 딥마인드(DeepMind)의 알파고(AlphaGo) 머신러닝 프로그램은 아주 오래되고 매우 복잡한 보드게임인 바둑의 세계 최고수 이세돌을 이겼다. 알파고는 바둑을 두도록 프로그램된 것이 아니라 스스로 두는 방법을 배웠다.

액센츄어의 수석 연구원인 알란 알터에 따르면 많은 조직이 비즈니스 제반에 머신러닝을 적용해 “전대미문의 개선”을 경험했다고 한다. 알터는 “머신러닝을 적용한 실제 애플리케이션은 매우 실용적이라 거의 모든 버티컬 산업으로 확산하고 있다”고 말했다.

현재 많은 공급업체가 데이터 외에 아무것도 필요로 하지 않는 머신러닝 솔루션을 판매하고 있다. 추가 인프라나 예측 분석 전문가 같은 고급 스킬 세트가 당장 필요하지도 않다.

세일스루의 데이터 과학 담당 부사장인 데이비드 글루엑은 “우리가 중요하게 여기는 것은 머신러닝 모델에 넣는 데이터의 품질이다. 시간이 지남에 따라 결과물을 개선하는 것 역시 모델 학습에 필요한 데이터의 양”이라고 강조했다.

뉴욕에 소재한 세일스루는 모든 규모의 기업이 더욱 효과적으로 이메일을 작성하고 홍보 캠페인을 진행할 수 있도록 고객 데이터를 마이닝하는 머신러닝 알고리즘을 사용한다.

또, 세일스루의 머신러닝 프로그램이 확보한 보고서와 사업적 식견을 직접 다운로드 할 수 있는 사용자 친화적 API를 중심으로 구축된 솔루션을 서비스 형태로 제공한다. 글루엑은 IT 외부의 관리자들이 빈번하게 세이스루의 개입을 주도한다고 강조했다. 이는 직접 솔루션을 구축하기 좋아하는 IT업계의 반발을 불러올 수도 있는 요인이다.

글루엑은 그러나 IT의 접근방식은 자원을 할당해야 하고 다른 중요한 일을 할 수 없다는 기회비용을 유발한다고 강조했다.

빌려 쓸 수 있는데 왜 굳이 사야 하지?
맞춤 드레스와 액세서리 렌탈 서비스를 제공하는 온라인 서비스 업체 렌트 더 런어웨이는 세일스루의 고객 중 한 곳이다. 오래된 업계에 발을 들이려 하는 신생기업인 렌트 더 런어웨이의 고객 유치팀은 자사 서비스에 대한 입소문을 퍼뜨리기 위해 세일스루를 고용했다. 다른 렌트 더 런어웨이 팀은 이메일 캠페인을 최적화하기 위해 세일스루와 함께 일했다.

회사의 고객 데이터로 무장한 세일스루의 알고리즘은 향후 30일간 옷을 빌릴 가능성이 가장 높은 고객들을 찾아냈다. 세일스루는 특정 비즈니스에 알맞은 고객 프로파일에 부합하는 후보를 물색하기 위해 페이스북의 닮은꼴 모델링 서비스를 활용해서 신규 고객 유치를 추진했다.

세일스루의 글루엑은 렌트 더 런어웨이는 모바일 가입자 유치 비용 40% 축소, 그리고 데스크톱 가입자 유치 비용 28% 감소를 포함하는 이익을 거뒀다며, “머신러닝에 대한 장벽을 낮추는 데 기여했다”고 말했다. 또 글루엑은 마지막으로 “서비스로서의 데이터 과학(DSaaS: Data Science as a Service)이 가장 중요하다. 자사의 데이터만 있으면 된다”고 요약했다.

건강관리 최전선
MLaaS가 신생업체만을 위한 것은 아니다. 21개의 병원, 4개의 의과대학 부속 병원, 그리고 2만 9,000명의 직원을 거느린 NHS 로시안은 영국에서 두 번째로 커다란 의료 법인이다. 이 의료 법인의 NICU(Neonatal Intensive Care Unit: 신생아집중치료실)는 의사, 간호사, 영양사, 환자 그 외 다른 이들이 공유해야 하는 엄청난 양의 필수 환자 데이터를 캡처하고 있다. 속도가 생명이다. NICU에서 생과 사의 차이는 흔히 몇 분 단위로 측정된다. 그러나 지금까지 NHS 로시안이 한 건의 보고서를 수작업으로 만드는 데는 2시간 이상이 소요됐다.

NHS 로시안은 환자 데이터를 신속하게 스캔해서 자동화된 보고서를 생성할 수 있는 기계 애플리케이션이 필요했다. 이 병원 체인은 서비스로서의 기계어 애플리케이션을 제공하는 런던 소재 아리아 NLG를 고용했다. 결과는 굉장했다. 보고서 작성 시간은 2시간에서 거의 실시간 수준으로 단축되어 신생아 환자들에게 적합한 치료에 필요한 정보를 의사와 간호사들에게 제공하고 있다.

아리아의 수석 과학자인 에후드 라이터는 아리아의 효율성은 얼마나 많은 데이터를 제공하는지와 그 데이터의 정확성에 의해 결정된다고 말했다. 머신러닝은 많은 데이터를 가지고 시간이 경과함에 따라 개선하는 반복적인 프로세스이므로, 시스템을 “교육”하기 위해서는 수천 개의 데이터 세트가 필요하다. 그렇지만 머신러닝 활용에 인프라나 분석 전문가가 더 여러 명 필요한 것은 아니다.

스마트 솔루션을 그리다
스타일 미 프리티 역시 비즈니스를 한 단계 더 끌어올리기 위해 서비스로서의 머신러닝의 혜택을 보고 있다. 스타일 미 프리티는 매월 2,500페이지 뷰를 기록하는, 결혼에 대한 아이디어를 제공하는 웹 사이트다.

스타일 미 프리티는 단순한 결혼 블로그에서 차별화되는 결혼용품을 선보이는 완전한 결혼 플랫폼으로 도약하기 위해 시각 인식 전문 머신러닝 업체 클래리파이의 머신러닝 시각 인식 솔루션을 활용한다.

스타일 미 프리티는 매주 수백 곳의 결혼식, 결혼용품 공급업체로부터 받은 10만 개 이상의 이미지를 활용하므로 시각적으로 매우 뛰어난 사이트다. 그러나 수작업 이미지 태깅을 통해서는 매주 날아오는 600곳의 결혼식 사진 중 겨우 50개 업체의 사진만을 분류할 수 있었다. 이제 이미지 10만 장 모두를 태그해서 업로드함에 따라 사이트 방문자들이 이용할 수 있는 이미지 수가 대폭 늘어났다.

또, 클래리파이 솔루션은 사진을 더 구분하기 쉽고 나은 방식으로 게시해서 방문자에게 더욱 세련된 이미지 콘텐츠 서비스를 제공한다. 예를 들면 ‘핫 핑크’, ‘하이 보디스’, ‘흰색 레이스’, ‘무릎길이 드레스’ 등 사진을 섬세하게 분류할 수 있다.

계획대로 구축하라
머신러닝 자원 전체를 구축하는 기업도 있고, 일부만 구축하기로 하는 기업도 있다. 이들 조직이 부딪힐 첫 번째 과제는 분석 전문가 고용이라는 격렬한 쟁탈전이다. 사실 이런 인재와 관련해 더 많이 지출하는 곳은 일반 기업이 아니라 머신러닝 업체일 것이다.

클래리파이를 창업하는데 머신러닝 분야의 박사학위를 활용한 매트 자일러는 “머신러닝 전문가에 대해 엄청난 수요가 있었다”며, 그러나 요즘은 머신러닝을 잘 활용하기 위해 그런 전문성이 필요하지 않다”고 설명했다.

인프라 측면에서, 거대한 오늘날의 머신러닝 데이터양을 처리하기 위해서는 막대한 컴퓨팅 파워가 필요하며, 이 처리능력 중 상당 부분이 솔루션 시험 단계에서 소비된다. 액센츄어의 알터는 이것이 클라우드 기술의 완벽한 적용 분야라고 말했다. 클라우드 공급업체들은 대체로 자사의 머신러닝 도구 세트를 제공한다. AWS는 최근 자사의 딥 러닝 라이브러리 오픈 소스 버전인 DSSTNE(Deep Scalable Sparse Tensor Network Engine)을 발표했다. 전문가들은 머신러닝 전체 지원을 확장 구축하는 것이 예산이 넉넉하지 않은 업체에는 적합하지 않다는 데 일반적으로 동의하고 있다.

구매, 구축, 임대 등의 결정은 결국 머신러닝 작업을 구축할 때 필요한 것을 가지고 있는가 아닌가를 결정한다. 중요한 것은 이 결정에 다양한 옵션이 많이 존재하며, 또 그 옵션이 아주 빨리 늘어나고 있다는 것이다. 비즈니스를 혁신하기 위한 머신러닝의 잠재력에 비추어 보았을 때, 매우 반가운 소식이다. 

IT 리더를 위한 교훈 : 머신러닝
- 서비스로서의 머신러닝(MLaaS) 솔루션은 기술이나 인력에 많은 투자를 해야 할 경우 적정한 가격의 대안이 될 수 있다.
- 머신러닝 공급업체와의 작업을 시작하려면, 너무 흔해서 넘쳐나는 바로 그것, 즉 데이터만 있으면 된다.
- 머신러닝은 회사 거의 모든 부서에서 상당한 운영상 개선을 가져올 수 있다.

 


X