2020.04.02

도미노 피자 배달 속도에 기여한 AI 이야기

Zeus Kerravala | InfoWorld
인공지능)과 머신러닝이라는 단어를 들으면 우주 탐사와 생물 의학처럼 연구 개발에 크게 의존하는 선진 산업이 떠오른다. 그러나 사실 AI와 머신러닝은 모든 업계가 주시해야 하는 기술이다. 소매업도 마찬가지다. 현대는 고객 서비스의 시대이며, 서비스의 작은 차이로 인해 시장 점유율이 크게 달라질 수 있다.

지난 주 엔비디아는 연례 행사인 GPU 기술 컨퍼런스를 가상으로 개최했는데, 이 현장은 AI/머신러닝의 실제 사용례 쇼케이스가 되었다. 그간 이 행사는 매우 기술 중심으로 진행되었지만 이번에는 엔비디아가 수년에 걸쳐 첨단 기술로 기업 운영을 개선한 방법을 보여주는 이벤트로 발전했다. 
 

AI/머신러닝으로 지점과 온라인 운영을 개선한 도미노

도미노는 AI와 머신러닝을 사용하는 방법을 보여준 대표적인 소매업체다. 도미노는 성공적인 운영 방식의 변화를 고안해냈다. 비법은 엔비디아의 기술로, 업계 선두의 피자 체인이 지점과 온라인 운영을 개선하고, 더 나은 고객 경험을 제공하고, 주문을 더 효율적으로 전달하게 된다. 

그 결과 고객의 만족도와 함께 배달원이 받는 팁도 높아졌다. 그러나 여러 장점의 작은 일부일 뿐이다. 피자를 지점에서 주문한 사람의 집으로 배달하려면 어떤 과정을 거쳐야 할까? 대답은 꽤 복잡하다. 
 

엔비디아 DGX-1 서버를 통한 AI/머신러닝 이니셔티브 가속화

도미노의 데이터 과학 부서는 딥 러닝 연구를 위한 통합 소프트웨어 및 하드웨어 시스템인 엔비디아의 DGX-1 서버를 활용해 사업의 속도와 효율성을 테스트했다. DGX 서버 라인에 익숙하지 않은 직원을 위해, 엔비디아는 기업이 쉽게 도입하고 즉시 사용할 수 있는 일련의 턴키 어플라이언스를 만들었다. 턴키 어플라이언스 없이는 하드웨어, 소프트웨어, AI 플랫폼을 통합하고 전체 시스템을 올바르게 조정하는 데 몇 주가 소요될 수 있다. 

도미노 부서는 주문의 특성과 주문 시 직원, 관리자, 고객의 수와 같이 매장에서 발생하는 상황을 통해 주문이 준비될 시기를 예측하는 배송 예측 모델을 만들었다. 이 모델은 주문 500만 건의 데이터 세트를 기반으로 했다. 엄청난 수는 아니지만 정확한 모델을 만들기에는 충분하다. 이후의 모든 주문은 시스템으로 피드백되어 모델 정확도가 더욱 높아진다.
 

데스크톱과 노트북은 AI와 머신러닝에 적합하지 않아

도미노의 이전 모델은 GPU 지원 노트북과 데스크톱을 사용했으며 훈련에 16시간 이상이 걸렸다. 도미노의 데이터 과학 및 AI 관리자 재커리 프라고소는 GTC 2020 가상 행사에서 긴 훈련 시간이 모델 개선을 매우 어렵게 만들었다고 말했다. 

DGX-1의 추가 컴퓨팅 성능 덕분에 도미노의 데이터 과학자는 더 짧은 시간에 더 복잡한 모델을 교육할 수 있었다. 이 시스템은 훈련 시간을 1 시간 미만으로 줄이고 주문 예측 정확도를 75%에서 95%로 높였다. 프라고소는 이 테스트는 도미노가 모델을 더 빨리 훈련해 생산성을 향상시킬 수 있는 방법을 입증했다고 말했다. 
 

리소스 공유는 DGX-1의 또 다른 장점

도미노는 이 과정에서 또 다른 이점을 발견했다. 바로 자원 공유다. DGX-1의 각각의 GPU는 32GB의 RAM으로 매우 커서 데이터 과학자는 이 중 일부만 사용해 동시에 여러 테스트를 실행할 수 있다. 데이터 과학자는 8개의 GPU를 손쉽게 사용해 리소스와 지식으로 공유하고 부서 간에 협업할 수 있다. 

과거에는 데이터 과학자가 자체 로컬 환경에서 작업했기 때문에 코드 검토와 품질 보증 테스트를 포함한 부서 간의 작업 공유가 어려웠다. 이제는 데이터 과학자가 공통의 DGX-1 서버로 작업하므로 사용자 정의와 재생성이 가능한 도커(Docker) 컨테이너를 쉽게 공유할 수 있다. 이를 통해 데이터 과학자는 필요 시 대규모 리소스 풀을 이용할 수 있다. 그러니 한가로이 앉아있을 시간이 없다. 도미노가 DGX-1과 통합한 도커 솔루션을 사용하면 모든 데이터가 도커 이미지에 포함되므로 여러 환경에서 코드를 보다 쉽게 복제할 수 있다. 

도미노는 최근 두 번째 DGX-1을 구입하고 쿠버네티스 컨테이너 관리 시스템을 추가했다. 최적화 엔진으로 관리되는 쿠버네티스를 통해 도미노는 모든 데이터 과학자에게 동적으로 자원을 할당하고 컨테이너를 더 빠르게 시작할 수 있다. 프라고소에 따르면, 리눅스에 익숙하지 않은 데이터 과학자도 포인트 앤 클릭으로 도커 컨테이너를 시작할 수 있다. 

배포에 있어서 도미노는 쿠버네티스 클러스터와 4개의 엔비디아 NPU를 포함하는 추론 스택을 만들었다. 이런 방식으로 데이터 과학자는 DGX-1에서 사용하는것과 동일한 도커 컨테이너 프레임워크를 사용해 모델과 구축하고 상호작용할 수 있다. 

또한 도미노는 데이터트론(Datatron)이라고 하는 머신러닝 운영 플랫폼을 인수했다. 이는 GPU를 사용해 쿠버네티스의 최상위에 위치하며 머신러닝 고유의 기능으로 도미노를 지원한다. 데이터트론을 사용하면 모델 성능을 실시간으로 모니터링할 수 있으므로, 모델 재교육이 필요한 경우 데이터 과학자가 알림을 받을 수 있다. 
 

IT 부서 전 영역에서 빠르게 움직이는 AI와 머신러닝

추론 스택 도입으로 도미노는 클라우드 공급업체가 머신러닝 모델을 호스팅할 때 제공하는 모든 이점을 누리면서 모든 데이터와 리소스를 온프레미스에 유지할 수 있다. 프라고소는 이를 통해 데이터 과학자가 모델을 배포하는 방식이 바뀌었고 배포 프로세스를 더 잘 제어할 수 있게 되었다고 말했다. 

프라스코는 이런 기술을 도입하려는 다른 기업을 향해 “데이터 과학자가 어떻게 협력할 것인지 생각해 보자. 도미노의 경우, DGX-1과 데이터 과학자가 공동 작업 공간에서 상호작용하고 있다. 이 제품을 처음 도입할 때는 예상하지 못했지만 우리에게 진정한 가치를 제공하고 있다”고 말했다. 

그동안 데이터 과학자는 기업 내에서 독립 사일로로 운영되었다. 점점 더 많은 IT 조직이 AI와 머신러닝 이니셔티브에 올바른 기술을 제공하는 임무를 요구받고 있다. 데이터 과학자는 대부분의 기업에게 값비싼 자원이며 모델이 완성되기만을 기다리며 앉아 있다면 맛있는 피자를 창 밖으로 던져버리는 것과 같다. DGX 서버 시리즈 같은 올바른 인프라를 통해 기업은 처리 시간을 단축해 데이터 과학자의 업무 효율을 높이고 대기 시간을 줄일 수 있다. editor@itworld.co.kr


2020.04.02

도미노 피자 배달 속도에 기여한 AI 이야기

Zeus Kerravala | InfoWorld
인공지능)과 머신러닝이라는 단어를 들으면 우주 탐사와 생물 의학처럼 연구 개발에 크게 의존하는 선진 산업이 떠오른다. 그러나 사실 AI와 머신러닝은 모든 업계가 주시해야 하는 기술이다. 소매업도 마찬가지다. 현대는 고객 서비스의 시대이며, 서비스의 작은 차이로 인해 시장 점유율이 크게 달라질 수 있다.

지난 주 엔비디아는 연례 행사인 GPU 기술 컨퍼런스를 가상으로 개최했는데, 이 현장은 AI/머신러닝의 실제 사용례 쇼케이스가 되었다. 그간 이 행사는 매우 기술 중심으로 진행되었지만 이번에는 엔비디아가 수년에 걸쳐 첨단 기술로 기업 운영을 개선한 방법을 보여주는 이벤트로 발전했다. 
 

AI/머신러닝으로 지점과 온라인 운영을 개선한 도미노

도미노는 AI와 머신러닝을 사용하는 방법을 보여준 대표적인 소매업체다. 도미노는 성공적인 운영 방식의 변화를 고안해냈다. 비법은 엔비디아의 기술로, 업계 선두의 피자 체인이 지점과 온라인 운영을 개선하고, 더 나은 고객 경험을 제공하고, 주문을 더 효율적으로 전달하게 된다. 

그 결과 고객의 만족도와 함께 배달원이 받는 팁도 높아졌다. 그러나 여러 장점의 작은 일부일 뿐이다. 피자를 지점에서 주문한 사람의 집으로 배달하려면 어떤 과정을 거쳐야 할까? 대답은 꽤 복잡하다. 
 

엔비디아 DGX-1 서버를 통한 AI/머신러닝 이니셔티브 가속화

도미노의 데이터 과학 부서는 딥 러닝 연구를 위한 통합 소프트웨어 및 하드웨어 시스템인 엔비디아의 DGX-1 서버를 활용해 사업의 속도와 효율성을 테스트했다. DGX 서버 라인에 익숙하지 않은 직원을 위해, 엔비디아는 기업이 쉽게 도입하고 즉시 사용할 수 있는 일련의 턴키 어플라이언스를 만들었다. 턴키 어플라이언스 없이는 하드웨어, 소프트웨어, AI 플랫폼을 통합하고 전체 시스템을 올바르게 조정하는 데 몇 주가 소요될 수 있다. 

도미노 부서는 주문의 특성과 주문 시 직원, 관리자, 고객의 수와 같이 매장에서 발생하는 상황을 통해 주문이 준비될 시기를 예측하는 배송 예측 모델을 만들었다. 이 모델은 주문 500만 건의 데이터 세트를 기반으로 했다. 엄청난 수는 아니지만 정확한 모델을 만들기에는 충분하다. 이후의 모든 주문은 시스템으로 피드백되어 모델 정확도가 더욱 높아진다.
 

데스크톱과 노트북은 AI와 머신러닝에 적합하지 않아

도미노의 이전 모델은 GPU 지원 노트북과 데스크톱을 사용했으며 훈련에 16시간 이상이 걸렸다. 도미노의 데이터 과학 및 AI 관리자 재커리 프라고소는 GTC 2020 가상 행사에서 긴 훈련 시간이 모델 개선을 매우 어렵게 만들었다고 말했다. 

DGX-1의 추가 컴퓨팅 성능 덕분에 도미노의 데이터 과학자는 더 짧은 시간에 더 복잡한 모델을 교육할 수 있었다. 이 시스템은 훈련 시간을 1 시간 미만으로 줄이고 주문 예측 정확도를 75%에서 95%로 높였다. 프라고소는 이 테스트는 도미노가 모델을 더 빨리 훈련해 생산성을 향상시킬 수 있는 방법을 입증했다고 말했다. 
 

리소스 공유는 DGX-1의 또 다른 장점

도미노는 이 과정에서 또 다른 이점을 발견했다. 바로 자원 공유다. DGX-1의 각각의 GPU는 32GB의 RAM으로 매우 커서 데이터 과학자는 이 중 일부만 사용해 동시에 여러 테스트를 실행할 수 있다. 데이터 과학자는 8개의 GPU를 손쉽게 사용해 리소스와 지식으로 공유하고 부서 간에 협업할 수 있다. 

과거에는 데이터 과학자가 자체 로컬 환경에서 작업했기 때문에 코드 검토와 품질 보증 테스트를 포함한 부서 간의 작업 공유가 어려웠다. 이제는 데이터 과학자가 공통의 DGX-1 서버로 작업하므로 사용자 정의와 재생성이 가능한 도커(Docker) 컨테이너를 쉽게 공유할 수 있다. 이를 통해 데이터 과학자는 필요 시 대규모 리소스 풀을 이용할 수 있다. 그러니 한가로이 앉아있을 시간이 없다. 도미노가 DGX-1과 통합한 도커 솔루션을 사용하면 모든 데이터가 도커 이미지에 포함되므로 여러 환경에서 코드를 보다 쉽게 복제할 수 있다. 

도미노는 최근 두 번째 DGX-1을 구입하고 쿠버네티스 컨테이너 관리 시스템을 추가했다. 최적화 엔진으로 관리되는 쿠버네티스를 통해 도미노는 모든 데이터 과학자에게 동적으로 자원을 할당하고 컨테이너를 더 빠르게 시작할 수 있다. 프라고소에 따르면, 리눅스에 익숙하지 않은 데이터 과학자도 포인트 앤 클릭으로 도커 컨테이너를 시작할 수 있다. 

배포에 있어서 도미노는 쿠버네티스 클러스터와 4개의 엔비디아 NPU를 포함하는 추론 스택을 만들었다. 이런 방식으로 데이터 과학자는 DGX-1에서 사용하는것과 동일한 도커 컨테이너 프레임워크를 사용해 모델과 구축하고 상호작용할 수 있다. 

또한 도미노는 데이터트론(Datatron)이라고 하는 머신러닝 운영 플랫폼을 인수했다. 이는 GPU를 사용해 쿠버네티스의 최상위에 위치하며 머신러닝 고유의 기능으로 도미노를 지원한다. 데이터트론을 사용하면 모델 성능을 실시간으로 모니터링할 수 있으므로, 모델 재교육이 필요한 경우 데이터 과학자가 알림을 받을 수 있다. 
 

IT 부서 전 영역에서 빠르게 움직이는 AI와 머신러닝

추론 스택 도입으로 도미노는 클라우드 공급업체가 머신러닝 모델을 호스팅할 때 제공하는 모든 이점을 누리면서 모든 데이터와 리소스를 온프레미스에 유지할 수 있다. 프라고소는 이를 통해 데이터 과학자가 모델을 배포하는 방식이 바뀌었고 배포 프로세스를 더 잘 제어할 수 있게 되었다고 말했다. 

프라스코는 이런 기술을 도입하려는 다른 기업을 향해 “데이터 과학자가 어떻게 협력할 것인지 생각해 보자. 도미노의 경우, DGX-1과 데이터 과학자가 공동 작업 공간에서 상호작용하고 있다. 이 제품을 처음 도입할 때는 예상하지 못했지만 우리에게 진정한 가치를 제공하고 있다”고 말했다. 

그동안 데이터 과학자는 기업 내에서 독립 사일로로 운영되었다. 점점 더 많은 IT 조직이 AI와 머신러닝 이니셔티브에 올바른 기술을 제공하는 임무를 요구받고 있다. 데이터 과학자는 대부분의 기업에게 값비싼 자원이며 모델이 완성되기만을 기다리며 앉아 있다면 맛있는 피자를 창 밖으로 던져버리는 것과 같다. DGX 서버 시리즈 같은 올바른 인프라를 통해 기업은 처리 시간을 단축해 데이터 과학자의 업무 효율을 높이고 대기 시간을 줄일 수 있다. editor@itworld.co.kr


X