월마트는 최근 소프트웨어 개발자가 다양한 인프라 종류와 클라우드 서비스를 단일 콘솔을 통해 소비할 수 있는 하이브리드 클라우드 플랫폼 구축 작업을 마무리했다. 월마트 클라우드 네이티브 플랫폼(Walmart Cloud Native Platform)을 통해 월마트는 수천 명의 자사 소프트웨어 엔지니어에게 퍼블릭 클라우드와 월마트의 자체 인프라 및 서비스를 공통된 방식으로 소비할 수 있는 추상화 계층을 제공하고자 한다.
공통 플랫폼 구축
월마트 인프라 서비스 담당 부사장 케빈 에반스는 “아이디어는 기반 인프라를 추상화해 똑같이 보이도록 하는 것이다. 따라서 애플리케이션팀과 개발자는 애저 클라우드와 월마트 인프라 간의 차이를 신경 쓰지 않아도 된다”라고 설명했다.에반스의 플랫폼 엔지니어링팀은 월마트의 모든 개발자를 위한 공통 인프라 계층 및 클라우드 기능 구축, 중앙 데이터 플랫폼 유지보수, 최적화된 공통 툴과 자동화를 통한 개발자 생산성 향상의 세 영역에 중점을 둔다. 에반스는 “우리 팀은 컨테이너 플랫폼이나 VM을 제공하는데, 개발자가 뭔가를 작성할 수 있는 단일 인터페이스가 된다. 또한 동급 최강의 기능을 보여주고 소비할 수 있도록 한다”고 강조했다.
월마트 개발자는 내부 콘솔인 DX.io를 통해 매니지드 서비스 카탈로그에 액세스할 수 있으며, 필요한 기능이나 자원을 한 번에 모두 선택할 수 있다. 예를 들어, 애저 코스모스 DB나 구글 클라우드 스패너 데이터베이스 중 어느 것이든 마음대로 고를 수 있다. 에반스는 “이들 기능은 해당 플랫폼에 특화된 것이지만, 우리의 동급 최강 옵션 중 일부가 된다”고 밝혔다.
기존에도 개발자가 애플리케이션의 구동 환경을 선택하는 데는 유연성이 있었지만, 반대로 사전 구축된 패턴도 날로 증가했다. 이런 패턴은 특정 기술 문제를 해결하는 데 유용하지만, 개발자가 뭔가를 구축하고 실행하는 방법에 대한 유연성은 떨어진다. 에반스는 “환경이 성숙해지면서 무엇을 어디에 배치할 것인지에 대한 결정을 플랫폼에 내장하고, 코드화된 요구사항과 환경 구성을 기반으로 의사결정 프로세스를 촉진하고자 한다”고 말했다.
당연히 여기에는 주관적인 견해와 추상화 간의 상쇄 효과가 생긴다. 에반스는 월마트의 개발자 플랫폼이 너무 엄격해 개발자가 클라우드 서비스 업체가 제공해야 하는 최고의 서비스를 소비하는 데 방해가 되지 않기를 바란다.
구체화되는 세쌍둥이 모델 클라우드
월마트는 클라우드 파트너로 마이크로소프트 애저, 구글 클라우드와 함께 작업을 진행했다. 월마트의 이른바 ‘세쌍둥이 모델 클라우드 전략’은 설계부터 하이브리드 클라우드로, 개발자가 퍼블릭 클라우드 플랫폼은 물론, 기존 월마트 데이터센터, 그리고 날로 증가하는 다양한 엣지 환경에서도 일관성 있는 방법으로 작업을 진행할 수 있도록 하는 것이 중요하다.월마트의 글로벌 CTO 슈레시 쿠마르는 “미국 전역에 걸쳐 지역 클라우드 모델을 통해 퍼블릭 클라우드와 월마트 프라이빗 클라우드를 연동함으로써 1만 대의 엣지 클라우드 노드를 월마트 시설에서 구현했고, 컴퓨팅 성능과 데이터를 고객 및 관계사와 더 가까운 곳으로 가져왔다”라고 강조했다.
이는 에반스와 플랫폼 엔지니어링팀이 쿠버네티스를 사용해 수많은 컨테이너를 유지하는 한편, VM 기반 워크로드를 위한 대규모 오픈스택 프라이빗 클라우드 플랫폼도 함께 관리해야 한다는 것을 의미한다. 현재 컨테이너는 새로운 애플리케이션을 구축할 때 선호하는 방식으로 자리 잡았다. 하지만 에반스는 월마트의 IT 환경이 매우 크기 때문에 VM 역시 장기적으로 전체 인프라의 일부로 남아 있을 것이라는 점을 인정했다.
이외에도 엣지 환경이 있는데, 월마트는 미국 전역에 있는 자사의 매장과 분배센터, 보급센터 6,000곳 이상에서 컴퓨팅 역량을 이용하고자 한다. 일부 애플리케이션은 중앙 데이터센터가 최적의 환경인 반면, 어떤 애플리케이션은 매장이나 창고에서 호스팅해 결제나 가격 애플리케이션처럼 민감한 워크로드를 위해 더 높은 운영 탄력성과 더 낮은 지연시간을 제공할 수 있다.
비용 절감과 개발 최적화
세쌍둥이 모델은 개발자 생산성과 혁신이라는 두 마리 토끼를 잡을 수 있는 기회를 제공했다. 연간 가격 최적화 기회 역시 18%나 높아졌다. 월마트는 이제 자사 웹 사이트 백엔드에서 매월 17만 건의 조정 작업을 수행할 수 있는데, 이는 전환 이전보다 1,700배나 많은 수치이다.쿠마르는 “워크로드를 올바른 곳에 배치하면 인프라 전반에 걸쳐 애플리케이션 성능을 높이고 지연을 낮출 수 있다. 여기에 더해 세쌍둥이 모델은 용량도 증가해 연말연시나 게임기 할인 판매 같은 일시적인 수요 폭증에 잘 대응할 수 있다”고 설명했다.
에반스는 월마트 애플리케이션의 70%가 범용 속성을 가지고 있어 거의 어디에서나 실행할 수 있을 것으로 추산한다. 이 때문에 날로 증가하는 월마트의 비즈니스 영역 전반에 걸쳐 더 쉽게 이식할 수 있다. 에반스는 “워크로드의 이동을 이음매없이 만들고 이를 어떤 개발자의 결정보다는 플랫폼 역량으로 만들고자 한다. 가능한 한 마찰을 없애 애플리케이션을 좀 더 비용 효율적인 곳에 배치할 수 있다”고 강조했다.
단기적으로는 윈윈 전략으로 보이지만, 퍼블릭 클라우드 서비스에 대한 의존도가 높아져 주의 깊게 모니터링하지 않으면 미래에 엄청난 클라우드 요금 고지서를 받을 수 있다는 점도 정확하게 인식하고 있다. 에반스는 “이들 서비스는 때로 퍼블릭 클라우드에서 엄청나게 비싸다. 그래서 파트너와 협력해 워크로드를 실행하기 가장 좋은 곳을 파악하고자 한다”고 덧붙였다.
editor@itworld.co.kr