엔비디아는 2020 년 암페어 A100 프로세서를 출시하며 다중 인스턴스 GPU를 지원하는 최초의 GPU라는 점을 강조했다. 가상화 하이퍼바이저가 CPU 코어를 나누는 것처럼 GPU를 최대 7개의 가상 GPU로 분할할 수 있다.
벌처는 자사가 A100 GPU 인스턴스를 쪼개서 판매하는 첫 클라우드 서비스 업체라고 강조했다. GPU 인스턴스의 비싼 가격은 여러 개의 GPU를 병렬로 실행하곤 하는 대기업 워크로드에는 적합하지만, 이제 막 AI 관련 워크로드를 시험해보고자 하는 중소기업에는 GPU 하나 가격도 엄두를 내기 어려운 것이 사실이다. 벌처 CEO J.J. 카드웰은 “AWS 같은 클라우드에서 카드 한 대를 통째로 이용하려면, 한달에 수천 달러의 요금을 내야 하는데, 많은 기업의 예산 범위를 벗어난다”라며, “카드 한 대 전체가 필요없는 AI/ML 워크로드가 많다”고 설명했다.
많은 연구원과 개발자의 작업이 테스트의 반복이며, 사용량은 일정하지 않다. 카드웰은 작은 규모의 데이터 세트를 테스트한 다음에 시간이 지나면서 규모를 늘리는 것이 일반적인 방식이지만, 대형 클라우드는 이런 작은 GPU 인스턴스를 제공하지 않는다고 지적했다.
벌처는 툴과 라이브러리, 프레임워크와 관련 기술까지 엔비디아의 AI 소프트웨어 스택도 충실하게 제공한다. 클라우드 서비스 업체가 GPU 인스턴스와 함께 자체 GPU 툴을 제공하는 경우가 많은데, 카드웰은 엔비디아가 자사 GPU 하드웨어를 최대한 이용할 수 있도록 동급 최강의 소프트웨어 스택을 구축했는데, 또 만드는 것은 합리적이지 않다고 덧붙였다.
벌처는 2014년 설립된 소규모 클라우드 서비스 업체로, 지금까지도 벤처캐피탈 자금을 받지 않고 영업이나 마케팅 부서 없이 운영하고 있다. 하지만 입소문만으로 연 매출 1억 2,500만 달러 규모로 성장했으며, 전 세계 25곳에 데이터센터가 있다. 벌처의 기본적인 서비스 구성은 비슷하지만, 가격에서 차이가 크다. 벌처는 더 작은 고객을 대상으로 하기 때문이다. 카드웰은 자사의 기본 서비스가 AWS보다 30~50% 정도 저렴하다고 강조했다.
editor@itworld.co.kr