클라우드

클라우드 SLA를 보는 또 하나의 관점

Bernard Golden | CIO 2009.11.20

클라우드 컴퓨팅의 SLA(Service Level Agreements)를 비난하는 기사를 찾으면 수백, 수천 건이 있을 것이다. 이들 기사에서 주로 예를 드는 것은 소문이 자자한 아마존 웹 서비스의 SLA이다. 또한 이들 기사는 최근에 발생한 클라우드 서비스 업체의 서비스 중단사태를 인용해 클라우드 컴퓨팅이 기업이 필요로 하는 진정한 SLA, 다시 말해 99.999%의 가용성을 보장하지 못한다고 주장한다.

 

이들 기사에서 언급하지 않고 있는 것은 기업의 데이터센터가 이들 클라우드 섭스 업체보다 높은 가용성을 가지고 운영되고 있다는 가정인데, 솔직히 여기에 대해서는 확신을 가지기 어렵다. 필자가 대기업 지원부서와 통화를 할 때마다, 친절한 콜센터 직원은 “오늘 아침 컴퓨터 동작이 다소 느려져” 지연이 발생했다고 사과한다. 또한 많은 사람들이 이메일이 다운됐다는 등의 이유로 화를 낸다. 따라서 클라우드 서비스와 내부 데이터센터 간의 비교가 그리 정확한 것은 아닐지도 모른다. 사실 많은 기업이 SLA 성능을 측정하지 않기 때문에 정확도 자체는 증명이 불가능한 것일 수도 있다.

 

여기서 반드시 짚고 넘어가야 할 것은 실제로는 99.999%의 가용성이 없다는 것이다. 업타임 인스티튜트의 데이터센터의 수준에 대한 정의에 따르면, 1계층은 단일 부품에 SPOF를 가지고 있는 곳이며, 4단계는 다중 냉방장치에 다중 전력 공급원, 예비 부품 등을 갖추고 있는 곳이다. 하지만 4단계의 데이터센터라 하더라도 가용성은 99.995%에 불과하다.

 

게다가 여기에는 비교 불가능한 요소도 있다. 클라우드 서비스 업체는 업타임 인스티튜트가 중점을 두는 인프라 서비스만 제공하는 것이 아니라 소프트웨어 기능도 함께 제공한다. 아마존의 경우, 소프트웨어 기능으로 하이퍼바이저와 스토리지 관리, 클라우드 관리 소프트웨어를 제공한다. 구글과 마이크로소프트는 아마존의 제공하는 서비스에 플랫폼 기능 계층을 추가로 제공한다.

 

만약 내부 데이터센터 SLA를 인프라 뿐 아니라 소프트웨어 계층까지 같이 살펴본다면, 클라우드 서비스 업체가 훨씬 더 나아보일 수도 있을 것이다.

 

“트랜잭션 프로세싱(Transaction Processing)”에서 공종 저자인 짐 그레이와 안드레아 로이터는 하드웨어가 소프트웨어보다 훨씬 더 안정적이라고 단정하고 있다. 이에 따라 이 책은 하드웨어의 안정성을 높이는 전략에는 지면을 할애하지 않고 있다. 대신에 안전한 트랜잭션을 위해서는 소프트웨어를 어떻게 설계해야 하는지에 중점을 두고 있다.

 

그레이와 로이터는 소규모 하드웨어와 한두 대 정도의 시스템에서 동작하는 애플리케이션을 가정하고 있다. 하지만 이런 접근은 아주 오래된 것으로, 오늘날은 엄청난 데이터와 대규모 애플리케이션이 주류로 자리 잡고 있다.

 

오늘날의 애플리케이션은 수십 대, 수백 대, 심지어는 수천 대의 시스템에 걸쳐 동작한다. 데이터센터의 규모도 정신이 아찔할 정도다. 마이크로소프트가 새로 구축한 시카고의 데이터센터는 40만 대의 시스템이 들어있다. 구글과 마이크로소프트는 더 이상 하드웨어가 튼튼하다는 가정에 의존할 수 없다는 것이다. 이런 규모에서 하드웨어 장애는 늘상 일어나는 일이다. 하드웨어를 보존해야 할 제한된 자원으로 취급해 안정성이 높은 비싼 시스템을 구입하는 대신, 이들 업체는 장애를 일상적인 것으로 받아들이고 저렴한 로우엔드 하드웨어를 구입한다. 대신 장비의 리던던시를 확실하게 강화하는 방법을 택하는데, 보통 3중의 여유 장비를 확보한다.

 

따라서 오늘날의 시스템에서 하드웨어의 안정성을 가정하는 것은 더 이상 설득력이 없다. 이는 시스템 설계자가 개별 하드웨어 부품의 장애를 애플리케이션 디자인에 반영해야만 한다는 것을 의미한다. 시스템 안정성에서 하드웨어의 영향이 미미하다는 그레이와 로이터가 주장은 규모 측면에서 재평가해야만 한다.

 

대규모 하드웨어 리던던시에 대한 수요는 애플리케이션 설계에서도 다른 접근법을 필요로 한다. 클라우드 애플리케이션은 수많은 시스템에 걸쳐 확산되는 것을 전제로 설계되며, 여러 카피의 코드와 애플리케이션 데이터와 통합할 준비가 된 상태의 애플리케이션이다. 그레이와 로이터가 지지하는 일관성 있는 접근법은 이런 종류의 애플리케이션 설계에는 적합하지 않다. 수많은 시스템과 데이터를 두고 트랜잭션 데이터베이스를 시스템 중앙에 배치한다면, 병목을 만들어 애플리케이션의 업타임은 물론 성능까지도 위협하게 된다.

 

오늘날 시스템의 가동 시간을 평가하는 기준 자체를 다시 한 번 생각해야 한다. 이제 값비싼 리소스의 리던던시를 통해 SPOF를 제거해 애플리케이션을 튼튼하게 만드는 것은 경제적인 면은 말할 것도 없고, 시스템적으로도 맞지 않다. 실제로 한 보고서에서 마이크로소프트의 데이터센터 설계자는 크리티컬한 자원의 리던던시를 없애고 대신 데이터센터 차원에서 리던던시를 구현하는 것을 주장했다.

 

요약하자면, 필자는 클라우드 컴퓨팅이 부적절한 SLA를 제공한다는 비난에 대해 회의적이다. 차세대 애플리케이션의 관점에서 보면, 기존의 가용성 평가 기준이 부적합하다는 것은 분명해진다. 결국 이제 SLA의 개념에 대해 다시 생각해 봐야 할 때인 것이다.

 

마지막으로, 이제 차세대 주류 비즈니스 애플리케이션이 수면 위로 떠오르고 있는 것 같다. ERP용 구글 아키텍처를 상상해 보라. 값비싼 하드웨어와 소프트웨어에 엄청난 비용을 들여 새로운 섬을 만드는 대신에, 기업들은 값싼 하드웨어를 대규모로 사용해 리던던시를 구현하고, 이런 자원을 이용하도록 설계된 소프트웨어 아키텍처를 제공하는 외부 서비스 공급업체를 이용하게 된다는 것이다.

 

그리고 기업들이 자체 데이터센터의 20%까지 가격이 떨어지기 전에는 이를 이용하지 않을 것이란 착각을 해서는 안된다. 최근에는 적지 않은 기업들이 기존 소프트웨어의 업그레이드에 돈을 지불하는 것조차 아까워하고 있다. 이제 기업들은 비용을 절약할 수 있다면, 추가적인 위험은 아무렇지도 않게 감수할 태세다.

 

앞으로의 전개는 더욱 더 흥미로워질 것으로 보인다.

 

*Bernard Golden은 컨설팅 회사인 하이퍼스트라투스의 CEO로, 가상화와 클라우드 컴퓨팅 전문가이다.

Sponsored

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.