IT 관리 / 네트워크 / 데이터센터

“데이터 계층을 위한 탄력적 컴퓨팅” 서버리스 데이터베이스의 이해

Martin Heller | Network World 2022.03.15
서버리스 클라우드 컴퓨팅 서비스의 시작은 서버를 프로비저닝하거나 관리할 필요 없이 코드를 실행하게 해주는 AWS 람다(Lambda)였다. AWS 람다는 서비스형 함수, 즉 FaaS(Functions as a Service)의 한 형태로, 마이크로소프트 애저와 구글 클라우드에서 다른 형태의 FaaS 구현도 뒤따라 등장했다.
 
ⓒ Getty Images Bank
 
이후 클라우드 제공업체는 다른 서비스도 서버리스 형태로 제공하기 시작했다. 서버리스는 클라우드 서비스에 대한 새로운 사고방식이다. 실제로 서버리스 아키텍처의 비용은 동일한 부하에서 영구 서버 인스턴스를 프로비저닝하는 가격보다 훨씬 더 저렴한 경우가 많다.


서버리스란 무엇인가

이름에서 연상되는 것과 달리 ‘서버리스’는 서버가 사용되지 않는다는 의미가 아니다. 서버를 프로비저닝하거나, 관리하거나, 그 비용을 지불할 필요가 없다는 뜻이다.

서버리스 서비스에 대한 요청이 들어오면 클라우드 제공업체는 인스턴스(가상머신) 또는 팟(pod, 컨테이너의 논리적 집합으로 보통 쿠버네티스로 관리함)을 할당해 풀(pool)에서 요청을 처리한다. 서버리스 코드가 종료되면 할당된 리소스도 풀로 회수된다. 사용하는 리소스에 대한 비용은 보통 CPU 용량, RAM 할당량, 활성 시간을 기반으로 계산한다.

서버리스 함수와 서비스는 상호 호출하거나 다른 서비스를 호출할 수 있으며, 공유 파일 시스템과 데이터베이스에 작성할 수도 있다. 서버리스 함수의 가장 큰 기술적인 이점은 극한의 확장성이다. 프로비저닝된 서버는 트래픽이 급증하면 성능이 쉽게 저하되지만, 새로운 서버리스 함수 인스턴스는 필요한 모든 이벤트에 대해 실행되고, 필요가 없어지면 자동으로 풀로 회수된다. 

요청이 들어온 시점에 풀에 적절한 크기의 인스턴스(또는 팟)가 없는 경우에는 어떻게 될까. 클라우드 제공업체가 새 인스턴스를 만들어야 한다. 이때 요청 처리에 약간의 지연이 발생한다. 지연을 감수할 수 없는 상황이라면 비용을 지불하고 일부 함수를 즉각적 대응을 위한 상시 대기 상태로 유지할 수 있다. AWS는 이런 서비스를 ‘프로비저닝된 동시성(Provisioned Concurrency)’이라고 부른다. 클라우드 제공업체마다 사용하는 이름은 다르지만, 일부 인스턴스를 워밍업된 상태로 유지해 지연을 줄인다는 면에서는 모두 동일하다.

일반적으로 서버리스 함수와 서비스는 가용성이 높다. 서버, 가상머신 또는 컨테이너를 하나만 사용해 서비스를 실행할 때는 데이터센터 장애로 인해 궁극적인 서비스 중단이 발생할 가능성이 높다. 클라우드 제공업체는 보통 서버리스 함수를 위한 예비 컴퓨팅 용량을 각 서비스 지역의 여러 가용성 구역(물리적으로 별개지만 가까운 거리 내에 있는 여러 데이터센터)에 걸쳐 유지한다.

클라우드 제공업체의 서버리스 함수와 서비스 외에, 서버리스 앱을 만들기 위한 클라우드 중립적 프레임워크와 SDK도 많다. 큐브리스(Kubeless), 풀루미(Pulumi), 오픈FaaS(OpenFaaS), 오픈위스크(OpenWhisk), 서버리스 프레임워크(Serverless Framework)가 대표적이다.


서버리스 데이터베이스란 무엇인가

코크로치 랩스(Cockroach Labs)의 짐 워커에 따르면 서버리스 데이터베이스는 다음과 같은 9가지 핵심 원칙을 따른다.
 
  1. 수동 서버 관리가 거의 없거나 아예 없음
  2. 앱/서비스 확장이 유연하고 자동적임
  3. 회복력과 본질적인 내결함성 서비스
  4. 상시 가용 및 즉각적 액세스
  5. 소비량 기반의 등급 또는 청구 메커니즘
  6. 지역을 포함한 모든 장애 영역 극복
  7. 지리적 확장
  8. 트랜잭션 보장
  9. (관계형 SQL의 우수한 특성)

1번부터 5번까지의 원칙은 모든 서버리스 서비스에 적용 가능하지만, 6번부터 9번 원칙은 글로벌 SQL 데이터베이스에만 해당한다. 9번은 코크로치DB와 같은 분산형 SQL 데이터베이스에 편향된 원칙이다(그래서 괄호로 표시함).

대다수 데이터베이스에 연결하는 전통적인 방법은 클라이언트에서 서버로 영구적 TCP 연결을 설정하는 것이다. 하지만 서버리스 데이터베이스에는 이 방법이 맞지 않는다. TCP 연결 설정에 많은 시간이 소모될 수 있기 때문이다. 이상적으로는 클라이언트가 서버리스 엔드포인트에 거의 즉각적으로(100ms 미만) 연결되고 간단한 쿼리의 경우 1초 이내에 응답을 받아야 한다. 아마존 오로라 서버리스(Aurora Serverless)와 같은 일부 서버리스 데이터베이스는 HTTP(가급적 HTTPS) 연결을 지원하며, 확장 지원과 즉각적인 연결에 필요한 연결 풀링을 알아서 관리한다.


서버리스 데이터베이스로 비용을 절감하는 방법

전통적인 데이터베이스의 크기는 예상되는 최대 쿼리 부하와 스토리지 용량에 맞춰 설정된다. 데이터 마이그레이션 없이 데이터베이스를 확장/축소할 수 있다면 트래픽이 많은 기간에는 CPU를 높이고 트래픽이 낮은 기간에는 낮추는 방법으로 비용을 절약할 수 있다.
 
일반적으로 서버리스 데이터베이스는 애초에 규모를 설정할 필요가 없다. 쿼리를 제출하지 않는 한 CPU에 대한 비용이 청구되지 않고, 쿼리를 제출하는 시점에는 쿼리가 필요한 만큼의 용량만 받게 된다. 비용은 사용된 용량에 데이터베이스의 활성 시간을 곱한 수치로 청구되며, 데이터 스토리지에 대한 비용도 여전히 청구된다. 아마존에 따르면, 오로라 서버리스를 사용할 경우 최대 부하에 맞춰 용량을 프로비저닝할 때보다 최대 90%의 비용을 절감할 수 있다.


서버리스 데이터베이스가 적합하지 않은 경우

서버리스 데이터베이스를 권장하는 사용례는 가변 워크로드, 예측할 수 없는 워크로드, 엔터프라이즈 데이터베이스 집단 관리, 서비스형 소프트웨어 애플리케이션, 여러 서버에 걸쳐 수평 확장된 데이터베이스다.

부하가 일정하며 예측 가능한 데이터베이스는 전통적인 서버를 사용하는 것이 더 낫다. 주중에 사용량이 많고 주말과 공휴일에 한산한 데이터베이스도 주말과 공휴일마다 서버를 내린다는 조건 하에 서버를 사용하는 것이 더 유리하다. 확실한 것은 계산을 해봐야 알 수 있지만, 가격표와 사용 패턴을 참고하면 어떤 방법이 비용면에서 더 유리한지 대략 판단할 수 있다.
 

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.