데이터ㆍ분석 / 클라우드

올바른 NoSQL 데이터베이스를 선택하는 5가지 질문과 주요 솔루션

Bob Violino | InfoWorld 2024.02.07
NoSQL 데이터베이스는 데이터베이스 쿼리에 SQL((Structured Query Language)을 사용해야 하는 한계를 극복하기 위해 생겨났다. 따라서 기존 관계형 데이터베이스 관리 시스템(RDBMS)에서는 찾아볼 수 없는 높은 운영 속도와 유연성을 제공하는 방식으로 데이터를 저장하고 관리한다.
 
ⓒ Getty Images Bank

앨리드 마켓 리서치(Allied Market Research)의 최근 보고서에 따르면, NoSQL 데이터베이스에 대한 수요는 계속 증가하고 있다. 2022년 전 세계 NoSQL 시장은 73억 달러의 매출을 기록했으며, 연평균 28%의 성장률로 2032년에는 863억 달러의 매출을 기록할 것으로 예상된다. 보고서는 전 세계 NoSQL 시장 성장을 이끄는 주요 요인으로는 빅데이터 분석에 대한 폭발적인 수요, 확장 가능하고 유연한 엔터프라이즈 데이터베이스 솔루션에 대한 필요성, 클라우드 컴퓨팅 플랫폼 및 기술의 보편화 등을 들었다.

기업이 NoSQL로의 마이그레이션을 고려하고 있다면, 데이터 스토리지 요구사항에 가장 적합한 NoSQL 데이터베이스를 선택하는 것이 중요하다. 현재 시장에는 24개 이상의 오픈소스 및 상용 NoSQL 데이터베이스가 나와 있으므로, 선택의 폭이 너무나 넓기 때문이다.

여기서는 NoSQL 데이터베이스 구매 결정에 도움이 되는 5가지 질문을 제시한다. 또한 현재 시장에 나와 있는 주요 NoSQL 데이터베이스의 특징도 살펴본다. NoSQL 데이터베이스를 선택하기 전에 해야 할 5가지 질문은 다음과 같다.
 
  • NoSQL이 올바른 선택인가?
  • 어떤 NoSQL 데이터 모델이 필요한가?
  • 지연시간 요건은 무엇인가?
  • 확장성과 데이터 일관성이 얼마나 중요한가?
  • 어떻게 배포할 것인가?
 

NoSQL 데이터베이스의 필요성

NoSQL 데이터베이스를 선택하기 전에 NoSQL이 가장 적합한 선택인지 확인하는 것이 중요하다. IDC의 리서치 담당 부사장 칼 올로프슨은 "백오피스 트랜잭션 처리, 인터랙티브 애플리케이션 데이터 관리, 스트리밍 데이터 캡처"가 모두 NoSQL을 선택해야 하는 좋은 이유라고 말한다.

이런 요구 사항을 염두에 두더라도, 특히 기존 RDBMS 대신 NoSQL을 선택하는 데는 장단점이 있기 때문에 NoSQL이 기업에 적합하지 않을 가능성을 배제해야 한다. 멀린스 컨설팅(Mullins Consulting)의 대표 컨설턴트 크레이그 멀린스는 "가장 먼저 결정해야 할 것은 왜 NoSQL 데이터베이스 시스템이 필요한가 하는 점”이라고 말했다. 먼저 기존 RDBMS가 사용례를 충족할 수 없는 이유를 파악해야 한다. 관계형/SQL 데이터베이스 시스템은 널리 설치되어 있으며, 대부분 기업에서 기존 시스템과 애플리케이션에 배포되어 있고, 숙련된 전문가가 관리하고 있다.

멀린스는 RDBMS를 대체할 수 있는 대안으로 다양한 데이터 저장 요구사항을 충족하기 위해 단일 시스템 내에서 여러 데이터 저장 기술을 사용하는 다중 저장소 지속성(Polyglot Persistence)을 제시한다. "모든 것을 관계형 사고방식에 억지로 끼워 맞추는" 대신, 다중 저장소 지속성을 통해 개발자와 관리자는 "각 사용례에 적합한 데이터 기술을 선택할 수 있다"는 것이다.

NoSQL의 핵심 강점은 탈중앙화되고 확장성과 내결함성을 갖춘 설계이다. 멀린스는 "대부분 NoSQL 데이터베이스 기술은 확장성과 장애를 견딜 수 있도록 구현되어 있다. 또한, 가볍고 CPU와 지원 측면에서 RDBMS보다 오버헤드가 적다”고 설명했다.
 

NoSQL 데이터 모델

NoSQL 데이터 모델은 키-값, 문서, 칼럼 저장소, 그래프의 4가지 주요 유형으로 나뉘며, 각 유형은 각기 다른 사용례에 적합하다. 멀린스는 각 유형의 강점을 다음과 같이 요약했다.

키-값 데이터베이스는 소매업 및 모바일과 같은 애플리케이션의 고가용성, 짧은 지연시간 요구 사항에 적합하다.
문서 데이터베이스는 이벤트 로깅, 온라인 쇼핑, 콘텐츠 관리 및 심층 분석 처리에 적합하다.
칼럼 저장소 데이터베이스는 이벤트 로깅, 콘텐츠 관리, 분석을 위한 카운팅 및 분류에 적합하다. 칼럼 저장소는 데이터를 자동으로 만료하도록 설정할 수도 있다.
그래프 데이터베이스는 데이터 요소가 서로 연결되어 있고 연결 관계의 수를 알 수 없는 애플리케이션에 적합하다. 대표적인 사용례는 소셜 미디어 네트워크, 추천 엔진, 물류 및 라우팅, 위치 인식 시스템, 대중교통 링크, 네트워크 토폴로지 등이다.

포레스터 리서치의 부사장 겸 대표 애널리스트 노엘 유한나는 "올바른 모델을 선택하는 것이 중요하다”라며, "문서 모델은 JSON 문서를 최적으로 저장하는 기능을 포함해 가장 많이 사용되는 모델이다. 그래프 모델은 상호 연결된 데이터에 중점을 두는 반면, 키-값 모델은 단순한 키-값 쌍 검색에 중점을 두기 때문에 널리 사용되지는 않는다”라고 설명했다.

어떤 데이터를 저장하고 어떻게 액세스할 것인지는 데이터 모델을 결정하는 데 필수적이다. 또한 일부 솔루션 업체의 제품은 다중 모델 데이터베이스로, 모든 모델을 지원해 여러 모델을 사용할 수 있는 유연성을 제공하기도 한다. 
 

지연시간 요구사항

IDC의 올로프슨에 따르면, 스트리밍 데이터 캡처나 실시간 데이터 공유 애플리케이션처럼 지연시간이 매우 짧아야 하는 경우라면 키-값 저장소를 고려해야 한다. 데이터가 단순한 목록이나 매트릭스인 경우에도 마찬가지이다. 

데이터의 형태가 매우 가변적이고 정의된 필드가 포함된 경우에는 JSON 문서 데이터베이스가 더 적합하다. 이는 일반적으로 애플리케이션과 사용자의 변화하는 요구사항에 맞춰 자주 변경되는 인터랙티브 애플리케이션의 경우에도 마찬가지이다. 지연시간 요구사항이 그다지 크지 않고 자재명세서 구조나 상호 연관된 데이터의 복잡한 그룹 등 복잡한 조합을 지원해야 하는 경우에는 그래프 데이터베이스를 고려할 수 있다.
 

확장성과 데이터 일관성

NoSQL 데이터베이스는 데이터를 세그먼트 또는 샤드(Shard)로 나눌 수 있으므로 수백 테라바이트를 실행하는 대규모 배치 환경에 유용하다. 유한나는 "샤딩은 데이터베이스를 확장하는 데 있어 NoSQL의 필수적인 기능”이라며, "기업은 수평적으로 확장된 클러스터에서 노드를 자동으로 확장 및 축소해 애플리케이션을 동적으로 확장할 수 있는 NoSQL 솔루션을 많이 찾는다”고 말했다.

ACID 준수를 통해 모든 트랜잭션의 데이터 일관성을 보장하는 데 중점을 두는 관계형 데이터베이스와 달리, NoSQL을 사용하면 데이터 일관성을 일관성 있게 또는 느슨하게 선택할 수 있다. 유한나는 "최종적인 일관성을 유지하면서 빠르게 확장하고 높은 성능을 제공할 수 있다"고 강조했다.
 

배포 방식

일부 NoSQL 데이터베이스는 온프레미스에서 실행할 수 있고, 일부는 클라우드에서만 실행할 수 있으며, 일부는 하이브리드 클라우드 환경에서 실행할 수 있다. 또한 서버리스 및 쿠버네티스 환경에서 실행되는 등 클라우드 아키텍처와 기본적으로 통합되는 NoSQL도 있다. 유한나는 "특히 애플리케이션에 우수한 성능과 확장성을 제공하면서 자동화를 통해 인프라 관리를 간소화하고자 하는 기업에는 서버리스가 필수적인 요소로 여겨진다”고 말했다.
 

시장을 선도하는 NoSQL 데이터베이스

이상의 5가지 질문을 던져보면 기업의 필요에 맞는 NoSQL 데이터베이스를 선택하는 데 도움이 될 것이다. 이제 시장에 나와 있는 주요 NoSQL 데이터베이스 솔루션을 살펴보자.

에어로스파이크(Aerospike)
에어로스파이크는 높은 읽기 및 쓰기 처리량이 필요한 애플리케이션을 위해 설계된 오픈소스 분산형 실시간 고성능 NoSQL 데이터베이스이다. 다중 모델 NoSQL이자 그래프 데이터베이스로, 동시에 여러 데이터 모델을 지원하고 확장에 제한이 없어 수십억 건의 트랜잭션에 걸쳐 실시간 처리가 가능하다. 제품 설명서에 따르면, 에어로스파이크는 대규모 병렬 처리와 통합 스토리지 모델을 사용해 작은 서버 공간을 사용한다.

이 플랫폼은 엣지에서 스트리밍 데이터를 수집하고 처리하며, 운영, 트랜잭션 또는 분석 워크로드를 위해 엣지 데이터를 레코드 시스템, 서드파티 소스, 데이터 웨어하우스 또는 데이터 레이크의 데이터와 결합할 수 있다. 배포 방식도 온프레미스와 클라우드 매니지드 서비스 모두 지원한다.

Sponsored

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.