가상화ㆍ컨테이너 / 데이터ㆍ분석 / 데이터센터 / 클라우드

“NoSQL부터 FaaS까지” 현대적인 데이터 아키텍처를 위한 7가지 핵심 기술

Jim Scott | InfoWorld 2018.02.23

기업 IT 인프라의 기반으로 재구성하는 것은 결코 만만한 과정이 아니다. 이런 변화는 보통 핵심 비즈니스 동인의 변화로 촉발되는데, 현재 일어나고 있는 변화 역시 정확히 그런 경우라고 할 수 있다. 쉽게 말해, 30여 년 가까이 기업 IT를 지배해 온 플랫폼으로는 이제 더 이상 비즈니스 추진에 필요한 워크로드를 제대로 처리할 수 없는 상황이 되었다는 말이다.

그리고 이러한 디지털 트랜스포메이션의 중심에는 비즈니스에서 가장 귀중한 자산인 데이터가 자리한다. 그 동안 조직의 데이터 사용은 호환성이 떨어지는 포맷, 전통적인 데이터베이스가 지닌 한계, 그리고 다양한 소스로부터 추출한 데이터를 자유자재로 결합할 수 있는 유연성의 부재 등으로 인하여 많은 제약이 따랐다. 새롭게 등장하는 기술들은 이러한 한계를 극복할 것을 약속하고 있다.

데이터 사용 장벽을 제거함에 있어 가장 중요한 것들 중 하나가 바로 소프트웨어 배치 모델의 개선이다. “데이터 민첩성”을 높이기 위해서는 보다 유연한 데이터베이스와 확장성이 뛰어난 실시간 스트리밍 플랫폼이 필요하다. 실제로 기업 환경에서 지금보다 더 유연한 실시간 ‘데이터 패브릭(data fabric)’을 만들기 위하여 7가지 기반 기술을 결합해야 한다.

이들 7가지 신기술은 기존의 기술과 달리 다양한 사용자와 사용례를 충족시킬 수 있을 만큼 충분한 확장성을 갖추고 있다. 또한 기업 사용자를 위해 보다 빠르고 똑똑한 의사 결정을 내리고, 고객 경험을 개선할 수 있다.

1. NoSQL 데이터베이스
RDBMS는 지난 30년 간 데이터베이스 시장을 지배해 왔다. 그러나 전통적인 관계형 데이터베이스는 겉잡을 수 없이 증가하는 데이터 볼륨과 데이터 처리 속도 앞에서 그 한계를 힘없이 드러내고 말았다. NoSQL 데이터베이스는 빠른 속도와 확장성으로 점차 전통적 데이터베이스를 대체해 나가고 있다. 도큐먼트 데이터베이스의 경우, 소프트웨어 엔지니어링 관점에서 훨씬 더 단순하고 간결한 모델을 제공한다. 이처럼 간결한 개발 모델은 시장 진출 속도를 증가시키고 고객 및 내부 사용자의 요구에 대한 보다 빠른 대응을 가능케 한다.

2. 실시간 스트리밍 플랫폼
고객 경험 개선에서 가장 중요한 것은 고객의 요구 사항에 실시간으로 응대하는 것이다. 고객을 직접 대면하는 산업들이 지난 10년 간 그토록 무시무시한 와해를 경험한 것은 우연이 아니었다. 결국 그 모든 것은 기업이 얼마나 신속하게 사용자의 요구에 대응할 수 있는가에 달려 있다. 고객에게 24시간 이내로 상품을 제안하겠다고 말하는 것은 의미가 없다. 왜냐하면 그 때쯤이면 고객은 이미 23시간 전에 내린 의사결정을 이행하고 난 뒤일 것이기 때문이다. 그리고 실시간 모델로 이전하기 위해서는 이벤트 스트리밍이 필요하다.

메시지 주도형 애플리케이션은 수년 전부터 존재해 왔다. 그러나 오늘날 스트리밍 플랫폼은 확장성 및 비용 측면에서 훨씬 뛰어나다. 최근 스트리밍 기술이 급격히 발전한 덕에 비즈니스를 최적화하는 여러 가지 새로운 방법들이 생겨나고 있다. 발 빠른 소비자 대응은 그 중 한 측면일 뿐이다. 소프트웨어 개발 및 테스팅 팀에게 실시간 피드백 루프를 제공한다면, 기업들은 이벤트 스트림을 이용하여 제품 품질을 향상 시키고 더 빨리 새로운 소프트웨어를 얻을 수 있을 것이다.

3. 도커와 컨테이너
컨테이너는 개발자와 운영자, 조직 모두에게 상당한 장점을 안겨 준다. 인프라 격리에 대한 전통적인 접근 방식은 정적 파티셔닝(static partitioning)으로, 물리 서버나 가상머신 등 별개의 고정된 자원을 각 워크로드에 할당하는 것이었다. 정적 파티션은 그 과정에서 발생한 문제를 쉽게 트러블슈팅 할 수 있지만, 그 대가로 현저하게 사용률이 낮은 하드웨어를 감수해야만 했다. 예를 들어 웹 서버의 경우 평균적으로 전체 가용 컴퓨트 중 10% 정도만 소비할 정도이다.

컨테이너 기술이 지닌 가장 큰 장점은 새로운 종류의 인프라 격리를 만들어 낼 수 있다는 것이다. 컨테이너에 대한 이해도가 낮은 사람들은 앤서블(Ansible), 퍼펫(Puppet), 또는 셰프(Chef) 등의 툴을 사용해서도 얼마든지 같은 장점을 누릴 수 있다고 믿겠지만, 이들 기술은 극히 상호보완적이다.

또한 아무리 노력한다 한들 이런 자동화 툴로는 별개의 인프라와 하드웨어 설정 간에 워크로드를 자유자재로 이동시킬 만큼의 격리 상태를 만들어 낼 수 없다. 동일한 컨테이너가 온프레미스 데이터센터에 있는 하드웨어에서, 그리고 퍼블릭 클라우드 상의 가상머신에서 똑같이 구동될 수 있으며, 여기에는 그 어떤 변화도 필요하지 않다. 진정한 의미에서의 워크로드 모빌리티가 실현되는 것이다.

4. 컨테이너 저장소
컨테이너 저장소는 민첩성 확보에 아주 중요한 역할을 한다. 컨테이너 이미지를 구축하기 위한 데브옵스 프로세스와 이들을 저장하기 위한 저장소가 없다면 컨테이너가 구동될 기기마다 각 컨테이너를 일일이 만들어야 하기 때문이다. 저장소가 생기면 해당 저장소로부터 구독이 가능하도록 설정된 어느 머신에서든 컨테이너 이미지를 실행할 수 있다.

그러나 데이터센터가 여러 개일 때는 일이 좀 더 복잡하다. 만일 컨테이너 이미지가 하나의 데이터센터에 구축되어 있다면, 이를 어떻게 다른 데이터센터로 옮길 것인가? 가장 이상적인 것은 통합 데이터 플랫폼을 이용해 데이터센터 간에 저장소를 미러링하는 것이다. 여기서 가장 중요한 것은 온프레미스와 클라우드 간 미러링 역량은 온프레미스 데이터센터 간 미러링 역량과는 많이 다를 수 있다는 것이다. 통합 데이터 플랫폼은 어떤 물리 인프라 또는 클라우드 인프라를 사용하는가와 관계 없이 이런 역량을 제공한다.

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.