2017.06.01

클라우드가 백업을 죽였는가?

Tarun Thakur | Datos IO CEO | Network World
기업들이 하이브리드 및 멀티 클라우드 인프라를 빠르게 도입하고 전통적인 워크로드를 클라우드로 마이그레이션함에 따라 분산 아키텍처가 사실상의 표준으로 부상했지만, 전통적인 백업 및 복구 전략은 이러한 움직임을 따라잡지 못하고 있다. 새로운 클라우드 우선 데이터 보호 접근 방법이 필요하다.



IDC에 따르면, CIO의 70%는 클라우드 우선 전략을 시행하고 있으며 대부분의 기업이 멀티 클라우드 인프라를 사용하면서 프라이빗, 퍼블릭, 관리형 등 그때그때 가장 적합한 클라우드에 애플리케이션을 배포하고 있다. 이와 같은 멀티 클라우드로의 발전은 인프라 환경의 기존 애플리케이션 계층을 무너뜨리는 두 가지 대대적인 변화를 이끌었다.

첫째, 클라우드에서 만들어지는 차세대 애플리케이션은 아파치 카산드라(Cassandra), 몽고DB(MongoDB), 아파치 HBase를 비롯한 차세대 분산 비관계형 데이터베이스에 배포된다.

비관계형 데이터베이스는 높은 가용성을 제공하는 대신 일관성 부분에서 절충이 필요하다. 분석 애플리케이션의 경우 기업들은 이제 신속하게 아파치 HDFS/ 하둡과 같은 구내 분석 데이터 스토어 또는 아마존 레드시프트(Redshift), 구글 빅쿼리(BigQuery)와 같은 클라우드 네이티브 데이터베이스를 구축한다.

게다가 이러한 차세대 애플리케이션은 퍼블릭 클라우드 인프라와 온프레미스 프라이빗 클라우드, 양쪽에 모두 배포되므로 상황은 더욱 복잡해진다.

둘째, 전통적인 데이터센터 애플리케이션이 클라우드로 마이그레이션되고 있다. 이런 애플리케이션의 대다수가 여전히 오라클, 마이크로소프트 SQL 서버와 같은 관계형 데이터베이스에 배포되지만 아마존 다이나모DB(DynamoDB)와 같은 차세대 클라우드 네이티브 데이터베이스에 배포하는 경우도 차츰 늘고 있다.

아마존 웹 서비스 데이터베이스 비즈니스가 불과 3년 만에 20억 달러 규모로 폭발적으로 성장했다는 사실이 이러한 변화를 보여주는 하나의 사례다.

클라우드 마이그레이션과 보조를 맞추는 데이터 보호
A많은 수의 애플리케이션과 데이터베이스를 보유한 모든 기업은 멀티 클라우드 환경을 도입하고 있으며, 이로 인한 파급 효과는 곳곳에 미치고 있다. CIO 관점에서 몇 가지 생각해야 할 전략적 요소가 있다.

첫째, 애플리케이션에 따라 클라우드 선택이 좌우된다. 예를 들어 오라클 엑사데이터(Exadata) 플랫폼을 활용하는 애플리케이션이 있는 경우 오라클 엑사데이터 플랫폼을 옮긴다면 AWS보다는 오라클 클라우드로 옮길 것이다.

마찬가지로 마이크로소프트 SQL 서버용 애플리케이션의 경우 보통 마이크로소프트 애저(Azure) 퍼블릭 클라우드나 아마존 AWS 가운데 하나로 옮기게 된다. 물론 비관계형 데이터베이스와 현대적 데이터베이스에 배포되는 새로운 현대적 애플리케이션은 처음부터 클라우드 우선 인프라에 배포된다.

둘째, 사용 사례가 클라우드의 경계를 넘나든다. 클라우드로 마이그레이션된 전체 애플리케이션을 보호하는 것 외에, 조직은 테스트, 개발 또는 분석을 위해 데이터 세트를 클라우드로 옮기고, 비용 효율성을 위해 비활성 데이터를 클라우드로 마이그레이션하고, 규정 준수와 거버넌스를 위해 온프라미스로 다시 데이터를 가져와야 한다.

핵심은 멀티 클라우드 세계에서 번창하려면 CIO는 전체적인 데이터 관리 전략에 포함된 새로운 백업 및 복구 전략을 마련해야 한다는 것이다. CIO는 태생이 클라우드인 하이퍼스케일 분산 애플리케이션을 위한 데이터 보호를 제공할 뿐만 아니라 애플리케이션 요건에 따라 모든 클라우드 리소스를 최적으로 활용할 수 있는 자유를 부여하는 데이터 보호 전략을 선제적으로 계획하고 실행해야 한다.

멀티 클라우드 환경에서의 데이터 보호에는 전통적인 데이터 보호와 근본적으로 다른 접근 방법이 필요하다. 전체적인 클라우드 마이그레이션과 보조를 맞출 수 있는 백업 및 복구 전략을 선택할 때 살펴야 할 몇 가지 핵심 역량은 다음과 같다.

- 클라우드 우선 탄력성: 클라우드의 강점을 십분 활용하려면 데이터 보호는 탄력적이고 컴퓨팅 기반이어야 하며 단절없는 확장성을 제공해야 한다.

- 하이퍼스케일과 분산: 멀티 클라우드 환경, 클라우드에서 만들어지는 차세대 애플리케이션, 그리고 클라우드로 마이그레이션되는 전통적인 애플리케이션의 공통적인 테마는 하이퍼스케일이다. 멀티 클라우드 애플리케이션은 기본적으로 하이퍼스케일이며 분산형이므로 데이터 보호 전략도 하이퍼스케일에서의 보호에 근거해야 한다.

- 애플리케이션 중심: 클라우드에는 LUN 또는 ESX VM 개념이 없다. 모든 기반 인프라는 탄력적 블록 스토리지(EBS) 또는 탄력적 컴퓨팅 클라우드(EC2)와 같은 클라우드 네이티브 서비스로 노출된다. 클라우드에서 가치는 스택을 애플리케이션을 향해 끌어올리는 데 있다. 따라서 모든 데이터 보호 전략은 인프라(예: LUN, VM)가 아닌 애플리케이션 중심으로 해 기반 인프라에 대한 종속성을 없애야 한다.

- 대규모에서의 성능: 멀티 클라우드 데이터 보호는 구식 미디어 서버 기반 아키텍처의 본질적인 단점을 없애야 한다. 데이터는 출처에서 목적지로 직접, 병렬로 이동해야 한다.

- 대규모에서의 효율성: 전통적인 데이터 보호 솔루션에 사용되는 중복 제거 기술은 멀티 클라우드 환경에서는 통하지 않는다. 클라우드에서 최고 수준의 백업 스토리지 효율성을 제공할 수 있는 애플리케이션 중심의 차세대 중복 제거를 찾아야 한다.

- 글로벌 데이터 가시성: 멀티 클라우드는 분산형이므로 데이터 보호는 어디서나 백업, 복구, 마이그레이션할 수 있는 역량을 구현하는 글로벌 데이터 가시성을 제공해야 한다.

- 범용적인 데이터 이식성: 멀티 클라우드 인프라로부터 완전한 독립성을 유지하려면 데이터 보호는 네이티브 형식으로 항상 일관적인 데이터 버전 관리를 제공해 완전한 데이터 복구 가능성, 이식성, 이동성을 실현해야 한다.

멀티 클라우드 환경에 클라우드 우선 데이터 보호 전략을 제대로 도입하면 전통적인 테두리 내에서는 불가능했던 혜택을 얻을 수 있다.

예를 들어 완전한 가용성과 성능을 확보해 데이터 보호 인프라에 장애 회복력을 제공하고, 분에서 시간 단위의 유연한 복구 지점 목표를 설정할 수 있다. 또한 애플리케이션 중심 중복 제거를 사용하면 공간 효율적인 백업으로 보조 스토리지 비용을 최대 70% 절감할 수 있다.

클라우드 우선 데이터 보호 전략은 클라우드를 중심으로 한 데이터 마이그레이션을 통해 하이브리드 클라우드 도입도 촉진할 수 있다. 궁극적으로 클라우드 우선 데이터 보호는 어디서나 백업(클라우드 하나 또는 여러 클라우드), 어디서나 복구(온프레미스 또는 퍼블릭 클라우드), 어디서나 마이그레이션(클라우드로, 클라우드 간, 또는 클라우드에서 온프레미스로)을 실현하는 기반이 된다.

또한 클라우드 우선 데이터 보호 전략은 클라우드의 변혁과 보조를 맞추고자 하는 CIO가 데이터의 가치를 판단하는 데 도움이 된다. 이런 수익화의 전제는 단순하다. 백업 또는 애플리케이션 일관적(application-consistent) 버전은 기업에서 운영 복구 요건을 충족할 수 있게 해주지만 실질적으로 비즈니스 성과를 이끄는 요소는 보조 데이터의 수익화다.

예를 들어 데이터를 주 또는 프로덕션 인스턴스로 복원한 다음 애플리케이션을 재가동하는 대신 보조 복사본에서 바로 애플리케이션을 실행할 수 있다면 그 기업은 시간과 비용을 절약할 수 있다.

그래서, 클라우드가 백업을 죽였는가? 전혀 그렇지 않다! 다만 이로 인해 새로운 멀티 클라우드 세계의 표준에 맞는 데이터 보호를 재창조할 필요성이 생겨났다. 디지털 변혁은 멀티 클라우드 인프라의 주류 도입을 촉진하면서 조직 발전 전략의 기반으로 자리잡고 있는 새로운 하이퍼스케일 분산 애플리케이션 시대를 이끌고 있다.

이 변혁과 보조를 맞추려면 CIO는 데이터의 상시 가용성을 보장해야 하며 이를 위해서는 요구 사항과 이에 대처하는 데 사용하는 기술을 새로운 시각으로 봐야 한다. editor@itworld.co.kr  


2017.06.01

클라우드가 백업을 죽였는가?

Tarun Thakur | Datos IO CEO | Network World
기업들이 하이브리드 및 멀티 클라우드 인프라를 빠르게 도입하고 전통적인 워크로드를 클라우드로 마이그레이션함에 따라 분산 아키텍처가 사실상의 표준으로 부상했지만, 전통적인 백업 및 복구 전략은 이러한 움직임을 따라잡지 못하고 있다. 새로운 클라우드 우선 데이터 보호 접근 방법이 필요하다.



IDC에 따르면, CIO의 70%는 클라우드 우선 전략을 시행하고 있으며 대부분의 기업이 멀티 클라우드 인프라를 사용하면서 프라이빗, 퍼블릭, 관리형 등 그때그때 가장 적합한 클라우드에 애플리케이션을 배포하고 있다. 이와 같은 멀티 클라우드로의 발전은 인프라 환경의 기존 애플리케이션 계층을 무너뜨리는 두 가지 대대적인 변화를 이끌었다.

첫째, 클라우드에서 만들어지는 차세대 애플리케이션은 아파치 카산드라(Cassandra), 몽고DB(MongoDB), 아파치 HBase를 비롯한 차세대 분산 비관계형 데이터베이스에 배포된다.

비관계형 데이터베이스는 높은 가용성을 제공하는 대신 일관성 부분에서 절충이 필요하다. 분석 애플리케이션의 경우 기업들은 이제 신속하게 아파치 HDFS/ 하둡과 같은 구내 분석 데이터 스토어 또는 아마존 레드시프트(Redshift), 구글 빅쿼리(BigQuery)와 같은 클라우드 네이티브 데이터베이스를 구축한다.

게다가 이러한 차세대 애플리케이션은 퍼블릭 클라우드 인프라와 온프레미스 프라이빗 클라우드, 양쪽에 모두 배포되므로 상황은 더욱 복잡해진다.

둘째, 전통적인 데이터센터 애플리케이션이 클라우드로 마이그레이션되고 있다. 이런 애플리케이션의 대다수가 여전히 오라클, 마이크로소프트 SQL 서버와 같은 관계형 데이터베이스에 배포되지만 아마존 다이나모DB(DynamoDB)와 같은 차세대 클라우드 네이티브 데이터베이스에 배포하는 경우도 차츰 늘고 있다.

아마존 웹 서비스 데이터베이스 비즈니스가 불과 3년 만에 20억 달러 규모로 폭발적으로 성장했다는 사실이 이러한 변화를 보여주는 하나의 사례다.

클라우드 마이그레이션과 보조를 맞추는 데이터 보호
A많은 수의 애플리케이션과 데이터베이스를 보유한 모든 기업은 멀티 클라우드 환경을 도입하고 있으며, 이로 인한 파급 효과는 곳곳에 미치고 있다. CIO 관점에서 몇 가지 생각해야 할 전략적 요소가 있다.

첫째, 애플리케이션에 따라 클라우드 선택이 좌우된다. 예를 들어 오라클 엑사데이터(Exadata) 플랫폼을 활용하는 애플리케이션이 있는 경우 오라클 엑사데이터 플랫폼을 옮긴다면 AWS보다는 오라클 클라우드로 옮길 것이다.

마찬가지로 마이크로소프트 SQL 서버용 애플리케이션의 경우 보통 마이크로소프트 애저(Azure) 퍼블릭 클라우드나 아마존 AWS 가운데 하나로 옮기게 된다. 물론 비관계형 데이터베이스와 현대적 데이터베이스에 배포되는 새로운 현대적 애플리케이션은 처음부터 클라우드 우선 인프라에 배포된다.

둘째, 사용 사례가 클라우드의 경계를 넘나든다. 클라우드로 마이그레이션된 전체 애플리케이션을 보호하는 것 외에, 조직은 테스트, 개발 또는 분석을 위해 데이터 세트를 클라우드로 옮기고, 비용 효율성을 위해 비활성 데이터를 클라우드로 마이그레이션하고, 규정 준수와 거버넌스를 위해 온프라미스로 다시 데이터를 가져와야 한다.

핵심은 멀티 클라우드 세계에서 번창하려면 CIO는 전체적인 데이터 관리 전략에 포함된 새로운 백업 및 복구 전략을 마련해야 한다는 것이다. CIO는 태생이 클라우드인 하이퍼스케일 분산 애플리케이션을 위한 데이터 보호를 제공할 뿐만 아니라 애플리케이션 요건에 따라 모든 클라우드 리소스를 최적으로 활용할 수 있는 자유를 부여하는 데이터 보호 전략을 선제적으로 계획하고 실행해야 한다.

멀티 클라우드 환경에서의 데이터 보호에는 전통적인 데이터 보호와 근본적으로 다른 접근 방법이 필요하다. 전체적인 클라우드 마이그레이션과 보조를 맞출 수 있는 백업 및 복구 전략을 선택할 때 살펴야 할 몇 가지 핵심 역량은 다음과 같다.

- 클라우드 우선 탄력성: 클라우드의 강점을 십분 활용하려면 데이터 보호는 탄력적이고 컴퓨팅 기반이어야 하며 단절없는 확장성을 제공해야 한다.

- 하이퍼스케일과 분산: 멀티 클라우드 환경, 클라우드에서 만들어지는 차세대 애플리케이션, 그리고 클라우드로 마이그레이션되는 전통적인 애플리케이션의 공통적인 테마는 하이퍼스케일이다. 멀티 클라우드 애플리케이션은 기본적으로 하이퍼스케일이며 분산형이므로 데이터 보호 전략도 하이퍼스케일에서의 보호에 근거해야 한다.

- 애플리케이션 중심: 클라우드에는 LUN 또는 ESX VM 개념이 없다. 모든 기반 인프라는 탄력적 블록 스토리지(EBS) 또는 탄력적 컴퓨팅 클라우드(EC2)와 같은 클라우드 네이티브 서비스로 노출된다. 클라우드에서 가치는 스택을 애플리케이션을 향해 끌어올리는 데 있다. 따라서 모든 데이터 보호 전략은 인프라(예: LUN, VM)가 아닌 애플리케이션 중심으로 해 기반 인프라에 대한 종속성을 없애야 한다.

- 대규모에서의 성능: 멀티 클라우드 데이터 보호는 구식 미디어 서버 기반 아키텍처의 본질적인 단점을 없애야 한다. 데이터는 출처에서 목적지로 직접, 병렬로 이동해야 한다.

- 대규모에서의 효율성: 전통적인 데이터 보호 솔루션에 사용되는 중복 제거 기술은 멀티 클라우드 환경에서는 통하지 않는다. 클라우드에서 최고 수준의 백업 스토리지 효율성을 제공할 수 있는 애플리케이션 중심의 차세대 중복 제거를 찾아야 한다.

- 글로벌 데이터 가시성: 멀티 클라우드는 분산형이므로 데이터 보호는 어디서나 백업, 복구, 마이그레이션할 수 있는 역량을 구현하는 글로벌 데이터 가시성을 제공해야 한다.

- 범용적인 데이터 이식성: 멀티 클라우드 인프라로부터 완전한 독립성을 유지하려면 데이터 보호는 네이티브 형식으로 항상 일관적인 데이터 버전 관리를 제공해 완전한 데이터 복구 가능성, 이식성, 이동성을 실현해야 한다.

멀티 클라우드 환경에 클라우드 우선 데이터 보호 전략을 제대로 도입하면 전통적인 테두리 내에서는 불가능했던 혜택을 얻을 수 있다.

예를 들어 완전한 가용성과 성능을 확보해 데이터 보호 인프라에 장애 회복력을 제공하고, 분에서 시간 단위의 유연한 복구 지점 목표를 설정할 수 있다. 또한 애플리케이션 중심 중복 제거를 사용하면 공간 효율적인 백업으로 보조 스토리지 비용을 최대 70% 절감할 수 있다.

클라우드 우선 데이터 보호 전략은 클라우드를 중심으로 한 데이터 마이그레이션을 통해 하이브리드 클라우드 도입도 촉진할 수 있다. 궁극적으로 클라우드 우선 데이터 보호는 어디서나 백업(클라우드 하나 또는 여러 클라우드), 어디서나 복구(온프레미스 또는 퍼블릭 클라우드), 어디서나 마이그레이션(클라우드로, 클라우드 간, 또는 클라우드에서 온프레미스로)을 실현하는 기반이 된다.

또한 클라우드 우선 데이터 보호 전략은 클라우드의 변혁과 보조를 맞추고자 하는 CIO가 데이터의 가치를 판단하는 데 도움이 된다. 이런 수익화의 전제는 단순하다. 백업 또는 애플리케이션 일관적(application-consistent) 버전은 기업에서 운영 복구 요건을 충족할 수 있게 해주지만 실질적으로 비즈니스 성과를 이끄는 요소는 보조 데이터의 수익화다.

예를 들어 데이터를 주 또는 프로덕션 인스턴스로 복원한 다음 애플리케이션을 재가동하는 대신 보조 복사본에서 바로 애플리케이션을 실행할 수 있다면 그 기업은 시간과 비용을 절약할 수 있다.

그래서, 클라우드가 백업을 죽였는가? 전혀 그렇지 않다! 다만 이로 인해 새로운 멀티 클라우드 세계의 표준에 맞는 데이터 보호를 재창조할 필요성이 생겨났다. 디지털 변혁은 멀티 클라우드 인프라의 주류 도입을 촉진하면서 조직 발전 전략의 기반으로 자리잡고 있는 새로운 하이퍼스케일 분산 애플리케이션 시대를 이끌고 있다.

이 변혁과 보조를 맞추려면 CIO는 데이터의 상시 가용성을 보장해야 하며 이를 위해서는 요구 사항과 이에 대처하는 데 사용하는 기술을 새로운 시각으로 봐야 한다. editor@itworld.co.kr  


X