2020.12.14

IDG 블로그 | 클라우드 데이터를 이전하고 개선하는 가장 확실한 방법

David Linthicum | InfoWorld
종종 듣는 질문 중 하나가 “어떻게 하면 데이터를 클라우드에 재배치하고, 데이터베이스와 애플리케이션, 보안, 거버넌스, 데이터옵스를 개선할 수 있을까?”라는 것이다. 모두가 데이터를 이전하고 자동으로 데이터의 상태를 개선하는 지름길이나 마법의 툴을 찾고 있다. 하지만 유감스럽게도 그런 마법은 없다.
 
ⓒ Getty Images Bank

한편으로는 마법이 아닌 마이그레이션 과정이 성공을 위한 최고의 한 수를 제공한다. 그 프로세스를 살펴보기 전에, 미리 알려줄 것이 있다. 

먼저, 클라우드로의 데이터 재배치에는 폭포수 방법론을 사용하지 않는다. 특정 작업은 다음 작업으로 넘어가기 전에 끝내야 하지만, 다 그런 것은 아니다. 의존성이 있는 것은 분명하지만, 다음에 소개하는 일련의 작업 중 어떤 것이든 마음대로 해도 된다.

둘째, 처음부터 제대로 하려면 적합한 인력을 갖추고 프로세스를 따라야 한다. 데이터베이스, 보안, 운영, 거버넌스, 클라우드 전용 서비스 등의 전문가가 필요한데, 지금은 이런 인력을 찾는 것이 어렵다.

마지막으로 여기 소개하는 것은 일반화된 접근법이다. 따라서 실제 환경에 따라 몇몇은 추가하거나 없애야 한다. 예를 들어, 의료기관이라면, 데이터를 사용하고 이전하고 배치하는 데 있어서 컴플라이언스와 거버넌스 문제를 좀 더 신경 써야 한다. 

이 세 가지를 염두에 두고 다음 프로세스를 따라 진행하기 바란다.

1. 데이터의 현재 상태를 평가한다. 모델(객체, 관계형, 인메모리, 특수용 등)부터 메타데이터, 애플리케이션 연결, 요구사항(보안, 거버넌스, BC/DR, 관리)까지 평가한다. 

2. 리던던시를 줄이고 효율성을 높일 수 있는 부분을 찾는다. 이 과정은 한 모델에서 다른 모델로(관계형에서 객체 데이터베이스로) 이전하는 것이라 큰 영향을 미칠 수 있다. 애플리케이션 리팩터링이나 모든 데이터 구조의 일반화, 신뢰할 수 있는 단일 소스 정의 등이 필요하기 때문이다. 보안과 거버넌스, 데이터옵스도 고려해야 하는데, 분명히 하자면, 이들은 모든 프로세스에 중복적으로 적용된다.

3. 앞의 과정에서 정의한 변경사항과 요구사항을 적용해 목표로 하는 데이터의 상태를 정의한다. 필자가 추천하는 방법은 CDM(Common Metadata Model)을 개발하는 것이다. CDM은 본질적으로 대부분 데이터, 때로는 기업 내에 존재하는 모든 데이터에 대한 신뢰할 수 있는 단일 소스를 제공한다. CDM은 데이터베이스 모델과 구조가 다른 많은 데이터베이스로 구성되지만, 사용자에게는 단 하나의 통일된 데이터베이스로 보이며, 질의를 하면 요청하면 일관성 있는 답변을 제공한다.

4. 대상 클라우드 플랫폼에 중점을 두고 마이그레이션 및 구현 계획을 정의한다. ‘악마는 디테일에 있고’ 일부는 여전히 즉석에서 변경되겠지만, 소소한 것이 될 것이다.

5. 애플리케이션과 데이터베이스를 위한 스테이징 및 테스트 플랫폼을 생성한다. 여기에는 CI/CD 링크가 포함될 수도 있다. 더 나아가 이 환경은 DBA는 물론 데브섹옵스팀도 관리해야 한다. 이런 유지보수 계획을 세워야 한다.

6. 스테이징 및 테스트 플랫폼에서 배치 테스트를 진행해 성능이나 보안, 거버넌스, 합목적성 등을 판단한다. 각 애플리케이션과 데이터베이스에 반복한다.

7. 테스트는 운영 비용을 결정하고 향후 몇 년 동안의 비용 계획을 세우는 데 필요한 데이터를 제공한다. 이제 실제 비용 지표가 있기 때문에 이 작업이 쉬워진다. 비용 계획은 충격적인 요금 고지서를 받지 않도록 해준다. 

8. 운영 계획을 정의한다. 모니터링과 관리 접근법, 지침서, 툴 등을 포함해야 한다. 추상화 및 자동화의 이점을 이용해 운영 프로세스에서 가능한 한 인력을 적게 투입할 수 있도록 해야 한다.

9. 단계별 배치를 시작하는데, 가장 작고 덜 중요한 데이터베이스와 애플리케이션으로 시작해서 크고 중요한 것으로 진행한다. 데드라인을 유연하게 가져가라. 걱정할 필요는 없다. 프로세스를 진행하면서 학습하고 점점 나아질 것이다. 이 과정을 서두르다 실패하는 경우가 많다. 왜냐하면 데드라인을 맞추려고 중요한 작업을 건너뛰는 경우가 생기기 때문이다.

10. 각 단계마다 인수 검사를 실시한다.

11. 데이터옵스를 시작한다.

12. 휴가를 떠난다.

평균적으로 이 과정에는 데이터베이스마다 3주 정도가 걸린다. 마이그레이션해야 할 데이터베이스가 100개라면, 42~52주가 걸리는 셈이다. 이런 데이터 이전 및 개선 프로세스는 마법도 아니고 자동도 아니다. 하지만 마이그레이션 과정에 녹여 넣을 수 있다. editor@itworld.co.kr


2020.12.14

IDG 블로그 | 클라우드 데이터를 이전하고 개선하는 가장 확실한 방법

David Linthicum | InfoWorld
종종 듣는 질문 중 하나가 “어떻게 하면 데이터를 클라우드에 재배치하고, 데이터베이스와 애플리케이션, 보안, 거버넌스, 데이터옵스를 개선할 수 있을까?”라는 것이다. 모두가 데이터를 이전하고 자동으로 데이터의 상태를 개선하는 지름길이나 마법의 툴을 찾고 있다. 하지만 유감스럽게도 그런 마법은 없다.
 
ⓒ Getty Images Bank

한편으로는 마법이 아닌 마이그레이션 과정이 성공을 위한 최고의 한 수를 제공한다. 그 프로세스를 살펴보기 전에, 미리 알려줄 것이 있다. 

먼저, 클라우드로의 데이터 재배치에는 폭포수 방법론을 사용하지 않는다. 특정 작업은 다음 작업으로 넘어가기 전에 끝내야 하지만, 다 그런 것은 아니다. 의존성이 있는 것은 분명하지만, 다음에 소개하는 일련의 작업 중 어떤 것이든 마음대로 해도 된다.

둘째, 처음부터 제대로 하려면 적합한 인력을 갖추고 프로세스를 따라야 한다. 데이터베이스, 보안, 운영, 거버넌스, 클라우드 전용 서비스 등의 전문가가 필요한데, 지금은 이런 인력을 찾는 것이 어렵다.

마지막으로 여기 소개하는 것은 일반화된 접근법이다. 따라서 실제 환경에 따라 몇몇은 추가하거나 없애야 한다. 예를 들어, 의료기관이라면, 데이터를 사용하고 이전하고 배치하는 데 있어서 컴플라이언스와 거버넌스 문제를 좀 더 신경 써야 한다. 

이 세 가지를 염두에 두고 다음 프로세스를 따라 진행하기 바란다.

1. 데이터의 현재 상태를 평가한다. 모델(객체, 관계형, 인메모리, 특수용 등)부터 메타데이터, 애플리케이션 연결, 요구사항(보안, 거버넌스, BC/DR, 관리)까지 평가한다. 

2. 리던던시를 줄이고 효율성을 높일 수 있는 부분을 찾는다. 이 과정은 한 모델에서 다른 모델로(관계형에서 객체 데이터베이스로) 이전하는 것이라 큰 영향을 미칠 수 있다. 애플리케이션 리팩터링이나 모든 데이터 구조의 일반화, 신뢰할 수 있는 단일 소스 정의 등이 필요하기 때문이다. 보안과 거버넌스, 데이터옵스도 고려해야 하는데, 분명히 하자면, 이들은 모든 프로세스에 중복적으로 적용된다.

3. 앞의 과정에서 정의한 변경사항과 요구사항을 적용해 목표로 하는 데이터의 상태를 정의한다. 필자가 추천하는 방법은 CDM(Common Metadata Model)을 개발하는 것이다. CDM은 본질적으로 대부분 데이터, 때로는 기업 내에 존재하는 모든 데이터에 대한 신뢰할 수 있는 단일 소스를 제공한다. CDM은 데이터베이스 모델과 구조가 다른 많은 데이터베이스로 구성되지만, 사용자에게는 단 하나의 통일된 데이터베이스로 보이며, 질의를 하면 요청하면 일관성 있는 답변을 제공한다.

4. 대상 클라우드 플랫폼에 중점을 두고 마이그레이션 및 구현 계획을 정의한다. ‘악마는 디테일에 있고’ 일부는 여전히 즉석에서 변경되겠지만, 소소한 것이 될 것이다.

5. 애플리케이션과 데이터베이스를 위한 스테이징 및 테스트 플랫폼을 생성한다. 여기에는 CI/CD 링크가 포함될 수도 있다. 더 나아가 이 환경은 DBA는 물론 데브섹옵스팀도 관리해야 한다. 이런 유지보수 계획을 세워야 한다.

6. 스테이징 및 테스트 플랫폼에서 배치 테스트를 진행해 성능이나 보안, 거버넌스, 합목적성 등을 판단한다. 각 애플리케이션과 데이터베이스에 반복한다.

7. 테스트는 운영 비용을 결정하고 향후 몇 년 동안의 비용 계획을 세우는 데 필요한 데이터를 제공한다. 이제 실제 비용 지표가 있기 때문에 이 작업이 쉬워진다. 비용 계획은 충격적인 요금 고지서를 받지 않도록 해준다. 

8. 운영 계획을 정의한다. 모니터링과 관리 접근법, 지침서, 툴 등을 포함해야 한다. 추상화 및 자동화의 이점을 이용해 운영 프로세스에서 가능한 한 인력을 적게 투입할 수 있도록 해야 한다.

9. 단계별 배치를 시작하는데, 가장 작고 덜 중요한 데이터베이스와 애플리케이션으로 시작해서 크고 중요한 것으로 진행한다. 데드라인을 유연하게 가져가라. 걱정할 필요는 없다. 프로세스를 진행하면서 학습하고 점점 나아질 것이다. 이 과정을 서두르다 실패하는 경우가 많다. 왜냐하면 데드라인을 맞추려고 중요한 작업을 건너뛰는 경우가 생기기 때문이다.

10. 각 단계마다 인수 검사를 실시한다.

11. 데이터옵스를 시작한다.

12. 휴가를 떠난다.

평균적으로 이 과정에는 데이터베이스마다 3주 정도가 걸린다. 마이그레이션해야 할 데이터베이스가 100개라면, 42~52주가 걸리는 셈이다. 이런 데이터 이전 및 개선 프로세스는 마법도 아니고 자동도 아니다. 하지만 마이그레이션 과정에 녹여 넣을 수 있다. editor@itworld.co.kr


X