2021.02.17

IDG 블로그 | 클라우드 마이그레이션을 위한 데이터베이스 일반화

David Linthicum | InfoWorld
지난 주 필자는 데이터베이스 일반화(Database Normalization)를 멀티클라우드 아키텍처의 베스트 프랙티스 중 하나로 소개했다. 이번에는 클라우드 마이그레이션에서 이 개념을 살펴보자.
 
ⓒ Getty Images Bank

데이터베이스 일반화를 데이터 일반화와 혼동하지 말기 바란다. 데이터 일반화는 리던던시를 줄이고 좀 더 최적화된 구조를 정의하는 작업으로, DBA라면 누구나 알고 있는 과정이다. 30년도 전에 대학에서 가르치던 내용이다.

데이터베이스 일반화는 데이터베이스 자체의 리던던시를 줄여 비즈니스 애플리케이션이나 데이터 과학자, 그리고 이들이 수행하는 데이터 분석의 요구에 부응하는 데 더 중점을 두는 데이터베이스 세트를 만드는 과정이다. 

문제는 데이터베이스와 데이터가 클라우드로 이전하면서 지나치게 복잡하고 리던던시로 가득 차 있다는 것이다. 이른바 단일 진실 공급원(single sources of truth)는 찾아보기 어렵다. 또한 클라우드로 데이터를 이전하는 기업 대부분은 그저 데이터베이스를 클라우드로 복제하고자 한다. 이는 큰 실수가 아닐 수 없다.

필자가 아는 한, 예산이란 제한적인 것이고, 데이터를 클라우드 네이티브 및 비 클라우드 네이티브 데이터베이스로 옮기고 결합하는 데는 그저 나쁜 데이터베이스 아키텍처를 클라우드로 밀어내는 것보다 많은 비용이 든다. 하지만 역시 필자가 아는 한, 일단 클라우드로 이전한 후에 문제를 바로잡으려면 훨씬 더 많은 비용이 든다.

만약 이렇게 하지 않으면, 데이터를 두 번 마이그레이션해야 한다. 먼저 리프트 앤 시프트 방식으로 퍼블릭 클라우드로 이전한 다음, 클라우드의 해당 데이터베이스 아키텍처가 최적화되지 않았다는 것을 파악해서 다시 수정해야 하기 때문이다. 최적화되지 않았다는 것은 너무 복잡하거나 리던던시가 많거나 너무 비싼 것을 말한다.

그렇다면 클라우드 마이그레이션에서 데이터베이스 일반화는 어떻게 수행해야 할 것인가? 이상적인 프로세스를 소개한다.
 
  • 이해관계자의 관심을 확보한다. 우선 마이그레이션과 일반화에 최소 2배 이상의 비용을 사용해야 하기 때문이다. 애플리케이션을 변경해 새로운 데이터베이스 스택에서 처리하는 것도 포함된다. 만약 경영진이 관련 비용을 선뜻 내놓지 않는다면, 위험성과 미래의 비용을 자세히 설명해야 한다. 이메일을 보낼 것을 권장한다. 나중에 아무 것도 하지 않는 어리석음에 대한 경고의 증거로 보낸편지함을 보여줄 수 있을 것이다.
 
  • 필요한 인력을 확보한다. 기존 데이터베이스 스택과 클라우드 네이티브 데이터베이스 선택지, 데이터베이스 설계, 데이터 마이그레이션 과정을 잘 아는 인력이 필요하다. 물론 데이터 보안과 데이터 거버넌스, 데이터 운영 인력도 필요하다.
 
  • 계획에 충분한 시간을 들인다. 이 작업의 대부분은 마이그레이션 계획과 관련된 것으로, 데이터베이스를 어떻게 변경하고 어떤 데이터베이스를 사용할 것인지 등을 고민해야 한다. 악마는 디테일에 있다. 만약 미들웨어 한 부분이나 데이터 컴플라이언스 시스템을 놓친다면, 다시 작업해야 할 것이다.

보기처럼 어려운 작업은 아니다. 과거에도 이 플랫폼에서 저 플랫폼으로 옮기는 동시에 데이터베이스를 바꾸곤 했다. 새로운 것은 지금은 데이터를 좀 더 전략적인 관점으로 본다는 정도이다. 이제 데이터는 핵심 분석 데이터가 되어야 하고, AI 시스템을 위한 학습 데이터도 되어야 한다. 데이터가 비즈니스의 모든 것이라고 해도 과언이 아닌 만큼, 그에 걸맞게 다루어야 한다. editor@itworld.co.kr


2021.02.17

IDG 블로그 | 클라우드 마이그레이션을 위한 데이터베이스 일반화

David Linthicum | InfoWorld
지난 주 필자는 데이터베이스 일반화(Database Normalization)를 멀티클라우드 아키텍처의 베스트 프랙티스 중 하나로 소개했다. 이번에는 클라우드 마이그레이션에서 이 개념을 살펴보자.
 
ⓒ Getty Images Bank

데이터베이스 일반화를 데이터 일반화와 혼동하지 말기 바란다. 데이터 일반화는 리던던시를 줄이고 좀 더 최적화된 구조를 정의하는 작업으로, DBA라면 누구나 알고 있는 과정이다. 30년도 전에 대학에서 가르치던 내용이다.

데이터베이스 일반화는 데이터베이스 자체의 리던던시를 줄여 비즈니스 애플리케이션이나 데이터 과학자, 그리고 이들이 수행하는 데이터 분석의 요구에 부응하는 데 더 중점을 두는 데이터베이스 세트를 만드는 과정이다. 

문제는 데이터베이스와 데이터가 클라우드로 이전하면서 지나치게 복잡하고 리던던시로 가득 차 있다는 것이다. 이른바 단일 진실 공급원(single sources of truth)는 찾아보기 어렵다. 또한 클라우드로 데이터를 이전하는 기업 대부분은 그저 데이터베이스를 클라우드로 복제하고자 한다. 이는 큰 실수가 아닐 수 없다.

필자가 아는 한, 예산이란 제한적인 것이고, 데이터를 클라우드 네이티브 및 비 클라우드 네이티브 데이터베이스로 옮기고 결합하는 데는 그저 나쁜 데이터베이스 아키텍처를 클라우드로 밀어내는 것보다 많은 비용이 든다. 하지만 역시 필자가 아는 한, 일단 클라우드로 이전한 후에 문제를 바로잡으려면 훨씬 더 많은 비용이 든다.

만약 이렇게 하지 않으면, 데이터를 두 번 마이그레이션해야 한다. 먼저 리프트 앤 시프트 방식으로 퍼블릭 클라우드로 이전한 다음, 클라우드의 해당 데이터베이스 아키텍처가 최적화되지 않았다는 것을 파악해서 다시 수정해야 하기 때문이다. 최적화되지 않았다는 것은 너무 복잡하거나 리던던시가 많거나 너무 비싼 것을 말한다.

그렇다면 클라우드 마이그레이션에서 데이터베이스 일반화는 어떻게 수행해야 할 것인가? 이상적인 프로세스를 소개한다.
 
  • 이해관계자의 관심을 확보한다. 우선 마이그레이션과 일반화에 최소 2배 이상의 비용을 사용해야 하기 때문이다. 애플리케이션을 변경해 새로운 데이터베이스 스택에서 처리하는 것도 포함된다. 만약 경영진이 관련 비용을 선뜻 내놓지 않는다면, 위험성과 미래의 비용을 자세히 설명해야 한다. 이메일을 보낼 것을 권장한다. 나중에 아무 것도 하지 않는 어리석음에 대한 경고의 증거로 보낸편지함을 보여줄 수 있을 것이다.
 
  • 필요한 인력을 확보한다. 기존 데이터베이스 스택과 클라우드 네이티브 데이터베이스 선택지, 데이터베이스 설계, 데이터 마이그레이션 과정을 잘 아는 인력이 필요하다. 물론 데이터 보안과 데이터 거버넌스, 데이터 운영 인력도 필요하다.
 
  • 계획에 충분한 시간을 들인다. 이 작업의 대부분은 마이그레이션 계획과 관련된 것으로, 데이터베이스를 어떻게 변경하고 어떤 데이터베이스를 사용할 것인지 등을 고민해야 한다. 악마는 디테일에 있다. 만약 미들웨어 한 부분이나 데이터 컴플라이언스 시스템을 놓친다면, 다시 작업해야 할 것이다.

보기처럼 어려운 작업은 아니다. 과거에도 이 플랫폼에서 저 플랫폼으로 옮기는 동시에 데이터베이스를 바꾸곤 했다. 새로운 것은 지금은 데이터를 좀 더 전략적인 관점으로 본다는 정도이다. 이제 데이터는 핵심 분석 데이터가 되어야 하고, AI 시스템을 위한 학습 데이터도 되어야 한다. 데이터가 비즈니스의 모든 것이라고 해도 과언이 아닌 만큼, 그에 걸맞게 다루어야 한다. editor@itworld.co.kr


X