2021.03.17

데이터베이스는 잊어라, 이제 필요한 것은 '데이터 플랫폼'

Matt Asay | InfoWorld
마크 포터의 이력은 흥미롭다. 포터는 AWS의 RDS(Relational Database Service)와 오로라(Aurora)를 운영한 적이 있으며, 그 이전에는 오라클에서 10년 이상을 근무하고, 이제는 몽고DB에서 일하고 있다. 데이터베이스 선구자격인 기업 3곳을 거친 포터는 데이터베이스 환경의 진화를 이야기할 수 있는 흥미로운 위치에 있다.

포터는 “백 오피스와 프론트 오피스 간의 분열이 해소되고 있다”고 관찰한다. 즉, 한때 명확하게 분리됐던 기록 시스템과 참여(engagement) 시스템이 통합되고 있다는 것이다.

정말 그렇다면 포터의 관찰이 데이터 전략 현대화에 전념하는 기업에는 어떤 의미가 있을까? 포터는 기업이 “데이터베이스 이상을 생각하고, 모든 관련 데이터 세트에서 실시간으로 데이터를 처리, 저장, 보호, 분석할 수 있는 ‘진짜 데이터 플랫폼’을 설계”해야 할 시점이라고 주장한다. 동시에 데이터 웨어하우스와 데이터 레이크를 새롭게 재구상하는 방법이 될 수도 있지 않을까?
 

데이터 시스템이 던지는 질문

오랫동안 데이터는 정말 각양각색으로 존재했다. 백 오피스 시스템은 행과 열에 잘 맞는 정형화된 데이터에 의존했다. 이러한 관계형 데이터베이스는 당시 놀라운 혁신이었으며, 지금까지도 기업에 많은 기여를 하고 있다. 하지만 필자는 과거 다음과 같은 주장을 했다.

“편리하게 정형화된 관계형 데이터베이스의 세계는 산더미 같은 비정형, 반정형 데이터로 인해 점점 복잡해진다. 새로운 데이터 대다수는 지난 수십 년 동안 (ERP와 CRM 시스템 등)기록 시스템을 밑바탕으로 구축되었지만, 제프리 무어가 말한 참여 시스템으로 만들어진다.”

포터는 세 번째 유형으로 ‘인사이트 시스템(Systems of Insight)’을 추가했다. 포터는 다음과 같이 설명한다.

“수십년 동안 기업은 기록 시스템과 참여 시스템을 유지해왔다. 기록 시스템은 주로 내부 프로그램과 사용자가 액세스하는 미션 크리티컬한 기본 정보 소스이고, 참여 시스템은 고객과 직원이 상호작용하는 디지털 인터페이스다. 최근에는 다양한 소스의 데이터를 결합해 기업 전반의 의사 결정에 정보를 제공하는 인사이트 시스템이 추가됐다. 오랫동안 각 시스템은 서로 다른 컴퓨터에서 운영됐고, 데이터 관리 면에서도 요구사항이 달랐으며, 서로 다른 부서에서 예산을 받았다.”

그러나 기업은 더 이상 다른 데이터와 상호작용하지 못하고 진화에 어려움을 겪는 사일로 시스템으로 연명할 수 없다. 포터는 상황이 너무 빠르게 변하고 있으며, 컴퓨터는 다음과 같은 질문을 하기 시작했다:

“모델 훈련과 추론이 부상함에 따라, 새로운 종류의 분석이 부상했다. 즉, 프로그램이 인사이트 시스템에 질문을 던지고 실시간으로 응답하는 것이지, 인간이 던진 질문을 구현하는 프로그램을 작성하는 것이 아니다. 이것은 아주 근본적인 변화다. SABRE를 구동한 IBM 7090에서 SKYNET을 구동하는 변화에 비유할 수 있을 정도다.”
 

모두를 지배하는 하나의 데이터 플랫폼

그렇다면 기업은 무엇을 해야 할까? 데이터베이스 기업의 CTO로서 포터의 답변은 궁금증을 불러 일으킨다.

“시스템 통합은 대부분의 기업이 혁신, 소프트웨어, 클라우드 기반으로의 전환을 위해 급진적인 디지털 트랜스포메이션 프로젝트를 진행하는 시점에 이루어진다. 즉, 데이터베이스를 넘어서 사고하고, 실시간으로 데이터를 처리, 저장, 보안, 분석할 수 있는 실제 ‘데이터 플랫폼’을 설계하기에 최적의 시기다.

몽고DB는 데이터베이스 이후의 세상을 어떻게 내다볼까? 현재 몽고DB는 자사를 ‘최신 애플리케이션용 데이터베이스’로 홍보하고 있다. 포터는 앞으로도 개인적인 전망을 글로 공개하겠다고 밝혔지만, 몽고DB 웹사이트에는 이미 여러 가지 단서가 흩어져 있다. 

예를 들어 한 프레젠테이션에서는 기업이 몽고DB의 아틀라스 매니지드 클라우드 데이터베이스, 데이터 레이크, 검색, 애플리케이션 개발 서비스 등 몽고DB 서비스 포트폴리오를 구축하는 방법을 설명하고 있다. 마치 스노우플레이크(Snowflake)가 ‘클라우드 데이터 플랫폼’이라고 홍보하는 것과 유사하다. 두 경우 모두 한 곳에서 데이터를 통합하고 쿼리까지 할 수 있도록 지원하는 것이고, 다른 기업들도 같은 전략을 취하고 있다.

성공할 수 있을까? 업계는 한동안 그런 성배를 찾아 헤맸다. 데이터 플랫폼은 지금까지는 데이터 레이크로 불렀던 것에 데이터 웨어하우스까지 포함해 더 큰 무엇을 만들고자 한다. 과거에 실패했다고 다음 번에도 실패할 것이라는 뜻은 아니다. 포터의 이력을 고려하면, 그가 제시하는 데이터베이스와 데이터 웨어하우스, 데이터 레이크가 데이터베이스를 진정 뛰어 넘는 데이터 플랫폼으로 진화하는 방향도 생각해 볼 필요가 있다. editor@itworld.co.kr 


2021.03.17

데이터베이스는 잊어라, 이제 필요한 것은 '데이터 플랫폼'

Matt Asay | InfoWorld
마크 포터의 이력은 흥미롭다. 포터는 AWS의 RDS(Relational Database Service)와 오로라(Aurora)를 운영한 적이 있으며, 그 이전에는 오라클에서 10년 이상을 근무하고, 이제는 몽고DB에서 일하고 있다. 데이터베이스 선구자격인 기업 3곳을 거친 포터는 데이터베이스 환경의 진화를 이야기할 수 있는 흥미로운 위치에 있다.

포터는 “백 오피스와 프론트 오피스 간의 분열이 해소되고 있다”고 관찰한다. 즉, 한때 명확하게 분리됐던 기록 시스템과 참여(engagement) 시스템이 통합되고 있다는 것이다.

정말 그렇다면 포터의 관찰이 데이터 전략 현대화에 전념하는 기업에는 어떤 의미가 있을까? 포터는 기업이 “데이터베이스 이상을 생각하고, 모든 관련 데이터 세트에서 실시간으로 데이터를 처리, 저장, 보호, 분석할 수 있는 ‘진짜 데이터 플랫폼’을 설계”해야 할 시점이라고 주장한다. 동시에 데이터 웨어하우스와 데이터 레이크를 새롭게 재구상하는 방법이 될 수도 있지 않을까?
 

데이터 시스템이 던지는 질문

오랫동안 데이터는 정말 각양각색으로 존재했다. 백 오피스 시스템은 행과 열에 잘 맞는 정형화된 데이터에 의존했다. 이러한 관계형 데이터베이스는 당시 놀라운 혁신이었으며, 지금까지도 기업에 많은 기여를 하고 있다. 하지만 필자는 과거 다음과 같은 주장을 했다.

“편리하게 정형화된 관계형 데이터베이스의 세계는 산더미 같은 비정형, 반정형 데이터로 인해 점점 복잡해진다. 새로운 데이터 대다수는 지난 수십 년 동안 (ERP와 CRM 시스템 등)기록 시스템을 밑바탕으로 구축되었지만, 제프리 무어가 말한 참여 시스템으로 만들어진다.”

포터는 세 번째 유형으로 ‘인사이트 시스템(Systems of Insight)’을 추가했다. 포터는 다음과 같이 설명한다.

“수십년 동안 기업은 기록 시스템과 참여 시스템을 유지해왔다. 기록 시스템은 주로 내부 프로그램과 사용자가 액세스하는 미션 크리티컬한 기본 정보 소스이고, 참여 시스템은 고객과 직원이 상호작용하는 디지털 인터페이스다. 최근에는 다양한 소스의 데이터를 결합해 기업 전반의 의사 결정에 정보를 제공하는 인사이트 시스템이 추가됐다. 오랫동안 각 시스템은 서로 다른 컴퓨터에서 운영됐고, 데이터 관리 면에서도 요구사항이 달랐으며, 서로 다른 부서에서 예산을 받았다.”

그러나 기업은 더 이상 다른 데이터와 상호작용하지 못하고 진화에 어려움을 겪는 사일로 시스템으로 연명할 수 없다. 포터는 상황이 너무 빠르게 변하고 있으며, 컴퓨터는 다음과 같은 질문을 하기 시작했다:

“모델 훈련과 추론이 부상함에 따라, 새로운 종류의 분석이 부상했다. 즉, 프로그램이 인사이트 시스템에 질문을 던지고 실시간으로 응답하는 것이지, 인간이 던진 질문을 구현하는 프로그램을 작성하는 것이 아니다. 이것은 아주 근본적인 변화다. SABRE를 구동한 IBM 7090에서 SKYNET을 구동하는 변화에 비유할 수 있을 정도다.”
 

모두를 지배하는 하나의 데이터 플랫폼

그렇다면 기업은 무엇을 해야 할까? 데이터베이스 기업의 CTO로서 포터의 답변은 궁금증을 불러 일으킨다.

“시스템 통합은 대부분의 기업이 혁신, 소프트웨어, 클라우드 기반으로의 전환을 위해 급진적인 디지털 트랜스포메이션 프로젝트를 진행하는 시점에 이루어진다. 즉, 데이터베이스를 넘어서 사고하고, 실시간으로 데이터를 처리, 저장, 보안, 분석할 수 있는 실제 ‘데이터 플랫폼’을 설계하기에 최적의 시기다.

몽고DB는 데이터베이스 이후의 세상을 어떻게 내다볼까? 현재 몽고DB는 자사를 ‘최신 애플리케이션용 데이터베이스’로 홍보하고 있다. 포터는 앞으로도 개인적인 전망을 글로 공개하겠다고 밝혔지만, 몽고DB 웹사이트에는 이미 여러 가지 단서가 흩어져 있다. 

예를 들어 한 프레젠테이션에서는 기업이 몽고DB의 아틀라스 매니지드 클라우드 데이터베이스, 데이터 레이크, 검색, 애플리케이션 개발 서비스 등 몽고DB 서비스 포트폴리오를 구축하는 방법을 설명하고 있다. 마치 스노우플레이크(Snowflake)가 ‘클라우드 데이터 플랫폼’이라고 홍보하는 것과 유사하다. 두 경우 모두 한 곳에서 데이터를 통합하고 쿼리까지 할 수 있도록 지원하는 것이고, 다른 기업들도 같은 전략을 취하고 있다.

성공할 수 있을까? 업계는 한동안 그런 성배를 찾아 헤맸다. 데이터 플랫폼은 지금까지는 데이터 레이크로 불렀던 것에 데이터 웨어하우스까지 포함해 더 큰 무엇을 만들고자 한다. 과거에 실패했다고 다음 번에도 실패할 것이라는 뜻은 아니다. 포터의 이력을 고려하면, 그가 제시하는 데이터베이스와 데이터 웨어하우스, 데이터 레이크가 데이터베이스를 진정 뛰어 넘는 데이터 플랫폼으로 진화하는 방향도 생각해 볼 필요가 있다. editor@itworld.co.kr 


X