2018.08.07

데이터베이스와 작별을 고하기 어려운 이유

Matt Asay | InfoWorld
레거시 RDMS와 작별을 고하기는 어렵지만, 결국 기업의 데이터 인프라는 오라클을 비롯한 데이터베이스 업체들의 손에서 벗어나게 된다.

Image Credit : GettyImagesBank

오라클을 버려야 할 기업을 하나 꼽으라면 단연 아마존이다. 그러나 아마존이 “오라클로 힘겹게 데이터베이스 인프라를 운영”하고 있음을 통탄하며 “장기적으로 비즈니스 요구사항을 지원할 수 있는 전용 데이터베이스를 직접 개발할 수 있을지 살펴보겠다”고 말한지도 14년이 지났다. CNBC의 조단 노벳에 따르면, 아마존이 오라클에서 벗어나는 시기는 2020년 1분기 이후가 될 전망이다.

“너를 떠날 수 없다”는 레드 제플린의 노랫말이 떠오르지만, 그 이유는 오라클 데이터베이스의 뛰어남이 아니라 데이터 이동에 필연적으로 따르는 마찰에 있다. 또는 가트너 애널리스트 머브 아드리안이 말했듯이 “레거시 데이터베이스가 가진 가장 큰 힘인 관성”이다.

아마존조차 레거시 오라클 데이터베이스에 잡혀 있는 이유
CTO 워너 보겔스의 말처럼 아마존은 2004년에 이미 오라클 데이터베이스의 능력치 이상으로 규모를 확장했을 것이다. 그러나 그로부터 불과 10년 후 이 기술을 대체할 방안을 심각하게 고려 중이다. 노벳의 다음 인터뷰 내용에 잘 드러나 있다.

“익명을 요구한 내부 관계자 중 한 명은 아마존이 4~5년 전부터 오라클에서 벗어나는 작업을 시작했다고 밝혔다. 또한 이 관계자는 아마존의 핵심인 쇼핑 사업의 일부는 여전히 오라클에 의존하고 있으며 완전한 마이그레이션은 14~20개월 후에 완료될 것이라고 말했다. 또 다른 관계자에 따르면 아마존은 이 전환 작업이 시작되기 훨씬 전부터 오라클을 떠나는 방안을 고민했지만 당시에는 필요한 엔지니어링 작업은 너무 많고 얻는 이익은 상대적으로 너무 적은 것으로 판단했다.”

“필요한 엔지니어링 작업은 너무 많고, 얻는 이익은 상대적으로 너무 적다”는 말은 대부분의 레거시 기술이 끈질기게 존재하는 이유다. 일단 애플리케이션이 메인프레임에서 실행되도록 만들어진 다음에는 다른 플랫폼에서 실행하기 위해 다시 만드는 데는 거의 아무런 실익이 없다. 아드리안은 “특정 툴을 중심으로 스키마 설계, 물리적 데이터 배치, 네트워크 아키텍처 등에 투자하면 쉽게 바꿀 수 없다”고 말했다.

어쨌든 고장나지 않은 것을 고칠 필요는 없다. 그래서 아마존은 레거시 데이터베이스가 필요에 맞게 확장되지 않음에도 불구하고 오라클에 묶여 있었다. 아마존은 아키텍처를 바꾸는 대신 다이나모DB(DynamoDB), 오로라(Aurora)와 같은 자체 데이터베이스 기술에서 실행되는 새 애플리케이션을 만들었다.

한편 오라클 회장 래리 엘리슨은 2017년 12월 실적 결산에서 아마존이 오라클에 5,000만 달러를 지불했다는 점과 과거 몇 년을 통틀어 아마존이 지불한 금액이 수억 달러에 이른다는 점에 흡족함을 표시했다. 그러나 이 흡족함도 클라우드 시장에서 오라클이 하찮은 시장점유율로 아마존 웹 서비스에 아예 상대가 되지 못했다는 사실을 덮지는 못했다. 이것이 중요한 의미를 갖는 이유는 점점 더 많은 데이터가 클라우드에서 태어나서 AWS, 마이크로소프트 애저와 같은 클라우드 데이터베이스에 머물고 있기 때문이다.

RDBMS를 원래 의도와는 다르게 사용하는 경우 많아
기업에서 현재 애플리케이션의 카탈로그를 작성한다면 아마 2005년의 아마존처럼 “관계형 기능이 아닌 다른 용도로 사용되는 경우가 빈번하다”는 것을 발견할 수도 있다. 더 깊이 들어가면 역시 아마존과 마찬가지로 “작업의 약 70%가 기본 키만 사용되고 하나의 행만 반환되는 키-값 유형의 작업이며, 약 20%는 행 집합을 반환하지만 그나마도 여전히 단일 테이블 작업”임을 발견할 수도 있다.

달리 말하면, 기업에서 데이터를 잘 살펴보면 오라클(또는 사용 중인 다른 관계형 데이터베이스)이 본래 용도로서의 효용성은 상당히 떨어진다는 사실을 발견할 수 있다.

데이터 경쟁의 핵심은 트랜스포메이션 지원
또한 기업은 아마존과 마찬가지로 “필요한 엔지니어링 작업은 너무 많고 얻는 이익은 상대적으로 너무 적다”는 이유로 기존 워크로드 용도로 앞으로 14년 더 RDBMS를 그대로 둘 수도 있다. 반면 새 애플리케이션에서는 이익이 상당히 크다.

점점 더 많은 데이터가 클라우드에서 태어날 뿐만 아니라, 데이터를 관리하는 방법도 예전에 비해 훨씬 더 많아졌다. 이 말이 오라클과 같은 관계형 데이터베이스가 죽었다는 의미는 아니다. 다만 하나의 애플리케이션이 다양한 데이터베이스로 구성되는 경우가 많아질 것임을 의미할 뿐이다. 보겔은 다음과 같은 글을 쓴 적이 있다.

“다양한 데이터 모델이 필요한 인터넷 스케일 애플리케이션을 구축하기를 원하는 고객이 늘고 있다. 이러한 요구에 대응하기 위해 현재 개발자들이 선택할 수 있는 옵션은 관계형, 키-값, 문서, 그래프, 인메모리 및 검색 데이터베이스다. 각각의 데이터베이스는 특정 문제 또는 문제 그룹을 해결한다.

다만 이 말은 미래의 관점에서 한 말이다. 즉, 기업이 무엇을 이미 구축했는지(또한 그걸 안고 가야 하는지)가 아니라, 지금 무엇을 구축 중이고 앞으로 무엇을 구축할 것인가에 관한 말이다.

이곳은 데이터를 쟁취하기 위한 전장이다. 핵심은 레거시 애플리케이션과 이를 지원하는 레거시 데이터베이스가 아니라 운영의 트랜스포메이션을 위해 방대한 데이터를 활용할 방법을 모색하는 기업의 미래다.

이 세계는 오라클(데이터베이스 업계의 선두업체)이 지금까지 영향력을 거의 발휘하지 못했다. 앞으로도 그 추세가 지속된다면 아마존은 데이터 인프라를 붙잡고 있는 오라클의 마지막 손을 뿌리치게 될 것이고 다른 대부분의 기업도 마찬가지일 것이다.  editor@itworld.co.kr

2018.08.07

데이터베이스와 작별을 고하기 어려운 이유

Matt Asay | InfoWorld
레거시 RDMS와 작별을 고하기는 어렵지만, 결국 기업의 데이터 인프라는 오라클을 비롯한 데이터베이스 업체들의 손에서 벗어나게 된다.

Image Credit : GettyImagesBank

오라클을 버려야 할 기업을 하나 꼽으라면 단연 아마존이다. 그러나 아마존이 “오라클로 힘겹게 데이터베이스 인프라를 운영”하고 있음을 통탄하며 “장기적으로 비즈니스 요구사항을 지원할 수 있는 전용 데이터베이스를 직접 개발할 수 있을지 살펴보겠다”고 말한지도 14년이 지났다. CNBC의 조단 노벳에 따르면, 아마존이 오라클에서 벗어나는 시기는 2020년 1분기 이후가 될 전망이다.

“너를 떠날 수 없다”는 레드 제플린의 노랫말이 떠오르지만, 그 이유는 오라클 데이터베이스의 뛰어남이 아니라 데이터 이동에 필연적으로 따르는 마찰에 있다. 또는 가트너 애널리스트 머브 아드리안이 말했듯이 “레거시 데이터베이스가 가진 가장 큰 힘인 관성”이다.

아마존조차 레거시 오라클 데이터베이스에 잡혀 있는 이유
CTO 워너 보겔스의 말처럼 아마존은 2004년에 이미 오라클 데이터베이스의 능력치 이상으로 규모를 확장했을 것이다. 그러나 그로부터 불과 10년 후 이 기술을 대체할 방안을 심각하게 고려 중이다. 노벳의 다음 인터뷰 내용에 잘 드러나 있다.

“익명을 요구한 내부 관계자 중 한 명은 아마존이 4~5년 전부터 오라클에서 벗어나는 작업을 시작했다고 밝혔다. 또한 이 관계자는 아마존의 핵심인 쇼핑 사업의 일부는 여전히 오라클에 의존하고 있으며 완전한 마이그레이션은 14~20개월 후에 완료될 것이라고 말했다. 또 다른 관계자에 따르면 아마존은 이 전환 작업이 시작되기 훨씬 전부터 오라클을 떠나는 방안을 고민했지만 당시에는 필요한 엔지니어링 작업은 너무 많고 얻는 이익은 상대적으로 너무 적은 것으로 판단했다.”

“필요한 엔지니어링 작업은 너무 많고, 얻는 이익은 상대적으로 너무 적다”는 말은 대부분의 레거시 기술이 끈질기게 존재하는 이유다. 일단 애플리케이션이 메인프레임에서 실행되도록 만들어진 다음에는 다른 플랫폼에서 실행하기 위해 다시 만드는 데는 거의 아무런 실익이 없다. 아드리안은 “특정 툴을 중심으로 스키마 설계, 물리적 데이터 배치, 네트워크 아키텍처 등에 투자하면 쉽게 바꿀 수 없다”고 말했다.

어쨌든 고장나지 않은 것을 고칠 필요는 없다. 그래서 아마존은 레거시 데이터베이스가 필요에 맞게 확장되지 않음에도 불구하고 오라클에 묶여 있었다. 아마존은 아키텍처를 바꾸는 대신 다이나모DB(DynamoDB), 오로라(Aurora)와 같은 자체 데이터베이스 기술에서 실행되는 새 애플리케이션을 만들었다.

한편 오라클 회장 래리 엘리슨은 2017년 12월 실적 결산에서 아마존이 오라클에 5,000만 달러를 지불했다는 점과 과거 몇 년을 통틀어 아마존이 지불한 금액이 수억 달러에 이른다는 점에 흡족함을 표시했다. 그러나 이 흡족함도 클라우드 시장에서 오라클이 하찮은 시장점유율로 아마존 웹 서비스에 아예 상대가 되지 못했다는 사실을 덮지는 못했다. 이것이 중요한 의미를 갖는 이유는 점점 더 많은 데이터가 클라우드에서 태어나서 AWS, 마이크로소프트 애저와 같은 클라우드 데이터베이스에 머물고 있기 때문이다.

RDBMS를 원래 의도와는 다르게 사용하는 경우 많아
기업에서 현재 애플리케이션의 카탈로그를 작성한다면 아마 2005년의 아마존처럼 “관계형 기능이 아닌 다른 용도로 사용되는 경우가 빈번하다”는 것을 발견할 수도 있다. 더 깊이 들어가면 역시 아마존과 마찬가지로 “작업의 약 70%가 기본 키만 사용되고 하나의 행만 반환되는 키-값 유형의 작업이며, 약 20%는 행 집합을 반환하지만 그나마도 여전히 단일 테이블 작업”임을 발견할 수도 있다.

달리 말하면, 기업에서 데이터를 잘 살펴보면 오라클(또는 사용 중인 다른 관계형 데이터베이스)이 본래 용도로서의 효용성은 상당히 떨어진다는 사실을 발견할 수 있다.

데이터 경쟁의 핵심은 트랜스포메이션 지원
또한 기업은 아마존과 마찬가지로 “필요한 엔지니어링 작업은 너무 많고 얻는 이익은 상대적으로 너무 적다”는 이유로 기존 워크로드 용도로 앞으로 14년 더 RDBMS를 그대로 둘 수도 있다. 반면 새 애플리케이션에서는 이익이 상당히 크다.

점점 더 많은 데이터가 클라우드에서 태어날 뿐만 아니라, 데이터를 관리하는 방법도 예전에 비해 훨씬 더 많아졌다. 이 말이 오라클과 같은 관계형 데이터베이스가 죽었다는 의미는 아니다. 다만 하나의 애플리케이션이 다양한 데이터베이스로 구성되는 경우가 많아질 것임을 의미할 뿐이다. 보겔은 다음과 같은 글을 쓴 적이 있다.

“다양한 데이터 모델이 필요한 인터넷 스케일 애플리케이션을 구축하기를 원하는 고객이 늘고 있다. 이러한 요구에 대응하기 위해 현재 개발자들이 선택할 수 있는 옵션은 관계형, 키-값, 문서, 그래프, 인메모리 및 검색 데이터베이스다. 각각의 데이터베이스는 특정 문제 또는 문제 그룹을 해결한다.

다만 이 말은 미래의 관점에서 한 말이다. 즉, 기업이 무엇을 이미 구축했는지(또한 그걸 안고 가야 하는지)가 아니라, 지금 무엇을 구축 중이고 앞으로 무엇을 구축할 것인가에 관한 말이다.

이곳은 데이터를 쟁취하기 위한 전장이다. 핵심은 레거시 애플리케이션과 이를 지원하는 레거시 데이터베이스가 아니라 운영의 트랜스포메이션을 위해 방대한 데이터를 활용할 방법을 모색하는 기업의 미래다.

이 세계는 오라클(데이터베이스 업계의 선두업체)이 지금까지 영향력을 거의 발휘하지 못했다. 앞으로도 그 추세가 지속된다면 아마존은 데이터 인프라를 붙잡고 있는 오라클의 마지막 손을 뿌리치게 될 것이고 다른 대부분의 기업도 마찬가지일 것이다.  editor@itworld.co.kr

X