2012.12.14

클라우드가 데이터웨어하우스로 적합한 것인가

Brandon Butler | Network World
아마존이 IBM과 마이크로소프트, 오라클과 경쟁할 잠재력이 있는 클라우드 기반의 데이터웨어하우스(DW) 툴인 레드시프트를 출시했다. 그러나 과연 우리에게 클라우드가 데이터웨어하우스로 적합한 것일까?
 
아마존은 최근 아마존 웹 서비스(AWS) 사용자를 대상으로 개최한 첫 컨퍼런스에서 중대한 소식 하나를 발표했다. 다름 아닌 새로운 클라우드 기반 데이터웨어하우스 툴인 레드시프트(Redshift)를 출시한 것이다. 그리고 이 출시 발표 이후 질문 하나가 제기됐다. 
 
과연 '우리에게도 클라우드가 데이터웨어하우스로 적합한 장소일까'라는 질문이다.
 
AWS가 공식 발표한 내용에 따르면, 클라우드는 데이터 관리에 애를 먹고 있는 기업에게 저비용 대안을 제공한다. 내부 구축을 위한 인프라스트럭처 투자가 필요없기 때문이다. 레드시프트와 관련된 가장 큰 문제는 아마 퍼블릭 클라우드의 일반적인 문제들과 맥을 같이 할 것이다. 일부는 중요한 금융 데이터나 개인 비밀 데이터를 퍼블릭 클라우드에 보관하는 것을 꺼린다. 또한 데이터를 클라우드로 실제 이전하는 방법에 대한 문제가 있을 수 있다.
 
위키본 프로젝트(Wikibon Project) 빅 데이터 담당 연구원 제프 켈리는 "레드시프트는 비용과 관리 측면에서의 잠재적 이익, 보안과 데이터 전송 관련 문제들로 인해 AWS의 다른 기업용 서비스와 비슷한 경로를 밟게 될 것임을 시사하고 있다"고 말했다. 
 
이미 아마존 클라우드를 활용하고 있는 미래지향적 기업들의 경우 클라우드 기반 데이터웨어하우스 서비스 도입 역시 서두를 확률이 높다. 반면 퍼블릭 클라우드 도입을 늦추고 있는 대기업들은 자사에 적합한 서비스인지를 테스트할 가능성이 높다.
 
전통적으로 여러 곳에 흩어진 데이터를 단일 장소에 모아 리포트와 쿼리를 실행시키는 맞춤형 데이터 스토리지 서비스를 데이터웨어하우스라고 일컬어 왔다. 많은 기업들이 데이터웨어하우스를 활용해 재무 보고서나 비즈니스 매트릭 분석 관련 작업을 하고 있다. 
 
레드시프트는 테라바이트에서 페타바이트로 확장이 가능하도록 설계된 컬럼/SQL 기반 툴이다. AWS는 레드시프트와 함께 사용할 수 있는 2개의 새로운 가상 장치 인스턴스를 발표했는데, 이는 각각 2TB와 16TB의 로컬 스토리지를 제공하는 XL 인스턴스와 8XL 인스턴스이다. 
 
AWS는 파액셀(ParAccel)이라는 데이터베이스 분석업체와 제휴해 레드시프트를 설계했다. 파액셀은 AWS의 모 기업인 아마존이 지난해 투자를 한 업체다. 레드시프트는 기존의 내부형 데어터웨어하우스와 마찬가지로, 예를 들면 아마존의 다이나모(Dynamo)DB NoSQL 데이터베이스, S3(Simple Storage Service) 또는 기존 고객 기업 내부의 애플리케이션을 통합할 수 있도록 설계할 수 있다. 레드시프트는 비즈니스 애널리틱스 툴에 활용할 수 있는 데이터 보관소다.

클라우드 기반 DW의 문제점
켈리는 "분명히 눈여겨볼 부분들이 있다고 판단한다. 데이터웨어하우징과 관련된 이슈 가운데 하나는 일부 기업들의 경우 매우 중요한 재산 정보는 클라우드로 이전하기 꺼릴 수 있다는 것"이라고 언급했다. 
 
그러나 다양한 수요가 있고 내부에서 데이터웨어하우징을 운용할 인프라를 갖고 있지 못한 기업에게는 장점이 많은 서비스가 될 수 있다. 켈리는 "이미 클라우드에서 데이터를 관리하고 있다면, 특히 AWS를 활용하고 있다면 레드시프트는 장점이 많은 서비스"라고 강조했다.
 
클라우드 기반 데이터웨어하우징에 있어 가장 큰 도전 가운데 하나는 데이터를 어떤 방법으로 AWS 클라우드로 이전하는가 하는 것이다. 테라바이트, 아니 페라바이트에 달하는 데이터를 상용 인터넷을 통해 AWS 클라우드로 이전하다보면 보안 문제가 발생할 가능성이 있다. 
 


2012.12.14

클라우드가 데이터웨어하우스로 적합한 것인가

Brandon Butler | Network World
아마존이 IBM과 마이크로소프트, 오라클과 경쟁할 잠재력이 있는 클라우드 기반의 데이터웨어하우스(DW) 툴인 레드시프트를 출시했다. 그러나 과연 우리에게 클라우드가 데이터웨어하우스로 적합한 것일까?
 
아마존은 최근 아마존 웹 서비스(AWS) 사용자를 대상으로 개최한 첫 컨퍼런스에서 중대한 소식 하나를 발표했다. 다름 아닌 새로운 클라우드 기반 데이터웨어하우스 툴인 레드시프트(Redshift)를 출시한 것이다. 그리고 이 출시 발표 이후 질문 하나가 제기됐다. 
 
과연 '우리에게도 클라우드가 데이터웨어하우스로 적합한 장소일까'라는 질문이다.
 
AWS가 공식 발표한 내용에 따르면, 클라우드는 데이터 관리에 애를 먹고 있는 기업에게 저비용 대안을 제공한다. 내부 구축을 위한 인프라스트럭처 투자가 필요없기 때문이다. 레드시프트와 관련된 가장 큰 문제는 아마 퍼블릭 클라우드의 일반적인 문제들과 맥을 같이 할 것이다. 일부는 중요한 금융 데이터나 개인 비밀 데이터를 퍼블릭 클라우드에 보관하는 것을 꺼린다. 또한 데이터를 클라우드로 실제 이전하는 방법에 대한 문제가 있을 수 있다.
 
위키본 프로젝트(Wikibon Project) 빅 데이터 담당 연구원 제프 켈리는 "레드시프트는 비용과 관리 측면에서의 잠재적 이익, 보안과 데이터 전송 관련 문제들로 인해 AWS의 다른 기업용 서비스와 비슷한 경로를 밟게 될 것임을 시사하고 있다"고 말했다. 
 
이미 아마존 클라우드를 활용하고 있는 미래지향적 기업들의 경우 클라우드 기반 데이터웨어하우스 서비스 도입 역시 서두를 확률이 높다. 반면 퍼블릭 클라우드 도입을 늦추고 있는 대기업들은 자사에 적합한 서비스인지를 테스트할 가능성이 높다.
 
전통적으로 여러 곳에 흩어진 데이터를 단일 장소에 모아 리포트와 쿼리를 실행시키는 맞춤형 데이터 스토리지 서비스를 데이터웨어하우스라고 일컬어 왔다. 많은 기업들이 데이터웨어하우스를 활용해 재무 보고서나 비즈니스 매트릭 분석 관련 작업을 하고 있다. 
 
레드시프트는 테라바이트에서 페타바이트로 확장이 가능하도록 설계된 컬럼/SQL 기반 툴이다. AWS는 레드시프트와 함께 사용할 수 있는 2개의 새로운 가상 장치 인스턴스를 발표했는데, 이는 각각 2TB와 16TB의 로컬 스토리지를 제공하는 XL 인스턴스와 8XL 인스턴스이다. 
 
AWS는 파액셀(ParAccel)이라는 데이터베이스 분석업체와 제휴해 레드시프트를 설계했다. 파액셀은 AWS의 모 기업인 아마존이 지난해 투자를 한 업체다. 레드시프트는 기존의 내부형 데어터웨어하우스와 마찬가지로, 예를 들면 아마존의 다이나모(Dynamo)DB NoSQL 데이터베이스, S3(Simple Storage Service) 또는 기존 고객 기업 내부의 애플리케이션을 통합할 수 있도록 설계할 수 있다. 레드시프트는 비즈니스 애널리틱스 툴에 활용할 수 있는 데이터 보관소다.

클라우드 기반 DW의 문제점
켈리는 "분명히 눈여겨볼 부분들이 있다고 판단한다. 데이터웨어하우징과 관련된 이슈 가운데 하나는 일부 기업들의 경우 매우 중요한 재산 정보는 클라우드로 이전하기 꺼릴 수 있다는 것"이라고 언급했다. 
 
그러나 다양한 수요가 있고 내부에서 데이터웨어하우징을 운용할 인프라를 갖고 있지 못한 기업에게는 장점이 많은 서비스가 될 수 있다. 켈리는 "이미 클라우드에서 데이터를 관리하고 있다면, 특히 AWS를 활용하고 있다면 레드시프트는 장점이 많은 서비스"라고 강조했다.
 
클라우드 기반 데이터웨어하우징에 있어 가장 큰 도전 가운데 하나는 데이터를 어떤 방법으로 AWS 클라우드로 이전하는가 하는 것이다. 테라바이트, 아니 페라바이트에 달하는 데이터를 상용 인터넷을 통해 AWS 클라우드로 이전하다보면 보안 문제가 발생할 가능성이 있다. 
 


X