2010.10.14

EMC, 그린플럼 어플라이언스로 대규모 데이터 처리 시장 공략

Joab Jackson | IDG News Service

대규모 데이터 관리의 문제점이 증가하면서 EMC가 지난 7월 인수한 그린플럼의 기술을 데이터 웨어하우스 어플라이어스로 구성해 관련 시장 공략을 본격화하고 있다.

 

그린플럼 데이터 컴퓨팅 어플라이언스(Greenplum Data Computing Appliance)는 그린플럼이 개발한 MPP(massively parallel processing)) 기술의 장점을 적극 활용한 것이 특징.

 

EMC는 이번 어플라이언스가 경쟁제품인 오라클 엑사데이터, IBM 네테자, 테라데이터 제품 등과 비교해 2배 이상 빠른 성능을 제공한다고 주장했다. 또 단일 랙에서 시간당 10TB를 처리할 수 있다고 전했다.

 

그린플럼의 전 사장이자 EMC 제품담당 부사장인 스콧 야라는 이번 제품으로 대규모 데이터의 정보를 처리해야하는 기업을 대상으로 한다고 설명했다. 야라는 “네트워크이나 웹 상의 머신은 사람이 할 수 있는 것보다 훨씬 많은 데이터를 생성한다. 모든 휴대폰과 센서 네트워크, 라우터 등이 매일 수백만 건의 이벤트를 쏟아내고 있다”며, “이런 데이터를 이해하기 위해서는 기업은 이전에는 없었던 데이터 분석 인프라를 만들어내야 한다”고 강조했다.

 

데이터를 더 빨리 소화하기 위해 그린플럼은 고성능 컴퓨팅 분야에서 사용해 온 병렬처리 아키텍처를 도입했다.

 

대부분의 데이터 웨어하우스 어플라이언스는 모든 데이터가 입력되는 하나의 마스터 노드를 가지고 있다. 이런 접근법은 대규모 데이터를 신속하게 가져오려 할 때 병목현상을 일으킬 수 있다. 하지만 병렬처리 구조에서는 랙 상의 각 서버가 전용 네트워크 연결을 가지고 있다.

 

유라는 “데이터를 단일 시스템에 로드하는 대신 이를 분산시키는 방법으로 그린플럼의 아키텍처는 클러스터 내의 모든 서버에 병렬적으로 데이터를 로드한다”고 설명했다. 피어 투 피어 방식으로 서브들은 모든 노드에 걸쳐 데이터의 균형을 조정한다는 것.

 

MPP 아키텍처는 또한 데이터 분석도 서버 전체에 걸쳐 병렬적으로 수행된다. 야라는 “단일 쿼리를 전체 서버에 걸쳐 분산 처리할 수 있다”고 덧붙였다.

 

그린플럼 데이터 컴퓨팅 어플라이언스는 데이터베이스 소프트웨어인 그린플럼 데이터베이스 4.0과 스토리지, 네트워킹 기능으로 구성된 통합 서버를 제공한다. 랙 하나에 서버 16대를 탑재할 수 있으며, 각 서버는 인텔 8코어 프로세서 2개씩을 탑재하고 있다. 또한 랙당 최대 36TB의 비압축 스토리지를 탑재할 수 있으며, 24개 랙에 최대 5PB의 압축 데이터를 담을 수 있다. 24랙 시스템은 총 4,608개의 데이터베이스 코어를 구동할 수 있다.

 

또한 EMC의 데이터 도메인 백업복구 소프트웨어와 연동해 데이터 웨어하우스의 자원을 EMC의 SAN에 백업할 수도 있으며, SAN을 추가 스토리지로 사용할 수도 있다.

 

뉴욕증권거래소 유로넥스트의 글로벌 데이터 서비스 담당 수석 부사장인 스티브 허시는 “이런 진화는 엄청난 차별화 요소가 될 것”이라고 강조했다. 유로넥스트는 2007년부터 그린플럼의 소프트웨어를 사용해 왔으며, 매일 4TB의 내부 운영 데이터를 생성한다.

 

허시는 “우리에게는 분석을 위해 데이터를 옮기는 것이 엄청나게 비싸다. 데이터를 한 번에 로드해 그 자리에서 분석하고 바로 사용 가능하게 할 필요가 있다”고 설명했다.

 

한편 EMC는 이번 신제품 발표와 데이터 컴퓨팅 제품 사업부도 새로 발족했는데, 그린플럼과 같은 데이터 관리 소프트웨어를 담당하게 된다고 밝혔다.  Joab_Jackson@idg.com



2010.10.14

EMC, 그린플럼 어플라이언스로 대규모 데이터 처리 시장 공략

Joab Jackson | IDG News Service

대규모 데이터 관리의 문제점이 증가하면서 EMC가 지난 7월 인수한 그린플럼의 기술을 데이터 웨어하우스 어플라이어스로 구성해 관련 시장 공략을 본격화하고 있다.

 

그린플럼 데이터 컴퓨팅 어플라이언스(Greenplum Data Computing Appliance)는 그린플럼이 개발한 MPP(massively parallel processing)) 기술의 장점을 적극 활용한 것이 특징.

 

EMC는 이번 어플라이언스가 경쟁제품인 오라클 엑사데이터, IBM 네테자, 테라데이터 제품 등과 비교해 2배 이상 빠른 성능을 제공한다고 주장했다. 또 단일 랙에서 시간당 10TB를 처리할 수 있다고 전했다.

 

그린플럼의 전 사장이자 EMC 제품담당 부사장인 스콧 야라는 이번 제품으로 대규모 데이터의 정보를 처리해야하는 기업을 대상으로 한다고 설명했다. 야라는 “네트워크이나 웹 상의 머신은 사람이 할 수 있는 것보다 훨씬 많은 데이터를 생성한다. 모든 휴대폰과 센서 네트워크, 라우터 등이 매일 수백만 건의 이벤트를 쏟아내고 있다”며, “이런 데이터를 이해하기 위해서는 기업은 이전에는 없었던 데이터 분석 인프라를 만들어내야 한다”고 강조했다.

 

데이터를 더 빨리 소화하기 위해 그린플럼은 고성능 컴퓨팅 분야에서 사용해 온 병렬처리 아키텍처를 도입했다.

 

대부분의 데이터 웨어하우스 어플라이언스는 모든 데이터가 입력되는 하나의 마스터 노드를 가지고 있다. 이런 접근법은 대규모 데이터를 신속하게 가져오려 할 때 병목현상을 일으킬 수 있다. 하지만 병렬처리 구조에서는 랙 상의 각 서버가 전용 네트워크 연결을 가지고 있다.

 

유라는 “데이터를 단일 시스템에 로드하는 대신 이를 분산시키는 방법으로 그린플럼의 아키텍처는 클러스터 내의 모든 서버에 병렬적으로 데이터를 로드한다”고 설명했다. 피어 투 피어 방식으로 서브들은 모든 노드에 걸쳐 데이터의 균형을 조정한다는 것.

 

MPP 아키텍처는 또한 데이터 분석도 서버 전체에 걸쳐 병렬적으로 수행된다. 야라는 “단일 쿼리를 전체 서버에 걸쳐 분산 처리할 수 있다”고 덧붙였다.

 

그린플럼 데이터 컴퓨팅 어플라이언스는 데이터베이스 소프트웨어인 그린플럼 데이터베이스 4.0과 스토리지, 네트워킹 기능으로 구성된 통합 서버를 제공한다. 랙 하나에 서버 16대를 탑재할 수 있으며, 각 서버는 인텔 8코어 프로세서 2개씩을 탑재하고 있다. 또한 랙당 최대 36TB의 비압축 스토리지를 탑재할 수 있으며, 24개 랙에 최대 5PB의 압축 데이터를 담을 수 있다. 24랙 시스템은 총 4,608개의 데이터베이스 코어를 구동할 수 있다.

 

또한 EMC의 데이터 도메인 백업복구 소프트웨어와 연동해 데이터 웨어하우스의 자원을 EMC의 SAN에 백업할 수도 있으며, SAN을 추가 스토리지로 사용할 수도 있다.

 

뉴욕증권거래소 유로넥스트의 글로벌 데이터 서비스 담당 수석 부사장인 스티브 허시는 “이런 진화는 엄청난 차별화 요소가 될 것”이라고 강조했다. 유로넥스트는 2007년부터 그린플럼의 소프트웨어를 사용해 왔으며, 매일 4TB의 내부 운영 데이터를 생성한다.

 

허시는 “우리에게는 분석을 위해 데이터를 옮기는 것이 엄청나게 비싸다. 데이터를 한 번에 로드해 그 자리에서 분석하고 바로 사용 가능하게 할 필요가 있다”고 설명했다.

 

한편 EMC는 이번 신제품 발표와 데이터 컴퓨팅 제품 사업부도 새로 발족했는데, 그린플럼과 같은 데이터 관리 소프트웨어를 담당하게 된다고 밝혔다.  Joab_Jackson@idg.com



X