개발자 / 데이터ㆍ분석 / 애플리케이션

맵알의 새로운 하둡 배포판으로 안전하게 업그레이드

Thor Olavsrud | CIO 2014.02.21
맵알의 최신 하둡 배포판에는 얀(Yet Another Resource Negotiator, YARN)과 함께 하둡 2.2 지원 기능이 들어 있다. 게다가 최신 하둡 아키텍처로 안전하게 업그레이드하면서 맵리듀스 1.x 스케줄러와도 호환된다.

맵알 테크놀로지(MapR Technologies)가 자사의 배포판을 경쟁사인 클라우데라(Cloudera)나 호튼웍스(Hortonworks)와는 차별화하였다. 맵알은 하위 호환성을 지원하여 기업이 클러스터의 동일한 노드에서 하둡 맵리듀스(Hadoop MapReduce) 1.x와 YARN 스케줄러(Scheduler)를 동시에 사용할 수 있다.

맵알의 CMO 잭 노리스는 “맵리듀스 1.x와 얀 스케줄러가 공존할 수 있도록 함으로써 맵리듀스 1.x 사용자들이 쉽고 안전하게 새로운 스케줄러로 업그레이드할 수 있는 길을 제공하고 있다”고 강조했다.

"다른 종류의 애플리케이션에도 프로세싱을 개방하고 싶을 경우에 단순히 하둡을 활용하겠다는 이유로 애플리케이션을 재 작성하지는 않을 것이다." -- 잭 노리스, 맵알 테크놀로지 CMO

"우리는 하둡의 생산에 초점을 맞추고 있다"고 노리스는 말했다. "일단 생산을 시작하면 이용성, 가동시간, 기존 앱과의 통합이 중요해 진다. 생산 환경을 변화시키는 것이 그리 쉽지 않기 때문에 우리는 이전의 배포판부터 현 배포판까지 하위 호환성을 지원하고 있다.

고객들은 '얀이 좋기는 하지만 일단 한 번 해보고 싶다. 이미 모든 것이 잘 되고 있다'고 말한다. 우리의 고객들은 플랫폼에서 하루 2만 개 이상의 작업을 처리하고 있다"라고 노리스는 설명했다.

아파치 하둡(Apache Hadoop) 얀은 지난해 10월에 공개된 하둡 2.0의 기초다. 얀은 하둡 운영체제로 동작하면서 과거 배치 처리를 위한 일회용 데이터 플랫폼이었던 것을 여러 번 사용할 수 있는 플랫폼으로 탈바꿈시킴으로써 배치, 상호형, 온라인, 스트림 프로세싱을 가능하게 한다.

얀은 주요 자원 관리자이자 HDFS(Hadoop Distributed File System)에 저장된 데이터에 접근하기 위한 중간자 역할을 함으로써 기업들이 데이터를 한 곳에 저장하고 이와 수 차례에 걸쳐 상호작용할 수 있도록 함과 동시에 일정한 서비스 수준을 확보하고 있다.

노리스는 얀을 맵알의 R/W(Read-Write) POSIX 데이터 플랫폼과 결합함으로써 맵알이 YARN 기반의 애플리케이션을 단순히 하둡 클러스터에서만 사용하고 컴퓨터 자원을 공유하는 것이 아니라 기본적인 분산형 파일 시스템과 데이터베이스 테이블에서 데이터를 읽고 쓰고 업데이트 할 수 있도록 한다고 말했다. 결과적으로 기업들은 더욱 광범위한 일련의 빅 데이터 애플리케이션을 개발하고 배치할 수 있게 된다.

EMA(Enterprise Management Associates)의 연구부장 에반 퀸은 "얀은 단순한 맵리듀스를 넘어 프로세싱 패턴을 위해 하둡을 개방하고 있다"고 말했다. "맵알의 하둡 배포판은 HDFS 외에 완전한 개방 표준 NFS 인터페이스를 추가함으로써 YARN을 더욱 확대해 맵리듀스 기반이 아닌 애플리케이션이 클러스터의 스토리지를 최적화해서 활용할 수 있도록 한다"라고 퀸은 덧붙였다.

"일반적인 용도의 스토리지 플랫폼의 경우, 무작위 읽기-쓰기가 중요하다"고 노리스는 말했다. "다른 종류의 애플리케이션에도 프로세싱을 개방하고 싶을 경우에 단순히 하둡을 활용하겠다는 이유로 애플리케이션을 재작성하지는 않을 것이다. 그저 해당 플랫폼에서 구동하고 싶을 뿐이다. HDFS API를 사용하기 위해 다시 작성해야 한다면 사전에 많은 생각과 계획이 필요한 변화가 일어날 수 있으며 경우에 따라서는 애플리케이션을 다시 개발해야 할 수도 있다. 아무런 변화 없이 맵알 플랫폼에서 직접 구동할 수 있을 때에서야 비로소 맵알이 제공하는 분산형 프레임워크를 적극 활용할 수 있는 것이다"라고 노리스는 설명했다.

클라우데라와 호튼웍스의 하둡 배포판은 완전한 오픈 소스(Open Source)이지만 맵알 테크놀로지스는 스냅샷(Snapshot)을 수행하는 기능과 재난복구 기능 등 하둡 아키텍처에서 제약사항으로 간주되는 것들을 해결하기 위해 하둡의 HDFS 계층을 HDFS API를 지원하는 자사의 맞춤식 상용 데이터 계층으로 대체했다.

"모든 표준 기업 애플리케이션 및 툴과 호환된다. 하둡용으로 개발된 패키지는 변경 또는 재 컴파일(Compile) 없이 맵알에서 구동한다"고 노리스는 말했다. "우리는 단순히 커뮤니티 로드맵을 살펴보고 커뮤니티보다 6개월 앞서기 위한 도약을 노린 것이 아니다. 우리는 스스로 제약사항을 발견하고 이를 개선했다. 오픈 소스 커뮤니티에서 아키텍처 변경은 매우 힘든 일이다"라고 노리스는 강조했다.

맵알 샌드박스로 무료 VM 설치 및 튜토리얼이 가능하다
또한 맵알은 자사의 배포판을 포함하고 있는 가상화 환경으로 사용자들이 5분 안에 하둡을 살펴보고 경험하는데 도움이 되는 하둡용 맵알 샌드박스 지원을 발표했다. 샌드박스는 맵알 배포판을 완전하게 구성한 가상머신 설치본으로, 개발자, 애널리스트, 관리자들을 위한 간단한 튜토리얼이 포함되어 있다.

"기업들은 하둡 개발자 및 데이터 공학자가 부족한 상태이며 유용하면서 접근성이 용이한 교육용 툴이 없고 생산적인 하둡 개발자는 앞으로도 계속 부족할 것이다"고 맵알 테크놀로지스의 생산관리 부사장 토머 쉬란은 말했다. "맵알 샌드박스를 통해 개발자들은 편리한 무료 패키지로 제공되는 모든 툴을 이용해 하둡에 신속하게 적응할 수 있다"라고 쉬란은 전했다.

HP 버티카 분석 플랫폼과 통합하는 맵알
결국, 해당 기업은 맵알에서의 새로운 HP 버티카(Vertica) 분석 플랫폼의 조기 접근 개방을 발표하여 HP 버티카의 분석 플랫폼을 맵알의 하둡 배포판과 긴밀하게 통합하는 고성능 상호작용형 솔루션인 하둡용 SQL(SQL-on-Hadoop)을 제공하고 있다. 해당 기업은 발전된 상호형 분석 역량뿐 아니라 BI및 ETL 툴 지원을 통해 ANIS SQL 준수성을 100% 제공한다고 밝혔다.

맵알 테크놀로지스의 CEO 겸 공동 창업자 존 슈뢰더는 "하둡을 채택한 기업들은 직업상 발전된 SQL 및 BI 툴이 필요한 많은 비즈니스 분석 집단들에 자율권을 주기 위해 부단히 노력했지만 불완전한 SQL 방식의 접근방식 때문에 발목이 잡혔다"고 말했다. "최고로 자부할 수 있는 맵알의 하둡용 플랫폼에서 HP 버티카의 풍부한 고성능 SQL과 내장된 분석 기능을 제공함으로써 비즈니스 애널리스트들은 하둡으로 연결한 데이터로부터 더욱 신속하고 상호적인 분석이 가능하게 되었다”라고 그는 덧붙였다. ciokr@idg.co.kr
Sponsored

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.