2018.11.05

신간 ∣ 빅데이터 전문가의 하둡 관리

편집부 | ITWorld
성안당은 ‘하둡’ 관리자의 필독서인 <빅데이터 전문가의 하둡 관리>을 발표했다.

빅데이터 시대에 속도와 신뢰성이 답보되면서 비용도 저렴해 효율적인 솔루션으로 각광받는 하둡은 2003년, 2005년에 발표된 구글 분산 파일 시스템(GFS)과 맵리듀스(MapReduce)를 구현했다. 대량의 자료를 처리할 수 있는 대형 컴퓨터 클러스터에서 동작하는 분산 애플리케이션을 지원하는 프리웨어 자바 소프트웨어 프레임워크이다.



저자인 샘 R. 알라파티는 하둡 관리자로, 하둡에 대한 큰 그림을 보여준다. 하둡 생태계의 하둡 컴포넌트들인 아브로, 플룸, HBase, HCatalog, 하이브, 휴, 카프카, 머하웃, 우지, 피그, 스쿱, 스톰, 테즈 등은 하나하나가 책 한 권으로도 나와 있을 만큼 큰 주제이지만, 이 책에서는 이런 솔루션들을 빠짐없이 소개하고 언급한다.

저자는 하둡 생태계에서 크게 얀과 하둡 분산 파일 시스템(HDFS)을 배치하면서 하둡으로 배치, 인터랙티브, 실시간 데이터 접근을 위해서는 ▲스크립트로는 피그 ▲SQL로는 하이브 ▲자바 스칼라로는 캐스케이딩 ▲스트림으로는 스파크 스트리밍 ▲인메모리로는 스파크 ▲검색으로는 솔라(Solr) ▲NoSQL로는 HBase와 어큐뮬로 ▲머신러닝으로는 스파크 MR과 스파크 R 등을 사용한다며 하둡의 핵심 컴포넌트와 툴을 한눈에 보여준다. 또 하둡을 관리하기 위해 알아야 하는 것, 하둡 1과 2의 차이점을 다룸으로써 하둡 3 시대에도 대비할 수 있도록 하며, 하둡 관리의 핵심 영역까지 소개한다.

이 책은 크게 5부 21장으로 구성돼 있다. 1부에서는 하둡의 아키텍처와 하둡 클러스터를, 2부에서는 하둡 애플리케이션 프레임워크, 3부에서는 하둡 데이터 관리 및 보호, 고가용성, 4부에서는 데이터 이동, 리소스 할당, 잡 스케줄링, 보안, 5부에서는 모니터링, 최적화, 문제 해결 등을 다룬다. editor@itworld.co.kr


2018.11.05

신간 ∣ 빅데이터 전문가의 하둡 관리

편집부 | ITWorld
성안당은 ‘하둡’ 관리자의 필독서인 <빅데이터 전문가의 하둡 관리>을 발표했다.

빅데이터 시대에 속도와 신뢰성이 답보되면서 비용도 저렴해 효율적인 솔루션으로 각광받는 하둡은 2003년, 2005년에 발표된 구글 분산 파일 시스템(GFS)과 맵리듀스(MapReduce)를 구현했다. 대량의 자료를 처리할 수 있는 대형 컴퓨터 클러스터에서 동작하는 분산 애플리케이션을 지원하는 프리웨어 자바 소프트웨어 프레임워크이다.



저자인 샘 R. 알라파티는 하둡 관리자로, 하둡에 대한 큰 그림을 보여준다. 하둡 생태계의 하둡 컴포넌트들인 아브로, 플룸, HBase, HCatalog, 하이브, 휴, 카프카, 머하웃, 우지, 피그, 스쿱, 스톰, 테즈 등은 하나하나가 책 한 권으로도 나와 있을 만큼 큰 주제이지만, 이 책에서는 이런 솔루션들을 빠짐없이 소개하고 언급한다.

저자는 하둡 생태계에서 크게 얀과 하둡 분산 파일 시스템(HDFS)을 배치하면서 하둡으로 배치, 인터랙티브, 실시간 데이터 접근을 위해서는 ▲스크립트로는 피그 ▲SQL로는 하이브 ▲자바 스칼라로는 캐스케이딩 ▲스트림으로는 스파크 스트리밍 ▲인메모리로는 스파크 ▲검색으로는 솔라(Solr) ▲NoSQL로는 HBase와 어큐뮬로 ▲머신러닝으로는 스파크 MR과 스파크 R 등을 사용한다며 하둡의 핵심 컴포넌트와 툴을 한눈에 보여준다. 또 하둡을 관리하기 위해 알아야 하는 것, 하둡 1과 2의 차이점을 다룸으로써 하둡 3 시대에도 대비할 수 있도록 하며, 하둡 관리의 핵심 영역까지 소개한다.

이 책은 크게 5부 21장으로 구성돼 있다. 1부에서는 하둡의 아키텍처와 하둡 클러스터를, 2부에서는 하둡 애플리케이션 프레임워크, 3부에서는 하둡 데이터 관리 및 보호, 고가용성, 4부에서는 데이터 이동, 리소스 할당, 잡 스케줄링, 보안, 5부에서는 모니터링, 최적화, 문제 해결 등을 다룬다. editor@itworld.co.kr


X