Offcanvas
Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.
Offcanvas
1111Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.
개발자 / 빅 데이터

신간 ∣ 빅데이터 전문가의 하둡 관리

편집부 | ITWorld 2018.11.05
성안당은 ‘하둡’ 관리자의 필독서인 <빅데이터 전문가의 하둡 관리>을 발표했다.

빅데이터 시대에 속도와 신뢰성이 답보되면서 비용도 저렴해 효율적인 솔루션으로 각광받는 하둡은 2003년, 2005년에 발표된 구글 분산 파일 시스템(GFS)과 맵리듀스(MapReduce)를 구현했다. 대량의 자료를 처리할 수 있는 대형 컴퓨터 클러스터에서 동작하는 분산 애플리케이션을 지원하는 프리웨어 자바 소프트웨어 프레임워크이다.



저자인 샘 R. 알라파티는 하둡 관리자로, 하둡에 대한 큰 그림을 보여준다. 하둡 생태계의 하둡 컴포넌트들인 아브로, 플룸, HBase, HCatalog, 하이브, 휴, 카프카, 머하웃, 우지, 피그, 스쿱, 스톰, 테즈 등은 하나하나가 책 한 권으로도 나와 있을 만큼 큰 주제이지만, 이 책에서는 이런 솔루션들을 빠짐없이 소개하고 언급한다.

저자는 하둡 생태계에서 크게 얀과 하둡 분산 파일 시스템(HDFS)을 배치하면서 하둡으로 배치, 인터랙티브, 실시간 데이터 접근을 위해서는 ▲스크립트로는 피그 ▲SQL로는 하이브 ▲자바 스칼라로는 캐스케이딩 ▲스트림으로는 스파크 스트리밍 ▲인메모리로는 스파크 ▲검색으로는 솔라(Solr) ▲NoSQL로는 HBase와 어큐뮬로 ▲머신러닝으로는 스파크 MR과 스파크 R 등을 사용한다며 하둡의 핵심 컴포넌트와 툴을 한눈에 보여준다. 또 하둡을 관리하기 위해 알아야 하는 것, 하둡 1과 2의 차이점을 다룸으로써 하둡 3 시대에도 대비할 수 있도록 하며, 하둡 관리의 핵심 영역까지 소개한다.

이 책은 크게 5부 21장으로 구성돼 있다. 1부에서는 하둡의 아키텍처와 하둡 클러스터를, 2부에서는 하둡 애플리케이션 프레임워크, 3부에서는 하둡 데이터 관리 및 보호, 고가용성, 4부에서는 데이터 이동, 리소스 할당, 잡 스케줄링, 보안, 5부에서는 모니터링, 최적화, 문제 해결 등을 다룬다. editor@itworld.co.kr
 Tags 하둡 성안당

회사명:한국IDG 제호: ITWorld 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 편집인 : 박재곤 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.