Offcanvas
개발자 / 데이터ㆍ분석

임팔라의 기술적 이해와 대형 클러스터 운영 체크리스트 7선 - IDG Summary

2019.02.14 | Cloudera
 
하이브는 SQL을 지원하긴 하지만 사용자가 SQL을 기반으로 애드혹 쿼리를 요청하거나 BI 도구를 사용해 분석할 경우에는 느릴 수 밖에 없는 한계를 갖고 있다. 기존 하둡용 SQL 엔진이 갖고 있는 성능 문제와 멀티 사용자 지원에 대한 문제를 해결하기 위해 만들어진 임팔라는 현존하는 하둡용 SQL 처리 엔진 가운데 가장 빠른 성능을 제공한다. 최근 국내에 임팔라를 활용한 대형 클러스터가 많아지면서 임팔라에서 제공하는 확장성 기능을 검토하지 않은 운영자는 소규모 클러스터에서 미처 겪지 못했던 문제를 겪을 수 있다. 임팔라에 관심이 있는 이들을 위한 기술적인 설명과 실제 운영자를 위한 클러스터 운영 체크리스트 7가지를 소개한다. 

<주요 내용>
- 하이브, 대화형 SQL 엔진으로는 역부족 
- 고성능과 멀티 사용자를 위한 SQL 엔진, 임팔라 
- 아파치 임팔라 쿼리 수행 아키텍처
- 클라우데라 엔터프라이즈 데이터 허브의 이해 
- 대형 임팔라 클러스터 운영 시 알아야 할 사항들
 
 
Tag

테크라이브러리 광고 및 콘텐츠 제휴 문의

입력하신 이메일로 안내메일을 발송해드립니다.

회사명:한국IDG 제호: ITWorld 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 편집인 : 박재곤 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.