하이브는 SQL을 지원하긴 하지만 사용자가 SQL을 기반으로 애드혹 쿼리를 요청하거나 BI 도구를 사용해 분석할 경우에는 느릴 수 밖에 없는 한계를 갖고 있다. 기존 하둡용 SQL 엔진이 갖고 있는 성능 문제와 멀티 사용자 지원에 대한 문제를 해결하기 위해 만들어진 임팔라는 현존하는 하둡용 SQL 처리 엔진 가운데 가장 빠른 성능을 제공한다. 최근 국내에 임팔라를 활용한 대형 클러스터가 많아지면서 임팔라에서 제공하는 확장성 기능을 검토하지 않은 운영자는 소규모 클러스터에서 미처 겪지 못했던 문제를 겪을 수 있다. 임팔라에 관심이 있는 이들을 위한 기술적인 설명과 실제 운영자를 위한 클러스터 운영 체크리스트 7가지를 소개한다.
<주요 내용>
- 하이브, 대화형 SQL 엔진으로는 역부족
- 고성능과 멀티 사용자를 위한 SQL 엔진, 임팔라
- 아파치 임팔라 쿼리 수행 아키텍처
- 클라우데라 엔터프라이즈 데이터 허브의 이해
- 대형 임팔라 클러스터 운영 시 알아야 할 사항들