아파치 타조(Apache Tajo)는 데이터웨어하우스(DataWarehouse) 시스템이다. 타조는 오픈소스 기반의 아파치 톱 레벨 프로젝트이기도 하다. 스파크, 스톰 등 여러 톱 레벨 프로젝트보다 상대적으로 덜 알려져 있긴 하지만 타조를 이용하면 하둡에 데이터웨어하우스를 구축할 수 있다. 타조가 부각되는 이유는 대용량 데이터 처리와 실시간 분석 작업을 한번에 할 수 있으며, 표준 SQL 지원 등으로 분석가들은 별도의 빅데이터 기술을 배우지 않고 기존 DW 환경에서 하둡에 접근할 수 있도록 도와준다는 점이다. 그러나 타조는 아직 알 속에 있다. 2015년 6월 30일 릴리즈한 최신 버전이 0.10.1이다. 한국에서 태어난 타조가 전세계 빅데이터 초원을 누리게 될 지 관심을 갖고 지켜보자.
주요 내용
오픈소스 데이터웨어하우스 타조, 하둡을 DW 세계로 데려가다
타조의 아키텍처
타조를 이용해야 하는 4가지 이유
타조가 넘어야 할 과제