-> 애널리틱스 세계로의 초대··· MS 엑셀 200% 활용하기
엑셀 개발자 겸 컨설턴트인 존 펠티에르는 “엑셀이 ‘공식적’으로 데이터 시각화 도구인 것은 아니다. 스프레드시트이다”라면서도 엑셀의 ‘강점’ 중 하나가 ‘유연성’이라고 덧붙였다.
그는 “엑셀은 다용도 스위스 군용 칼 같은 소프트웨어이다. 수식 기능에 더해, 데이터를 시각화해 분석할 수 있도록 데이터를 준비시키는 추가적인 기능들이 있다”라고 설명했다.
다음은 엑셀의 데이터 시각화 도구를 사용해 데이터를 제시하는 방법을 다룬 ‘안내서’이다. 아래 설명을 위해 사용한 엑셀 버전은 윈도우용 오피스 365 버전이다. 다른 버전을 사용하고 있다면, 여기에서 설명한 일부 기능이 없을 수도 있다.
차트
엑셀에서 가장 선명한 데이터 시각화 기능은 여러 다양한 차트다. 마이크로소프트는 몇 년에 걸쳐 막대나 선, 원형 같은 기본 차트부터 분산형 및 표면형 같은 고급 차트에 이르는 여러 다양한 차트를 계속 추가했다.
예를 들어 윈도우용 엑셀 2016년 버전에서는 트리맵과 선버스트(sunburst), 폭포 등 6종의 새로운 차트를, 2019년 버전에서는 깔대기형 차트와 지도 차트를 도입했다. 오피스 365 가입자는 이 새로운 차트 종류를 모두 사용할 수 있다.
워크시트에 차트를 추가하려면, 차트로 변환하고 싶은 데이터를 선택한 후 리본에서 삽입 탭을 누른 다음 추천 차트 버튼을 클릭한다. 추천 차트는 데이터를 살핀 후, 데이터를 가장 강력하게 표시할 몇 가지 차트 종류를 제시하는 기능이다. 제시된 차트 가운데 적합한 차트가 없다면, 모든 차트 탭을 클릭한 후 자신이 원하는 종류를 선택한다. 차트에 추세선을 추가하고 싶다면, 디자인>차트 요소 추가>추세선을 클릭한 다음 추세선 스타일을 선택한다.
피벗 테이블과 피벗 차트
다른 많은 시각화 도구에서 도출해 사용하는 기본 엑셀 기능 중 하나는 피벗 테이블이다. 펠티에르에 따르면, 엑셀에서 데이터 시각화를 이용하기 위해 가장 먼저 할 일은 피벗 테이블 사용 방법, 작동 원리를 파악하고 이해하는 것이다.
피벗 테이블은 데이터를 요약해 제시한다. 수천 행과 수십 열을 쉽게 판독할 수 있는 형태로 묶어 제시함으로써 정보를 해석하고 추세를 포착할 수 있도록 도와준다. 또 데이터를 여러 방식으로 묶어 쉽게 결론에 도달할 수 있도록 도와준다. 특정 소스를 배제했을 때 통계적 결론이 어떻게 변화할지 보여주는 것을 예로 들 수 있다.
피벗 테이블은 값을 가진 열이나 행이 아주 많을 때 특히 유용하다. 엑셀은 SUM (=Sum) 함수라는 기본적인 합산 기능을 제공한다. 10여 개의 열, 몇 개의 행을 대상으로 총계를 구할 때 유용한 기능이다. 그러나 열과 행이 수백, 수천 개라면 어떻게 해야 할까? 피벗 테이블은 SUM 함수가 강화된 기능이라고 생각하면 된다.
피벗 테이블의 ‘피벗’은 다른 관점에서 데이터를 파악하기 위해 테이블의 데이터를 회전시키는 기능이다. SUM 함수보다 더 효과적으로 데이터를 조정할 수 있다. 예를 들어, 특정 달이나 분기를 배제한 상태에서 연간 매출을 조사하고 싶을 때 클릭 몇 번으로 이렇게 할 수 있다. SUM 함수는 더 많은 수고가 필요하다.
위 이미지에서 왼쪽은 원본 데이터이다. 열은 Product(제품), Origin(원산지), Day sold(판매일), Price(가격), Unit Sales(단위 매출), Dollar Sales(달러 기준 매출)이다. 열 옆에 3가지 피벗 테이블이 있다. 수입산과 국내산 과일 각각의 매출, 각 과일 종류 별 총 매출, 요일에 따른 각 과일의 매출을 비교한 것이다. SUM 함수로는 이런 종류의 인사이트를 쉽게 얻을 수 없다.
피벗 테이블을 만들기란 아주 쉽다. 자신의 데이터 세트에서 각 열 맨 위 레이블로 열과 행을 선택한다. 리본의 삽입 탭을 클릭했을 때 첫 두 옵션이 피벗 테이블과 추천 피벗 테이블이다.
엑셀의 추천 피벗 테이블은 시트의 내용을 확인한 후 스프레드시트의 모든 범주에서 생성한 다양한 피벗 테이블의 썸네일 목록을 제시하는 기능이다. 원하는 피벗 테이블을 선택한 후 확인을 누른다.
추천 옵션에 원하는 데이터 정렬 방식이 없을 경우, 자신의 기준으로 테이블을 만들 수 있다. 이 경우, 클릭 몇 번이 더 필요하다. 피벗 테이블 버튼을 누른다. 그러면 테이블에 포함시킬 열과 행, 데이터 범위를 선택하라고 요청 받을 것이다. 원하는 범위가 포함되도록 클릭하고 드래그한 후 확인을 누른다.
어느 방법을 사용하든, 엑셀은 안에 테이블이 있는 새 워크시트를 연다. 원한다면, 필자가 스크린샷에서 한 것처럼 원본 데이터 시트로 복사해 넣을 수도 있다. 확인을 선택하면, 피벗 테이블 필드 창이 화면 오른 쪽에 열린다. 여기에서 데이터를 필터링할 필드를 선택할 수 있다. 추천 피벗 테이블을 선택하면, 피벗 테이블 필드 창의 필드를 선택, 선택 해제해 조정을 할 수 있다.
피벗 테이블을 이용하면 부수적인 혜택이 나타난다. 스프레드시트의 지저분한 부분을 찾을 수 있는 것이다. 필자는 엑셀로 수입과 지출에 대한 개인 회계를 처리하고 있다. 2018년을 대상으로 피벗 테이블을 생성했는데, 연방 세금를 ‘Fed’와 ‘Feds’라는 레이블을 사용해 입력한 것을 발견했다. 예금은 발행자 이름이나 ‘Deposit’으로 입력되어 있었다. 결국 테이블을 더 정확히 표시해 확인하기 위해 항목들을 다시 정리했다.
피벗 차트는 피벗 테이블을 시각화해 표시하는 기능이다. 피벗 차트를 삽입하려면, 리본의 삽입 탭에서 피벗 차트를 선택한다. 피벗 테이블처럼 데이터 소스 범위를 선택해야 한다. 그리고 차트로 표시할 필드를 선택한다.
슬라이서(Slicer)
엑셀은 데이터의 일부에만 초점을 맞출 수 있도록 피벗 테이블에 필터를 적용할 수 있는 기능도 제공한다. 슬라이서(Slicers)는 데이터를 범주 별로 쪼개고, 이런 범주들을 빨리 활성화, 비활성화 시켜 특정 정보로 좁혀 파악할 수 있는 내장 필터이다.
슬라이서는 기존 피벗 테이블을 출처로 삽입되기 때문에, 먼저 테이블을 만들어야 한다. 그리고 삽입 탭으로 이동해 슬라이서 버튼을 클릭한다. 예제로 제시한 과일 매출 스프레드시트를 사용, 요일과 위치, 단위 매출에 대한 슬라이더를 생성할 수 있다. 여기에서는 Product(제품), Origin(원산지), Day(요일)를 선택한다.
그러면 각 범주에 대해 3개의 상자가 열린다. Product와 Origin 아래 각각 Apples와 Imported를 선택하고, Day는 그냥 놔둔다. 우리는 특정 주의 요일에 판매된 수입산 사과의 수를 알 수 있다. 아래 예제의 날짜(요일)는 데이터에서 자동으로 생성이 된다. 수입산 사과는 수요일, 목요일, 토요일에만 판매가 되었다. 따라서 슬라이서는 이 요일들을 목록으로 표시한다.
슬라이서는 필터와 달리 여러 피벗 테이블을 가로질러 동작할 수 있다. 즉 슬라이서는 여러 피벗 테이블을 대상으로 사용할 때 특히 유용하다. 하나의 피벗 테이블에서는 슬라이서와 필터가 크게 다르지 않다.
먼저 피벗 테이블을 생성하고, 마우스 오른쪽 클릭을 한 후 보고서 연결을 선택해 2개 이상의 피벗 테이블을 연결할 수 있다. 그러면 연결된 테이블이 상자로 표시된다. 처음에는 가장 먼저 생성한 1개 테이블만 선택이 되어 있다. 다른 테이블을 선택하면 연결이 되는 것이다.
예제인 과일 스프레드시트에서 제품과 원산지에 대한 2개 피벗 테이블을 연결해 국내 재배 과일에 대한 단위 매출 총계를 얻을 수 있다.
스파크라인(Sparklines)
스파크라인은 하나의 엑셀 셀 안에 표시되는 아주 작은 기본 차트이다. 셀 안에 선과 열, 비교 분석(Win/loss) 스파크라인을 만들어 데이터의 추세를 설명할 수 있다.
이와 관련, 펠티에르는 “5개 사업 부문의 지난 2년 간 분기 실적을 보여주는 대시보드를 가정하자. 각 부문의 실적을 시각적으로 표현하고 싶지만, 일반 차트 5개를 표시할 공간이 화면에 부족하다. 이런 유형의 정보가 스파크라인에 적절하다”라고 설명했다.
테이블이나 피벗 테이블의 데이터에서 스파크라인을 생성할 수 있다. 12개월 동안의 매출 등 데이터 범위를 선택한 후 리본의 삽입 탭으로 이동해 스파크라인 섹션에서 ‘선, 열, 비교 분석(Line, Column, Win/Loss)’을 선택한다. 소스 데이터 범위를 확인한 후 스파크라인의 대상 셀을 선택한 다음 확인을 클릭한다.
스파크라인은 단일 셀에 표시되기 때문에, 하나의 행이나 하나의 열에서 이에 대한 데이터를 선택해야 한다. 즉 여러 행과 열에서 데이터 범위를 선택하고, 해당되는 스파크라인을 위한 대상 셀 여러 개를 선택해 동시에 여러 스파크라인을 추가할 수 있다. 다시 말해 3개 데이터 행에 대한 추세를 보여주기 위해 3개 스파크라인이 필요하다면 3개 대상 셀을 선택해야 한다.