아는 만큼 표현한다··· 엑셀을 데이터 시각화 툴로 활용하기

Computerworld
‘엑셀’(Excel)은 기본적으로 숫자를 다루는 프로그램이다. 그러나 이 인기 높은 스프레드시트 소프트웨어에는 그 이상의 재주들이 마련돼 있다. 기본적인 데이터 분석 기능을 제공하며, 또 놀라울 수준의 데이터 시각화 도구가 숨겨져 있다.

-> 애널리틱스 세계로의 초대··· MS 엑셀 200% 활용하기

엑셀 개발자 겸 컨설턴트인 존 펠티에르는 “엑셀이 ‘공식적’으로 데이터 시각화 도구인 것은 아니다. 스프레드시트이다”라면서도 엑셀의 ‘강점’ 중 하나가 ‘유연성’이라고 덧붙였다. 

그는 “엑셀은 다용도 스위스 군용 칼 같은 소프트웨어이다. 수식 기능에 더해, 데이터를 시각화해 분석할 수 있도록 데이터를 준비시키는 추가적인 기능들이 있다”라고 설명했다.

다음은 엑셀의 데이터 시각화 도구를 사용해 데이터를 제시하는 방법을 다룬 ‘안내서’이다. 아래 설명을 위해 사용한 엑셀 버전은 윈도우용 오피스 365 버전이다. 다른 버전을 사용하고 있다면, 여기에서 설명한 일부 기능이 없을 수도 있다.
 
ⓒ Image Credit : Getty Images Bank

 

차트

엑셀에서 가장 선명한 데이터 시각화 기능은 여러 다양한 차트다. 마이크로소프트는 몇 년에 걸쳐 막대나 선, 원형 같은 기본 차트부터 분산형 및 표면형 같은 고급 차트에 이르는 여러 다양한 차트를 계속 추가했다. 

예를 들어 윈도우용 엑셀 2016년 버전에서는 트리맵과 선버스트(sunburst), 폭포 등 6종의 새로운 차트를, 2019년 버전에서는 깔대기형 차트와 지도 차트를 도입했다. 오피스 365 가입자는 이 새로운 차트 종류를 모두 사용할 수 있다. 
 

트리맵 차트는 데이터의 범주와 하위 범주를 다른 크기의 블록으로 표현한다. ⓒ IDG

워크시트에 차트를 추가하려면, 차트로 변환하고 싶은 데이터를 선택한 후 리본에서 삽입 탭을 누른 다음 추천 차트 버튼을 클릭한다. 추천 차트는 데이터를 살핀 후, 데이터를 가장 강력하게 표시할 몇 가지 차트 종류를 제시하는 기능이다. 제시된 차트 가운데 적합한 차트가 없다면, 모든 차트 탭을 클릭한 후 자신이 원하는 종류를 선택한다. 차트에 추세선을 추가하고 싶다면, 디자인>차트 요소 추가>추세선을 클릭한 다음 추세선 스타일을 선택한다.
 

피벗 테이블과 피벗 차트

다른 많은 시각화 도구에서 도출해 사용하는 기본 엑셀 기능 중 하나는 피벗 테이블이다. 펠티에르에 따르면, 엑셀에서 데이터 시각화를 이용하기 위해 가장 먼저 할 일은 피벗 테이블 사용 방법, 작동 원리를 파악하고 이해하는 것이다.

피벗 테이블은 데이터를 요약해 제시한다. 수천 행과 수십 열을 쉽게 판독할 수 있는 형태로 묶어 제시함으로써 정보를 해석하고 추세를 포착할 수 있도록 도와준다. 또 데이터를 여러 방식으로 묶어 쉽게 결론에 도달할 수 있도록 도와준다. 특정 소스를 배제했을 때 통계적 결론이 어떻게 변화할지 보여주는 것을 예로 들 수 있다.

피벗 테이블은 값을 가진 열이나 행이 아주 많을 때 특히 유용하다. 엑셀은 SUM (=Sum) 함수라는 기본적인 합산 기능을 제공한다. 10여 개의 열, 몇 개의 행을 대상으로 총계를 구할 때 유용한 기능이다. 그러나 열과 행이 수백, 수천 개라면 어떻게 해야 할까? 피벗 테이블은 SUM 함수가 강화된 기능이라고 생각하면 된다.

피벗 테이블의 ‘피벗’은 다른 관점에서 데이터를 파악하기 위해 테이블의 데이터를 회전시키는 기능이다. SUM 함수보다 더 효과적으로 데이터를 조정할 수 있다. 예를 들어, 특정 달이나 분기를 배제한 상태에서 연간 매출을 조사하고 싶을 때 클릭 몇 번으로 이렇게 할 수 있다. SUM 함수는 더 많은 수고가 필요하다.
 

우측의 피벗 테이플 3개가좌측의 원본 데이터를 요약해 제시하고 있다. ⓒ IDG

위 이미지에서 왼쪽은 원본 데이터이다. 열은 Product(제품), Origin(원산지), Day sold(판매일), Price(가격), Unit Sales(단위 매출), Dollar Sales(달러 기준 매출)이다. 열 옆에 3가지 피벗 테이블이 있다. 수입산과 국내산 과일 각각의 매출, 각 과일 종류 별 총 매출, 요일에 따른 각 과일의 매출을 비교한 것이다. SUM 함수로는 이런 종류의 인사이트를 쉽게 얻을 수 없다.

피벗 테이블을 만들기란 아주 쉽다. 자신의 데이터 세트에서 각 열 맨 위 레이블로 열과 행을 선택한다. 리본의 삽입 탭을 클릭했을 때 첫 두 옵션이 피벗 테이블과 추천 피벗 테이블이다.

엑셀의 추천 피벗 테이블은 시트의 내용을 확인한 후 스프레드시트의 모든 범주에서 생성한 다양한 피벗 테이블의 썸네일 목록을 제시하는 기능이다. 원하는 피벗 테이블을 선택한 후 확인을 누른다.

추천 옵션에 원하는 데이터 정렬 방식이 없을 경우, 자신의 기준으로 테이블을 만들 수 있다. 이 경우, 클릭 몇 번이 더 필요하다. 피벗 테이블 버튼을 누른다. 그러면 테이블에 포함시킬 열과 행, 데이터 범위를 선택하라고 요청 받을 것이다. 원하는 범위가 포함되도록 클릭하고 드래그한 후 확인을 누른다.

어느 방법을 사용하든, 엑셀은 안에 테이블이 있는 새 워크시트를 연다. 원한다면, 필자가 스크린샷에서 한 것처럼 원본 데이터 시트로 복사해 넣을 수도 있다. 확인을 선택하면, 피벗 테이블 필드 창이 화면 오른 쪽에 열린다. 여기에서 데이터를 필터링할 필드를 선택할 수 있다. 추천 피벗 테이블을 선택하면, 피벗 테이블 필드 창의 필드를 선택, 선택 해제해 조정을 할 수 있다.

피벗 테이블을 이용하면 부수적인 혜택이 나타난다. 스프레드시트의 지저분한 부분을 찾을 수 있는 것이다. 필자는 엑셀로 수입과 지출에 대한 개인 회계를 처리하고 있다. 2018년을 대상으로 피벗 테이블을 생성했는데, 연방 세금를 ‘Fed’와 ‘Feds’라는 레이블을 사용해 입력한 것을 발견했다. 예금은 발행자 이름이나 ‘Deposit’으로 입력되어 있었다. 결국 테이블을 더 정확히 표시해 확인하기 위해 항목들을 다시 정리했다.

피벗 차트는 피벗 테이블을 시각화해 표시하는 기능이다. 피벗 차트를 삽입하려면, 리본의 삽입 탭에서 피벗 차트를 선택한다. 피벗 테이블처럼 데이터 소스 범위를 선택해야 한다. 그리고 차트로 표시할 필드를 선택한다.
 

피벗 차트는 피벗 테이블의 데이터를 시각적으로 표현할 수 있게 해준다. ⓒ IDG

 


슬라이서(Slicer)

엑셀은 데이터의 일부에만 초점을 맞출 수 있도록 피벗 테이블에 필터를 적용할 수 있는 기능도 제공한다. 슬라이서(Slicers)는 데이터를 범주 별로 쪼개고, 이런 범주들을 빨리 활성화, 비활성화 시켜 특정 정보로 좁혀 파악할 수 있는 내장 필터이다.

슬라이서는 기존 피벗 테이블을 출처로 삽입되기 때문에, 먼저 테이블을 만들어야 한다. 그리고 삽입 탭으로 이동해 슬라이서 버튼을 클릭한다. 예제로 제시한 과일 매출 스프레드시트를 사용, 요일과 위치, 단위 매출에 대한 슬라이더를 생성할 수 있다. 여기에서는 Product(제품), Origin(원산지), Day(요일)를 선택한다.

그러면 각 범주에 대해 3개의 상자가 열린다. Product와 Origin 아래 각각 Apples와 Imported를 선택하고, Day는 그냥 놔둔다. 우리는 특정 주의 요일에 판매된 수입산 사과의 수를 알 수 있다. 아래 예제의 날짜(요일)는 데이터에서 자동으로 생성이 된다. 수입산 사과는 수요일, 목요일, 토요일에만 판매가 되었다. 따라서 슬라이서는 이 요일들을 목록으로 표시한다.
 

슬라이서는 데이터를 범주별로 빠르게 필터링할 수 있게 해준다. ⓒ IDG


슬라이서는 필터와 달리 여러 피벗 테이블을 가로질러 동작할 수 있다. 즉 슬라이서는 여러 피벗 테이블을 대상으로 사용할 때 특히 유용하다. 하나의 피벗 테이블에서는 슬라이서와 필터가 크게 다르지 않다.

먼저 피벗 테이블을 생성하고, 마우스 오른쪽 클릭을 한 후 보고서 연결을 선택해 2개 이상의 피벗 테이블을 연결할 수 있다. 그러면 연결된 테이블이 상자로 표시된다. 처음에는 가장 먼저 생성한 1개 테이블만 선택이 되어 있다. 다른 테이블을 선택하면 연결이 되는 것이다.

예제인 과일 스프레드시트에서 제품과 원산지에 대한 2개 피벗 테이블을 연결해 국내 재배 과일에 대한 단위 매출 총계를 얻을 수 있다.
 

피벗테이블 사이에 슬라이서 연결을 구축해 좀더 정교한 결과를 얻을 수 있다.  ⓒ IDG


스파크라인(Sparklines)
스파크라인은 하나의 엑셀 셀 안에 표시되는 아주 작은 기본 차트이다. 셀 안에 선과 열, 비교 분석(Win/loss) 스파크라인을 만들어 데이터의 추세를 설명할 수 있다.

이와 관련, 펠티에르는 “5개 사업 부문의 지난 2년 간 분기 실적을 보여주는 대시보드를 가정하자. 각 부문의 실적을 시각적으로 표현하고 싶지만, 일반 차트 5개를 표시할 공간이 화면에 부족하다. 이런 유형의 정보가 스파크라인에 적절하다”라고 설명했다.
 

스파크라인은 단일 셀에 담기는 미니 차트로, 데이터 트렌드를 강조할 수 있다. 위 이미지의 우측 하단 영역을 참고한다.  ⓒ IDG

테이블이나 피벗 테이블의 데이터에서 스파크라인을 생성할 수 있다. 12개월 동안의 매출 등 데이터 범위를 선택한 후 리본의 삽입 탭으로 이동해 스파크라인 섹션에서 ‘선, 열, 비교 분석(Line, Column, Win/Loss)’을 선택한다. 소스 데이터 범위를 확인한 후 스파크라인의 대상 셀을 선택한 다음 확인을 클릭한다.

스파크라인은 단일 셀에 표시되기 때문에, 하나의 행이나 하나의 열에서 이에 대한 데이터를 선택해야 한다. 즉 여러 행과 열에서 데이터 범위를 선택하고, 해당되는 스파크라인을 위한 대상 셀 여러 개를 선택해 동시에 여러 스파크라인을 추가할 수 있다. 다시 말해 3개 데이터 행에 대한 추세를 보여주기 위해 3개 스파크라인이 필요하다면 3개 대상 셀을 선택해야 한다.

 

조건부 서식(Conditional Formatting)

스프레드시트의 수 많은 행과 열의 숫자를 확인하기란 쉽지 않다. 하지만 쉽게 중요한 데이터 포인트와 추세를 포착할 수 있는 방법이 있다. 테이블과 피벗 테이블, 셀 범위에 엑셀의 조건부 서식 기능을 사용하는 방법이다. 

예를 들어, 높은 값은 녹색으로 낮은 값은 붉은색으로 표시하도록 엑셀에 명령할 수 있다. 그러면 자동으로 높은 정도, 낮은 정도를 토대로 녹색과 붉은색의 밝기, 어둡기를 조정한다.
 

단일 셀 내의 조건부 서식에는 3가지 유형이 있다. 색상, 막대, 화살표가 그것이다. ⓒ IDG


가령 손익을 설명할 때 조건부 서식을 사용할 수 있다. 지역, 제품 등을 기준으로 특정 기간 동안 손익을 시각적으로 표시해준다. 셀의 색상을 바꾸는 것에 더해, 데이터 막대나 아이콘들을 사용할 수 있다.

조건부 서식을 추가하려면 서식을 지정할 데이터를 선택한다. 그리고 리본에서 홈 탭을 선택한 후 스타일 그룹 아래 조건부 서식 버튼을 클릭한다. 그런 다음, 강조할 셀을 선택하고(예, 특정 값 이상 또는 미만, 상위나 하위 10% 등), 전체 선택 범위에 데이터 막대, 색상 범위, 아이콘 세트를 적용할 수 있다. 

가장 큰 장점은 여러 서식을 동시에 추가할 수 있다는 것이다. 필자의 경우 점차 어두워지는 색상 범위, 전월 대비 증감을 표시하는 화살표, 셀 데이터를 월에서 가장 큰 항목과 비교하는 막대를 추가했다.
 

아이콘

조건부 서식과 스파크라인에는 부수적인 기능 한 가지가 있다. ‘Webdings’ 폰트를 사용해 스프레드시트에 아주 작은 그래픽을 추가하는 기능이다. 엑셀구루 블로그(Excelguru Blog) 운영자인 켄 펄스는 다음과 같이 설명하고 있다.

“서식을 연결할 수는 없다. 그러나 고정된 그림을 삽입해 통합 문서에서 데이터를 더 생동감 있게 표현할 수 있다.”

이는 상사가 쉽게 파악을 하고, 전체 추세를 확인해 이해할 수 있도록 정보를 요약해 제시하는 데 도움을 준다.

이 삽입된 아이콘은 상향 및 하향 추세, 손익, 또는 상태와 같은 것들을 표현할 수 있다. 워크시트에 아이콘을 추가하려면 리본의 삽입 탭으로 이동해 일러스트레이션 그룹에서 아이콘을 선택한다. 그리고 아이콘 한 개를 선택한 후 삽입을 클릭한다. 그러면 워크시트 안에 크기 조정, 회전, 이동에 사용할 수 있는 핸들과 함께 이미지가 표시된다.
 

연결된 데이터 형식(Linked data types)

마이크로소프트는 최근 오피스 365 가입자를 대상으로 ‘연결된 데이터 형식’이라는 새로운 엑셀 기능을 공개했다. 숫자나 문자가 아닌, 온라인 데이터 소스와 연결된 값을 셀에 집어넣을 수 있다. 마이크로소프트 빙 검색 엔진이 데이터 소스이다.

현재 지원하는 데이터 형식은 주식과 지리(지역) 단 2가지이다. 엑셀은 주식 종목 코드나 주의 명칭을 인식, 실시간으로 빙에서 관련 데이터를 검색해 표시한다. 이러한 데이터 종류 중 하나가 입력된 셀에는 상태를 가리키는 아이콘이 포함되어 있다. 이 아이콘을 클릭하면 관련 정보가 카드로 표시된다.

예를 들어, 주식 종목 코드 셀은 회사와 주가, 52주 최고가 및 최저가, P/E 등 주가 실적에 대한 다양한 정보를 표시할 수 있다. 지리(지역) 셀은 해당 지역의 인구부터 전력 소비량까지 다양한 정보를 표시할 수 있다.
 

특정 지역에 대한 다양한 종류의 정보를 보고자 한다면 연결된 지오그래피 셀을 클릭하면 된다. ⓒ IDG


주식 관련 셀을 아주 쉽게 추가할 수 있다. 주식 종목 코드나 회사 이름을 하나의 열에 입력한다. 그런 다음 선택을 한 후, 리본의 데이터 탭을 클릭한다. 리본 중간 부분에 주식 및 지역 버튼이 있는 데이터 형식 그룹이 있다.

주식을 클릭하면, 종목 코드가 회사 이름으로 대체되고, 각 이름 왼쪽 옆에 아이콘이 표시된다. 회사를 선택하면 회사의 카드에서 표시할 데이터 종류를 선택할 수 있는 메뉴가 팝업으로 표시된다.

지역 또한 흥미롭다. 주식과 마찬가지로 하나의 열에 여러 지역(주, 국가, 도시 등)을 입력한다. 그런 다음 셀을 선택한 후 데이터>지역을 클릭한다. 그러나 정확해야 한다. GA와 CA, MN, NC를 입력한 후 지역 버튼을 클릭하면, 조지아와 캘리포니아, 미네소타, 노스 캐롤라이나가 아닌 가봉, 캐나다, 몽고, 뉴칼레도니아가 표시된다. Geo, Calif, Minn, N.C라고 입력해야 한다. 주의 명칭을 완전히 입력하는 방법도 있다.
 

오피스 365 가입자는 주식이나 위치와 관련해 다양한 비교 및 분석 작업을 수행할 수 있다. ⓒ IDG


빙은 인구와 GDP 같은 기본 정보는 물론, 화석 연료 소비량 및 기대 수명 같은 정보까지 다양한 지역 정보를 제공한다.

현재 오피스 365 가입자만 엑셀이 새로 도입한 연결된 데이터 형식 기능을 사용할 수 있다. 마이크로소프트는 추가적인 연결된 데이터 형식을 배포할 계획이라고 밝혔지만 그 시기는 공개하지 않았다.
 

예측(Forecasts)

윈도우용 엑셀 2016년에 도입된(맥은 지원하지 않음) 예측 시트는 AI를 사용, 과거 성과(실적)를 토대로 미래의 값을 예측하는 기능이다. 역사적, 시간 기반 데이터를 이용할 수 있고, 예상치를 고, 중, 저로 구분해 차트로 제시한다. 사용한 데이터가 많을수록 예측이 더 정확해진다.
 

역사적 데이터를 이용해 엑셀은 데이터 포인트가 향하는 방향을 예측할 수 있다. ⓒ IDG


예측을 생성하려면, 반드시 시간 기반 역사적 데이터를 사용해야 한다. 커서를 데이터 셀 중 하나에 위치시킨다. 그리고 리본의 데이터 탭으로 이동해 예측 그룹에서 예측 시트를 선택한다. 표시되는 화면에서 차트 종류(선 또는 막대), 예측 종료일, 기타 옵션을 선택한다. 생성을 클릭하면, 엑셀이 역사적 데이터와 예측 값이 모두 포함된 차트가 있는 새 워크시트를 생성한다. 예측 값은 역사적 데이터와 다르게 음영으로 처리되어 있다. 이는 계절 데이터에 특히 유용하다는 평가를 받고 있다.
 

빠른 분석(Quick Analysis)

마지막 팁이다. 윈도우용 엑셀 2016, 엑셀 2019, 오피스 365 엑셀을 사용하고 있다면, 빠른 분석 기능을 사용, 조건부 서식과 차트, 피벗 테이블, 스파크라인 등 여러 시각화 도구를 선택한 데이터에 빨리 적용할 수 있다. 

분석하려는 셀을 선택한다. 그러면 선택한 데이터의 우측 구석 가까이 빠른 분석 아이콘이 표시된다. 이 아이콘을 클릭한 후 추가하고 싶은 시각화 도구의 종류를 선택한다.
 

빠른 분석 기능은 사용자가 즉각적 데이터 분석을 위해 다양한 도구를 활용할 수 있게 해준다. ⓒ IDG


ciokr@idg.co.kr