데이터 시각화란 무엇인가...데이터 시각화 전문가의 부상

Computerworld

의사 결정권자들이 빅 데이터가 주는 결과를 이해하지 못할 때 빅 데이터의 유용성은 떨어진다. 그래서 빅 데이터를 분석해 표현해주는 데이터 시각화(data visualization) 전문가들이 필요하다.

데이터의 단순한 나열보다 사진 한 장이 더 가치가 있다는 말은 오늘날 경영분석에서 자주 논의된다. 빅 데이터 트랜드가 가속화되고 분석 기법을 사용하는 기업이 늘어나면서, 분석된 데이터를 알기쉽게 설명해주는 전문가들의 수요는 늘어나고 있다.

지난해 가을, IT 전문 리서치 업체인 가트너는 2015년까지 빅 데이터 관련 일자리가 440만 개로 늘어나게 될 것이며 이들 가운데 대부분은 데이터 시각화와 같이 이전에는 요구되지 않았던 새로운 기술들을 필요로 한다고 예측했다.

데이터 시각화는 정확히 무엇인가? 데이터 시각화를 실시하는 주체가 정확히 누구이며, 이것이 단순히 총천연색 그래프나 흥미를 유발하는 인포그래픽과 다른 점은 무엇인가?

역설적인 사실은, 데이터 시각화 전문가(data visualizer)가 정확히 어떤 것인지 알기가 쉽지 않다는 것이다. 이에 대해 IT 고용 전문가들은 데이터 시각화의 정의가 아직 확실히 내려지지 않았기 때문이며, 이를 직함이나 직업 그 자체로 간주하는 사람은 드물다고 말했다.

오히려 데이터 시각화를 다른 역할과 더해져 직원들이 갖춰야 하는 능력(a skill set)으로 보는 기업들이 많아지고 있다. 특히 이런 경향은 사업분석업무를 담당하는 직원들 사이에서 더욱 더 두드러진다.

기업에서 채용시 자격요건으로 '데이터 시각화'를 제시하는 경우도 지난 6개월간 12%가 증가했다고 데이터 분석 전문 채용사이트인 icrunchdata의 공동창립자인 토드 네빈스는 말했다. 이에 반해 기업에서 채용시 자격요건으로 빅 데이터를 제시하는 경우는 63% 증가했다고.

네빈스는 "데이터 시각화는 아직 초기 단계지만 기업들이 데이터 사용과 축적을 전략적으로 추진함에 따라 점점 주목받고 있다"고 말했다.

하지만 이런 흐름을 주도하는 것은 IT 부서가 아니다. IT 전문가들은 "IT 부서는 데이터 분석과 데이터 시각화에서 제한적인 역할만을 수행하고 있다"고 말했다.

시스코(Cisco) 애널리틱스 부문장 그레고리 르완도스키(Gregory Lewandowski)는
"IT 부서는 일반적으로 기업 플랫폼(dashboard)과 비즈니스 인텔리전스를 제공하는 역할을 수행하지만 대부분 주어진 역할을 수행하는데 그칠 뿐 적극적으로 나서는 경우는 적다"고 말했다.


데이터 시각화 전문가인 스테판 퓨는 단순한 색상의 그래프 막대를 이용해 이를 보는 사람들이 쉽게 세 가지 종류의 데이터를 구분할 수 있게 한다. 화살표와 부가 설명을 함으로써 그래프가 의미하는 바를 누구든지 알아볼 수 있게 한다. 이곳을 클릭하면 스테판 퓨의 손을 거치기 이전의 그래프를 볼 수 있다.

데이터 시각화 전문 컨설팅 업체인 퍼셉츄얼 에지(Perceptual Edge) 창업자 스테판 퓨는 "IT 부서는 시각화를 구현하는 기술에 주목할 뿐 이런 기술 자체를 사용하지 않는다"고 말했다.

퓨는 에드워드 투프트(Edward Tufte)의 데이터 시각화에 대한 워크숍에 참석한 후, IT와 비즈니스 인텔리전스에 대한 전문성을 바탕으로 2003년 퍼셉츄얼 에지를 설립했다. 에드워드 투프트는 원칙으로서의 데이터 시각화를 개발하고 1983년에 이에 대해 '양적 정보의 시각 디스플레이(The Visual Display of Quantitative Information)'라는 제목의 책을 저술했다.

스테판 퓨는 데이터 시각화 전문가로서 유명해졌고 '설득적 그래프 및 도표 디자인(Show Me the Numbers : Designing Tables and Graphs to Enlighen)' 등 여러 권의 책을 저술했다.

퓨는 "심지어 IT 부서에는 자주 요청하는 리포트를 작성하는 상근 비즈니스 인텔리전스 분석가가 배치되어 있다"며, "하지만 이들 비즈니스 인텔리전스 분석가들은 데이터를 이해하지 못한다. 사람들이 리포트의 어느 부분의 데이터를 가져다 활용하는지 알지 못한다"고 말했다.

퓨는 "데이터를 사용해 의사결정을 내리는 사람들과 이들이 필요로 하는 데이터를 제공하는 IT 관계자 사이에는 커다란 간극이 있다. 데이터를 이해하는 사람과 조직에서 데이터를 분배하기 위해 갖고 있는 기술을 이해하는 사람을 찾기란 매우 힘들다. 그리고 두 가지를 모두 잘하는 사람은 더욱 찾기 어렵다"고 말했다.


스테판 퓨와 다른 많은 이들은 오늘날 데이터 시각화에서 필요로 하는 미적인 감각을 연마하는 것에 대해 논의하고 있다.

포레스터 리서치 수석 애널리스트이자 부회장인 보리스 에벨슨은 "데이터 시각화에는 두 가지 단계가 있다"고 말했다. 첫 단계는 개인의 능력을 통해 최신의 기술과 도구를 사용해 정보를 제시하고 분석하는 것이다.

예를 들어 엑셀이나 코그노스(Cognos)와 같은 도구를 사용하기 보다는 데이터 분석가들은 타블로(Tableau)나 스팟파이어(Spotfire)를 사용하기가 쉽고 이해가 용이한 차트나 스캐터 플롯(Scatter Plot) 등을 만든다.

하지만 일부 애플리케이션에 있어서는 이것만으로는 충분치 않다. 최근 뉴욕의 한 대형 은행은 보리스 에벨슨에게 은행 내부적으로 포괄적이면서도 세련된 포트폴리오 분석을 시각적으로 잘 표현해 줄 수 있는 직원이 필요하다고 전했다.

이를 통해 많은 고객들에게 나타날 수 있는 투자와 위험에 대해 분석해 주고자 했다. 그 은행은 모든 도구와 기술을 갖고 있었지만 여전히 다양한 시각 정보를 두뇌가 흡수하고 반응하는 방법에 대한 전문적인 이해를 가진 직원을 찾고 있었다.

보리스 에벨슨은 "중요한 것은 데이터 시각화 기술이 아니라 비쥬얼 인식의 심리적인 부분을 아는 것"이라고 말했다. 이 은행에서는 데이터 종류에 따라 다른 시각화를 적용할 수 있는 사람을 찾고 있었다. 또한 인구의 약 7%정도는 색맹이기 때문에 색상에 의존하지 말아야 할 것이라는 예시에서 보듯이, 특정 시각화 기술이 줄 수 있는 한계에 대해서도 충분히 이해하고 있는 사람이 필요했다.

이 은행은 새로운 전문가를 초빙했다. 정규직이 아닌 파트타임 컨설턴트였는데, 애널리스트들은 이는 빅 데이터에 대한 수요가 많아지더라도 많은 기업에서 채택하게 될 고용 형태가 될 것이라고 설명했다. 세 번째 옵션은 데이터 시각화 프로젝트를 외부에 맡기는 것이다.

데이터 시각화를 다룬다는 것
데이터 시각화를 다룬다는 것은 다음과 같다.
- 데이터와 고객을 이해해라. 어떤 메시지를 전달할 것인지 결정해라.

- 메시지 전달에 필요한 핵심 내용을 제외한 나머지는 생략하라.

- 최선의 표현 방법을 결정하라

양적 정보 전달시에는 단어, 숫자가 기입된 도표, 그래프, 이들의 조합 등 효과적인 정보 전달을 위해 다양한 방법을 생각해야 한다. 이 원칙은 직관적이지 않다. 그래서 훈련을 통해 인간의 눈과 두뇌가 어떤 방식으로 시각 정보를 처리하는지 연구해야 한다. 이를 위해 데이터 시각화 전문가와 상의해야 한다(혹은 스스로 터득하거나 직원들을 훈련시킬 수도 있다).

- 단순, 명료, 정확한 커뮤니케이션을 위해 화면을 디자인하라
데이터가 아닌 그 어떤 것도 필요가 없을 시에는 집어넣지 마라.
다채로운 색상과 비주얼 효과나 그래프의 선도 불필요하게 많이 넣지 마라.
데이터가 아닌 요소는 정보에 비해 크게 부각되어서는 안 된다.
메시지 전달에 가장 중요한 정보를 시각적으로 강조하라.

- 데이터를 토대로 어떤 행동을 취해야 하는지에 대해 설명하라. 대부분의 양적 정보는 단순히 정보 전달뿐만 아니라 유용한 반응을 이끌어 내기 위해서 제시된다.

애널리스트뿐만 아니라 조직 전반에도 데이터 시각화 훈련의 필요하다는 것을 인식하는 기업들이 늘고 있다.

시스코의 르완도스키는 스테판 퓨의 워크숍을 6년 전에 이수했다. 르완도스키는 "많은 이들이 놓치고 있는 중요하지만 미묘한 부분을 알게 되었다. 변화를 가져오지만 알아차리기는 어려운 것들이 매우 많다"라고 말했다.

여러 데이터 시각화 전문가들과 마찬가지로, 르완도스키는 자연히 데이터 시각화 분야에 끌려 들어갔다. 14년 전, 르완도스키는 시스코에서 영업과 사업개발업무를 담당했다. 그리고 나서 파트너 관계를 조율하는 업무를 담당하며 비즈니스 인텔리전스(BI) 애플리케이션을 시작했다.

자신의 전문성을 비즈니스 인텔리전스와 데이터 분석으로 점차 확산시킨 르완도스키는 이제 사내에 비즈니스 인텔리전스 보급을 전담하는 글로벌 비즈니스 오퍼레이션 팀에서 세 명으로 구성된 팀을 이끌고 있다.

르완도스키는 "데이터 시각화가 IT 부서의 기능은 아니라고 생각하지만, 그럼에도 이 팀이 IT 조직과 사업의 중간자적 성격을 지니고 있다"고 말했다.


르완도스키의 팀은 시스코 데이터에 대한 특정한 시각화와 기업의 모범사례 보급과 같은 데이터 시각화 전반에 많은 시간을 쏟고 있다.

르완도스키는 "우리 팀은 교육을 통해 올바른 데이터 시각화를 실현시키기를 원한다. 종국에는 누구나 의사소통능력을 높혀 나가야 할 책임을 지게 될 것"이라고 설명했다.


스테판 퓨는 시장 점유율이 전달 내용의 핵심이었기 때문에 일부러 보기 쉽고 절제된 전 구획을 통해 도표를 구성했다. 그래프 아래 부분의 도표를 통합함으로써 정확한 수치를 원하는 사람들에게 필요한 정보를 제공한다. 이곳을 클릭하면 스테판 퓨의 손을 거치기 이전의 그래프를 볼 수 있다.

그러나 르완도스키는 "데이터 시각화 전문가에게 있어 최종적 목적으로 특정 질문에 대해 해답을 제시하는 데이터를 제시하는 것만으로는 충분치 않다"고 말했다.

"데이터 시각화의 본질 가운데 하나는 사물을 바라보는 방식을 바꿈으로써 의사결정권자들이 예전에는 질문하지 못했던 것을 하게 만드는 것이다. 성공적인 데이터 시각화가 이뤄지면, 사람들은 더 심층적인 질문을 하게 되고 이는 뛰어난 전략으로 이어져 궁극적으로는 기업에 도움이 된다"고 설명했다.

르완도스키는 데이터 시각화가 적절히 이뤄지면 근본적 사업 이익을 가져온다고 말했다. 르완도스키는 '르완도스키 피라미드'라 부르는 그래픽을 개발했다. 이 그래픽은 글로벌 전략에 변화를 가져왔다. 이는 실제로 전략적 중요성이 크기 때문에 세부적인 내용까지 언급하지는 않았다.

르완도스키는 "기본적으로 르완도스키 피라미드는 우리가 어떤 것의 개수를 셀 때 사용하는 구분이다. 예를 들어 주문 숫자나 고객 숫자를 파악하고 난 후 이를 여러 층위로 나누는 것"이라고.

오랫동안 이 모델이 있어 관리자들은 변화된 부분을 추적 관리하고 변화를 유발하는 기저의 원인을 파악해 기업의 포지셔닝에 변화를 주거나 이머징 마켓에서 이익을 보는 것이 가능해진다(르완도스키는 정확히 무엇에 있어서의 변화인지는 밝히지 않았다).

르완도스키는 "이를 묘사함에 있어서 이전에는 본적없는 방식으로 만들어 내부의 이해관계자들이 물어봐야 하는 질문의 종류를 구체화시킬 수 있는 방식으로 하려고 한다"고 말했다.

웰스파고의 기업 데이터와 분석 전문가인 다나 주버는 12년의 경력 가운데 여러 직책에서 데이터 분석 일을 했지만 데이트 시각화를 알게 된 것은 6년 전 웰스파고에 들어왔을 때였다고 말했다.

은행에서는 데이터 시각화에 대한 내부 훈련 프로그램을 받게 했고 투프트 등이 제공하는 외부 세미나도 참석하게 했다. 다나 주버는 "이 전에는 데이터 시각화에 원칙이 있다는 사실에 대해 이해하지 못했다"고 말했다.

웰스파고 은행의 경영자가 분명하게 느끼고 있는 것은 바로 데이터 분석뿐만이 아니라 데이터 시각화가 데이터 분석가가 아니더라도 필수적인 스킬이 됐다는 점이다.

관심있는 사람들은 누구든지 사내에서 필요한 과정을 들을 수 있다. 다나 주버는 "과정 이수자의 수가 늘어남에 따라 데이터 시각화에 대한 관심이 조직 전반에 늘어나고 있다. 데이터 시각화의 가치를 알고 업무에 적용하는 사람들이 늘어나고 있다"고 설명했다.

이것이야 말로 스테판 퓨가 원하는 과정이었을 것이다. 물론 빅 데이터가 데이터 시각화에 초점을 맞추기는 했지만, 데이터 시각화는 기업에서 오랜 시간동안 필요성이 제기되는 스킬이었다.

데이터 시각화의 중요성을 깨닫는 기업이 늘고는 있지만 이들 가운데 대다수는 초점을 잘못 맞추고 있다. 직무상세에서는 코그노스로 차트를 어떻게 그리는지 등에 대한 기술적인 부분들에 대해 기재가 된 반면 그래픽 디자인 전문성에 대한 언급은 없다.

퓨는 "현재 사람들이 원하는 기술의 종류는 그들 자신이 원하고자 하는 기술은 아닐 것이다. 인간 두뇌가 색과 모양을 인식하는 스킬을 포함해, 미묘한 부분에 대한 이해가 없이는, 순간적인 데이터 시각화에 그치게 되는 것이다. 그리고 여러 비주얼 이팩트가 만연한 내용을 제시하는 수준이 되어버려 눈은 즐겁지만 의사소통 전달에는 부족함이 많아진다"고 말했다.

좋은 데이터 시각화에 필요한 특질들은 다음과 같다.
- 어려운 문제 풀기를 즐기고 데이터를 받아들여라
- 고객과 고객이 원하는 정보가 무엇인지에 대해 이해해야 한다.
- 인내심을 갖고 새로운 도구나 디스플레이 표기방법의 차이에 대해 이해해야 한다.
- 예술과 비주얼 디자인에 대한 이해와 관심이 있어야 한다.
- 수학, 공학, 통계, 경영, 재무 등으로 학위를 따야 한다
- 에드워드 투프테나 스페한 퓨가 등 고수들에게서 최고의 현장경험을 배워야 한다
- 좌뇌와 우뇌를 둘 다 사용할 수 있다는 두뇌 스킬
editor@itworld.co.kr