2015.07.09

IDG 블로그 | 100년 동안 유행한 그 단어, '빅데이터'

Andy Cotgreave | Computerworld
시각화 분석과 데이터 과학이 뜨거운 주제로 부상하고 있다. 그 어느 때보다도 많은 데이터가 생성되고 있으며, 사람들은 최신 데이터를 빠르고 효율적으로 찾는 방법과 세상을 바꾸기 위해서는 어떤 행동을 취해야 하는지 알고 싶어한다. 사람들은 이를 두고 빅데이터의 시대가 도래했다며, 새로운 패러다임이 형성되고 있다고 말한다. 그러나 사실 데이터를 분석하고 온전히 이해하려는 차원에서 봤을 때 이 개념은 지난 100년 전부터 이미 뜨거운 이슈였다.

지난 1914년,뉴욕의 윌러드 브린턴은 “도해식의 사실 제시법(Graphic Methods for Presenting Facts)”이라는 데이터를 전하는 이론에 관한 첫 번째 책을 썼다. 브린턴은 “매년 수백만 달러의 자금이 데이터를 모으는 데 사용되고 있다”고 말했다. 그 당시 최첨단의 펀치 카드 프로세싱 기기를 이용하는 사람들은 그전보다도 더 많은 데이터를 다룰 수 있었는데, 대략 시간당 3,000개의 레코드 수준이었다.

정보를 처리하고 전달하는 것은 그 당시에도 매우 중요했다. 브린턴은 “작은 두뇌에 정보와 사실을 무조건 많이 주입한다고 해서 해결되는 문제는 아니다”고 말했다. 브린턴은 빅데이터를 이해하기 쉽고, 행동으로 옮길 수 있는 분석력으로 도출하는 사람이 가장 성공할 것이라고 깨달은 것이다.

시각화 분석에 대한 브린턴의 책은 오늘날에도 주효하다. 그가 처음 책을 발행한 후로 101년이 흐른 지금, 필자에게도 지대한 영향을 미치고 있다. 그러나 시각화 이론이 여전히 괄시를 받고 있으며, 잘 알려지지 않았다는 점에 놀라고는 한다.

항상 문제는 같다. 인간이 만들어내는 데이터는 지금도 늘어나고 있다. 데이터를 저장하고 처리하고, 분석하는 도구도 늘어나고 있다. 이러한 도구는 우리가 구현하고자 하는 수준보다 다소 뒤처진다는 느낌마저 든다. 사실 이것이 현실이며, 마케터들이 빅데이터를 포장해왔다는 것이 현실이고, 과거와 크게 다른 것은 없다.

효과적인 데이터 커뮤니케이션을 위한 지침은 익히기 쉬우며, 학술 연구 단체로부터의 투자도 늘어나고 있다. 하지만 1914년 브린턴이 지적했던 문제를 여전히 범하고 있다.

오늘날과도 연관이 된 부분을 브린턴의 책 속에서 몇 가지 찾아봤다.

첫 번째, 브린턴은 올바른 차트를 선택해야 한다고 역설했다. 책 도입부에서 브린턴은 파이 차트와 레이어 차트에 대한 반감을 드러내며, “고대 유물은 버리라”고 주문하기까지 했다. 막대나 선 그래프가 옳다고 생각한다면, 면적 그래프는 사용하지 않는 것이 좋다. 항상 0에서 축을 그리는 것이 좋다. 이 속에는 현대인이 읽어도 괜찮을 만한 좋은 가이드라인이 기재돼 있다.

두 번째, 100년 전 브린턴은 상호작용성이 중요하다는 것을 예견하고 있었다. 오늘날 우리는 데이터와의 상호 작용을 위해 드래그 앤 드롭을 한다. 그러나 브린턴은 데이터 집합에서 서로 다른 예측을 하기 위해 테이블 주변으로 작은 데이터 구역을 옮길 수 있게 하는 인덱스카드 시스템을 예상했다. 데이터를 통해 서로 다른 예측을 해보는 것은 오늘날에도 여전히 중요한 이슈다.

세 번째, 브린턴은 데이터 커뮤니케이션 업무를 담당하는 사람을 위한 체크리스트도 소개했다. 애널리스트의 책상 앞에 한 장씩 인쇄해서 붙여놓아도 좋다. 데이터를 표현하는 방식에 대한 자신만의 생각과 인사이트를 적용한다면, 데이터 커뮤니케이션 수준이 더욱 높아질 것이다.

브린턴이 책을 발행한 지 100년이 넘었지만, 시각적 판단능력은 여전히 중요한 문제다. 일부 과제들은 최근들어 새롭게 부상한 것이지만, 아이디어와 기회, 도전 과제를 배우고, 공유하고, 이를 토론할 수 있는 플랫폼이 있으니 문제없다고 생각한다. 시간이 지나면 모든 사회의 시각적 판단능력을 높일 수 있다고 본다. editor@itworld.co.kr 


2015.07.09

IDG 블로그 | 100년 동안 유행한 그 단어, '빅데이터'

Andy Cotgreave | Computerworld
시각화 분석과 데이터 과학이 뜨거운 주제로 부상하고 있다. 그 어느 때보다도 많은 데이터가 생성되고 있으며, 사람들은 최신 데이터를 빠르고 효율적으로 찾는 방법과 세상을 바꾸기 위해서는 어떤 행동을 취해야 하는지 알고 싶어한다. 사람들은 이를 두고 빅데이터의 시대가 도래했다며, 새로운 패러다임이 형성되고 있다고 말한다. 그러나 사실 데이터를 분석하고 온전히 이해하려는 차원에서 봤을 때 이 개념은 지난 100년 전부터 이미 뜨거운 이슈였다.

지난 1914년,뉴욕의 윌러드 브린턴은 “도해식의 사실 제시법(Graphic Methods for Presenting Facts)”이라는 데이터를 전하는 이론에 관한 첫 번째 책을 썼다. 브린턴은 “매년 수백만 달러의 자금이 데이터를 모으는 데 사용되고 있다”고 말했다. 그 당시 최첨단의 펀치 카드 프로세싱 기기를 이용하는 사람들은 그전보다도 더 많은 데이터를 다룰 수 있었는데, 대략 시간당 3,000개의 레코드 수준이었다.

정보를 처리하고 전달하는 것은 그 당시에도 매우 중요했다. 브린턴은 “작은 두뇌에 정보와 사실을 무조건 많이 주입한다고 해서 해결되는 문제는 아니다”고 말했다. 브린턴은 빅데이터를 이해하기 쉽고, 행동으로 옮길 수 있는 분석력으로 도출하는 사람이 가장 성공할 것이라고 깨달은 것이다.

시각화 분석에 대한 브린턴의 책은 오늘날에도 주효하다. 그가 처음 책을 발행한 후로 101년이 흐른 지금, 필자에게도 지대한 영향을 미치고 있다. 그러나 시각화 이론이 여전히 괄시를 받고 있으며, 잘 알려지지 않았다는 점에 놀라고는 한다.

항상 문제는 같다. 인간이 만들어내는 데이터는 지금도 늘어나고 있다. 데이터를 저장하고 처리하고, 분석하는 도구도 늘어나고 있다. 이러한 도구는 우리가 구현하고자 하는 수준보다 다소 뒤처진다는 느낌마저 든다. 사실 이것이 현실이며, 마케터들이 빅데이터를 포장해왔다는 것이 현실이고, 과거와 크게 다른 것은 없다.

효과적인 데이터 커뮤니케이션을 위한 지침은 익히기 쉬우며, 학술 연구 단체로부터의 투자도 늘어나고 있다. 하지만 1914년 브린턴이 지적했던 문제를 여전히 범하고 있다.

오늘날과도 연관이 된 부분을 브린턴의 책 속에서 몇 가지 찾아봤다.

첫 번째, 브린턴은 올바른 차트를 선택해야 한다고 역설했다. 책 도입부에서 브린턴은 파이 차트와 레이어 차트에 대한 반감을 드러내며, “고대 유물은 버리라”고 주문하기까지 했다. 막대나 선 그래프가 옳다고 생각한다면, 면적 그래프는 사용하지 않는 것이 좋다. 항상 0에서 축을 그리는 것이 좋다. 이 속에는 현대인이 읽어도 괜찮을 만한 좋은 가이드라인이 기재돼 있다.

두 번째, 100년 전 브린턴은 상호작용성이 중요하다는 것을 예견하고 있었다. 오늘날 우리는 데이터와의 상호 작용을 위해 드래그 앤 드롭을 한다. 그러나 브린턴은 데이터 집합에서 서로 다른 예측을 하기 위해 테이블 주변으로 작은 데이터 구역을 옮길 수 있게 하는 인덱스카드 시스템을 예상했다. 데이터를 통해 서로 다른 예측을 해보는 것은 오늘날에도 여전히 중요한 이슈다.

세 번째, 브린턴은 데이터 커뮤니케이션 업무를 담당하는 사람을 위한 체크리스트도 소개했다. 애널리스트의 책상 앞에 한 장씩 인쇄해서 붙여놓아도 좋다. 데이터를 표현하는 방식에 대한 자신만의 생각과 인사이트를 적용한다면, 데이터 커뮤니케이션 수준이 더욱 높아질 것이다.

브린턴이 책을 발행한 지 100년이 넘었지만, 시각적 판단능력은 여전히 중요한 문제다. 일부 과제들은 최근들어 새롭게 부상한 것이지만, 아이디어와 기회, 도전 과제를 배우고, 공유하고, 이를 토론할 수 있는 플랫폼이 있으니 문제없다고 생각한다. 시간이 지나면 모든 사회의 시각적 판단능력을 높일 수 있다고 본다. editor@itworld.co.kr 


X