2013.09.27

칼럼 | 데이터 부자와 정보 거지...NSA 폭로·총기 난사 사건이 시사하는 빅 데이터 함정

Rob Enderle | CIO

이제 EU 최고 인권상 수상자 유력 후보에 오른 에드워드 스노든(Edward Snowden)의 NSA 민간인 감시 폭로 사건을 보자. 다음으로 미국에서 일어나는 대규모 총기 난사 사고들을 생각해보자.

전혀 관계 없어 보이는 두 이야기지만 사실 이 사례들은 빅 데이터 관련 문제의 핵심을 공유하고 있다. 우리는 흔히 애널리틱스나 결과물이 아닌, 데이터에 주목한다. 그러나 이런 방식을 취할 때, 의미 없는 솔루션을 개발하는 실수를 범할 수 있다. 그 결과가 유익할 가능성은 별로 없는 것이다.

빅 데이터 자체에 집착하면 결과물은 허술해진다
몇 개월 전 버락 오바마 재선 운동 본부의 CTO 하퍼 리드는 EMC 행사에서 빅 데이터 활동의 출발점은 데이터 애널리틱스여야 하며, 정보 수집보다 정보 활용 계획 수립을 우선시해야 한다고 역설했다.

리드는, 특히 프로젝트의 첫 단계에서는, '미니멀리즘'의 원칙에 유념해야 한다고 강조했다. 적은 데이터로 많은 일을 할 수 없는 이들이라면, 대량의 정보를 수집한다 해서 특별히 더 많은 가치를 발굴할 수 있지 못할 것이며, 오히려 복잡성 증대와 목표 혼동의 문제만을 겪을 것이라고 지적했다.

그러나 흥미로운 점은 리드의 이와 같은 이론을 토대로 재선에 성공한 오바마 행정부가 시민들의 개인 정보를 다룸에 있어서는 정반대의 행동을 취했다는 사실이다.

사실 우리는 강력해진 스토리지 파워에 취해 데이터 수집에 지나치게 집착해 왔고, 지금도 그러하다. 마치 최대한의 데이터를 수집하는 것이 오늘날의 시대 정신으로 보일 정도다. 이런 태도는 지난 20여 년을 데이터의 저장과 백업, 그리고 재저장 문제 해결에 집착하는 결과로 이어졌다.

미 정부는 빅 데이터 문제를 겪고 있다
일례로 미국 정부는 시민들의 출생, 체포, 학력, 봉사, 건강, 차량, 재직, 납세(소득세, 재산세, 부가가치세 등) 기록을 수집한다. 연방, 주, 혹은 지방 정부는 어쩌면 자신보다 더 많은 자신의 정보를 갖고 있다.

문제는 9/11 이후 이토록 막대한 정보를 분석할 수 있는 이가 아무도 없다는 점이다. 각각의 데이터는 각기 다른 시스템에 보관되었고, 이들 간에 공유는 거의 없다시피 했다.

사건 이후 발간된 '9/11 위원회 보고서(The 9/11 Commission Report)' 역시 그 시작을 시스템의 무능력에 대해 지적하고, 이를 극복해 위협을 확인하고 거기에 대응하기 위한 협력의 중요성을 강조하는 것으로 출발한다.

정부에겐 재난을 사전에 예측할 데이터가 모아져 있다는 것이 보고서가 기본적으로 강조하는 사항이다. 뿐만 아니라 정부에겐 항공기가 공격 당할 경우 그것의 운행을 중단할 자산 역시 존재한다고 보고서는 설명했다.

하지만, 결국 아무것도 실행된 것은 없었다. 한 마디로 '데이터 부자'지만 '정보 거지'다.

NSA, 우리는 그저 모든 데이터를 모을 뿐이다
조직적 협력의 부재 문제를 해결하기 위해 노력하는 대신(이는 절대적으로 데이터베이스를 구축하는 수고를 서로에게 떠넘기려는 알력 다툼의 문제라고 생각한다), 국가안보국(National Security Administration, NSA)은 막대한 규모의 개인 정보를 포착하는 작전을 시행했다.
일부는 NSA의 프로그램이 위헌이라 주장하기도 한다. 그러나, NSA가 구축한 데이터베이스와 그 위에 쌓고 있는 데이터들이 여타 정부의 정보 소스들과의 상호 검토에 폐쇄적이라는 점도 문제다.



2013.09.27

칼럼 | 데이터 부자와 정보 거지...NSA 폭로·총기 난사 사건이 시사하는 빅 데이터 함정

Rob Enderle | CIO

이제 EU 최고 인권상 수상자 유력 후보에 오른 에드워드 스노든(Edward Snowden)의 NSA 민간인 감시 폭로 사건을 보자. 다음으로 미국에서 일어나는 대규모 총기 난사 사고들을 생각해보자.

전혀 관계 없어 보이는 두 이야기지만 사실 이 사례들은 빅 데이터 관련 문제의 핵심을 공유하고 있다. 우리는 흔히 애널리틱스나 결과물이 아닌, 데이터에 주목한다. 그러나 이런 방식을 취할 때, 의미 없는 솔루션을 개발하는 실수를 범할 수 있다. 그 결과가 유익할 가능성은 별로 없는 것이다.

빅 데이터 자체에 집착하면 결과물은 허술해진다
몇 개월 전 버락 오바마 재선 운동 본부의 CTO 하퍼 리드는 EMC 행사에서 빅 데이터 활동의 출발점은 데이터 애널리틱스여야 하며, 정보 수집보다 정보 활용 계획 수립을 우선시해야 한다고 역설했다.

리드는, 특히 프로젝트의 첫 단계에서는, '미니멀리즘'의 원칙에 유념해야 한다고 강조했다. 적은 데이터로 많은 일을 할 수 없는 이들이라면, 대량의 정보를 수집한다 해서 특별히 더 많은 가치를 발굴할 수 있지 못할 것이며, 오히려 복잡성 증대와 목표 혼동의 문제만을 겪을 것이라고 지적했다.

그러나 흥미로운 점은 리드의 이와 같은 이론을 토대로 재선에 성공한 오바마 행정부가 시민들의 개인 정보를 다룸에 있어서는 정반대의 행동을 취했다는 사실이다.

사실 우리는 강력해진 스토리지 파워에 취해 데이터 수집에 지나치게 집착해 왔고, 지금도 그러하다. 마치 최대한의 데이터를 수집하는 것이 오늘날의 시대 정신으로 보일 정도다. 이런 태도는 지난 20여 년을 데이터의 저장과 백업, 그리고 재저장 문제 해결에 집착하는 결과로 이어졌다.

미 정부는 빅 데이터 문제를 겪고 있다
일례로 미국 정부는 시민들의 출생, 체포, 학력, 봉사, 건강, 차량, 재직, 납세(소득세, 재산세, 부가가치세 등) 기록을 수집한다. 연방, 주, 혹은 지방 정부는 어쩌면 자신보다 더 많은 자신의 정보를 갖고 있다.

문제는 9/11 이후 이토록 막대한 정보를 분석할 수 있는 이가 아무도 없다는 점이다. 각각의 데이터는 각기 다른 시스템에 보관되었고, 이들 간에 공유는 거의 없다시피 했다.

사건 이후 발간된 '9/11 위원회 보고서(The 9/11 Commission Report)' 역시 그 시작을 시스템의 무능력에 대해 지적하고, 이를 극복해 위협을 확인하고 거기에 대응하기 위한 협력의 중요성을 강조하는 것으로 출발한다.

정부에겐 재난을 사전에 예측할 데이터가 모아져 있다는 것이 보고서가 기본적으로 강조하는 사항이다. 뿐만 아니라 정부에겐 항공기가 공격 당할 경우 그것의 운행을 중단할 자산 역시 존재한다고 보고서는 설명했다.

하지만, 결국 아무것도 실행된 것은 없었다. 한 마디로 '데이터 부자'지만 '정보 거지'다.

NSA, 우리는 그저 모든 데이터를 모을 뿐이다
조직적 협력의 부재 문제를 해결하기 위해 노력하는 대신(이는 절대적으로 데이터베이스를 구축하는 수고를 서로에게 떠넘기려는 알력 다툼의 문제라고 생각한다), 국가안보국(National Security Administration, NSA)은 막대한 규모의 개인 정보를 포착하는 작전을 시행했다.
일부는 NSA의 프로그램이 위헌이라 주장하기도 한다. 그러나, NSA가 구축한 데이터베이스와 그 위에 쌓고 있는 데이터들이 여타 정부의 정보 소스들과의 상호 검토에 폐쇄적이라는 점도 문제다.



X