2012.11.13

하둡 내 빅 데이터 보호 방법

Thor Olavsrud | CIO
빅 데이터는 조직들이 자신의 비즈니스, 고객, 환경에 있어 이전까지는 상상만 해왔던 수준까지 이해도를 높여줄 것을 약속한다.
 
비즈니스가 데이터 기반의 서버들로 전환되고, 기업이 보유한 데이터가 경쟁우위를 점할 주요요인이 되어가면서, 빅 데이터가 가진 잠재력은 엄청나다. 그 결과, 데이터와 인프라 모두의 보안이 그 어느 때보다 중요해졌다.
 
잃어버리면 오히려 독이 되는 빅 데이터
비교우위를 제공하는 데이터의 경우, 그 보안은 명백하다. 그 데이터를 잃어버리거나, 경쟁업체의 손에 들어가게 되면 자신만의 경쟁우위는 사라진다. 더 나쁜 점은, 이점이 사라지는 것에서 그치지 않고 골치거리가 될 수도 있다.
 
포레스터 리서치의 표현을 빌리면, 많은 경우에서 조직들은 이런 데이터들을 '독성 데이터(toxic data)'로 받아들일 수 있다. 
 
예를 들어, 이용자 행동에 대한 통찰을 얻는데 사용될 수 있는 데이터- 누가 어느 기지국에 로그온하고, 그들이 얼마나 오랫동안 온라인 상태를 유지하고, 얼마나 많은 데이터를 사용하며, 그들이 이동 중인지 아니면 서있는 지 등-들을 수집하는 이동통신업체를 떠올려보라.
 
경쟁 이동통신업체 역시 막대한 양의 이용자 생성 데이터를 갖고 있을 것이다. 신용카드 번호, 주민등록번호, 구매 습관 데이터, 이용 패턴 등 인간이 스스로 선택한 경험에서 나온 모든 정보들이 여기 해당된다. 
 
이런 데이터의 상관관계를 보여주고 이것에서 추론을 얻는 능력은 소중하지만, 그 연관된 데이터가 조직 밖으로 흘러나가 다른 누군가의 손에 들어가면 해당 개인과 조직 모두에게 치명적일 수 있기 때문에, 그 반대 급부 또한 막대하다.
 
빅 데이터, 컴플라이언스와 제어권을 잊지 말라
미국 텍사스 오스틴 소재 데이터 보안 솔루션 업체 가장(Gazzang) CEO 래리 워녹은 "지금까지 접해 본 대부분의 빅 데이터 프로젝트들은 대체로 산만해 보였다"고 말했다. 
 
워녹은 "이 데이터에 접속하려는 경쟁이 치열한데 비해, 몇몇 전통적인 컴플라이언스와 제어권은 프로젝트의 후순위로 밀려난 듯한 모습이다. 기본 베스트 프랙티스를 망각할 정도로 너무 빠르게 가고 있다면, 회사는 갈피를 잡지 못하게 된다"고 설명했다.
 
가장 CTO 더스틴 커크랜드는 "하둡(Hadoop)과 유사 NoSQL 데이터 스토어들은 크기에 상관없이 어느 조직이든, 막대한 데이터세트를 수집, 관리, 분석하도록 해 주지만, 이 신생 기술들은 포괄적인 보안을 염두에 두고 설계된 것이 아니기 때문에 이런 저장소들이 인기와 크기를 커져갈수록, 민감한 데이터가 저장되고 휩쓸릴 가능성이 높아진다"고 덧붙였다. 
 
빅 데이터 보안의 9가지 팁
자사의 빅 데이터를 안전하게 할 수 있는 세부 절차는 다음과 같다. 
 
1. 빅 데이터 프로젝트를 시작하기 전에 보안을 염두에 둬라. 
소잃고 외양간 고치는 상황이 발생하면 이미 늦듯이, 데이터 유출 사건이 일어나기 전에 데이터 보안을 강화해야 한다. IT 보안팀과 빅 데이터 프로젝트에 연관된 다른 이들이 하둡 클러스터에 기업 데이터를 설치하고 피드하기에 앞서, 심각하게 데이터 보안에 대해 논의해야 한다.
 


2012.11.13

하둡 내 빅 데이터 보호 방법

Thor Olavsrud | CIO
빅 데이터는 조직들이 자신의 비즈니스, 고객, 환경에 있어 이전까지는 상상만 해왔던 수준까지 이해도를 높여줄 것을 약속한다.
 
비즈니스가 데이터 기반의 서버들로 전환되고, 기업이 보유한 데이터가 경쟁우위를 점할 주요요인이 되어가면서, 빅 데이터가 가진 잠재력은 엄청나다. 그 결과, 데이터와 인프라 모두의 보안이 그 어느 때보다 중요해졌다.
 
잃어버리면 오히려 독이 되는 빅 데이터
비교우위를 제공하는 데이터의 경우, 그 보안은 명백하다. 그 데이터를 잃어버리거나, 경쟁업체의 손에 들어가게 되면 자신만의 경쟁우위는 사라진다. 더 나쁜 점은, 이점이 사라지는 것에서 그치지 않고 골치거리가 될 수도 있다.
 
포레스터 리서치의 표현을 빌리면, 많은 경우에서 조직들은 이런 데이터들을 '독성 데이터(toxic data)'로 받아들일 수 있다. 
 
예를 들어, 이용자 행동에 대한 통찰을 얻는데 사용될 수 있는 데이터- 누가 어느 기지국에 로그온하고, 그들이 얼마나 오랫동안 온라인 상태를 유지하고, 얼마나 많은 데이터를 사용하며, 그들이 이동 중인지 아니면 서있는 지 등-들을 수집하는 이동통신업체를 떠올려보라.
 
경쟁 이동통신업체 역시 막대한 양의 이용자 생성 데이터를 갖고 있을 것이다. 신용카드 번호, 주민등록번호, 구매 습관 데이터, 이용 패턴 등 인간이 스스로 선택한 경험에서 나온 모든 정보들이 여기 해당된다. 
 
이런 데이터의 상관관계를 보여주고 이것에서 추론을 얻는 능력은 소중하지만, 그 연관된 데이터가 조직 밖으로 흘러나가 다른 누군가의 손에 들어가면 해당 개인과 조직 모두에게 치명적일 수 있기 때문에, 그 반대 급부 또한 막대하다.
 
빅 데이터, 컴플라이언스와 제어권을 잊지 말라
미국 텍사스 오스틴 소재 데이터 보안 솔루션 업체 가장(Gazzang) CEO 래리 워녹은 "지금까지 접해 본 대부분의 빅 데이터 프로젝트들은 대체로 산만해 보였다"고 말했다. 
 
워녹은 "이 데이터에 접속하려는 경쟁이 치열한데 비해, 몇몇 전통적인 컴플라이언스와 제어권은 프로젝트의 후순위로 밀려난 듯한 모습이다. 기본 베스트 프랙티스를 망각할 정도로 너무 빠르게 가고 있다면, 회사는 갈피를 잡지 못하게 된다"고 설명했다.
 
가장 CTO 더스틴 커크랜드는 "하둡(Hadoop)과 유사 NoSQL 데이터 스토어들은 크기에 상관없이 어느 조직이든, 막대한 데이터세트를 수집, 관리, 분석하도록 해 주지만, 이 신생 기술들은 포괄적인 보안을 염두에 두고 설계된 것이 아니기 때문에 이런 저장소들이 인기와 크기를 커져갈수록, 민감한 데이터가 저장되고 휩쓸릴 가능성이 높아진다"고 덧붙였다. 
 
빅 데이터 보안의 9가지 팁
자사의 빅 데이터를 안전하게 할 수 있는 세부 절차는 다음과 같다. 
 
1. 빅 데이터 프로젝트를 시작하기 전에 보안을 염두에 둬라. 
소잃고 외양간 고치는 상황이 발생하면 이미 늦듯이, 데이터 유출 사건이 일어나기 전에 데이터 보안을 강화해야 한다. IT 보안팀과 빅 데이터 프로젝트에 연관된 다른 이들이 하둡 클러스터에 기업 데이터를 설치하고 피드하기에 앞서, 심각하게 데이터 보안에 대해 논의해야 한다.
 


X