소셜미디어 / 애플리케이션

SNS 데이터, 소유권 분쟁

Paul Krill | InfoWorld 2011.03.11
하둡(Hadoop)과 다른 대용량 데이터 기술은, 종종 사용자의 명확한 동의를 받지 않은 채 사용자의 소셜 활동을 분석해 준다.
 
최근 유행하는 대용량 데이터의 개념은 페이스북과 트위터에 포스팅되는 비정형 정보를 포함하여 일반적으로 끝없이 증가하는 데이터 집합과 사업 기회를 창출하기 위해 모든 것으로부터 지식을 수집하는 것을 의미한다. 그러나 여기에는 잠재된 위험요소가 있다. 사용자가 인터넷에 자기 자신을 공개한 후 정확히 '누가 모든 이 데이터를 소유하고 있느냐'는 문제다.
 
대용량 데이터는 컴퓨팅 플랫폼에 분산되어 있는 아파치 하둡(Apache Hadoop)과 같은 기술과 관련이 있고 IBM등의 몇몇 기술 업체들에 의해 주로 활용되고 있다. 그러나 기가옴(GigaOm)의 애널리스트 데릭 해리스는 “대용량 데이터라는 용어가 오해의 소지가 있고 대용량 데이터의 원천은 소셜 네트워크와 휴대폰 등 다른 소스”라며 “대용량 데이터는 센서, 컴퓨터, 웹에서 유입된다”고 주장했다.
 
대용량 데이터에 대한 IT와 경영 부서들의 커다란 관심으로 인해 “대용량 데이터는 이제 막 활용될 수 있게 되었고 대용량 데이터로 무엇인가를 할 수 있게 되었다”며 본질적으로 대용량 데이터를 분석할 수 있게 되었다고 해리스는 말했다. 모질라(Moizilla)의 개발자 크라스챤 헤일만은 “대용량 데이터와 관련하여 중요한 점은 우리가 상당한 양의 정보를 축적하고 유전자 정보 분석 혹은 정부 데이터 제공과 같이 선의의 목적으로 그것을 사용할 수 있는 곳에서 시스템을 보유하고 있다는 것”이라고 말했다. 그리고 헤일만은 “비즈니스 애널리스트들이 하둡과 같은 기술을 사용하여 한 시간 동안 서버를 대여한 후 대규모 데이터를 연구할 수 있다”고 말했다.
 
대용량 데이터에 대한 관심이 증가하고 있는 상황에서 벤더들이 대용량 데이터를 활용하기 위한 움직임도 활발하게 나타나고 있다. IBM이 데이터 웨어하우스 어플라이언스 업체인 네테자(Netezza)를 17억 달러에 인수한 것도 이러한 맥락으로 볼 수 있다. 테라데이터타 역시 비정형 데이터에 대한 고급 분석과 관리 서비스를 제공하는 신생 데이터 웨어하우징 업체 아스타 데이터 시스템즈(Aster Data Systems)를 인수했다.
 
소셜 네트워크에서의 대용량 데이터 마이닝(Mining)
 
에코(Echo)와 클라우데라(Cloudera) 같은 업체들은 대용량 데이터와 소셜 네트워크 데이터 분야에서 틈새 시장을 찾고 있다. 에코의 크리스 사드 전략 부문 부회장은 “수 백만 달러 규모 업체들이 현재 사업을 영위하고 있는 대용량 데이터는 액티브 데이터와 관련한 것들”이라고 말했다. IT 기업들과 개별 사용자들은 데이터 수집이 현저히 증가함에 따라 제공되는 대용량 데이터의 종류도 증가할 것이라고 확신하고 있다.
 
예를 들어, 미디어 업체와 광고 에이전시 같은 업체들에 서비스를 제공중인 에코의 스트림서버(StreamServer)는 고객과 관련한 소셜 미디어 데이터를 단일 스트림으로 제공한다. 고객사로 로이터(Reuters)를 확보한 에코는 고객사의 웹 사이트뿐만 아니라 트위터와 페이스북과 같은 사이트에서 고객사의 데이터를 수집한다. 그러면 고객은 그러한 데이터에 대한 실시간 환경을 구축할 수 있다. 고객들은 포럼과 라이브 블로그와 같은 애플리케이션을 개발하기 위해 ‘대규모의 통합 데이터 집합’을 얻게 되는 것이다.
 
클라우데아는 데이터 관리를 위한 플랫폼 기능을 제공하는 자사 고유의 하둡 배포판을 제공하고 있고 클라우데아 엔터프라이즈(Cloudera Enterprise) 제품은 대규모 데이터 스토리지와 분석 기능을 제공한다. 클라우데아의 CTO 아므르 아와댈라는 자사의 하둡 배포판을 사용함으로써 기업들은 소셜 데이터를 수집하고 통합할 수 있고 중앙의 데이터 저장소에 그러한 데이터를 저장할 수 있다고 말했다. 그러면 사용자들은 새로운 관계와 같은 요인을 살펴보기 위한 목적으로 데이터를 분석하기 위해 맵리듀스(MapReduce)를 실행할 수 있다.
 
그러나 누가 데이터를 소유하는가?
 
모질라의 개발자 헤일만은 “웹에 축적된 모든 데이터 또는 실시간 데이터가 바로 대용량 데이터”라며 “여기서 놓치지 말아야 할 이슈는 이 데이터를 과연 누가 갖느냐 하는 것”이라고 지적했다.   
 
헤일만은 “페이스북과 같은 사이트가 제공하는 속도와 인터페이스의 현란함으로 사람들은 자신이 무엇을 하고 있는지 깨닫지 못한 채 자신의 정보를 넘겨주고 있는 것 같다”고 말했다. 예를 들어, 사람들이 자신의 술 취한 자신의 사진을 업로드 한 경우 차후에 잠재적인 고용주가 그러한 사진을 살펴볼 수도 있는 것이다.
 
헤일만은 “진짜 심각한 문제는 바로 인터넷에서 무언가를 삭제하는 것”이라며 “사람들이 인터넷에 무언가를 올리자마자, 그것이 캐쉬되고, 어딘가에 복사되기 때문에 인터넷에 무언가를 올릴 때 심사숙고 해야 한다”고 강조했다.
 
기가옴의 애널리스트 해리스는 데이터의 소유권은 환경에 따라 다르다는 의견을 내놓았다. 해리스는 “데이터를 생성하는 업체들이 해당 데이터에 대한 명백한 소유권을 갖는다”고 주장했다.  
 
비록 웹에는 공공 소유의 데이터가 있지만, 페이스북과 트위터는 사용자들이 생성한 데이터를 소유한다고 해리스는 말했다. 그리고 그는, 예를 들어, 데이터 마켓플레이스와 같은 대용량 데이터의 개념으로 기업들은 한 번에 한 달 동안 트위터의 스트림을 분석한다며 “만약 당신이 데이터를 활용하고 분석하고자 한다면 이용할 수 있는 데이터는 여기저기 널려있다”고 말했다.
 
클라우데아의 책임자는 “누가 비정형 데이터를 소유하는가의 문제는 대답하기 어려운 것”이라며 “애플의 앱 스토어에서 고객 구매 정보와 같은 데이터는 애플이 소유한다”고 말했다. 그리고 이 책임자는 “비록 구글이 사용자에게 데이터 삭제권을 제공하지만 여전히 데이터 자체는 구글의 소유한다”고 덧붙였다.
 
그러므로 소셜 네트워크 데이터를 포팅하기 위한 데이터 포터빌리티 프로젝트(Data Portability Project)는 사용자가 자기 자신의 데이터를 소유하고 소셜 네트워크는 사용자가 그것을 이동하기 쉽도록 만들어야 한다는 것이 권장사항이다. 데이터 포터빌리티 프로젝트의 공동 설립자 역할도 겸하고 있는 에코의 사드 부회장은 “데이터가 업로드된 후 사용자들이 무엇을 할 수 있는지에 대해 사이트들이 공개하는 사례가 많아지고 있다”고 설명했다.
 
사드 부회장은 “몇몇 사례에서 사용자들은 그들이 사용하고 있는 온라인 서비스와 자신의 데이터에 대한 소유권과 보관을 공유하고 있다”고 지적하면서 “이는 마치 은행에 있는 돈과 같다”고 말했다. 사드 부회장은 “돈을 소유한 것은 예금주이지만, 예금주를 대신해 돈의 사용하고 보호하는 권한은 은행에 있는 것과 같다”고 풀이했다.
 
이러한 이슈는 프라이버시에 관한 것만은 아니다. 대용량 데이터 개념 중 한가지는 트렌드, 사업 기회, 시장 동향, 잠재적 고객, 그리고 고객 분류 등을 파악하기 위해 여러 소스로부터 데이터를 분석하는 것이다. 대용량 데이터 툴을 사용하여 웹에서 이용 가능한 정보를 분석할 때, 기업들이 콘텐츠를 올린 사람의 동의 없이 정보를 분석할 권리를 진짜로 가지고 있는지에 대해 다시 한번 짚고 넘어가야 한다.
 
사드 부회장은 “만약 누군가가 공공 인터넷에서 콘텐츠를 올리면, 사람들이 자신의 데이터가 투표되고 처리되며 색인되고 사용되도 좋다는 일종의 사회적 계약을 맺은 것을 간주해야 한다”고 주장했다. 사드 부회장은 “그러나 페이스북이 사적인 네트워크가 되어 사용자 정보의 어느 부분이 공개될 수 있는가의 경계를 지속적으로 살펴보는 것은 다른 이야기”라며 “공개하지 않겠다고 밝힌 정보를 공개하는 것은 사회적인 계약을 위반한 것”이라고 덧붙였다. editor@itworld.co.kr
Sponsored

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.