2011.03.11

대용량 데이터 마이닝: SNS 데이터 소유권은?

Paul Krill | InfoWorld
 
최근 유행하고 있는 대용량 데이터(Big Data)의 개념은 비즈니스 기회를 창출하기 위해 페이스북과 트위터에 포스팅되는 비정형 정보까지 포함한 모든 것으로부터 지식을 수집하는 것을 의미한다. 그러나 이러한 개념에는 정확히 누가 모든 이런 데이터를 소유하고 있는가라는 문제를 제기할 수 있다는 위험도 존재한다.
 
기가옴(GigaOm)의 데릭 해리스 애널리스트는 “대용량 데이터”라는 용어에 대해 약간 오해의 소지가 있다. 현재 논의되는 대용량 데이터의 원천은 소셜 네트워크와 휴대폰 등이라고 설명했다.
 
그는 이어 대용량 데이터에 대한 IT와 경영 부서들의 관심으로 인해 “대용량 데이터는 이제야 활용될 수 있게 되었다”라며 이제 갓 본질적으로 대용량 데이터를 분석할 수 있게 된 상황이라고 말했다.
 
모질라의 크라스챤 헤일만 개발자는 “지금까지는 인간 게놈 정보 분석 혹은 정부 데이터 제공과 같이 선의의 목적으로 그것을 사용할 수 있는 곳에서 대용량 데이터 분석 시스템을 보유하고 있었다”라고 말했다. 그는 비즈니스 애널리스트들이 하둡과 같은 기술을 사용하여 한 시간 동안 대여한 서버를 활용한 후 대규모 데이터를 연구할 수 있었다는 점을 덧붙였다.
 
대용량 데이터에 대한 관심이 증가하고 있는 상황에서 벤더들이 대용량 데이터를 활용하기 위한 움직임을 보이고 있다는 것은 새삼스러운 것이 아니다. IBM은 데이터 웨어하우스 어플라이언스 업체인 네테자(Netezza)를 17억 달러에 인수했다. 또 테라데이터는 비정형 데이터에 대한 고급 분석과 관리 서비스를 제공하는 신생 데이터 웨어하우징 업체 아스타 데이터 시스템즈를 인수했다.
 
소셜 네트워크에서의 대용량 데이터 마이닝
에코와 클라우데라 같은 업체들은 대용량 데이터와 소셜 네트워크 데이터 분야에서 틈새 시장을 찾고 있다. 에코의 크리스 사드 전략 부문 부회장은 “이러한 수백만 달러 규모 업체들이 현재 사업을 진행 중인 대용량 데이터 분야는 활동 데이터와 관련한 것들이다”라고 설명했다.
 
IT 기업들과 개별 사용자들은 데이터 수집이 현저히 증가함에 따라 제공되는 대용량 데이터의 종류도 증가할 것이라고 확신하고 있다. 예를 들어, 미디어 업체와 광고 에이전시 같은 업체들에 서비스를 제공중인 에코의 스트림서버는 고객과 관련한 소셜 미디어 데이터를 단일 스트림으로 제공한다.
 
고객사로 로이터를 확보하고 있는 에코는 고객사의 웹 사이트뿐만 아니라 트위터와 페이스북과 같은 사이트에서 고객사의 데이터를 수집한다. 그러면 고객은 그러한 데이터에 대한 실시간 환경을 구축할 수 있다. 고객들은 포럼과 라이브 블로그와 같은 애플리케이션을 개발하기 위해 “대규모의 통합 데이터 집합”을 얻게 되는 것이다.
 


2011.03.11

대용량 데이터 마이닝: SNS 데이터 소유권은?

Paul Krill | InfoWorld
 
최근 유행하고 있는 대용량 데이터(Big Data)의 개념은 비즈니스 기회를 창출하기 위해 페이스북과 트위터에 포스팅되는 비정형 정보까지 포함한 모든 것으로부터 지식을 수집하는 것을 의미한다. 그러나 이러한 개념에는 정확히 누가 모든 이런 데이터를 소유하고 있는가라는 문제를 제기할 수 있다는 위험도 존재한다.
 
기가옴(GigaOm)의 데릭 해리스 애널리스트는 “대용량 데이터”라는 용어에 대해 약간 오해의 소지가 있다. 현재 논의되는 대용량 데이터의 원천은 소셜 네트워크와 휴대폰 등이라고 설명했다.
 
그는 이어 대용량 데이터에 대한 IT와 경영 부서들의 관심으로 인해 “대용량 데이터는 이제야 활용될 수 있게 되었다”라며 이제 갓 본질적으로 대용량 데이터를 분석할 수 있게 된 상황이라고 말했다.
 
모질라의 크라스챤 헤일만 개발자는 “지금까지는 인간 게놈 정보 분석 혹은 정부 데이터 제공과 같이 선의의 목적으로 그것을 사용할 수 있는 곳에서 대용량 데이터 분석 시스템을 보유하고 있었다”라고 말했다. 그는 비즈니스 애널리스트들이 하둡과 같은 기술을 사용하여 한 시간 동안 대여한 서버를 활용한 후 대규모 데이터를 연구할 수 있었다는 점을 덧붙였다.
 
대용량 데이터에 대한 관심이 증가하고 있는 상황에서 벤더들이 대용량 데이터를 활용하기 위한 움직임을 보이고 있다는 것은 새삼스러운 것이 아니다. IBM은 데이터 웨어하우스 어플라이언스 업체인 네테자(Netezza)를 17억 달러에 인수했다. 또 테라데이터는 비정형 데이터에 대한 고급 분석과 관리 서비스를 제공하는 신생 데이터 웨어하우징 업체 아스타 데이터 시스템즈를 인수했다.
 
소셜 네트워크에서의 대용량 데이터 마이닝
에코와 클라우데라 같은 업체들은 대용량 데이터와 소셜 네트워크 데이터 분야에서 틈새 시장을 찾고 있다. 에코의 크리스 사드 전략 부문 부회장은 “이러한 수백만 달러 규모 업체들이 현재 사업을 진행 중인 대용량 데이터 분야는 활동 데이터와 관련한 것들이다”라고 설명했다.
 
IT 기업들과 개별 사용자들은 데이터 수집이 현저히 증가함에 따라 제공되는 대용량 데이터의 종류도 증가할 것이라고 확신하고 있다. 예를 들어, 미디어 업체와 광고 에이전시 같은 업체들에 서비스를 제공중인 에코의 스트림서버는 고객과 관련한 소셜 미디어 데이터를 단일 스트림으로 제공한다.
 
고객사로 로이터를 확보하고 있는 에코는 고객사의 웹 사이트뿐만 아니라 트위터와 페이스북과 같은 사이트에서 고객사의 데이터를 수집한다. 그러면 고객은 그러한 데이터에 대한 실시간 환경을 구축할 수 있다. 고객들은 포럼과 라이브 블로그와 같은 애플리케이션을 개발하기 위해 “대규모의 통합 데이터 집합”을 얻게 되는 것이다.
 


X