소셜미디어

IBM, 기업 개발자 위한 트위터 분석 방법 공개

Joab Jackson | IDG News Service 2015.02.26
트위터는 전 세계 대중들의 대화를 실시간으로 확인할 수 있기 때문에 기업에게 훌륭한 정보원이다. IBM은 트위터의 복잡하고 정신없는 데이터에서 가치있는 정보를 발굴하는 새로운 방법을 고안해 공개했다.

이번주 라스베이거스에서 열린 IBM 인터커넥트(InterConnect) 컨퍼런스에서 IBM은 트위터 데이터를 재사용 및 분석하기 위해 데이터를 어떻게 가공하는지 상세하게 밝혔다. 이는 지난 10월 IBM이 트위터의 모든 메시지에 접근할 수 있도록 한 트위터와의 파트너십 결과물이다.

IBM의 왓슨 분석 서비스 책임자인 린다 헌트는 발표 중에 “이제 개발자들은 수백만명의 사람들로부터 수집된 통찰력과 인텔리전스를 얻을 수 있다”라고 말했다.

트위터 사용자들은 어디에서나 매달 10~50억 개의 메시지를 생성한다. IBM은 이런 모든 ‘속보’들을 저장하지 않고, 전체 트윗 중에서 약 10%의 대표 샘플로 저장하고 색인한다. IBM은 이렇게 선택된 트위터 메시지를 2년간 유지한다고 IBM의 DE(distinguished engineer)인 토마스 쉑이 밝혔다.

IBM은 클라우드 애플리케이션 개발을 위한 플랫폼 서비스들을 모아 놓은 블루믹스(Bluemix)에서 이 데이터 세트를 검색할 수 있는 API 세트를 제공한다. 예를 들어서 하나의 트위터 메시지 세트는 특정 시간별 혹은 지역별로 필터링할 수 있다.

사용자가 하나의 트위터 메시지 세트를 다운로드 하도록 요청하면, 이를 JSON(JavaScript Object Notation) 포맷으로 수행해서, 다른 블루믹스 서비스나 소프트웨어에서 쉽게 소화할 수 있도록 한다.

쉑은 현재 인기있는 영화에 대한 트위터 메시지를 블루믹스 데이터 웨어하우스 인 대시DB(DashDB)에 연결하는 방법을 시연했다. 대시DB를 이용하면 영화에 대한 트위터 메시지는 미국의 주 별로 분류할 수 있다. 영화 배급업체는 이 데이터를 사용해서 어떤 주에서 영화 광고를 더 많이 할지를 결정할 수 있다.

다른 블루믹스 서비스도 트위터 데이터 분석에 사용할 수 있다. R 프로그래밍 언어로 분석도 가능하고, 결과를 Node.js 런타임 및 D3.js 시각화 라이브러리를 사용해서 웹 페이지에 올릴 수 있다.

또한, IBM은 트위터 데이터를 왓슨 애널리틱스(Watson Analytics)에도 포함시켰다. 왓슨 애너리틱스는 클라우드 기반의 분석 서비스인데, 한 예로 트위터의 한 사용자나 어떤 주제가 긍정이나 부정 혹은 양면적으로 대중들에게 여겨지고 있는지 살펴볼 수 있다.

IBM을 통한 이런 감정 분석은 브랜드의 인기나 호불호 조사에 활용될 것으로 기대된다. editor@itworld.co.kr
 
Sponsored

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.