애플리케이션

NPR, 스트리밍 및 웹 트래픽 분석에 검색엔진 사용

Joab Jackson | IDG News Service 2011.03.28

미국 공영 라디오 방송(NPR)이 새로운 로그 검색 엔진인 ‘스플렁크(Splunk)’를 이용하여 오디오 스트리밍과 다운로드의 웹 트래픽도 분석할 수 있게 됐다.

 

NPR의 메트릭스 애널리스트인 손드라 러셀은 23일 뉴욕에서 일에 열린 기가옴(GigaOm) 주최의 '빅데이터 컨퍼런스(Big Data Conference)'에서 스플렁크 도입에 대해 설명했다.

 

스플렁크는 각종 기기들이 만들어낸 데이터까지도 찾아내는 검색 엔진을 제공한다. 스플렁크는 원래 프로그램과 하드웨어가 트랜잭션과 에러 및 다른 운용 정보를 기록하기 위해 생성한 파일들과 로그 파일들을 분석하기 위해 만들어졌다. 스플렁크는 여러 개의 애플리케이션과 하드웨어에서 얻어진 타임스탬프 메시지들을 끼워 맞춰 시스템 관리자들이 찾기 어려운 시스템 문제들을 정확하게 짚어낼 수 있게 해준다.

 

그러나 이 행사에서 발표한 스플렁크의 CTO인 에릭 스완은 “최근 몇 년 동안 스플렁크의 고객들이 본래 의도한 것과는 다른 용도로 스플렁크를 사용하고 있다” “웹 트래픽 분석과 BI가 대표적이 활용사례”라고 설명했다.

 

대부분의 웹 트래픽 모니터링에서 NPR은 웹 페이지마다 얼마나 많은 사람들이 방문했는지에 관한 리포팅 기능을 제공하는 표준 웹 트래픽 분석 소프트웨어를 사용하고 있다. 이러한 소프트웨어는 보통 쿠키를 이용하거나 페이지가 브라우저에 출력될 때 소프트웨어에게 알려주는 조그만 스크립트를 페이지에 내장시키는 방법으로 파악한다.

 

하지만 미디어 기관은 그 안의 여러 가지 서비스들에 대해 유용하고 신뢰성 있는 요약을 얻기가 어려웠다. 예를 들면, 얼마나 많은 청중들이 스트리밍 오디오와 비디오 프로그램을 듣고 있는지 정확하게 파악하고 싶었는데 이를 가능하게 해줄 마땅한 솔루션이 없었다.

 

이러한 데이터를 얻기 위해 NPR은 서버의 로그 파일을 분석하고, 그 결과를 웹 분석 업체인 어도비의 옴니처(Omniture)에게 의뢰해 사용자가 이해하기 쉬운 형태로 변환시켜주는 PHP 스크립트를 작성하게 했다. 정보를 되돌려 주는데 최대 24시간이 걸리며 여전히 러셀은 그 결과가 정확한 카운트를 제공하고 있다고 믿지 않았다.

 

스트리밍을 사용할 때, 많은 사용자들이 스트리밍을 시작했다가 중지시키고 다시 시작하기도 한다. 또는 인터넷 연결이 끊어진 뒤 다시 스트리밍을 시작할 수도 있다. 서버 로그 파일에는 이것들이 단일 사용자의 일련의 행동이 아닌 모두 독립된 이벤트들로 기록된다. 그 결과 여러 청취자들이 얼마나 많이 연결했는지, 얼마나 많은 복수의 스트리밍이 단일 사용자에게 연결되어 있는지 알 수 있는 방법이 없다.

 

러셀은 “PHP 스크립트로는 그렇게 세밀한 단계까지 알 수 없었고 따라서 우리의 수치들은 빗나갈 수 있었다”며 “이 수치들의 결과를 가지고 합리적인 의사 결정을 내리기란 불가능하”고 말했다.

 

스플렁크를 이용하여 NPR은 서버의 로그 파일로부터 청취자의 수와 정보를 직접적으로 얻어낼 수 있었다. 이 소프트웨어는 유저들이 검색 결과를 쓰고 그래프로 그릴 수 있게 해주며 그것들을 대시보드에 보여주기도 한다.

 

NPR의 예를 들면 이 소프트웨어는 스트리밍이 실행되거나 다운로드된 각 프로그램의 정확한 청취자 수를 제공하였다. 러셀은 “스플렁크를 이용하면 복수의 로그 항목들을 하나의 구별된 방문으로 묶을 수 있기 때문에 비교적 정확한 수치 결과를 얻을 수 있다”고 말했다.

 

뿐만 아니라 스플렁크는 유저들의 모바일 플랫폼들을 파악하는 것을 도와주었다. NPR 사이트에 접속하는 트래픽 중 아이폰이나 아이패드, 안드로이드 스마트폰을 사용하는 모바일 고객들의 비중이 높아지는 추세다. 한 번은, 한 매니저가 아이폰의 운영체제 중 어떤 버전이 가장 많이 쓰이는지 알고 싶어했고 그 결과는 그 회사가 아이폰 앱을 디자인할 때 방향을 제시해 줄 수 있었다.

 

이밖에도 스플렁크는 도저히 풀지 못할 것 같아 보이던 문제들을 해결했다 : 스트리밍 음원에 대해 얼마만큼의 로얄티를 지불해야할지 결정하는 일 등이다. NPR은 사운드익스체인지(Sound Exchange)라는 음원 스트리밍 서비스를 제공하는데, 재생 당시 해당 스트리밍을 들은 사람의 수에 따라 재생된 각 곡에 대한 로얄티를 지불해야 한다. 청취자와 스트리밍 이용에 대해 정확하게 분석해 로열티를 결정하는 것은 그리 간단하지만은 않았다.   

 

스플렁크를 이용하여, 러셀은 파일의 두 정보, 즉 각 음원이 언제 재생되었는지, 그리고 그 음악이 재생되고 있을 때에 듣고 있던 사람은 모두 몇 명이었는지에 관한 정보를 한 데 모을 수 있었다. 러셀은 “스플렁크가 각각의 정보를 통합시킨다”고 강조했다. editor@idg.co.kr

 

Sponsored

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.