2015.07.03

인스타그램이 ‘트렌드’를 읽는 법

Joab Jackson | IDG News Service
매일 7,000만 장의 사진과 짧은 동영상을 올리는 3억 이상의 사용자를 보유한 인스타그램은 실시간으로 관심있는 이벤트를 볼 수 있는 서비스다. 그러나 지속적으로 콘텐츠가 업로드되는 과정에서 어떻게 떠오르는 트렌드를 읽을 수 있을까?

인스타그램의 엔지니어 다닐로 헤젠시와 우디 바인스베르크는 블로그를 통해서 인스타그램이 트렌드를 찾아내는 비법을 공개했다.

실시간 콘텐츠를 생산하기 위해 대중들의 관심사를 수집하는 인터넷 서비스라면 인스타그램의 상세한 알고리즘에 관심이 높을 것이다. 또한, 이 글에서는 인스타그램 뿐만 아니라, 아마도 다른 소셜 네트워킹 사이트가 어떤 것을 ‘트렌드’라고 결정하는지를 엿볼 수 있다.

트위터와 마찬가지로 인스타그램은 자동으로 트렌드 토픽을 생성한다.

인스타그램은 사진과 동영상을 공유하는 모바일 앱이며, 대다수의 사용자들이 휴대폰으로 촬영한 콘텐츠를 올린다. 그 결과, 많은 사람들은 사건 사고, 이벤트 등의 중요한 순간을 사진으로 담아 공유한다.

예를 들어 일주일 전 미국 대법원이 동성 결혼 합법 판결을 내렸을 때에 인스타그램에는 #eqality라는 해시태그를 단 사진이 수 천장 올라왔으며, 이 중 상당수가 워싱턴의 대법원 앞 계단에서 촬영되었다. 이 해시태그는 소셜 미디어 서비스에서 콘텐츠에 주석 역할을 하며, 해당 주제를 나타내는 키워드 앞에 샵 기호(#)를 붙여 사용한다.

많은 사람들이 여러 개의 해시태그를 포함한 게시물을 올리는 상황에서, 인스타그램은 사용자들을 위한 ‘핫 트렌드’를 어떻게 짚어낼까? 인스타그램은 사용된 모든 해시태그를 데이터베이스로 저장하는데, 지난 7일간 매 5분마다 평균적으로 얼마나 자주 사용되었는지 집계한다. 어떤 태그가 갑자기 평소보다 더 많이 사용되면 트렌드로 인지한다.

연구원들은 해시태그가 진짜 트렌드인지 계산하기 위해서 더 복잡한 신경망 모델을 사용할 수도 있지만, 단순히 7일 전 데이터와 비교하는 것만으로도 충분하며, 상대적으로 가벼운 컴퓨팅 프로레싱 및 메모리로 큰 그림의 트렌드를 읽을 수 있다고 설명했다.

어떤 이벤트가 끝이 났을 때, 해시태그가 감소하는 것도 확인할 수 있다. 이 엔지니어들은 “이벤트가 끝나면 해당 해시태그의 사용량은 자연스럽게 줄어든다”라고 설명했다. 이벤트 후에 해당 사진을 보고 싶어하는 경우 문제가 될 수 있어서, 인스타그램은 이벤트가 끝난 후에도 몇 시간 동안 해당 트렌드를 강조하는 일종의 반감기 기능을 두고 있다.

또 하나의 과제는 서로 다른 해시태그가 같은 이벤트를 의미하는 경우다. 예를 들어서 #fashionweek 태그는 #model #fashion 같은 해시태그와 함께 나타나는 경우가 많다.

그래서 개발 팀은 같은 이벤트를 지칭하는 해시태그를 하나로 묶는 알고리즘을 개발했다. #equality 와 #lovewins 처럼 해시태그가 같이 나타나는 빈도를 살피는 것이다. 또한 오타에 의해서 만들어진 매우 비슷한 단어도 살피는데, #valentinesday 와 #valentineday를 하나로 묶는다. 사전에 설정된 토픽으로 태그를 분류하는 내부의 도구도 사용하고 있다.

트렌드와 해시태그는 사용자들이 이 서비스에 더 많은 시간을 머무르게 하는 핵심 요소다. 지난 주, 인스타그램은 ‘탐색’ 및 검색 기능을 개편해서 관심을 받고 있는 콘텐츠 노출을 높였다. editor@itworld.co.kr


2015.07.03

인스타그램이 ‘트렌드’를 읽는 법

Joab Jackson | IDG News Service
매일 7,000만 장의 사진과 짧은 동영상을 올리는 3억 이상의 사용자를 보유한 인스타그램은 실시간으로 관심있는 이벤트를 볼 수 있는 서비스다. 그러나 지속적으로 콘텐츠가 업로드되는 과정에서 어떻게 떠오르는 트렌드를 읽을 수 있을까?

인스타그램의 엔지니어 다닐로 헤젠시와 우디 바인스베르크는 블로그를 통해서 인스타그램이 트렌드를 찾아내는 비법을 공개했다.

실시간 콘텐츠를 생산하기 위해 대중들의 관심사를 수집하는 인터넷 서비스라면 인스타그램의 상세한 알고리즘에 관심이 높을 것이다. 또한, 이 글에서는 인스타그램 뿐만 아니라, 아마도 다른 소셜 네트워킹 사이트가 어떤 것을 ‘트렌드’라고 결정하는지를 엿볼 수 있다.

트위터와 마찬가지로 인스타그램은 자동으로 트렌드 토픽을 생성한다.

인스타그램은 사진과 동영상을 공유하는 모바일 앱이며, 대다수의 사용자들이 휴대폰으로 촬영한 콘텐츠를 올린다. 그 결과, 많은 사람들은 사건 사고, 이벤트 등의 중요한 순간을 사진으로 담아 공유한다.

예를 들어 일주일 전 미국 대법원이 동성 결혼 합법 판결을 내렸을 때에 인스타그램에는 #eqality라는 해시태그를 단 사진이 수 천장 올라왔으며, 이 중 상당수가 워싱턴의 대법원 앞 계단에서 촬영되었다. 이 해시태그는 소셜 미디어 서비스에서 콘텐츠에 주석 역할을 하며, 해당 주제를 나타내는 키워드 앞에 샵 기호(#)를 붙여 사용한다.

많은 사람들이 여러 개의 해시태그를 포함한 게시물을 올리는 상황에서, 인스타그램은 사용자들을 위한 ‘핫 트렌드’를 어떻게 짚어낼까? 인스타그램은 사용된 모든 해시태그를 데이터베이스로 저장하는데, 지난 7일간 매 5분마다 평균적으로 얼마나 자주 사용되었는지 집계한다. 어떤 태그가 갑자기 평소보다 더 많이 사용되면 트렌드로 인지한다.

연구원들은 해시태그가 진짜 트렌드인지 계산하기 위해서 더 복잡한 신경망 모델을 사용할 수도 있지만, 단순히 7일 전 데이터와 비교하는 것만으로도 충분하며, 상대적으로 가벼운 컴퓨팅 프로레싱 및 메모리로 큰 그림의 트렌드를 읽을 수 있다고 설명했다.

어떤 이벤트가 끝이 났을 때, 해시태그가 감소하는 것도 확인할 수 있다. 이 엔지니어들은 “이벤트가 끝나면 해당 해시태그의 사용량은 자연스럽게 줄어든다”라고 설명했다. 이벤트 후에 해당 사진을 보고 싶어하는 경우 문제가 될 수 있어서, 인스타그램은 이벤트가 끝난 후에도 몇 시간 동안 해당 트렌드를 강조하는 일종의 반감기 기능을 두고 있다.

또 하나의 과제는 서로 다른 해시태그가 같은 이벤트를 의미하는 경우다. 예를 들어서 #fashionweek 태그는 #model #fashion 같은 해시태그와 함께 나타나는 경우가 많다.

그래서 개발 팀은 같은 이벤트를 지칭하는 해시태그를 하나로 묶는 알고리즘을 개발했다. #equality 와 #lovewins 처럼 해시태그가 같이 나타나는 빈도를 살피는 것이다. 또한 오타에 의해서 만들어진 매우 비슷한 단어도 살피는데, #valentinesday 와 #valentineday를 하나로 묶는다. 사전에 설정된 토픽으로 태그를 분류하는 내부의 도구도 사용하고 있다.

트렌드와 해시태그는 사용자들이 이 서비스에 더 많은 시간을 머무르게 하는 핵심 요소다. 지난 주, 인스타그램은 ‘탐색’ 및 검색 기능을 개편해서 관심을 받고 있는 콘텐츠 노출을 높였다. editor@itworld.co.kr


X