2011.09.30

인류의 공통 패턴, 트위터 분석으로 발견

Joab Jackson | CIO
코넬 대학의 사회과학자들이 트위터와 하둡을 이용해 인간 행동을 연구한 결과를 발표했다.
 
 
트위터나 페이스북 및 여타 소셜 미디어들에 대한 비판 중 하나는, 무가치한 정보나 생각이 넘쳐난다는 것이다. 그러나 사회과학자들은 빅 데이터 도구와 다양한 소셜 코멘트를 조합해 인간의 사고 및 행동에 대한 유용한 정보일 수 있음을 밝혀내고 있다.
 
최근 코넬 대학 연구진도 소셜 네트워크를 통해 이와 같은 결론을 도출했다. 이 대학의 스캇 골더와 마이클 마시는 84개국 240만 네티즌이 2년 동안 쏟아낸 5억 900만 개의 트위터 메시지를 분석했다. 그 결과 국가 및 언어에 상관없이 사람들은 동일한 일간 정서 패턴을 보이는 것으로 드러낫다.
 
이번 연구보고서는 사이언스 저널의 29일 판에 게재된 것으로, '다양한 문화를 아울러 일간 및 계절 간 정서 변화는 업무, 수면, 광량 변인에 좌우된다'는 제목이다.
 
연구진은 학문적 성과를 위해 소셜 네트워크를 이용하는 것이 새로운 연구 기법의 가능성을 제시한다는 의견도 남겼다.
 
마시는 "사회과학 및 행동과학 연구에 있어 이번 연구는 새로운 기회를 설명하고 있다. 인류는 디지털 기기를 통해 점점 더 많이 상호작용하고 있다. 5년 전만에도 전혀 상상할 수 없었던 행동양태다"라고 말했다.
 
골더는 "일상적이고 쓸모없는 대화라고 간주하지 않았다. 오히려 실시간인 동시에 언제 생산됐는지를 알 수 있는 메시지라는 점에서 가치가 크다고 본다"라고 말했다.
 
연구진은 메시지를 수집하기 위해 트위터 API를 사용했으며, XML 형태로 수집돼 플랫 파일(flat files)로 변환된 데이터를 추출하는데 6-노트 클러스터를 이용했다. 이후 코넬 대학 센서에서 구동되는 55-노드 하둡 클러스터를 이용해 데이터세트를 분석했다.
 
그들이 사용한 분석 도구는 링귀스틱 인쿼리 앤 워드 카운트(Linguistic Inquiry and Word Count)라는 것으로, 긍정적이거나 부정적인 기분 상태를 판단할 수 있도록 하는 알고리즘을 탑재하고 있다.
 
예를 들어 '놀라운', '환상적인', '꽤나'와 같은 단어를 포함한 메시지는 긍정적인 정서로 분석됐으며, '후회스러운', '포기', '무서운', '분노'와 같은 단어를 담은 메시지는 부정적인 정서를 나타내는 것으로 분석됐다.
 
메시지 분석 결과에 따르면 사람들은 아침과 주말에 좀더 쾌활한 성향을 보였다. 아침에는 명랑하다가 시간이 지나면서 점차 시무룩해졌으며, 저녁에는 다시 발랄해지는 경향이 나타났다.
 
주말에도 아침 시간에 좀더 쾌활한 경향이 있었다. 단 주중에 비해 트윗이 시작되는 시간이 평균 2시간 늦었다는 차이점이 나타났다. 주말에 보다 많은 잠을 자기 때문인 것으로 풀이됐다.
 
일요일부터 목요일까지 근무하는 이슬람 문화권에서도 이와 같은 패턴이 명백히 나타났다고 연구진은 전했다.
 
연구진 측은 이번 연구에 대해 어쩌면 당연하게 보이는 결과를 도출한 것일 수 있겠지만, 트위터를 이용한 실증적 형태를 통해 이같은 패턴을 규명한 최초의 연구라는 점에서 큰 의의가 있다고 강조했다.
 
이를테면 피험집단을 실험실 환경에서 관찰하는 전형적인 사회심리학 실험 조건의 경우 일상적인 환경이 아니라는 점에서 오류의 가능성이 있다는 설명이다.
 
골더는 또 "피험자에 따라서는 자신의 정서가 어떤지 파악하는데 익숙치 못한 이들이 있다. 일상적인 언어로 이뤄진 메시지 속에서 단어를 분석하는 접근도 큰 장점이 된다"라고 말했다.
 
한편 이번 연구는, 컴퓨터 보조형 사회 과학 연구 프로젝트를 개발한다는 목적에서 사회과학자 및 컴퓨터 과학자들로 연구진을 구성해 이뤄진 것이다. 실제로 골더의 경력에는 HP에서의 연구부문 과학자 이력도 포함돼 있다. ciokr@idg.co.kr


2011.09.30

인류의 공통 패턴, 트위터 분석으로 발견

Joab Jackson | CIO
코넬 대학의 사회과학자들이 트위터와 하둡을 이용해 인간 행동을 연구한 결과를 발표했다.
 
 
트위터나 페이스북 및 여타 소셜 미디어들에 대한 비판 중 하나는, 무가치한 정보나 생각이 넘쳐난다는 것이다. 그러나 사회과학자들은 빅 데이터 도구와 다양한 소셜 코멘트를 조합해 인간의 사고 및 행동에 대한 유용한 정보일 수 있음을 밝혀내고 있다.
 
최근 코넬 대학 연구진도 소셜 네트워크를 통해 이와 같은 결론을 도출했다. 이 대학의 스캇 골더와 마이클 마시는 84개국 240만 네티즌이 2년 동안 쏟아낸 5억 900만 개의 트위터 메시지를 분석했다. 그 결과 국가 및 언어에 상관없이 사람들은 동일한 일간 정서 패턴을 보이는 것으로 드러낫다.
 
이번 연구보고서는 사이언스 저널의 29일 판에 게재된 것으로, '다양한 문화를 아울러 일간 및 계절 간 정서 변화는 업무, 수면, 광량 변인에 좌우된다'는 제목이다.
 
연구진은 학문적 성과를 위해 소셜 네트워크를 이용하는 것이 새로운 연구 기법의 가능성을 제시한다는 의견도 남겼다.
 
마시는 "사회과학 및 행동과학 연구에 있어 이번 연구는 새로운 기회를 설명하고 있다. 인류는 디지털 기기를 통해 점점 더 많이 상호작용하고 있다. 5년 전만에도 전혀 상상할 수 없었던 행동양태다"라고 말했다.
 
골더는 "일상적이고 쓸모없는 대화라고 간주하지 않았다. 오히려 실시간인 동시에 언제 생산됐는지를 알 수 있는 메시지라는 점에서 가치가 크다고 본다"라고 말했다.
 
연구진은 메시지를 수집하기 위해 트위터 API를 사용했으며, XML 형태로 수집돼 플랫 파일(flat files)로 변환된 데이터를 추출하는데 6-노트 클러스터를 이용했다. 이후 코넬 대학 센서에서 구동되는 55-노드 하둡 클러스터를 이용해 데이터세트를 분석했다.
 
그들이 사용한 분석 도구는 링귀스틱 인쿼리 앤 워드 카운트(Linguistic Inquiry and Word Count)라는 것으로, 긍정적이거나 부정적인 기분 상태를 판단할 수 있도록 하는 알고리즘을 탑재하고 있다.
 
예를 들어 '놀라운', '환상적인', '꽤나'와 같은 단어를 포함한 메시지는 긍정적인 정서로 분석됐으며, '후회스러운', '포기', '무서운', '분노'와 같은 단어를 담은 메시지는 부정적인 정서를 나타내는 것으로 분석됐다.
 
메시지 분석 결과에 따르면 사람들은 아침과 주말에 좀더 쾌활한 성향을 보였다. 아침에는 명랑하다가 시간이 지나면서 점차 시무룩해졌으며, 저녁에는 다시 발랄해지는 경향이 나타났다.
 
주말에도 아침 시간에 좀더 쾌활한 경향이 있었다. 단 주중에 비해 트윗이 시작되는 시간이 평균 2시간 늦었다는 차이점이 나타났다. 주말에 보다 많은 잠을 자기 때문인 것으로 풀이됐다.
 
일요일부터 목요일까지 근무하는 이슬람 문화권에서도 이와 같은 패턴이 명백히 나타났다고 연구진은 전했다.
 
연구진 측은 이번 연구에 대해 어쩌면 당연하게 보이는 결과를 도출한 것일 수 있겠지만, 트위터를 이용한 실증적 형태를 통해 이같은 패턴을 규명한 최초의 연구라는 점에서 큰 의의가 있다고 강조했다.
 
이를테면 피험집단을 실험실 환경에서 관찰하는 전형적인 사회심리학 실험 조건의 경우 일상적인 환경이 아니라는 점에서 오류의 가능성이 있다는 설명이다.
 
골더는 또 "피험자에 따라서는 자신의 정서가 어떤지 파악하는데 익숙치 못한 이들이 있다. 일상적인 언어로 이뤄진 메시지 속에서 단어를 분석하는 접근도 큰 장점이 된다"라고 말했다.
 
한편 이번 연구는, 컴퓨터 보조형 사회 과학 연구 프로젝트를 개발한다는 목적에서 사회과학자 및 컴퓨터 과학자들로 연구진을 구성해 이뤄진 것이다. 실제로 골더의 경력에는 HP에서의 연구부문 과학자 이력도 포함돼 있다. ciokr@idg.co.kr


X