데이터ㆍ분석

'빅 데이터 분석으로 퇴역군인 자살 예방'...미국 뒤르켐 프로젝트

Thor Olavsrud | CIO 2013.09.06

뒤르켐 프로젝트가 진행한 첫 번째 단계는 예측 모델을 구성하는 것이었다. (당시 다트머스 세이어 공과 대학 메타학습 워킹 그룹(Metalearning Working Group)의 공동 디렉터였던) 풀랭은 다트머스 가이젤 의과 대학의 폴 톰슨(Paul Thompson), 토마스 맥앨리스터(Thomas McAllister), 로라 플래시맨(Laura Flashman), 그리고 재향군인회의 빈스 와츠(Vince Watts) 등 연구자들과의 협업을 통해 작업을 진행했다.

통제 집단 연구를 통해 연구진은 텍스트-마이닝(text-mining) 방법론이 자살 예측에 통계적 타당성을 지닌다는 가설을 입증하고자 했다.

풀랭은 “우리는 우리가 임상적으로 유효한 분류자를 확보했음을 증명해야 했다. 확인 결과 65%의 정밀도를 달성했다. 만족스러운 수치였다. 완벽하다고는 이야기할 수 없었지만, 결과의 일관성이 뛰어났기에 우리는 이를 기반으로 이후의 작업을 진행해갈 수 있었다”라고 설명했다.

그는 “파트너들의 도움은 뒤르켐 프로젝트가 풍부한 지식 기반을 다져나가는데 값진 자양분이 될 것이고, 이는 궁극적으로 퇴역 군인들의 자살 문제에 정신 건강 전문가들이 적절히 개입할 수 있는 토대를 구축할 것”이라고 덧붙였다.

퇴역 군인들의 소셜 미디어 데이터 통합과 저장에 도움을 준 아티비오와 클라우데라
프로젝트 팀은 작업의 1단계라 할 수 있는 예측 모델 구성을 진행하는 동시에 아티비오(Attivio), 클라우데라(Cloudera)와의 파트너십을 통해 대량의 데이터를 수집, 저장, 분석하는 플랫폼을 구축하는 작업 또한 진행했다.

아티비오의 CTO 시드 프롭슈타인은 “빅 데이터는 많은 경제적 가치를 잠재하고 있다. 이를 활용할 기회를 가진다는 것은 환상적인 일이다”라고 말했다.

프롭슈타인은 “많은 퇴역 군인들이 자신들이 목격하고 경험한 기억들을 다루는데 어려움을 겪고 있다. 이런 상태에 놓인 이들은 좌절의 목소리를 낸다. 그리고 소셜 미디어는 그 1차 출구가 된다. 트위터에 자신의 심정을 반영한 노래 가사나 시구를 인용하는 식으로 말이다. 그들의 표현 방식에는 일정한 경향이 있다”라고 설명했다.

그는 “시스템의 핵심은 누가 무슨 말을 했는지를 이해하는 것이 아니다. 시스템이 발견하고자 하는 것은 패턴과 논리다. 부정적인 표현을 직접적으로 사용하는 환자는 없다. 즉 시스템은 부정적인 ‘표현 지표'를 감지할 수 있어야 하는 것이다”라고 덧붙였다.

뒤르켐 프로젝트는 페이스북, 트위터, 링크드인 등 소셜 미디어 거인들과도 파트너십을 구축했다. 프로젝트는 모바일 SNS 애플리케이션들을 이용해 사용자들의 자발적 참여를 통해 구성되는 소셜 미디어 및 모바일 폰 데이터베이스를 구축함으로써 임상의들이 자살 등 위험 행동을 야기할 가능성이 있는 심리적 위험 지표를 실시간으로 평가할 수 있게 할 계획이다.

애플리케이션은 관련 콘텐츠(연구를 위한 참여에 동의한 퇴역 군인들의 온라인 활동 기록)를 자동으로 의료 데이터베이스에 통합한다. 그 결과 텍스트 저장소는 기계 학습 시스템에 의해 지속적으로 업데이트, 분석이 이뤄지며, 이를 기반으로 시스템은 통계학적으로 자살과 연관성을 지니는 텍스트 콘텐츠 및 행동 패턴을 실시간으로 모니터링한다.

풀랭은 “뒤르켐 프로젝트는 초기 단계부터 유력한 발견에 기초를 두고 진행돼왔다. 여기에 더해 페이스북과의 파트너십은 우리가 퇴역 군인 커뮤니티와 연결 고리를 형성하는데 큰 도움이 됐다. 페이스북의 역량은 그 어느 곳과도 견줄 수 없이 뛰어나다”라고 말했다.

풀랭의 설명에 페이스북의 미주 지역 공공 정책 사업부 부사장이자 본인 스스로 퇴역 군인 중 한 사람인 조엘 캐플런은 “우리 페이스북은, 고민을 겪는 사용자들에게 가장 적절한 시기와 지점에서 가장 적절한 자원을 지원해 줄 역량을 갖추고 있다”라고 덧붙였다.

캐플런은 “재향군인회의 뒤르켐 프로젝트에 참여하게 된 것은 우리로써도 상당히 의미 있는 작업이다. 그들의 연구는 우리 사회가 보다 나은 방향으로 나아가는데 있어 중요한 의의를 지니며, 프로젝트가 목표로 하는 툴의 개발에 우리의 서비스가 도움이 될 수 있다는 사실에 기쁘다. 프라이버시 산업의 주요 일원으로써 정부 및 시민 사회와 힘을 모으는 이번 과정을 통해 우리는 자살률을 낮추고 삶의 질을 증진하는 실질적인 성과가 얻어질 수 있으리라 기대하고 있다”라고 말했다.

데이터베이스에는 각종 내, 외부적 위협 인자(진탕, 외상 후 스트레스 장애, 가족 스트레스 등) 역시 포함된다. 일례로 퇴역 군인들을 대상으로 진행한 한 조사 결과에 따르면 데메롤(Demerol) 약물 복용과 자살률 사이에는 높은 연관 관계가 존재하는 것이 확인되었다. 풀랭은 두 요인 사이에 만성 통증과 관련한 어떠한 상호 연관성이 존재하는 것으로 추측된다고 결과를 해석했다.

현재로써는 뒤르켐 프로젝트에 개입 성분(intervention component)이 포함될 계획은 없는 상태다. 그러나 풀랭은 프로젝트가 임상의들을 만족 시키고 그들에게 효과적인 예측 툴로 인정 받게 된다면 이 역시 가능할 것이라 전망했다.

데이터 프라이버시 고민
풀랭은 프로젝트의 작업에 프라이버시와 관련한 우려 역시 제기되고 있는 것이 사실이라고 인정했다. 하지만 풀랭은 프로그램은 전적으로 사용자의 동의를 통해서만 운영된다고 강조했다. 수집된 데이터는 가이젤 의대의 현장 데이터베이스에 보관된다. 덧붙여 개인 식별 정보의 외부/제 3자 공유는 HIPAA 의료 프라이버시 표준에 의해 보호되는 연구의 의료 협약에 의거해 강력히 금지되고 있다.

이번 연구의 공동 조사관이자 가이젤 의대의 교수로 재직 중인 폴 톰슨은 “참가자의 프라이버시를 보장하기 이해 우리는 대학 IT 방화벽 내부에 안전한 데이터 스토리지 환경을 구축했다. 연구의 모든 단계는, 그리고 향후 이것이 실행된 이후의 모든 작업 역시 이 환경 안에서 통합적으로 관리가 이뤄질 것이다”라고 설명했다.

풀랭은 “자살을 예측하고 문제에 개입하는 과정은, 기술적 측면에서보단 사회적 측면에서 어려운 경우가 많다. 우리는 이 문제를 적절히 해결할 방법을 고민해야만 할 것이다. 우리에겐 질환자들을 도와줄 세심함과 그 과정에서 전해질 비판을 이겨낼 강인함이 모두 필요하다”라고 말했다.

그는 “자살 예방을 위해 우리가 수집하고자 하는 정보가 재무 지표 같은 요소보다 프라이버시와 관련해 더 많은 우려를 야기한다는 사실은 인정한다. 자살은 말 그대로 개인적인 선택의 문제다. 이를 막고자 한다면, 인간 정신의 깊은 지점을 관찰할 수 있어야 한다는 사실은 부정할 수 없다”라고 덧붙였다. ciokr@idg.co.kr
 

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.