결국 모든 언론의 예상이 틀렸다. 클린턴 캠프는 잘못된 분석을 바탕으로 '안티-트럼프(트럼프에 부정적인)' 메시지를 전파했고, 트럼프 캠프보다 훨씬 많았던 선거 자금을 잘못 쓰고 말았다. 반면 트럼프는 정확한 분석으로 한정된 선거 자금을 더 효과적으로 활용하고, 메시지를 전파해 대선에서 승리할 수 있었다.
<이미지 : flickr/Marc Nozell>
아이러니는 지난 두 번의 선거에서 오바마가 분석에 기반해 공화당 후보들을 이겼다는 것이다. 그러나 결과적으로 다른 정당에 속한 트럼프가 이 사실에서 더 많은 것을 배운 듯싶다. 이는 데이터 분석을 이용하는 사람에게 더 큰 교훈 하나를 알려준다. 데이터 소스가 확실해야 한다는 점이다. 지금부터 이번 대선에서 뜻밖의 결과가 초래된 이유, 분석에서 명심해야 할 3가지 원칙을 정리한다.
데이터 소스가 갖고 있는 (이미 알려진) 문제들
사람들의 커뮤니케이션 방식이 크게 바뀌었다. 이는 대선 이전에 발생한 변화이다. 특히 그 힘이 커지고 있는 밀레니얼 세대의 커뮤니케이션 방식이 급변했다. 이들은 유선 전화 대신 휴대폰을 이용한다. 휴대폰으로 전화를 걸어도 발신자를 확인해 모르는 사람이면 전화를 받지 않는 경우가 많다. 즉 많은 사람이 전화 여론조사를 피할 수 있다는 의미이다. 이는 표본 추출에 큰 문제가 되고 그 결과 기법에 상당한 결함을 발생시킨다. 결국 오차 범위가 확대된다. 4~5%가 아닌 15%가 될 수 있는 것이다.
선거가 무르익으면서 언론과 클린턴 캠프가 트럼프 지지자를 비난했다. 클린턴 본인도 '개탄스러운 사람들'이라고 말할 정도였다. 현명한 전략은 아니었다. 그들이 지지 후보를 바꾸는 대신 공격을 받았다는 생각에 투표장으로 향하도록 만들기 때문이다. 이는 분석가에게 더 큰 문제 하나를 초래했다. 이들 유권자는 조사에 응하지 않거나 조사에 응해도 사실을 말하지 않았던 것이다. 이로 인해 클린턴 지지자 통계에 편의(편향)가 발생하면서, 관련 조사가 무용지물이 됐다.
분석은 이런 통계 편의를 파악해 줄여야 한다. 그렇지 않으면, 자신을 고용한 사람이 잘못된 결정을 내리도록 만들 수 있기 때문이다. 이번 대선 결과가 여기에 해당된다.
트럼프 캠프의 강점
클린턴과 달리 트럼프 캠프는 이런 문제를 올바르게 인식하고, 비교적 덜 알려진 분석 회사인 케임브릿지 애널리티카(Cambridge Analytica)와 라티노(히스패닉) 유권자에 초점을 맞춘 다른 익명의 회사 한 곳과 계약을 체결했다. 그리고 이들은 기존과 다른 방법을 이용했다. 선거 10일 전, 소규모 팀이 표본 추출 방법을 바꿔서 편의를 없앴다. 그리고 기존 방법으로는 누락되었을 유권자를 조사했다. 이를 통해 공략할 유권자 집단, 선거 자금 활용 방법을 더 효과적으로 조언할 수 있었다.
간단히 말해, 이들은 '다른 모든 사람이 틀렸다'는 사실을 깨달았다. 예비 경선 동안 드러난 수 많은 증거를 바탕으로 고객에게 훌륭한 전략적 무기를 제공했고, '예정된 패배'를 미국 역사상 가장 극적인 승리로 바꿔 놓았다.
게다가 트럼프는 자신에게 불리한 통계를 믿고 싶지 않았고, 이에 이들이 더 나은 방법을 찾아내도록 압박했다. 반면 클린턴은 자신에 유리한 통계를 좋아했기 때문에 이런 일을 하지 않았다. 이는 사람들이 자주 저지르는 실수이다. 자신이 좋아하는 결과를 의심하지 않으면 거의 대부분 나쁜 결과가 초래된다.
2번째 회사
선거 후에 '영웅'이 된 또 다른 회사가 있다. 애틀랜타의 트라팔가 그룹(Trafalgar Group)이다. 이 회사는 트럼프 지지자가 통계에 제대로 반영되지 않는 이유를 집중 분석했고 이를 바로잡을 창의적인 방법을 고안했다. 그리고 그 결과는 놀랄 만큼 정확했다. 문제는 이 방법에 대해 평판 높고 규모가 큰 회사들이 어떻게 대응했는가이다. 결과적으로 잘못된 예상을 내놓았던 이 큰 회사들은 트라팔가 그룹 방법론의 문제를 집중적으로 지적했다.
화가 나면서도 흥미로운 점은 이들 대기업이 선거 이후에 자신의 무능력을 감추는 데 급급했다는 것이다. 이들은 "올바르게 조사했는데 근거가 잘못됐다", "데이터가 엉터리였다"라고 변명했다. '올바르게 만드는 것'이 가장 중요하고, 변명으로는 성과를 일궈낼 수 없다는 점을 망각한 것이다. 이들은 승자와 패자의 차이를 다시 복습할 필요가 있다. 그러면 변명을 잘하는 것과 지속적인 성과 사이에 아무런 상관관계가 없다는 사실을 깨달을 것이다.
분석의 3가지 원칙
이 모두는 '분석의 3가지 원칙'으로 귀결된다. 첫째, 데이터 소스를 확신할 수 있어야 한다. 표본 추출 기법이 튼튼하지 못하면 정확한 결과를 도출할 수 없다. 이 경우 차라리 조사를 하지 않는 것이 낫다. 의사결정자에게 잘못된 조언을 할 수 있기 때문이다. 둘째, 편의를 파악해 없애야 한다. 편의는 결과를 무용지물로 만든다. 이를 없애지 못하면 역시 의사결정자에게 잘못된 조언을 하게 된다.
마지막으로, 의사결정자는 분석 결과를 의심해야 한다는 것을 명심할 필요가 있다. 특히 듣기 좋은 결과는 더 의심해야 한다. 나중에 분석가를 탓해봐야 승패를 되돌릴 수 없다. 분석가를 해고할 수 있지만, 결국 자신도 같은 신세가 된다. 확신할 수 있는 데이터를 수집하고 편의를 파악해 없애고 분석 결과를 의심해야, 좋은 인사이트를 확보하고 좋은 결과를 만들어낼 수 있다.
* Rob Enderle은 엔덜 그룹(Enderle Group)의 대표이자 수석 애널리스트다. 그는 포레스터리서치와 기가인포메이션그룹(Giga Information Group)의 선임 연구원이었으며 그전에는 IBM에서 내부 감사, 경쟁력 분석, 마케팅, 재무, 보안 등의 업무를 맡았다. 현재는 신기술, 보안, 리눅스 등에 대해 전문 기고가로도 활동하고 있다. ciokr@idg.co.kr
함께 보면 좋은 콘텐츠
Sponsored
Surfshark
“유료 VPN, 분명한 가치 있다” VPN 선택 가이드
ⓒ Surfshark VPN(가상 사설 네트워크, Virtual Private Network)은 인터넷 사용자에게 개인 정보 보호와 보안을 제공하는 중요한 도구로 널리 인정받고 있다. VPN은 공공 와이파이 환경에서도 데이터를 안전하게 전송할 수 있고, 개인 정보를 보호하는 데 도움을 준다. VPN 서비스의 수요가 증가하는 것도 같은 이유에서다. 동시에 유료와 무료 중 어떤 VPN을 선택해야 할지 많은 관심을 가지고 살펴보는 사용자가 많다. 가장 먼저 사용자의 관심을 끄는 것은 별도의 예산 부담이 없는 무료 VPN이지만, 그만큼의 한계도 있다. 무료 VPN, 정말 괜찮을까? 무료 VPN 서비스는 편리하고 경제적 부담도 없지만 고려할 점이 아예 없는 것은 아니다. 보안 우려 대부분의 무료 VPN 서비스는 유료 서비스에 비해 보안 수준이 낮을 수 있다. 일부 무료 VPN은 사용자 데이터를 수집해 광고주나 서드파티 업체에 판매하는 경우도 있다. 이러한 상황에서 개인 정보가 유출될 우려가 있다. 속도와 대역폭 제한 무료 VPN 서비스는 종종 속도와 대역폭에 제한을 생긴다. 따라서 사용자는 느린 인터넷 속도를 경험할 수 있으며, 높은 대역폭이 필요한 작업을 수행하는 데 제약을 받을 수 있다. 서비스 제한 무료 VPN 서비스는 종종 서버 위치가 적거나 특정 서비스 또는 웹사이트에 액세스하지 못하는 경우가 생긴다. 또한 사용자 수가 늘어나 서버 부하가 증가하면 서비스의 안정성이 저하될 수 있다. 광고 및 추적 위험 일부 무료 VPN은 광고를 삽입하거나 사용자의 온라인 활동을 추적하여 광고주에게 판매할 수 있다. 이 경우 사용자가 광고를 보아야 하거나 개인 정보를 노출해야 할 수도 있다. 제한된 기능 무료 VPN은 유료 버전에 비해 기능이 제한될 수 있다. 예를 들어, 특정 프로토콜이나 고급 보안 기능을 지원하지 않는 경우가 그렇다. 유료 VPN의 필요성 최근 유행하는 로맨스 스캠은 인터넷 사기의 일종으로, 온라인 데이트나 소셜 미디어를 통해 가짜 프로필을 만들어 상대를 속이는 행위다. 이러한 상황에서 VPN은 사용자가 안전한 연결을 유지하고 사기 행위를 방지하는 데 도움이 된다. VPN을 통해 사용자는 상대방의 신원을 확인하고 의심스러운 활동을 감지할 수 있다. 서프샤크 VPN은 구독 요금제 가입 후 7일간의 무료 체험을 제공하고 있다. ⓒ Surfshark 그 외에도 유료 VPN만의 강점을 적극 이용해야 하는 이유는 다음 3가지로 요약할 수 있다. 보안 강화 해외 여행객이 증가함에 따라 공공 와이파이를 사용하는 경우가 늘어나고 있다. 그러나 공공 와이파이는 보안이 취약해 개인 정보를 노출할 위험이 있다. 따라서 VPN을 사용하여 데이터를 암호화하고 개인 정보를 보호하는 것이 중요하다. 서프샤크 VPN은 사용자의 개인 정보를 안전하게 유지하고 해킹을 방지하는 데 유용하다. 개인정보 보호 인터넷 사용자의 검색 기록과 콘텐츠 소비 패턴은 플랫폼에 의해 추적될 수 있다. VPN을 사용하면 사용자의 IP 주소와 로그를 숨길 수 있으며, 개인 정보를 보호할 수 있다. 또한 VPN은 사용자의 위치를 숨기고 인터넷 활동을 익명으로 유지하는 데 도움이 된다. 지역 제한 해제 해외 여행 중에도 한국에서 송금이 필요한 경우가 생길 수 있다. 그러나 IP가 해외 주소이므로 은행 앱에 접근하는 것이 제한될 수 있다. VPN을 사용하면 지역 제한을 해제해 해외에서도 한국 인터넷 서비스를 이용할 수 있다. 따라서 해외에서도 안전하고 편리하게 인터넷을 이용할 수 있다. 빠르고 안전한 유료 VPN, 서프샤크 VPN ⓒ Surfshark 뛰어난 보안 서프샤크 VPN은 강력한 암호화 기술을 사용하여 사용자의 인터넷 연결을 안전하게 보호한다. 이는 사용자의 개인 정보와 데이터를 보호하고 외부 공격으로부터 사용자를 보호하는 데 도움이 된다. 다양한 서버 위치 서프샤크 VPN은 전 세계 곳곳에 여러 서버가 위치하고 있어, 사용자가 지역 제한된 콘텐츠에 액세스할 수 있다. 해외에서도 로컬 콘텐츠에 손쉽게 접근할 수 있음은 물론이다. 속도와 대역폭 서프샤크 VPN은 빠른 속도와 무제한 대역폭을 제공하여 사용자가 원활한 인터넷 경험을 누릴 수 있도록 지원한다. 온라인 게임, 스트리밍, 다운로드 등 대역폭이 필요한 활동에 이상적이다. 다양한 플랫폼 지원 서프샤크 VPN은 다양한 플랫폼 및 디바이스에서 사용할 수 있다. 윈도우, 맥OS, iOS, 안드로이드 등 다양한 운영체제 및 디바이스에서 호환되어 사용자가 어디서나 안전한 인터넷을 즐길 수 있다. 디바이스 무제한 연결 서프샤크 VPN은 무제한 연결을 제공하여 사용자가 필요할 때 언제든지 디바이스의 갯수에 상관없이 VPN을 사용할 수 있다.