보안

구글이 우리에 대해 알고 있는 것 1편

Robert L. Mitchell | Computerworld 2009.05.14

AP18CD.JPG“구글은 당신의 어머니보다 당신에 대해 많이 알고 있다”

 

전자 프론티어 재단(Electronic Forntier Foundation)의 수석 변호사인 케빈 뱅크스톤(Kevin Bankston)이 최근에 한 말이다. 몇 년 전이라면 이런 말이 별로 실감나지 않았을 수도 있다. 그렇지만 당신이 계속 확장되는 구글 제품들을 계속해서 많이 사용하는 사람에 속한다면(내 경우 마지막으로 세어봤을 때 12개 정도 사용하고 있었다) 뱅크스톤이 무언가를 알아낸 게 아닌지 궁금할 것이다.

 

프라이버시 옹호론자와 정책 입안자가 일반적인 온라인 프라이버시에 대해, 특히 구글에 대해 경고하는 이유는 쉽게 이해할 수 있다. 구글은 자사의 검색 엔진을 사용하고 있는 사용자가 검색한 사항뿐만 아니라 광고 서비스를 이용하는 파트너 회사의 웹사이트에서 수행한 작업도 알고 있다. 크롬(Chrome) 브라우저를 사용하는 사용자라면 주소창이나 옴니박스(Omnibox)에 친 모든 웹사이트가 노출되었을 수도 있다.

 

구글은 사용자의 이메일(Gmail), 캘린더(Google Calendar), 심지어는 마지막에 있었던 위치(Google Latitude)까지도 모두 알 수 있다. 무엇을 보고 있는지(YouTube), 누구한테 전화하는지에 대해 알 수도 있으며 또, 전화 메시지(Google Voice)의 복사본을 갖고 있을 수도 있다.

 

피카사(Picasa) 웹 앨범에 사용자의 사진을 갖고 있어 얼굴 인식 기술을 사용하여 새로운 사진에서 여러분과 여러분 친구의 얼굴을 구별해 낼 수도 있다. 또한 구글 북스(Google Books)를 이용하여 무슨 책을 읽고 어떤 구절에 주석을 달았으며 얼마 동안 독서를 했는지도 파악할 수 있다.

 

물론 기술적으로 말하자면 구글은 사용자에 관한 어떤 정보도 알지 못한다. 그렇지만 구글은 사용자가 검색한 내용이나 방문한 웹사이트, 클릭한 광고를 통해 사용자의 정보와 서버 상에서 수행한 작업에 관한 어마어마한 양의 데이터를 간직하고 있다.

 

뱅크스톤에 따르면 구글은 “이제까지 존재해왔던 두뇌의 출력 정보와 가장 유사한 것을 갖고 있는 자사를 소비자가 믿어주길 바라고 있다”고 한다.

 

구글의 글로벌 사생활 보호 담당 법률고문인 피터 플레셔(Peter Fleischer) 는 구글이 세 가지 “기본 원칙”에 따라 개인 정보를 이용하고 있다고 설명하면서 “구글에서는 정보를 판매하지 않으며 허가 없이 정보를 수집하거나 광고에 이용하지 않습니다”라고 말했다. 그렇지만 “개인 정보”가 의미하는 것이 무엇인지에 대해서는 폭넓은 합의가 아직 이루어지지 않은 상태이다.

 

이런 비즈니스 모델을 따르는 회사는 구글 뿐만이 아니다. 웨스트포인트의 미국 육군 사관학교 교수이자 구글링의 보안: 구글은 당신에 대하여 얼마나 아는가?(Googling Security: How Much Does Google Know About You?)이라는 책의 저자인 그렉 콘티(Greg Conti)는 “온라인 툴은 사실 무료가 아니다. 우리는 온라인 툴을 사용하면서 그 대가로 개인 정보를 소액으로 지불하고 있는 것이다”라고 말했다. 구글은 개인에 관한 데이터와 개인이 만든 콘텐츠와 온라인에서 무엇을 했는지에 대한 정보를 가장 많이 갖고 있는 회사일 것이다.

 

온라인 사생활 침해에 관한 논란의 중심에 구글이 있게 된 것은 계속 확장되는 제품군과 서비스를 통해 창출되는 구글의 제어권 하에 놓인 숨막힐 정도의 데이터때문이다. 월드 프라이버시 포럼(World Privacy Forum)의 임원인 팸 딕슨(Pam Dixon)에 따르면 “어떤 회사도 구글만큼 소비자의 데이터를 많이 갖고 있지는 않다”고 한다. 비록 구글은 이에 반박하고 있지만 말이다.

 

불투명성 대 투명성

 

비평론자는 구글이 수집한 데이터를 어떻게 사용하는지, 구글 서비스 간에, 또는 광고회사들과 이 정보를 어떻게 공유하는지, 소송을 제기한 사람과 정부 심사원으로부터 어떻게 이 데이터를 보호하는지, 정보를 지우거나 “익명화”하여 사용자를 추적할 수 없게 만들기 전에 얼마나 데이터를 보유하는지에 대한 설명이 너무 모호하다고 말한다.

 

딕슨은 “구글이 데이터를 사용하는 방법이 투명하지 못하고 사용자의 기본적인 정보 권리가 없다는 사실에서 프라이버시가 매우 민감한 문제가 되고 있다”라고 말했다.

 

사생활 보호 정책이 투명하지 못한 것은 구글뿐만이 아니다. 사실 이런 문제는 너무 광범위하게 퍼져 있어 연방 통상 위원회(Federal Trade Commission)은 온라인 사업자 측에 대해 “명료하고, 간단하며 소비자 지향적인 탁월한” 방법으로 회사 측에서 수집하는 데이터가 무엇인지, 데이터를 어떻게 사용하고 사용자들은 어떻게 선택적으로 이를 제외시킬 수 있는지에 대해 설명할 수 없다면 온라인 비즈니스는 앞으로 더 많은 규제를 받게 될 것이라고 경고했다.

 

그렇지만 구글은 데이터에 대한 불투명성과 데이터 범위에 대한 우려는 과장된 것이라고 반박하고 있다. 구글의 법률부서의 제품 법률고문인 마이크 양(Mike Yang)은 “구글이 갖고 있는 정보가 사용자의 사생활을 침해할 가능성이 있다는 인식이 잘못되었다고 생각한다”라고 말했다. 그는 구글이 사용자에게 충분한 투명성과 제어권을 부여하고 있다고 주장한다. “계정 내에 사용자에게 보여지는 것보다 더 많은 정보가 많을 것이라고 생각하기 쉽지만, 이는 사실이 아닌 경우가 많다. 대부분의 제품에서 구글이 사용자에 대해 아는 정보는 서비스 안에서 보여지는 것  뿐이다”라고 설명했다.

 

그렇지만 사실 구글이 저장하는 사용자 정보의 양은 꽤 많다. 이런 정보에는 사용자가 제어하고 사용자의 계정과 연관된 사용자 생성 콘텐츠, 하나 이상의 브라우저 쿠키 아이디와 연관되며 사용자의 컴퓨터에 저장된 서버 로그 데이터 등이 있다. 서버 로그 데이터는 사용자에게 보이지 않으며 개인적으로 식별되는 정보로 간주하지 않아야 한다.

 

이런 로그 정보는 사용자가 구글의 다양한 서비스를 어떻게 사용했는지에 대한 자세한 정보를 갖고 있다. 여런 정보에는 웹 페이지 요청(날짜, 시간, 요청 사항), 쿼리 히스토리, IP 주소, 사용자의 브라우저에 고유한 하나 이상의 쿠키 ID와 기타 메타데이터 등이 포함된다.  구글은 자사의 서버 로그 구조에 대해 더 자세하게 밝히기를 거부했으며 구글의 모든 서비스의 서버 로그가 하나의 통일된 구조는 아니라고 밝혔다.

 

구글은 검색 쿼리 로그와 기타 서버 로그 데이터가 물리적인 컴퓨터의 브라우저와 IP 주소와 연관된 것으로 개인적인 구글 계정과 연관된 것은 아니기 때문에, 이 데이터에 대한 정보를 제공하지 않을 것이라고 밝혔다. 구글은 또 이런 데이터에 대해서 밝히게 되면 문제를 해결하기보다는 더 큰 사생활 침해 문제를 야기할 것이라고 반박했다. 양은 “이런 데이터들을 투명하게 밝히게 되면 자신의 부인이 검색한 사항도 알 수 있게 될 것이다. 이처럼 권리에 관해서는 균형을 잡기가 어려운 법”라고 말했다.

 

사용자들은 이전 어느 때보다도 많은 제어 권리를 갖고 있다. 구글은 수많은 제품에서 14일 이내에 사용자가 생성한 콘텐츠를 제거하지만 이 기간은 더 길수도 있다(지메일에서는 60일이다). 구글은 “합리적인 사용자의 기대나 업계의 관행에 어긋나는” 유지 정책에 관해서 개인정보보호 정책에서나 각각의 제품에서 별도로 고지한다고 밝혔다.

 

사용자는 구글의 광고 선호 관리자(Ads Preferences Manager)에 저장된 관심 분야를 추가, 또는 제거하거나 타깃 광고를 하기 위해 필요한 사용자의 브라우저와 연결하는 더블클릭 쿠키를 선택적으로 없앰으로써 계속 나오는 광고를 제어할 수 있다. 보다 자세한 정보를 보고 싶으면 “구글에서 사생활을 보호할 수 있는 6가지 방법”을 참조한다.

 

구글의 신뢰 및 안전 담당 기업제품 매니저인 슈먼 고셈마줌더(Shuman Ghosemajumder)는 사용자가 걱정할 일은 아무것도 없다고 말했다. 구글의 모든 애플리케이션은 별도의 서버에서 수행되며 어떤 방식으로든 연합되지 않는다는 설명이다. 고셈마줌더는 “구글의 로 로그(raw log)만 제외하면 각 데이터들은 각각의 저장소에 있다”라고 말했다. 그렇지만 어떤 데이터는 특정 환경에서 공유되기도 하며 구글의 프라이버시 정책은 혁신을 위한 재량권을 많이 확보하도록 설계되었다.

 

양은 구글 헬스(Google Health)를 예로 들었다. 사용자가 주치의와 메시지를 교환할 경우 이 메시지가 지메일에 남겨지거나 의사와의 약속 일정이 자동적으로 구글 캘린더(Google Calendar)에 적히길 원할 것이라고 그는 말했다.

 

구글은 투명한 프라이버시 정책에서 결여된 것이 서비스의 투명성에서 보완되길 바라고 있다..

 

그렇지만 의료적인 프라이버시 문제를 지원한 딕슨(Dixon)은 구글의 투명 정책이 약하다며 반박했다. 의료기록은 한번 구글 헬스로 넘어가면 HIPAA나 의사-환자간 기밀성 규칙에 따라 보호받지 않는다. 구글은 구글 헬스를 광고에 사용할 어떠한 계획도 없을 것이라고 밝히고 있지만 데이터를 서비스 간에 공유함으로써 서비스 간의 경계선을 무너뜨리고 있다고 딕슨은 말한다.

 

건강에 문제가 생긴 사용자가 구글 헬스를 사용하고, 구글의 검색 엔진로 질병에 대해 공부하고 지메일을 사용해서 의사와 상의를 하고, 구글 캘린더에 세부 약속을 링크하고 래티튜드(Latitude)에서 인식한 위치가 병원이었다고 하자. 딕슨은 이런 상황에서 “광고업자, 법 집행자, 민사 소송자가 알게 되는 사용자 정보는 무엇일까? 사용자에 관한 사실들은 어디에 있습니까? 이에 대해 알지 못한다는 것이 마음에 걸린다”라고 묻는다. robert_mitchell@computerworld.com

[계속]

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.