두 회사 모두 수집 및 분석된 데이터는 AI 챗봇의 지능을 개발하기 위한 핵심 데이터라고 주장한다. 애플 역시 구글과 마찬가지로 “매일의 시리 활동에서 그레이딩(grading)에 사용되는 비중은 1% 미만이며 데이터는 일반적으로 몇 초 정도의 길이”라고 해명했다. 가디언에 녹음 데이터를 제공한 내부고발자는 자신이 맡은 일이 “음성 비서의 활성화가 사용자가 의도한 것인지 우발적인 것인지 여부, 사용자의 질의가 실질적으로 시리가 도움을 줄 만한 내용인지 여부, 시리의 응답이 적절했는지 여부 등을 포함한 다양한 요소에 대한 응답을 그레이딩하는 것”이었다고 말했다.
애플은 시리 데이터가 무작위로 처리되고 “다른 애플 서비스를 통해 수집되는 다른 데이터와 연계되지 않는다”는 점도 강조했지만, 내부고발자는 가디언과의 인터뷰에서 녹음 데이터에는 “사용자의 위치, 연락처 정보, 앱 데이터가 함께 첨부됐다”고 말했다.
애플이 사용자의 애플 ID와 시리를 엄격히 분리한다는 점을 감안하면 이 정보가 어떻게 녹음 데이터에 연결되는지는 불분명하다. 가디언은 “녹음 데이터에는 구체적인 이름이나 식별 정보가 첨부되지 않았으며 개별 녹음 데이터를 다른 녹음 데이터와 쉽게 연결할 수도 없었다”고 전했다. 오래 전부터 시리와 관련해서 개인정보보호를 중시하는 회사 정책을 홍보해온 애플은 “아이폰에서 일어난 일은 아이폰 안에 머무른다”고 주장한다.
또한 애플 측은 가디언에 “시리 응답은 보안 시설에서 분석되며, 모든 검수자는 애플의 엄격한 기밀 요건을 의무적으로 준수해야 한다”고 말했다. 이렇게 보면 애플은 사용자의 시리 대화를 보호하고 시리 대화 내에 존재하는 데이터를 단서로 사용자를 특정할 수 없도록 하기 위해 상당한 노력을 기울이는 것으로 보인다.
물론 사용자가 추적될 가능성이 없다고는 할 수 없다. 비록 수집된 데이터로 불법적인 행위가 일어났다고 믿을 만한 근거는 없지만 시리를 비롯한 모든 음성 기반 비서가 호출 단어와 비슷한 소리로 작동될 수 있다는 사실에는 변함이 없다. 그것이 문제의 핵심이다. 전화기 또는 홈팟은 우발적으로 작동되면 사용자가 녹음되기를 원하지 않을 민감한 대화나 로맨틱한 관계 등 들리는 모든 소리를 녹음하기 때문이다. 내부고발자에 따르면 시리는 명확한 “헤이 시리” 명령이 없어도, 예를 들어 재킷의 “지퍼를 여닫는 소리”에도 반응해서 수시로 활성화된다.
이 데이터 조각이 그레이딩에 사용되는 데이터 중 하나로 선택된다면 계약업자가 들을 수 있다. 또, 애플 워치를 사용하면 의도하지 않아도 시리가 작동할 가능성이 대폭 높아진다. 워치를 위로 들어 올리기만 해도 시리가 작동되기 때문이다. 애플 워치는 항상 켜져 있으므로 시리가 민감한 대화를 우발적으로 녹음하게 될 가능성이 폰이나 홈팟에 비해 더 높다.
사용자에게 결정권 부여해야
시리의 인간 분석은 중요하다. 애플이 아무리 온갖 테스트를 하더라도 실제 세계의 샘플이 없으면 시리의 무작위 샘플을 수집이 얼마나 효과적인지 알 방법이 없기 때문이다. 그건 쟁점이 아니다. 그러나 무작위든 아니든 애플이 정보를 흡수하는 풀에 내가 포함될지 여부는 나 스스로 결정할 권리가 있어야 한다.애플은 초기 설정에서 위치, 광고 추적, 앱 충돌, 마이크 액세스 등 다른 모든 것에 대해서는 사용자에게 의사를 물으면서도 무작위 데이터 수집에 동의하는지 여부는 묻지 않는다. 또한 무작위 데이터 수집을 끄는 설정도 없다. 현재 상태에서는 수집을 거부할 방법이 없다. 가디언이 지적했듯이 애플은 긴 개인정보보호 정책 어디에도 “가명화된 녹음 데이터를 사람이 직접 듣고 작업한다”는 사실을 명시적으로 언급하지 않는다.
아마 애플은 이 인적 요소(사람이 듣는다는 점)를 포괄하는 새로운 문구로 개인정보보호 정책을 수정하는 방법을 택하겠지만, 개인정보보호를 안드로이드 폰 대비 아이폰의 강점으로 줄기차게 주장하는 회사로서 그 정도로는 충분하지 않다. 사용자는 초기 설정 과정에서 옵션을 통해 모든 시리 데이터 수집을 손쉽게 거부할 수 있어야 한다. 그렇게 한다면 사용자와의 신뢰를 지키는 데 있어 큰 진전이 될 것이다.
또한 시리의 질의를 보고 삭제할 수도 있어야 한다. 지금은 대화 내역을 확인하는 유일한 방법은 시리에게 요청하는 것이고, 삭제하는 유일한 방법은 사파리 기록을 지우고 시리의 구술을 비활성화하는 것이다. 구글과 아마존이 제공하는 세부적인 질의 타임라인과는 차이가 크다. 시리에서도 민감한 대화를 찾아 삭제하고, 호출하지 않은 시점에 시리가 무엇을 들었는지도 전체적으로 볼 수 있어야 한다. 지금 문제가 되는 부분이 바로 후자와 관련된 사항이다.
물론 아이폰에서 헤이 시리 호출어나 워치의 팔 들어 말하기 동작을 끌 수는 있다. 그러나 이 경우 기능과 편의성이 제한된다. 오디오 데이터 수집을 거부할 수 있는 간단한 스위치만 있으면 사람들도 애플의 데이터 수집을 훨씬 더 편안하게 받아들이게 된다. 애플이 시리 개발을 위해 분석할 데이터를 수집한다는 사실을 사용자가 이미 알았다면 자극적인 문구를 사용한 외설스러운 기사도 나오지 않았고, 파장이라고 해봐야 일부 사용자가 설정으로 들어가 데이터 수집을 끄는 정도였을 것이다.
모두가 시리가 더 개선되기를 원한다. 필자는 애플이 이를 위해 일부 녹음 데이터를 수집해 들어야 할 필요가 있다는 점도 이해한다. 단지 그 과정에 내가 포함될지 여부를 나 스스로 결정할 수 있기를 원할 뿐이다. editor@itworld.co.kr