소셜미디어 / 웹서비스

MS와 빙, 커뮤니티 의견 기반 검색 결과로 '가짜 뉴스' 위험을 극복할 수 있을까?

Mark Hachman | PCWorld 2017.12.19
최근 마이크로소프트는 공식 기자 회견을 통해 빙이 앞으로 ‘대안적 사실’, 즉 개인의 견해를 워싱턴 포스트 같은 공식 보도와 동등하게 간주할 계획이라고 말했다.

오해는 없기 바란다. 이것은 개인의 ‘견해’이고 어디까지나 ‘대안적 사실’이다. 그러나 향후 몇 주 동안 빙에서 도입될 새로운 접근법인 것은 분명하다. ‘사실을 넘어서는 것’들을 의견이 중심이 되는 새로운 세상으로 몰아내는 접근법이다. 빙은 단순한 검색 결과 목록에 그치지 않고, 특정 질문에 대립하는 두 가지 견해(의견)를 반영하는 답을 제시할 예정이다. 새로운 목소리 중 하나는 수많은 사람들이 활발히 기여 및 참여하고 있는 인기 온라인 커뮤니티인 레딧(Reddit)이다.

이 글을 읽는 독자들도 두 가지 상반된 견해가 제시되는 것이 유용한 상황이나 사례들을 떠올릴 수 있을 것이다. 새 ‘스타워즈’는 볼만한 영화일까? 안드로이드와 iOS 중 무엇이 더 나을까? ‘콜레스테롤이 건강에 좋을까?’ 같이 사실에 가까운 정답이 존재하는 질문 또한 양쪽의 찬반 논쟁이 유용할지 모른다. 그러나 빙이 조심스럽게 다뤄야 하는 질문들이 있다.


“오바마는 이슬람교도일까?"라는 질문을 빙은 어떻게 분류하는가
마이크로소프트 AI 디비전의 파트너 디자인 및 기획 담당 크리스티나 베어는 빙의 새로운 접근법을 설명하면서 가장 ‘시시한’ 검색 질문을 선택했다. “양배추가 사람 몸에 좋을까요?”라는 질문이었다. 베어는 이 질문을 선택한 이유에 대해 “그래야 양배추의 모든 것이 정말 놀랍다는 ‘거품’에 빠지지 않으니까요”라고 대답을 했다.

베어는 빙이 ‘곤란한’ 근본적인 질문을 어떻게 처리할지 설명하지 않았다. ‘신이 존재할까?’ 같은 질문이 여기에 해당된다(현재 빙 검색 결과에 따르면, 신은 존재한다.). 이 경우에는 기댈 데가 존재할지 모른다. 무신론자는 신의 존재를 부정하고, 기독교도는 신의 존재를 확신하기 때문이다. 진실은 누구도 모른다. 마이크로소프트는 2가지 관점을 모두 제공해 궁지에서 벗어날 수 있다.


그러나 신의 존재는 과학과 종교 간 ‘성전’에 비하면 ‘아이들 장난’이다. 단 7일만에 세상이 만들어졌다고 믿는 사람이 있을까? 기후 변화는 진짜가 아닐까? 사람이 기후 변화를 초래했을까? 근본주의 기독교도는 7일만에 세상이 만들어졌다고 믿는다. 물론 이것이 ‘이들이 틀렸다’는 사실을 바꿔 놓지 않는다. 논쟁의 여지가 없이 틀렸다. 절대적으로 틀렸다. 그러나 검색 엔진은 그렇게 판단하지 않는다. 2가지 관점을 모두 제공하기 때문이다.

마이크로소프트에서 빙과 코타나 등 AI 사업 조직을 책임지고 있는 조디 리바스 부사장은 검색 엔진이 극복해야 할 진짜 문제가 ‘근본적인 질문’이라는 점을 인정한다.

데이터가 아주 확실한 경우도 있다. 조지 워싱턴의 출생연도를 예로 들 수 있다. 이 경우, 정답은 단 하나다. 하지만 견해와 관점이 다른 질문들도 많다. 리바스는 “그런데 특정 관점에 다른 관점보다 더 큰 가중치를 줘야 하는 질문들이 존재한다”고 말했다.

리바스는 “이것이 도전과제이다. 빙을 비롯한 검색 엔진은 원래 가장 관련성이 큰 대답을 찾는 것을 추구했다. 그러나 이런 접근법이 적합하지 않은 사례들도 많다고 생각한다. 이에 모두 권위가 있는(믿을 만한) 경우, 여러 관점을 제시하는 시도를 하는 것이다.”고 덧붙였다.
레딧을 중심으로 ‘권위’에 대한 질문이 제기된다
리바는 “’권위’가 곧 ‘키워드’다. 그러나 이를 알려주는 신호를 찾기가 쉽지 않다”고 설명했다.

마이크로소프트는 ‘권위’를 판단 및 결정하는 기준을 수립했다. 예를 들어, 마이크로소프트의 검색 알고리즘은 팝업 광고가 가득한 사이트를 스팸 사이트로 분류해 검색 결과 순위를 낮춘다. 그러나 다른 사람이 추천하는 사이트 등 권위 있는 사이트는 저절로 검색 순위가 상승한다. 또한, 두 가지 목소리가 반영될 확률도 높아진다.


리바스는 “이런 기술의 일부를 레딧에, 또 커뮤니티 자체의 중재 기능으로 사용할 계획”이라고 설명했다.

일면 제대로 된 계획처럼 들린다. 그러나 레딧의 ‘현실’을 감안했을 때 효과가 있을지는 불확실하다. 불특정다수의 커뮤니티인 레딧은 스스로를 인터넷의 ‘프론트 페이지’로 홍보한다. 공동 창업자인 알렉시스 오하니안(Alexis Ohanian)에 따르면, 활성 사용자가 3억 3,000만 명에 달한다. 새로운 게시물은 매달 1,070만 개, 코멘트(댓글)는 매일 280여 만 개에 달한다. 마이크로소프트의 빙 알고리즘은 이런 코멘트 전부를 ‘흡수’할 예정이다. ‘트렌드가 반영된’ 코멘트는 빙 사용자 검색 페이지의 상단으로 보낼 계획이다. 유사하게 질문을 한 사용자는 관련된 레딧 대화가 이 질문에 대한 답을 제공할 경우, 페이지 상단에서 이를 확인할 수 있게 된다.

사용자는 모든 레딧 게시물과 코멘트에 대해 ‘업보트(Upvote, 좋아요)’나 ‘다운보트(Downvote, 싫어요)’ 점수를 얻는다. 이 점수는 해당 코멘트나 게시물의 중요도를 높이거나 낮추는 역할을 한다. 그러나 사용자들이 마음껏 ‘업보트’와 ‘다운보트’를 ‘행사’할 수 있다는 문제가 있다. 예를 들어, 유용한 정보라서 업보트를 받을 수도 있고, 아이러니하게 관련이 없는 주제이지만 웃겨서 업보트를 받을 수도 있다. 또한, 최초 게시자가 답글을 다는 경우, 내용과 상관없이 업보트의 수가 증가하는 경향도 있다. 레딧 사용자가 ‘본명’으로 정보를 게시하는 경우는 드물다. 따라서 특정 주제의 ‘권위자’를 파악하기 아주 어렵다.

서브레딧(Subreddit)은 독자적인 기준에 입각해 독립적으로 ‘완화’를 시도한다. 예를 들어, r/science subreddit은 각 링크에 출처를 표시하고, 주제에 부합하는 코멘트만 게시할 것을 요구한다. “r/eyebleach subreddit”은 NSFW(Not Safe For Work, 직장에서 보면 안되는) 사진을 금지하고, ‘행복하고, 사랑스러우며, 적당히 ‘섹시’한’ 이미지를 장려한다.

다시 말해, 게시물이나 코멘트는 특정한 이유 없어도 인기를 얻고 성공할 수 있다. 따라서 어떤 게시물이나 코멘트가 빙으로 이동할지 확신할 수 없다. 마이크로소프트의 리바스는 업보트가 ‘권위’를 결정하는 중요한 요소 중 하나가 될 것이라고 인정했다. 사용자가 다른 사용자에게 유용한 정보를 제공한 것인지, 아니면 장난을 친 것인지 알 수 있는 방법이 존재하지 않아 이런 선택을 했을 수도 있다. 즉 마이크로소프트는 ‘인기’와 ‘정확도’를 혼합한 전략을 택한 셈이다. 따라서 빙이 ‘사실’을 제공하는지, ‘견해’를 제공하는지 알 방법이 없다.

그러나 레딧의 오하니안은 ‘진짜’ 사람들이 ‘업보트’를 행사하고 코멘트와 뉴스를 옮긴다는 점에서 페이스북 같은 사이트와 차별화가 된다고 강조한다. 페이스북 같은 사이트는 알고리즘(때로는 유료 광고)을 기반으로 게시물을 전파하기 때문이다. 오하니안은 인터뷰에서 “레딧에서 뉴스가 확산되기 위해서는 아주 많은 사람들이 ‘동의’나 ‘좋다’고 말해야 한다.”고 강조했다.


또 “사용자가 가짜 정보를 게시하고, 이 게시물이 수많은 업보트를 통해 전파되는 사례는 광범위하지 않다.”고 덧붙였다. 오하니안에 따르면, 레딧에는 오바마 전 대통령이 이슬람교도라는 ‘거짓’을 확산시키는 r/the_donald 같은 ‘악성’ 서브레딧에 적극적으로 대응하는 ‘안티-이블’ 팀이 있다. 오하니한과 레딧의 홍보 책임자인 알리 맥은 “질문을 적합한 서브레딧과 연결하는 편집이나 수정 프로세스도 존재한다”고 덧붙였다. 예를 들어, ‘최고의 팬층을 보유한 NFL 팀은?’ 같은 질문은 시애틀 시호크스(Seattle Seahawks) 서브레딧으로 연결된다.

오하니안은 “우리는 커뮤니티의 순위에 영향을 주는 ‘핫’한 부분과 관련된 알고리즘은 물론, 코멘트에 대한 알고리즘에 대해서도 많은 것을 생각하고 있다. 레딧 스레드의 대화 품질이 다른 사이트보다 훨씬 더 우수하다고 생각한다. 그렇지만 항상 더 개선시킬 여지가 있다.”고 설명했다.

알고리즘이 지배하면, 사용자가 피해를 입을 수 있다.
그러나 마이크로소프트의 경우, '편집이나 수정’ 같은 ‘감시감독’이 존재하지 않는다. 리바스는 “확장이 어렵거나 불가능하기 때문에 모든 것을 알고리즘이 견인한다.”고 말했다.

그렇지만 필터를 활용할 계획도 세운다. 사용자가 성인 등급 콘텐츠 검색에 대해 ‘성인’ 필터를 활성화시킬 경우, 빙은 검색 결과에 이 필터를 적용한다.


마이크로소프트와 레딧이 콘텐츠를 ‘감시감독’ 할 수 있는 경우에도, 자동 프로세스가 ‘농락’ 당할 수 있다. 2016년을 예로 들면, 마이크로소프트의 테이(Tay) AI 챗봇이 ‘세뇌’를 당해 급진 우익의 도구가 되어버린 사례가 있었다(후계자들인 조(Zo)와 샤오이스(XiaoIce)는 지금까지는 이런 문제가 없음). 레딧은 ‘더 도널드(The_Donald)’ 같은 극우 사이트의 게시물을 더 많은 사람들이 보도록 첫 페이지로 이동하려고 시도한 많은 봇과 사용자들을 저지하기 위해 고군분투한 ‘역사’를 갖고 있다.

더 나아가, 다양한 레딧의 서브레딧들이 검색 엔진을 가지고 놀려 시도한 ‘역사’도 깊다. “Lets upvote this so that foreigners see this picture when they Google South Africa(외국인이 구글에서 남아프리카를 검색하면 이 사진을 볼 수 있도록 업보트!),” 같은 게시물은 무해한 게시물이니 넘어간다 하더라도, ‘힐러리 클린턴의 사진을 ‘거짓말쟁이’라는 검색어와 연결한 행위’는 선거에 영향을 줬을 수도 있다(빙이 이런 콘텐츠를 차단할 수 있을까? 아직도 ‘영화 전체(Full Movie)’라고 검색하면 유튜브의 해적판 영화가 검색되는 경우도 있다). 현재도 페이스북의 ‘가짜 뉴스’가 2016년 대선에 영향을 줬다고 비난 받고 있는 실정이다. 향후 중간 선거 동안에 동일한 메카니즘이 빙에 적용될 가능성을 배제하기는 어렵다.

그러나 리바스는 마이크로소프트의 알고리즘은 과거의 실수와 실패를 반복하지 않을 것으로 믿고 싶어한다. 그는 “’언론의 자유’, ‘다른 견해(의견)’를 존중해야 한다. 그러나 동시에 신뢰도가 높은 권위 있는 소스에 더 큰 가치를 줘야 한다. 여기에 어떤 방법을 사용해야 할까? 이것이 근본적인 도전과제”라고 말했다.

필자도 궁금하다. 어떤 방법이 있을까? 마이크로소프트와 빙이 새로운 검색 경험을 배포하면서, 이런 방법을 찾아낼지도 모르겠다. 그러나 가짜 뉴스의 ‘견해’가 ‘사실’을 혼탁하게 만들고 있는 세상에서 검색 엔진까지 이 두 가지를 융합할 필요가 있을까? editor@itworld.co.kr  

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.