2020.09.21

“유튜브의 깜깜이 추천 알고리즘을 파헤친다” 모질라 리그렛리포터

Mark Hachman | PCWorld
모질라의 리그렛리포터(RegretReporter)는 유튜브의 추천 알고리즘을 파헤쳐 왜 원하지 않는 동영상을 제시하는지 파악하고자 하는 노력의 결과물이다.
 
ⓒ Mozilla

일상적으로 유튜브에서 여러 동영상을 보다 보면, 갑자기 생각하지 못한 상황에 부딪힌다. 들어본 적도 없는 콘텐츠 제작자가 달 착륙은 가짜라는 이야기를 하려고 한다. 당황스러운 순간이다. 이런 경험이 있는 모든 사용자처럼, 모질라의 리그렛리포터는 어떻게 이런 일이 어떻게 일어났는지 알고자 한다.

파이어폭스와 크롬에서 이용할 수 있는 모질라의 새로운 플러그인 리그렛리포터는 2017년 엘사게이트 스캔들을 되짚어 본다. 어린이가 좋아하는 캐릭터를 엽기적이고 불쾌한 상황에 이용한 이런 동영상은 콘텐츠 제작자가 유튜브 추천 알고리즘의 허점을 노린 것이다. 유튜브는 이런 종류의 동영상이 수익을 내지 못하도록 하고, 유튜브 키즈 채널에는 나타나지 못하도록 했다고 밝혔다. 

하지만 문제가 완전히 사라진 것은 아니다. 아무런 의도 없는 ‘과학’ 비디오 검색이 유튜브의 ‘깜깜이’ 추천 알고리즘 때문에 음모 이론의 수렁으로 이어질 수 있기 때문이다. 이런 경우, 사용자는 ‘신고하기’를 클릭해 해당 동영상을 유튜브에 신고할 수 있다. 하지만 그 이후에는 어떻게 되는가? 리그렛리포터는 본질적으로 사용자가 별도의 익명화된 불만을 제기할 수 있도록 해준다. 연구원은 사용자의 불만 신고를 유튜브가 왜 어떻게 이런 동영상을 보여주는지 분석하는 데 사용할 수 있다.

동작 방식은 간단하다. 사용자는 브라우저 확장 프로그램을 다운로드해 설치하면, 리그렛리포터는 백그라운드에서 조용히 감시하며 사용자가 얼마나 오랫동안 유튜브를 서핑하는지 드러나지 않게 추적한다. 사용자가 신고할 만한 동영상을 발견하면, 리그렛리포터는 해당 동영상의 URL을 기록하고 신고하는 이유를 묻는다.

이제 리그렛리포터는 사용자가 이전에 시청했던 동영상 목록을 사용자의 ID는 익명으로 유지한 채 제공해 동영상의 연쇄가 구글의 토끼굴로 서서히 이어지는 과정을 구축한다. 여기서 파악하고자 하는 것은 어떤 비디오가 인종주의자나 폭력, 음모론 콘텐츠로 이어지는 실마리가 됐으며, 궁극적으로 이런 결과로 이어지는 패턴이 있는지 여부이다. 모질라는 연구 결과를 공개적으로 공유할 계획이라고 밝혔다.
 
리그렛리포터는 파이어폭스와 크롬용 확장 프로그램으로, '유감스러운' 비디오를 연구원에게 신고해 유튜브가 해당 비디오를 추천한 이유를 알아내고자 한다. ⓒ Mozilla

모질라가 유튜브 같은 사이트의 AI 알고리즘을 검증하기 시작한 것은 2019년 말이다. 모질라의 부사장 애쉴리 보이드는 자신의 유튜브 추천 목록에 한국 비디오가 등장하는 것을 목격했는데, 한국 로맨틱 코미디 드라마를 본 다음에 일어난 일이었다. 보이드는 자신이 유튜브에서 보내는 시간의 70%를 유튜브 추천 목록을 보는 데 사용한다고 말했다.

보이드는 “만약 우리가 제대로 알지 못하는 상태에서 데이터가 수집되어 광고나 다른 콘텐츠를 보내는 데 사용된다고 생각한다면, 리그렛리포터는 상황을 약간 뒤집어서 사람들이 자신의 정보를 집단 연구 프로젝트의 일부로 사용할 수 있도록 하는 것이다”라고 설명했다.
 
리그렛리포터로 동영상을 신고하는 과정. ⓒ Mozilla

리그렛리포터의 데이터 역시 인간 사용자와 마찬가지의 약점을 가질 수 있다. 모질라는 ‘유감스럽다’의 기준이 사람마다 다르다는 점을 인정했다. 이 툴은 메타데이터를 추적하지 않기 때문에 동영상의 어떤 점이 유튜브로 하여금 다음 동영상을 추천하게 했는지를 알아내는 것은 연구원의 직관에 달려있다. 사용자는 리그렛리포터에 연속적인 비디오 시청 기록을 제공할 것인지를 결정할 수 있으며, 제공하지 않으면 데이터의 유용성은 떨어진다. 유튜브의 알고리즘은 본질적으로 블랙박스와 같으며, 모질라의 목표는 그 속에 조금이라도 빛을 비추는 것이다.

유튜브는 모질라 연구원들이 관심을 가지고 있는 사이트 중 하나일 뿐이다. 보이드는 모질라가 이미 트위터 트렌드와 해시태그 및 기타 기법에 의한 확산성에 대한 질문을 시작했다고 밝혔다. 모질라는 또한 데어튜브(TheirTube)와도 관련되어 있다. 아티스트 토모 키하라가 만든 데어튜브는 6가지 페르소나를 생성해 유튜브가 어떤 비디오를 추천하는지 보여주고자 한다. editor@itworld.co.kr


2020.09.21

“유튜브의 깜깜이 추천 알고리즘을 파헤친다” 모질라 리그렛리포터

Mark Hachman | PCWorld
모질라의 리그렛리포터(RegretReporter)는 유튜브의 추천 알고리즘을 파헤쳐 왜 원하지 않는 동영상을 제시하는지 파악하고자 하는 노력의 결과물이다.
 
ⓒ Mozilla

일상적으로 유튜브에서 여러 동영상을 보다 보면, 갑자기 생각하지 못한 상황에 부딪힌다. 들어본 적도 없는 콘텐츠 제작자가 달 착륙은 가짜라는 이야기를 하려고 한다. 당황스러운 순간이다. 이런 경험이 있는 모든 사용자처럼, 모질라의 리그렛리포터는 어떻게 이런 일이 어떻게 일어났는지 알고자 한다.

파이어폭스와 크롬에서 이용할 수 있는 모질라의 새로운 플러그인 리그렛리포터는 2017년 엘사게이트 스캔들을 되짚어 본다. 어린이가 좋아하는 캐릭터를 엽기적이고 불쾌한 상황에 이용한 이런 동영상은 콘텐츠 제작자가 유튜브 추천 알고리즘의 허점을 노린 것이다. 유튜브는 이런 종류의 동영상이 수익을 내지 못하도록 하고, 유튜브 키즈 채널에는 나타나지 못하도록 했다고 밝혔다. 

하지만 문제가 완전히 사라진 것은 아니다. 아무런 의도 없는 ‘과학’ 비디오 검색이 유튜브의 ‘깜깜이’ 추천 알고리즘 때문에 음모 이론의 수렁으로 이어질 수 있기 때문이다. 이런 경우, 사용자는 ‘신고하기’를 클릭해 해당 동영상을 유튜브에 신고할 수 있다. 하지만 그 이후에는 어떻게 되는가? 리그렛리포터는 본질적으로 사용자가 별도의 익명화된 불만을 제기할 수 있도록 해준다. 연구원은 사용자의 불만 신고를 유튜브가 왜 어떻게 이런 동영상을 보여주는지 분석하는 데 사용할 수 있다.

동작 방식은 간단하다. 사용자는 브라우저 확장 프로그램을 다운로드해 설치하면, 리그렛리포터는 백그라운드에서 조용히 감시하며 사용자가 얼마나 오랫동안 유튜브를 서핑하는지 드러나지 않게 추적한다. 사용자가 신고할 만한 동영상을 발견하면, 리그렛리포터는 해당 동영상의 URL을 기록하고 신고하는 이유를 묻는다.

이제 리그렛리포터는 사용자가 이전에 시청했던 동영상 목록을 사용자의 ID는 익명으로 유지한 채 제공해 동영상의 연쇄가 구글의 토끼굴로 서서히 이어지는 과정을 구축한다. 여기서 파악하고자 하는 것은 어떤 비디오가 인종주의자나 폭력, 음모론 콘텐츠로 이어지는 실마리가 됐으며, 궁극적으로 이런 결과로 이어지는 패턴이 있는지 여부이다. 모질라는 연구 결과를 공개적으로 공유할 계획이라고 밝혔다.
 
리그렛리포터는 파이어폭스와 크롬용 확장 프로그램으로, '유감스러운' 비디오를 연구원에게 신고해 유튜브가 해당 비디오를 추천한 이유를 알아내고자 한다. ⓒ Mozilla

모질라가 유튜브 같은 사이트의 AI 알고리즘을 검증하기 시작한 것은 2019년 말이다. 모질라의 부사장 애쉴리 보이드는 자신의 유튜브 추천 목록에 한국 비디오가 등장하는 것을 목격했는데, 한국 로맨틱 코미디 드라마를 본 다음에 일어난 일이었다. 보이드는 자신이 유튜브에서 보내는 시간의 70%를 유튜브 추천 목록을 보는 데 사용한다고 말했다.

보이드는 “만약 우리가 제대로 알지 못하는 상태에서 데이터가 수집되어 광고나 다른 콘텐츠를 보내는 데 사용된다고 생각한다면, 리그렛리포터는 상황을 약간 뒤집어서 사람들이 자신의 정보를 집단 연구 프로젝트의 일부로 사용할 수 있도록 하는 것이다”라고 설명했다.
 
리그렛리포터로 동영상을 신고하는 과정. ⓒ Mozilla

리그렛리포터의 데이터 역시 인간 사용자와 마찬가지의 약점을 가질 수 있다. 모질라는 ‘유감스럽다’의 기준이 사람마다 다르다는 점을 인정했다. 이 툴은 메타데이터를 추적하지 않기 때문에 동영상의 어떤 점이 유튜브로 하여금 다음 동영상을 추천하게 했는지를 알아내는 것은 연구원의 직관에 달려있다. 사용자는 리그렛리포터에 연속적인 비디오 시청 기록을 제공할 것인지를 결정할 수 있으며, 제공하지 않으면 데이터의 유용성은 떨어진다. 유튜브의 알고리즘은 본질적으로 블랙박스와 같으며, 모질라의 목표는 그 속에 조금이라도 빛을 비추는 것이다.

유튜브는 모질라 연구원들이 관심을 가지고 있는 사이트 중 하나일 뿐이다. 보이드는 모질라가 이미 트위터 트렌드와 해시태그 및 기타 기법에 의한 확산성에 대한 질문을 시작했다고 밝혔다. 모질라는 또한 데어튜브(TheirTube)와도 관련되어 있다. 아티스트 토모 키하라가 만든 데어튜브는 6가지 페르소나를 생성해 유튜브가 어떤 비디오를 추천하는지 보여주고자 한다. editor@itworld.co.kr


X