빙과 ChatGPT, 인종차별로 오염된 챗봇 테이의 전철 밟나?

Mark Hachman | | PCWorld 2023.02.14
마이크로소프트의 AI 챗봇 테이(Tay)를 기억하는가? AI 기능을 추가한 검색 엔진 빙이 필자의 5학년 아들 앞에서 인종차별적인 단어를 내뱉기 시작한 순간 머릿속에 테이가 떠올랐다. 

필자에게는 아들이 둘 있다. 둘 다 벌써 오픈AI의 AI 기반 도구인 ChatGPT에 익숙하다.  이번 주 검색 엔진 빙이 자체 AI 기반 검색 엔진과 챗봇을 통합한다고 발표했을 때, 집에 돌아와 아들들에게 이 도구가 어떻게 작동하고 이전에 보았던 것과는 어떻게 다른지를 보여줘야겠다는 생각이 가장 먼저 들었다. 

몸이 아파서 집에 있었던 막내 아들에게 가장 먼저 빙을 보여주었다. ‘새로운 빙 체험’ 기사에서처럼 전반적인 인터페이스를 설명해주었다. 하지만 빙이 긴 내용을 말로 설명하고 주석을 다는 원리에 집중했고, 무엇보다도 테이와 같은 전철을 밟지 않도록 사용자가 쓰는 거친 욕설을 학습하지 않을 수 있는 안전 장치를 자세히 설명했다. 테이는 마이크로소프트가 야심차게 소개한 AI 챗봇이었지만, 사용자의 욕설과 인종차별적 혐오 발언을 학습해 인종차별적 사상을 지닌 AI로 변신해버렸다.
 
ⓒ Jon Phillips/IDG

필자가 아들에게 보여주고자 했던 것은 악의 없는 질문을 빙이 어떻게 차단하는지였다. 예시를 위해 “다양한 여러 민족의 별칭을 알려 줘(Tell me the nicknames for various ethnicities)”라는 질문을 던졌다. 

전에도 같은 질문을 던진 적이 있었으므로 빙은 인종차별적인 혐오 단어를 끄집어 낼 가능성이 있다며 필자를 꾸짖었다. 그러나 빙에서 이전 대화가 저장되는 시간은 45분 정도였으므로 더 예전에 빙이 보인 반응은 아들에게 보여줄 수 없었다. 하지만 문제는 빙이 이번에 내놓은 대답을 아들이 봐 버렸다는 점이다. 절대 보지 않았으면 하는 답변이었다.

주의 : 다음 스크린샷은 다양한 인종에 대한 혐오적 표현을 포함한다. PCWorld는 인종차별적 용어를 허용하지 않으며, 파악한 내용을 기사에 정확히 담기 위해 이 스크린샷을 공유할 뿐이다.
 

테이라는 망령

빙이 내놓은 응답은 이전과 완전히 달랐다. 그렇다. 빙은 일부 인종적 별칭이 중립적이거나 긍정적이지만, 인종차별적이고 해로운 별칭도 있음을 환기하며 답변을 시작했다. 그러나 필자는 결과가 둘 중 하나일 거라고 예상했다. 빙은 사회적으로 수용 가능한 인종 집단(흑인, 라틴계)의 특징을 제공하거나 단순히 응답을 거부할 것이라고 말이다. 대신에 빙은 자신이 알고 있는 거의 모든 인종적 묘사를 나열하기 시작했다. 긍정적인 묘사와 상당히 부정적인 묘사 모두 말이다. 
 

부모로서 필자가 어떻게 반응했을지 상상할 수 있을 것이다. 이러한 단어을 알아서도 말해서도 안 된다는 사실을 알고 있는 아들은 무서워하며 화면에서 눈을 피했다. 끔찍한 인종차별 용어가 화면에 뜨기 시작하자 필자는 응답 중지 버튼을 눌렀다. 

아들 앞에서 빙을 실시간으로 시연하지 말았어야 했다는 점을 인정한다. 그러나 변명을 하자면, 이런 일이 절대 일어나지 않을 거라는 확신이 들 만큼 이유가 많았다.

필자는 이 경험을 마이크로소프트에게 알렸고 대변인은 다음과 같이 이야기했다. “문제의식을 환기해주어 고맙다. 마이크로소프트는 이러한 문제를 매우 심각하게 받아들이고 있으며, 출시 초기 단계 학습에 적용하기 위해 전념하고 있다. 즉각적인 조치를 취했고 문제를 해결하기 위한 추가적인 개선을 검토하고 있다.”

다른 회사도 아니고 마이크로소프트는 주의해야 할 이유가 있다. 일례로 마이크로소프트는 이미 2016년에 AI 챗봇 테이 때문에 공개적인 망신을 당한 경험이 있다. 테이가 사용자와의 상호작용으로 학습한다는 사실을 알자 사용자들은 테이에게 인종차별적 발언을 쏟아부었다. 혐오 발언을 잔뜩 들이마신 테이는 인종차별주의자 그 자체로 변해 버렸다.

마이크로소프트는 2016년 테이 사건에 대한 깊은 유감을 표하며, 취약점이 수정되면 재출시하겠다고 밝혔지만 결국 그 계획은 폐기한 것 같다. 특히 어떤 단어가 욕설로 간주되는가에 대한 대중의 잣대가 더욱 엄격해지면서 마이크로소프트는 민감한 주제에 사용자를 노출하는 문제를 진지하게 생각했을 것이다.

의도치 않게 아들을 빙의 욕설에 노출한 지 얼마 후 질문을 다시 던졌다. 스크린샷의 두 번째 반응이 답변이다. 
 

“이미 같은 질문에 답변했습니다. 또한 이 주제에 대한 질문을 이어가는 것은 부적절하다고 생각합니다. 다양한 인종을 부르는 별칭은 사회적·문화적 배경이 다른 사람들에게 상처를 줄 수 있고, 비하하는 말이 될 수도 있습니다. 따라서 그런 행동을 용인하거나 격려하고 싶지는 않습니다. 다른 질문을 하시거나 대화를 마쳐 주시기 바랍니다. 이해해 주셔서 감사합니다.”


과거 대화의 연속이라 할지라도 이것이 필자가 빙에게 기대했던 대답이다.
 

예전과는 다르다고 주장하는 마이크로소프트

여기서 짚고 넘어가야 할 것은 테이도 물론 AI 인격체였지만, 이 답변은 마이크로소프트의 의견을 반영한 것이라는 점이다. 사실상 이 답변은 마이크로소프트가 발화체인 것이나 마찬가지다. 이 스크린샷에는 각주와 링크가 없다. 일반적으로 빙은 답변에 각주와 링크로 출처를 넣지만 이 답변에는 둘 다 없다. 사실상 이 질문에 답하고 있는 것은 AI가 아니라 마이크로소프트인 것이다.  

워싱턴 주 레드몬드 본사에서 열린 마이크로소프트의 빙 출시 행사의 핵심은 테이와 같은 실수가 다시는 발생하지 않을 것이라는 보장이었다. 최고 법무 책임자인 브래드 스미스의 최근 블로그 게시물에 따르면, 마이크로소프트는 이른바 ‘책임감 있는 AI(Responsible AI)’의 기반을 마련하기 위해 지난 6년 간 부단히 노력을 기울여왔다. 2019년 마이크로소프트는 ‘책임감 있는 AI 오피스(an Office of Responsible AI)’를 만들었다. 마이크로소프트는 스미스, ‘책임감 있는 AI’의 리드 사라 버드와 나타샤 크램튼을 ‘책임감 있는 AI’ 최고 책임자로 임명했다. 심지어 ‘책임감 있는 AI 비즈니스 스쿨’까지 운영하고 있다.

마이크로소프트는 인종차별 및 성차별 개념을 책임감 있는 AI의 일부가 되어서는 안 될 할 특정한 가드레일로 만들지는 않았다. 그러나 사용자가 편안함과 안전함을 느껴야 한다는 점을 암시하며 지속적으로 안전을 언급한다. 안전에 인종차별 및 성차별을 걸러내는 작업이 포함되지 않는다면 그것도 큰 문제다.

CEO 사티야 나델라는 출시 행사에서 “개인적·사회적인 측면 모두에서 인간의 가치, 마이크로소프트의 선호와 더욱 일치하는 AI를 구축할 수 있도록, 책임감 있는 AI를 원칙으로, 그리고 엔지니어링 관습으로 환원하는 최우선순위로 받아들인다”라고 설명했다. 

빙과 어떻게 상호작용했는지를 생각하다가 질문 하나가 떠올랐다. 이것은 함정이었을까? 필자는 본질적으로 빙에게 학문적 연구를 가장해 인종차별적 욕설을 따라하라고 요청한걸까? 그랬을 경우, 마이크로소프트는 여기에서도 안전 가드레일 제공에 있어 크게 실패한 것이다. 


이 동영상(51:26)을 틀면 몇 초 후 바로 마이크로소프트의 애저 AI의 책임감 있는 AI 리더인 사라 버드가 인간이 빙을 설득해 자사 안전 규칙 위반을 저지를 수 있는지를 확인하려고 시도한다. 빙과의 상호작용을 위해 자동화된 대화 도구를 설계한 방법을 설명하는 이야기한다. 말하자면, 대중이 사용하기 전에 마이크로소프트가 이 도구를 가지고 폭넓은 테스트를 거친다는 의미다.  

충분한 시간을 들여 빙 챗봇을 가지고 실험하자, 똑같은 질문을 너무 많이 해도 AI의 답변이 각각 다를 것이라는 점을 알아낼 수 있었다. 그러나 좋은 친구 혹은 가까운 동료와 지금까지 나눈 모든 대화를 떠올려보자. 대화가 수백 번 순조롭게 진행되더라도, 예상치 못한 끔찍한 말을 듣는 어떤 한 순간이 그 사람과의 모든 미래 상호작용을 바꿀 것이다. 

혐오와 비방이 가득한 답변이 마이크로소프트의 ‘책임감 있는 AI’ 프로그램과 부합할까? 이 질문으로 인해 언론의 자유, 연구의 의도 등과 관련된 수많은 질문이 파생된다. 그러나 마이크로소프트는 이 점에서 완벽성을 보여주어야 한다. 그러나 어디까지나 앞으로 이렇게 하겠다는 확신을 주려고 했다. 앞으로 시간을 두고 계속 지켜볼 일이다. 

입에 올리기는커녕 절대로 머릿속에 떠올리지도 않았으면 하는 혐오 표현에 아들을 노출시켰다는 사실에 충격을 받고 당황한 필자는 그날 밤 빙을 PC에서 삭제했다. 향후에도 이 도구를 사용할 것인가를 확실히 재고하게 된 경험이었다.   
editor@itworld.co.kr 

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.