AIㆍML

오픈AI, AI 창작물 탐지 툴 출시…”아직 신뢰 못해”

Mark Hachman | PCWorld 2023.02.02
오픈AI는 지난 화요일 자사의 ChatGPT같은 AI가 작성한 글을 AI가 식별하는 AI 클래시파이어(Classifier) 툴을 출시했다고 밝혔다. 문제는 ChatGPT가 오픈AI의 신규 툴을 우회하는 데 꽤 능숙하다는 점이다.
 
ⓒ OpenAI

ChatGPT는 학생들이 다양한 종류의 과제를 분류하는 데 가상 어시스턴트로 사용할 수 있어 학계를 완전히 압도했다. 그럼에도 일부 학생은 선을 넘어 AI로 작성한 콘텐츠를 원본인 것처럼 제출하는 부정행위를 하고 있다. 문제는 어떤 답변이 사람이 쓴 것인지, AI가 쓴 것인지 구분하기 어렵다는 것이다. 

하지만 오픈AI의 클래시파이어에는 한 가지 약점이 있다. 잘 속을 수 있다는 것이다. 오픈AI는 보도자료에서 인간이 작성한 글을 AI가 작성한 글이라고 식별한 것은 26%를 사람이 작성했다고 식별했으며, 문장은 9%였다고 밝혔다. AI가 작성한 글을 사람이 작성했다고 판별한 경우 오픈AI의 툴이 평균적으로 AI를 쓴 사람의 약 1/4을 구분·발견하지 못했음을 알 수 있다. 

그럼에도 클래시파이어는 여러 가지 주의사항도 보여준다. 첫째, 단어가 많을수록 더 좋다는 것이다. 1,000 단어 이하이면 툴이 오판할 확률이 높다는 것이 오픈AI 측의 설명이다. 두 번째로, 현재는 영어로만 작동하며, 코드를 작성한 주체가 AI인지 사람이지 여부를 절대로 확인할 수 없다. 마지막으로, AI가 작성한 글을 클래시파이어를 우회하도록 편집할 수 있다. 오픈AI는 “자사 클래시파이어를 완전히 신뢰할 수 없다”라고 강조했다. 

잠깐 테스트해 봤을 때 AI 클래시파이어는 J.D 샐린저의 호밀밭의 파수꾼(The Catcher in the Rye)의 한 문단을 AI가 작성한 글인지 구분하지 못했지만, 루이스 캐롤의 이상한 나라의 앨리스(Alice in Wonderland)는 ‘매우 높은 확률’로 AI가 작성한 글이 아니라고 결론 내렸다. 또한 클래시파이어는 본지 편집국장이 쓴 글을 사람이 쓴 것이라고 했다. 

그럼에도 ChatGPT로 문장을 작성하려 했지만 액세스가 되지 않아 최근 떠오르는 검색 엔진 유닷컴(You.com)은 제2의 테스트 플랫폼으로 기능했다. 유닷컴은 자체 AI 챗봇을 통합한 바 있다.
 
클래시파이어 툴이 작동하는 모습. / ⓒ OpenAI

유닷컴과 ChatGPT는 출처를 밝힐 때 차이가 있다. 명령어 “식민주의가 서구 문명을 형성한 과정을 서술하라”고 명령하자 유챗(YouChat) 챗봇은 위키피디아, 브리태니커닷컴, 테네시 대학교 명예 세미나를 인용했다. 오픈AI의 클래시파이어는 이 명령어를 ‘AI가 작성했을 가능성 있다’라고 구분했다. 또한 날 수 있는 에뮤에 대한 짧은 스토리와 관련해선 AI가 작성했다고 결론 짓기도 했다.

이후 ChatGPT에서도 식민주의에 대한 글에 대해서도 비슷한 답변을 받았다. ‘클래시파이어는 AI가 작성한 글인지 여부를 명확히 구분하지 못했다’라고 클래시파이어는 결론 내렸다. 

ChatGPT에도 “로켓을 만들어 달로 날아가는 개에 대한 짧은 소설을 작성해”라는 명령어로, 비슷한 소설 테스트를 했는데, 앞 사례처럼 ‘불확실’하다는 답변이 나왔다. 

결론은 오픈AI 툴의 결론은 우유부단한 결론을 내리며, AI가 작성한 글이라고 최종 결론을 내리기 불충분하다는 것이다.

흥미로운 점은 오픈AI는 AI 탐색 툴 중에서 유일한 것도 아니라는 것이다. 하이브(Hive) AI의 한 머신러닝(ML) 엔지니어는 하이브 모더레이션이란 무료 AI 탐지 툴을 만들었다. 하이브 모더레이션(Hive Moderation)은 AI와 사람의 창작물을 구분하는 툴로, 이 툴만이 제대로 역할을 해내는 것으로 보인다. 하이브 모더레이션은 신뢰 비율, 즉 AI가 작성한 글이 포함됐을 가능성에 대한 결과값을 낸다. 

앞의 식민주의 질문에서 하이브 모더레이션은 확증에 가까운 신뢰도 99.9%로 ‘AI가 작성한 글이 포함됐을 가능성이 있음’이라고 말했다. 개와 로켓에 대한 이야기의 경우에도 99.9%가 나왔다. 이상한나라의 앨리스, 호밀밭의 파수꾼 한 토막도 AI가 작성했을 가능성은 0%라고 했다. PCWorld닷컴에 게재된 엔비디아 스토리도 AI가 작성했을 확률이 0%라고 판정했다.
 
ⓒ Hive Moderation

심지어 ChatGPT에 “식민주의가 서구 문명을 형성한 과정에 대해 AI가 작성한 것인지 불확실한 방식으로 설명해”라는 명령어를 시험했을 때에도, ChatGPT는 식별하지 못했지만, 하이브 모더레이션은 식별했다.

실제로 필자가 해본 모든 테스트에서 하이브 모더레이션은 어떤 표본이 AI가 작성한 것인지, 어떤 것이 옳은 지와 관련해 절대적인 신뢰도를 보여줬다. 따라서 오픈AI의 클래시파이어는 오픈AI 계열이란 점에서 주목할 만한 가치는 있을지 모르나, 하이브 모더레이션이 AI 작성 여부를 판단하는 기능에서 초기 선두자일 수 있다. 
editor@itworld.co.kr
 Tags AI IT 오픈AI

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.