2018.03.29

IDG 블로그 | 인공지능으로 가짜뉴스 문제를 해결하는 방법

James Kobielus | InfoWorld
가짜 뉴스 현상에서 AI의 역할은 너무나 과장됐지만, AI는 만연한 오류 정보 조작을 해결하는 데 도움이 된다.

오늘날의 정치 상황에서 가장 자주 거론되는 용어 중 하나는 ‘가짜 뉴스’일 것이다. 예를 들어, 현 미국 대통령은 자신에게 우호적이지 않은 뉴스를 가짜 뉴스의 일종이라고 공격하지 않은 날이 없다.

물론 도널드 트럼프 대통령의 엄청난 신뢰도 격차로부터 주의를 돌리기 위한 서투른 시도로 일축할 수도 있다. 실제로 가짜 뉴스 문제는 과장된 면이 있으며, 2016년 미국 대통령 선거 기간에는 특히 심했다. 하지만 사람들의 가짜 뉴스에 대한 걱정이 사라진 적은 없다. 국내외를 막론하고 정치 공작원이 매일 매일의 뉴스를 자신들에게 유리하게 조작하기 위해 할 수 있는 모든 것을 하고 있다는 것을 부인하기는 어렵다.

Image Credit : GettyImagesBank

AI는 가짜 뉴스 문제에 연루되어 있다. 정치 공작원이 AI 툴을 사용해 가짜 기사를 만들고 배포한다는 증거는 없다. 하지만 사악한 판도라의 상자로 여겨지는 AI에 가짜 뉴스에 대한 책임을 묻는 의혹의 시선은 멈추지 않고 있다. 자연어 처리, 인간의 뇌를 닮은 신경망, 그리고 데이터 중심의 알고리즘 등이 필경 인류에 도전할 것처럼 느껴지기 때문이다.

좀 더 넓은 관점에서 보면, AI는 가짜 뉴스에 기여하는 요인이 될 수 있다. 하지만 어디까지나 솔루션의 일부일 뿐이다. 결국 정치 방정식의 모든 진영이 이런 툴을 이용할 수 있고, 따라서 AI는 우리가 사용할 수 있는 양날의 검이다.

그렇다면 과연 AI는 가짜 뉴스 문제에서 어느 정도의 원인일까? 새로운 기법을 사용해 놀랄 정도로 진짜 같은 문자와 이미지, 비디오, 오디오, 심지어 대화까지 생산할 수 있다는 점에서 모든 가능한 콘텐츠 종류를 조작할 수 있는 기술적 가능성을 의심하는 사람은 없을 것이다. 이런 알고리즘의 역량은 학습 데이터의 증가와 적대신경망(Generative Adversarial Networks)의 정교화, 숙련된 데이터 과학자의 참여 등으로 점점 더 발전할 것이다.

이런 인식이 대중의 생각에 스며들면서 편집증적인 사람들은 여전히 어딘가 가짜 뉴스 조달자가 있다는 막연한 음모론을 믿고 있다. 사실 외계인 납치만큼이나 제대로 된 증거가 없는 일이다.

물론 AI는 가짜 뉴스를 찾아 가능한 차단하는 강력한 툴도 될 수 있다. 이미 오픈소스 커뮤니티부터 연구 프로젝트, 사용 솔루션까지 이 문제를 해결하기 위해 최고의 데이터 과학자가 참여하고 있다. 분명 대형 소셜 미디어와 콘텐츠 업체는 이 기술에 엄청나게 투자하고 있을 것이다.

아직 가야 할 길이 멀지만, 이미 AI가 어떻게 가짜 뉴스에 대한 강력한 방어책을 제공하는지는 개략적으로 알 수 있다.

우선, 이른바 ‘팩트 체크’가 핵심이다. 하지만 모든 상상할 수 있는 주제에 대해 알고리즘이 믿고 결정을 맡길 만한 흠결없는 진실의 정보원이 없다는 명백한 사실 때문에 말처럼 쉽지는 않다. 특히 속보의 경우는 더욱 어렵다.

이런 상황에서 비정상을 탐지하는 AI의 역량이 사실 확인의 핵심 자원이 된다. 만약 특정 뉴스가 여러 번 돌고 난 뒤에도 오직 한 곳의 뉴스 사이트가 특종으로 보도하고 있다면, 가짜 뉴스일 가능성이 있다. 아니면 단지 풍자나 야유, 무지, 그도 아니면 뻔뻔한 사기일 수도 있다.

마찬가지로 AI에 주입한 자연어 이해 역량은 특정 기사의 의미론적 구성 요소를 해체해 각각을 평판이 좋은 소스에 대해 정확도를 교차 확인할 수 있다. 게다가 예측 AI 모델은 의심스러운 뉴스 기사를 격리해 사람이 실시간으로 점검하도록 할 수도 있다. 크라우드 소싱은 확장할 수 있는 온디맨드 팩트 체크 자원 풀을 제공해 AI의 가짜 뉴스 탐지 알고리즘을 훈련할 데이터를 제공할 수도 있다.

불일치 점검은 AI가 사람보다 더 빨리 더 정확하게 수행할 수 있는 또 하나의 가짜 뉴스 색출 프로세스이다. 가짜뉴스 공급자는 아무래도 교정과 같은 편집 과정에 충실하지 않다는 점에서 AI 알고리즘은 문법이나 철자, 구문, 구두점 등의 오류를 확인할 수 있다. 여기에 더해 AI 컴퓨터 비전 알고리즘으로 조작된 사진이나 보정된 이미지를 찾아낼 수 있다.

스팸 확인도 가짜 뉴스의 홍수를 저지하는 데 유용한 AI의 역량이다. 봇넷, 심지어 정치 집단은 가짜 뉴스를 공유하고 ‘좋아요’를 누르고 직접 인터넷에 퍼트리고 있다는 점에서 이를 실시간으로 탐지하도록 AI 모델을 훈련해 너무 늦기 전에 뉴스 순환을 잠식하지 못하도록 할 수 있다. 사람은 획기적인 내용을 담은 기사에 조종 당할 수 있기 때문에 AI의 가짜 뉴스 확인 역량은 이런 사회공학적 공격이 뉴스 순환을 손상하기 전에 막을 수 있는 핵심 요소가 된다. 이미 가짜 뉴스 방지 커뮤니티는 안티스팸 영역에서 가짜 뉴스 블랙리스트나 쓰레기 콘텐츠 표시 애드온 등과 같은 방어책을 사용한다.

물론 이런 방어책이 자신의 소중한 환상을 지지하는 모든 가짜 뉴스 사이트를 열심히 구독하는 당파주의자를 막을 수는 없다. 마찬가지로 표현의 자유를 억압하지 않고 정교하게 만든 가짜 사실을 진짜 뉴스에 심어 배포하는 정치 공작원을 막을 수 있는 기술적인 방법은 별로 없다.

이 모든 것은 결국 사회 시간에 배운 원칙을 다시 한 번 확인해 준다. 민주주의 사회는 공적인 일에 대해 잘 알고 있는 시민에 의해 좌우된다는 것이다. 다시 말해 모두가 많은 뉴스에 대해 개방적인 자세를 유지하면서도 비평적인 생각해야 한다. 자신의 페이스북 피드에만 의존하는 것은 무지로 가는 틀림없는 길이다.  editor@itworld.co.kr


2018.03.29

IDG 블로그 | 인공지능으로 가짜뉴스 문제를 해결하는 방법

James Kobielus | InfoWorld
가짜 뉴스 현상에서 AI의 역할은 너무나 과장됐지만, AI는 만연한 오류 정보 조작을 해결하는 데 도움이 된다.

오늘날의 정치 상황에서 가장 자주 거론되는 용어 중 하나는 ‘가짜 뉴스’일 것이다. 예를 들어, 현 미국 대통령은 자신에게 우호적이지 않은 뉴스를 가짜 뉴스의 일종이라고 공격하지 않은 날이 없다.

물론 도널드 트럼프 대통령의 엄청난 신뢰도 격차로부터 주의를 돌리기 위한 서투른 시도로 일축할 수도 있다. 실제로 가짜 뉴스 문제는 과장된 면이 있으며, 2016년 미국 대통령 선거 기간에는 특히 심했다. 하지만 사람들의 가짜 뉴스에 대한 걱정이 사라진 적은 없다. 국내외를 막론하고 정치 공작원이 매일 매일의 뉴스를 자신들에게 유리하게 조작하기 위해 할 수 있는 모든 것을 하고 있다는 것을 부인하기는 어렵다.

Image Credit : GettyImagesBank

AI는 가짜 뉴스 문제에 연루되어 있다. 정치 공작원이 AI 툴을 사용해 가짜 기사를 만들고 배포한다는 증거는 없다. 하지만 사악한 판도라의 상자로 여겨지는 AI에 가짜 뉴스에 대한 책임을 묻는 의혹의 시선은 멈추지 않고 있다. 자연어 처리, 인간의 뇌를 닮은 신경망, 그리고 데이터 중심의 알고리즘 등이 필경 인류에 도전할 것처럼 느껴지기 때문이다.

좀 더 넓은 관점에서 보면, AI는 가짜 뉴스에 기여하는 요인이 될 수 있다. 하지만 어디까지나 솔루션의 일부일 뿐이다. 결국 정치 방정식의 모든 진영이 이런 툴을 이용할 수 있고, 따라서 AI는 우리가 사용할 수 있는 양날의 검이다.

그렇다면 과연 AI는 가짜 뉴스 문제에서 어느 정도의 원인일까? 새로운 기법을 사용해 놀랄 정도로 진짜 같은 문자와 이미지, 비디오, 오디오, 심지어 대화까지 생산할 수 있다는 점에서 모든 가능한 콘텐츠 종류를 조작할 수 있는 기술적 가능성을 의심하는 사람은 없을 것이다. 이런 알고리즘의 역량은 학습 데이터의 증가와 적대신경망(Generative Adversarial Networks)의 정교화, 숙련된 데이터 과학자의 참여 등으로 점점 더 발전할 것이다.

이런 인식이 대중의 생각에 스며들면서 편집증적인 사람들은 여전히 어딘가 가짜 뉴스 조달자가 있다는 막연한 음모론을 믿고 있다. 사실 외계인 납치만큼이나 제대로 된 증거가 없는 일이다.

물론 AI는 가짜 뉴스를 찾아 가능한 차단하는 강력한 툴도 될 수 있다. 이미 오픈소스 커뮤니티부터 연구 프로젝트, 사용 솔루션까지 이 문제를 해결하기 위해 최고의 데이터 과학자가 참여하고 있다. 분명 대형 소셜 미디어와 콘텐츠 업체는 이 기술에 엄청나게 투자하고 있을 것이다.

아직 가야 할 길이 멀지만, 이미 AI가 어떻게 가짜 뉴스에 대한 강력한 방어책을 제공하는지는 개략적으로 알 수 있다.

우선, 이른바 ‘팩트 체크’가 핵심이다. 하지만 모든 상상할 수 있는 주제에 대해 알고리즘이 믿고 결정을 맡길 만한 흠결없는 진실의 정보원이 없다는 명백한 사실 때문에 말처럼 쉽지는 않다. 특히 속보의 경우는 더욱 어렵다.

이런 상황에서 비정상을 탐지하는 AI의 역량이 사실 확인의 핵심 자원이 된다. 만약 특정 뉴스가 여러 번 돌고 난 뒤에도 오직 한 곳의 뉴스 사이트가 특종으로 보도하고 있다면, 가짜 뉴스일 가능성이 있다. 아니면 단지 풍자나 야유, 무지, 그도 아니면 뻔뻔한 사기일 수도 있다.

마찬가지로 AI에 주입한 자연어 이해 역량은 특정 기사의 의미론적 구성 요소를 해체해 각각을 평판이 좋은 소스에 대해 정확도를 교차 확인할 수 있다. 게다가 예측 AI 모델은 의심스러운 뉴스 기사를 격리해 사람이 실시간으로 점검하도록 할 수도 있다. 크라우드 소싱은 확장할 수 있는 온디맨드 팩트 체크 자원 풀을 제공해 AI의 가짜 뉴스 탐지 알고리즘을 훈련할 데이터를 제공할 수도 있다.

불일치 점검은 AI가 사람보다 더 빨리 더 정확하게 수행할 수 있는 또 하나의 가짜 뉴스 색출 프로세스이다. 가짜뉴스 공급자는 아무래도 교정과 같은 편집 과정에 충실하지 않다는 점에서 AI 알고리즘은 문법이나 철자, 구문, 구두점 등의 오류를 확인할 수 있다. 여기에 더해 AI 컴퓨터 비전 알고리즘으로 조작된 사진이나 보정된 이미지를 찾아낼 수 있다.

스팸 확인도 가짜 뉴스의 홍수를 저지하는 데 유용한 AI의 역량이다. 봇넷, 심지어 정치 집단은 가짜 뉴스를 공유하고 ‘좋아요’를 누르고 직접 인터넷에 퍼트리고 있다는 점에서 이를 실시간으로 탐지하도록 AI 모델을 훈련해 너무 늦기 전에 뉴스 순환을 잠식하지 못하도록 할 수 있다. 사람은 획기적인 내용을 담은 기사에 조종 당할 수 있기 때문에 AI의 가짜 뉴스 확인 역량은 이런 사회공학적 공격이 뉴스 순환을 손상하기 전에 막을 수 있는 핵심 요소가 된다. 이미 가짜 뉴스 방지 커뮤니티는 안티스팸 영역에서 가짜 뉴스 블랙리스트나 쓰레기 콘텐츠 표시 애드온 등과 같은 방어책을 사용한다.

물론 이런 방어책이 자신의 소중한 환상을 지지하는 모든 가짜 뉴스 사이트를 열심히 구독하는 당파주의자를 막을 수는 없다. 마찬가지로 표현의 자유를 억압하지 않고 정교하게 만든 가짜 사실을 진짜 뉴스에 심어 배포하는 정치 공작원을 막을 수 있는 기술적인 방법은 별로 없다.

이 모든 것은 결국 사회 시간에 배운 원칙을 다시 한 번 확인해 준다. 민주주의 사회는 공적인 일에 대해 잘 알고 있는 시민에 의해 좌우된다는 것이다. 다시 말해 모두가 많은 뉴스에 대해 개방적인 자세를 유지하면서도 비평적인 생각해야 한다. 자신의 페이스북 피드에만 의존하는 것은 무지로 가는 틀림없는 길이다.  editor@itworld.co.kr


X