AIㆍML / 미래기술

“입 모양 읽고, 희귀병 진단하고” AI가 인간보다 뛰어난 분야들

Peter Sayer | PCWorld 2016.11.18
수백만 년 동안, 인간은 거의 모든 분야에서 지구상의 다른 생명체들보다(예컨대 돌고래나 오랑우탄 같은) 뛰어난 능력을 보여왔다. 물론 수영이나 나무 오르기 같은 것은 예외지만 말이다.

최근 몇 년 사이 인류는 여러 분야에서 그 자신을 능가하는 새로운 형태의 지능을 만들어냈다. 이러한 인공지능(AI)중에서 가장 유명한 것이 아마도 딥마인드(Deepmind)가 개발한 알파고 일 것이다. 알파고는 불과 몇 년 만에 그 역사가 4,000년에 이르는 바둑의 전략을 학습해 2 명의 세계 정상급 기사들과의 대국에서 승리를 거두었다.

딥마인드가 개발한 소프트웨어 중에는 8비트 비디오 게임 '브레이크아웃(Breakout)을 플레이 할 수 있는 인공 지능도 있다. 방망이로 공을 쳐서 벽돌을 떨어뜨리는 게임이다. 이 AI는 별도의 지시 없이 화면만 보고 게임 플레이 방식을 익혔다고 딥마인드 CEO 데미스 하사비스는 자랑스레 말했다. 먼저 화면의 숫자를 읽는 법과 숫자 세는 법을 가르쳐준 후 점수를 최대한 높게 받으라는 명령을 줬을 뿐이었다. 아무리 똑똑한 AI여도 최초의 룰과 동기 부여에 관한 힌트는 필요했던 것 같다.

하지만 AI가 할 수 있는 일이 이게 전부일까? AI가 인간과 비슷한, 혹은 더 우수한 역량을 보여주는 다섯 가지 분야를 소개한다.

나무 블록으로 탑 쌓기
AI라고해서 비디오 게임만 하는 것은 아니다. 가끔은 실제 장난감도 가지고 논다. 마치 인간 아기들처럼, AI도 나무 블록을 쌓아 올리고 무너지는 모습을 보며 기본적인 물리 지식을 익힌다. 페이스북 리서치팀은 회선 신경망(convolutional neural network)을 이용한 AI를 개발했다. 이 AI는 블록으로 쌓은 탑이 무너지는 영상만을 보여주었을 뿐인데 이 정보로부터 인간과 비슷한 수준으로 실제 블록이 무너질 상황을 정확히 예측해내기도 했다.



입 모양 읽기
다른 사람의 입 모양만 보고 그 사람이 무슨 말을 하고 있는지 추측하는 건 결코 쉽지 않은 일이지만, 가능하기만 하다면 청력에 이상이 있는 사람이나, 시끄러운 작업장 등에서 유용하게 쓰일 것이다. 인간이 말을 할 때 필요한 것 중 상당부분(치아와 혀의 위치, 목소리를 내고 있는지 아닌지 등)은 인간과 AI 모두에게 파악하기 쉽지 않은 정보다. 그런데 영국 옥스포드 대학의 한 연구팀이 짧은 문장을 입 모양만으로 읽어낼 수 있는 립넷(LipNet)이라는 시스템을 개발했다. 단어 오류율은 약 6.6%다. 같은 실험에 참가한 인간 경쟁자들의 오류율은 35.5%에서 57.3% 사이였다.

연구팀은 이 기술이 묵음 받아쓰기, 시끄러운 환경에서 입 모양 시각 자료의 도움을 받은 음성인식 등에 활용될 수 있을 것이라 기대했다. 텍스트로 결과물이 나오기 때문에 방송국 TV쇼의 자막 생성 작업에 투입되거나 보안 서비스에서 감시 카메라 내용을 기록하는 역할을 할 수도 있을 것이다.

받아쓰기
AI는 음성 데이터를 텍스트화 하는 작업에는 더욱 능하다고 마이크로소프트는 말한다. 마이크로소프트는 사람만큼, 혹은 사람보다 더 뛰어난 AI 기반의 자동 발화 인식 시스템을 연구 중이다. 이 시스템은 미국 표준 기술 연구소의 테스트에서 5.9% 수준의 오류를 보였는데 이는 마이크로소프트에서 고용한 인간 속기사와 동일한 오류 수준이며, 또 다른 테스트에서는 11.1%의 오차를 보여 11.3%를 기록한 인간보다 약간이지만 우세했다.

하지만 발화된 정보를 받아 적는 기술은 단순히 인간보다 조금 더 나은 정도의 수준으로는 상용화 되기가 어렵다. 발화한 내용 중 잘못 기록된 부분이 있다면 대부분 사람들은 그냥 직접 타이핑을 해 고치는 쪽을 선택할 것이기 때문이다.

뉴스 보도
지금 읽고 있는 이 글은 인간이 쓴 것이지만, 다음 번에 읽게 될 글은 어쩌면 AI가 작성한 것일지도 모른다.

그게 꼭 나쁜 것만은 아니다. 인도의 한 기업 제닉(Genic)에서 개발한 모그IA(MogIA)는 글을 쓰지는 않았지만, 이번 미국 대선에서 도널드 트럼프가 우승할 것이라는 예측을 대부분의 정치부 기자들보다 훌륭하게 해냈다.

AI는 구조화 된 데이터를 단어로 전환하는 작업을 매우 빠르게 해낼 수 있다. 파이낸셜 타임즈의 한 기자와 캘리포니아 주에 위치한 스타트업 스텔스(Stealth)에서 개발한 AI ‘엠마(Emma)’의 대결이 이를 잘 보여준다.

엠마는 통계 수치가 발표되고 정확히 12분만에 실업률 통계에 관한 기사를 써냈는데 이는 FT 기자보다 3배 빠른 속도였다. 정보 측면에서는 매우 정확하고 분명했지만, ‘뉴스’라고 부르기에는 부족했다. ‘1년만에 구직자 수가 반등했다’가 엠마가 내놓을 수 있는 분석의 전부였다. 독자들이 원하는 건 빠른 뉴스이기도 하지만, 정확하고 통찰력 있는 뉴스를 원하기 때문이다.

단순한 고용 통계 정보를 문맥 속에 담아내는 일은 엠마가 가진 지식으로는 역부족이었을 것이다. 하지만 이것이 절대 극복하지 못할 문제점은 아니다. 실제로 IBM에서 개발한 AI 왓슨(Watson)은 사전, 백과사전, 소설, 연극 등 다양한 문언을 읽는 것 만으로 TV 퀴즈 쇼 제퍼디(Jeopardy)에서 우승할 만큼의 문맥적 지식을 얻었기 때문이다.

질병 진단
한편 퀴즈 쇼에서 우승을 거머쥔 왓슨은 이후 의과대학에 진학해 1,500만 페이지에 달하는 의학 서적과 종양학에 대한 학술 논문들을 읽었다. IBM측에서는 AI가 어디까지나 인간 의사들의 작업을 돕는 보조적 역할을 할 뿐이라고 말했지만 일부 보고서에 따르면, 왓슨은 인간 의사들보다 훨씬 뛰어난 암 진단 능력을 보여주었다고 한다.

근래에 왓슨은 방대한 량의 정보를 입력, 처리할 수 있는 능력을 대부분 의사들은 살면서 한두 번밖에 겪거나 진료하지 못하는 희귀병 환자 진단에 활용하고 있다.

왓슨은 독일 마르부르크 대학병원 진단 미확정 희귀병 센터의 의사들에게도 큰 도움을 줄 것으로 기대된다. 센터에는 매년 수천 명의 환자들이 정확한 진단이 내려지지 않은 희귀병을 가지고 찾아오는데 이들 중에는 분석이 요구되는 수천 페이지의 의료 기록을 가지고 오는 이들도 있다.

베르노 빈지나(Vernor Vinge) 레이 커즈웨일(Ray Kurzweil)같은 작가들은 아직 수 년 후의 일이긴 하지만 결국 AI기술이 ‘특이점’에 도달하는 시점이 올 것이라고 예상한다. AI가 인류의 통합적 문제 해결 능력을 갖게 되는 시점이 온다는 것이다.

만일 우리 세대가 죽기 전에 그 날이 온다면, 그 때는 그런 ‘특이점’을 목격할 수 있을 때까지 생명을 연장시켜 준, 왓슨 같은 AI에게 직접 감사의 인사를 전할 수 있을 지도 모르겠다. editor@itworld.co.kr

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.