iOS / 미래기술

글로벌 칼럼 | “‘사람이 되지 못한 시리” 음성 비서가 여전히 신기한 기능에 불과한 이유

Dan Moren | Macworld 2016.10.18
요즘 사람들의 일상은 반쯤 완성된, 어설픈 인공 지능 비서와 가상 에이전트에 둘러싸여 있다. 음성 기반 인터페이스의 현재 상태는 홈 오토메이션, 가상 현실 기술과 마찬가지다. 즉, 일상에 조금씩 스며들 만큼 인기는 있지만 대부분의 사람들에게 고정적인 생활의 일부가 되기엔 아직 부족하다.

애플 시리가 이번 달로 다섯 살이 된다. 그러나 필자가 전에도 언급했듯이 시리의 발전 속도는 당초 사람들이 기대했던 수준에 미치지 못한다. 기술 저널리스트 월트 모스버그는 이번 주 시리를 혹독하게 비판하는 에서 누구나 한 번쯤은 떠올렸을 법한 질문을 던졌다. "시리는 왜 이렇게 바보 같을까?"

틀린 말이 아니다. 모스버그만큼은 아니지만 필자도 시리를 사용할 때마다 거의 항상 어설픈 면을 발견한다. 아이폰을 사용하는 필자의 친구들 대부분은 시리를 유용한 도구보다는 그냥 신기한 기능 정도로 생각한다. 작년에 필자는 시리 2.0이 포함해야 할 몇 가지 아이디어를 제안한 적이 있지만 지금은 한 걸음 뒤로 물러나 좀더 큰 문제를 살펴보자.

급한 불만 끄기
모스버그의 글은 몇 가지 구체적인 문제를 제기한다. 시리는 대통령 후보가 누구인지 모르고, 대통령 후보 토론 날짜도 모르고, 크레타 섬의 날씨를 물어보면 영어 발음이 동일한 일리노이 주 크리트 타운의 날씨를 알려준다. 그러나 필자를 어이없게 하는 것은 이런 문제보다 오히려 애플에 내놓는 해결책이다. 모스버그는 이렇게 말했다:

“내가 지적한 이 문제들을 지금 시리에게 시험해 보면 정확한 답을 알려준다. 스크린샷을 찍어 분노의 항의문과 함께 트윗한 이후 애플이 각각의 문제를 수정했기 때문이다.
이런 방법으로 시리에 새 기능을 구현한다면 (약간 과장해서 말하자면) 시리는 가능성이 없다. 시리는 사례별로 하나하나 대처할 수 있는 종류의 기능이 아니다. 이 문제는 애플이 구글 지도에서 자체 지도 시스템으로 처음 전환했을 때 직면했던 문제와 닮은 점이 있다. 즉, 사람들은 한 번 물어서 엉뚱한 대답을 듣게 되면(또는 시리의 경우 아예 대답을 듣지 못하게 되면), 그 다음부터는 의심하게 된다. 음성 기반 비서와 같이 아직 충분히 검증되지 않은 기능에 있어서는 특히 더 그렇다.


애플은 모스버그에게 보낸 글에서 사람들이 가장 많이 사용하는 작업에 대한 시리의 대처 능력을 향상시키기 위해 지속적으로 노력하고 있다고 밝혔다.

“애플은 지속적으로 시리를 개선하고 있다고 강조했으며, 많은 사람들이 매일 요청하는 작업, 즉 전화 길기, 문자 보내기, 장소 찾기 등에 특히 집중하고 있다고 강조했다. 반면 애플은 위에 내가 언급한 경우와 같이 매일 수백 건 정도에 불과한 "긴 꼬리", 즉 발생량이 적은 질문에 대해서는 그만큼 신경을 쓰지 않는다.”

필자는 이 말을 듣고 더 많은 의문이 떠올랐다. 사람들이 시리에게 "긴 꼬리" 질문을 덜 하는 이유는 애초에 시리가 그러한 종류의 질문에 제대로 된 대답을 하지 못하기 때문이 아닐까? 애플이 이러한 종류의 질문에 대한 처리 방법을 개선하지 않는다면 사람들도 그러한 질문을 아예 포기하게 되고, 결국 전체적으로 시리를 덜 사용하게 되지 않을까? 자기 충족적 예언으로도, 닭이 먼저냐 달걀이 먼저냐의 문제로도 볼 수 있다.

"그리고(and)"
현재 시리를 비롯해 대부분의 음성 기반 비서는 이른바 "불쾌한 골짜기"에 여전히 한참 미치지 못하는 수준이다. 불쾌한 골짜기란 인공 지능이 인간과 거의 비슷해지면서 사람들이 인공 지능과의 상호 작용에서 불쾌함을 느끼게 되는 단계를 의미하는 용어다. 현재 음성 기반 비서들의 지능은 말하자면 집에서 키우는 개 수준이라서(개를 모욕할 생각은 없지만) 아직은 대화의 상대가 기계라는 점이 너무나 명확하게 느껴진다. 개는 알렉사나 시리와 마찬가지로 자신의 이름을 알아서 그 이름을 부르면 귀를 쫑긋 세운다. 개에게 특정 명령을 내리고 그 명령을 이해시킬 수는 있다. 그러나 개는 이미 알고 있는 것을 기반으로 새로운 지시를 이해하는 능력은 아주 낮다.

예를 들어 시리를 비롯한 인공 지능 에이전트의 발목을 잡는 한 가지를 꼽으라고 한다면 그 답은 간단하다. 우리가 하루에 수십, 수백 번 사용하는(이 기사에서만 25번 나옴) 단어, "and"다.

"and"의 개념은 인간의 뇌에게는 단순하지만 가상 비서에게는 엄청나게 복잡하다. 사람에게 쇼핑 목록에 우유와(and) 오랜지 주스와(and) 바나나를 넣으라고 말하면 대부분 문제 없이 넣는다. 그러나 시리에게 이렇게 말하면 전혀 다른, 쓸모 없는 결과가 나온다.

두 개의 명령을 하나로 합치는 경우에도 비슷한 문제를 볼 수 있다. 아이에게 전등과(and) 텔레비전을 끄라고 하면 (아이 나이가 어느 정도 이상만 된다면) 문제 없이 따른다. 그러나 상대가 아마존 에코라면 한 가지 지시를 내리고, 이행할 때까지 기다린 다음 두 번째 지시를 내려야 한다. 인내심이 좀 필요하다.

애플은 머신 러닝과 AI에 많은 에너지를 쏟아 붓고 있다. 지난 8월 기술 저널리스트 스티븐 레비는 이 두 분야에 대한 애플의 노력을 심층적으로 다룬 적이 있는데 이 기사에서 가장 흥미를 끄는 부분은 그 노력에서 시리가 차지하는 비중이 아주 작다는 점이었다. 시리의 현재 위상에 비추어 보면 '너무' 작다고 할 수 있을 정도다.

지금은 가상 비서가 평균적인 초등학교 5학년 아이보다 덜 똑똑하다 해도 별 문제는 없다. 어차피 5학년생들이 사회를 지배하는 것도 바라는 바는 아니다. 그러나 인공 지능 에이전트가 사람들이 상상해온 만큼 유용한 수준까지 발전하기 위해서는 큰 도약이 필요하다. 그러기 위해서는 아마 "and"라는 단어의 의미도 알아야 할 것이다. editor@itworld.co.kr

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.