“애플 시리 vs. 안드로이드 보이스 액션” 성능 전격비교

PCWorld
애플의 새 음성기반 디지털 비서 기능인 아이폰 4S 시리(Siri)가 안드로이드 버전 2.2(프로요) 이상의 안드로이드 폰에 있는 인기 기능 안드로이드의 보이스 액션(Voice Actions)과 겨루고 있다. 
 
시리와 보이스 액션 모두 사용자가 메시지, 웹 검색, 메모, 내비게이션 등을 손으로 입력하지 않고 음성으로 말하게 함으로써 사용자의 생활을 훨씬 편리하게 해주겠다고 내세우고 있다. 
 
구글은 11월에 안드로이드의 음성 인식 엔진을 업데이트하여 안드로이드 4.0 (아이스 크림 샌드위치)와 함께 삼성 갤럭시 넥서스(Galaxy Nexus)에 새롭게 탑재할 예정이다. 아이스크림 샌드위치는 재정비한 음성 인식 엔진과 함께 새로운 핸즈 프리 음성 구동 기능까지 포함할 것이라고 전해진다.
 
애플과 구글 두 기업은 각각 시리와 아이스크림 샌드위치의 새 음성 기능을 내세워 음성 명령 경쟁에 박차를 가하고 있는 듯 하다. 그런데 이 두 경쟁 기능을 어떻게 비교해야 할까? 애플과 구글은 동일한 수준의 서비스를 제공하고 있는가? 아니면 더 최근에 나온 시리가 새롭게 업데이트될 안드로이드 보이스 액션으로도 따라갈 수 없는 확실한 강점을 가지고 있는가? 여기 양쪽 서비스의 가장 중요한 특징들을 간략히 살펴보고 혹시 시리가 부러워지기 시작한 사람들을 위해 보이스 액션을 보강할 수 있는 몇몇 안드로이드 서드파티 앱을 소개하고자 한다. 
 
전면 승부
시리와 보이스 액션은 문자 메시지나 이메일을 받아 적기, 음악 재생하기, 주소록에서 연락처 찾아 전화 걸기, 메모 받아 적기 등 몇 가지 동일한 기능을 제공한다. 시리에서 먼저 웹 검색에 이어 검색 결과 선택까지 제공하긴 했지만, 웹 페이지 열기는 두 서비스 모두에서 가능하다. 
 
안드로이드에서는 “위키피디아로 이동(Go to Wikipedia)”와 같은 명령문들을 이용하여 웹 페이지를 직접 열 수도 있다. 연락처에서 전화를 걸거나 음악을 재생하는 것과 같은 일부 음성 명령 기능은 아이폰의 기존 음성 명령 기능에도 있었다. 
 
하지만 필자의 경험에 따르면, 아이폰에서 선보였던 시리 이전의 음성 명령 기능은 별로 믿을만하지 않았다. 한 예로 필자의 아이폰 3GS는 무엇을 재생하라고 말하던 간에 라디오헤드(Radiohead)의 곡만 재생한다. 그에 비하면 적어도 아이폰 4S에서는 애플의 음성 명령 기능이 많이 개선된 듯 하다.
 
내비게이션
보이스 액션이 시리와 시리의 턴바이턴(turn-by-turn) 음성 안내 내비게이션에 비해 명백히 우수한 점이 하나 있는데, 보이스 액션은 무료 길 찾기가 포함되어 있는 안드로이드의 구글 지도(Google Maps)와 연동되어 있다는 점이다(미국 내에서만 해당). 사용자는 “샌프란시스코의 2번가 501로 안내하라”라고 말하면, 가는 내내 안드로이드의 음성 안내 내비게이션을 들으며 찾아갈 수 있다.
 
애플에서도 구글 지도를 보고 방향을 찾을 수 있긴 하지만(음성 안내는 지원되지 않는다), 아이폰에서는 시리와 연동된 턴바이턴 내비게이션 앱을 제공하지 않는다. 따라서 현재로서는 안드로이드의 내비게이션이 분명 우위에 있지만, 애플이 외부 앱과 시리를 연동하는 방법을 공개한다면 상황이 어떻게 바뀔지는 아직 모른다.


 
구글은 411을 이용할 수 있다
애플에 따르면 시리는 옐프(Yelp)와 같은 소스에서 지역 비즈니스 정보를 얻을 수는 있지만, 주소록에 번호가 등록되어 있지 않으면 기업에 직접 전화를 걸 수가 없다. 반면, 보이스 액션은 온라인으로 해결할 수 있는데, 기업 검색을 하고, 전화번호를 추출해서 자동으로 전화를 걸어 준다.
 
개방형 마이크
아이스크림 샌드위치에서 가장 신기한 기능은 아마도 “개방형 마이크 경험”일 것인데, 아무 버튼도 누르지 않고 전화기에 대고 말하기만 해도 음성 인식을 활성화시킬 수 있는 기능이다. 이 것은 센서리(Sensory)의 트룰리핸즈프리(Trulyhandsfree) 기술과 같은 다른 음성 입력 서비스에서 이미 제공했던 기능이지만, 시리에서는 이 기능을 제공하지 않는다. 
 
아이스크림 샌드위치에서는 또한 새로운 음성 인식 엔진을 탑재하고 있는데, 구글은 이 새로운 엔진으로 사용자들이 보다 자연스러운 언어적 접근을 통해 음성 명령을 이용하게 될 것이라 장담한다. 철자 교정기까지 포함하고 있는 새로운 안드로이드 OS는 사용자가 말하면서 발생한 문법 오류일 가능성이 높은 부분을 회색으로 표시함으로써 사용자가 SMS나 이메일, 메모로 돌아가 재빨리 오류를 정정할 수 있게 해준다. 
 
지원 언어
애플의 시리는 현재 영어, 불어, 독일어를 지원하고 있으며 2012년에는 중국어, 이탈리아어, 일본어, 한국어, 스페인어 등을 포함하여 더 많은 언어들을 지원할 계획이다. 이에 비해 안드로이드의 보이스 액션은 현재 영어만 지원하고 있지만, 구글은 아이스크림 샌드위치의 새로운 음성 인식 엔진은 거의 대부분의 언어를 지원하도록 하겠다고 말했다. 이것은 굉장한 선언이지만, 어쨌든 안드로이드의 음성 명령 기능이 과연 얼마나 많은 언어들을 지원할지는 두고 봐야 알 것 같다.


 
개인화
애플이 보이스 액션과 완전히 차별화를 두는 것은 바로 시리의 개인화 기능이다. 시리는 사용자가 원하는 정보를 얻는데 필요한 수 많은 자연스러운 요청들을 처리할 수 있다. 예를 들어 시리에게 월요일에 우산이 필요할지를 질문하면 시리는 사용자가 기상 정보를 궁금해한다는 사실을 알아차릴 수 있다. 
 
반면 보이스 액션의 경우에는 “…로 안내하라”나 “메모하라”와 같은 직접적인 명령 형태로 이야기해야 하지만 안드로이드 4.0에서는 과연 위의 예시처럼 자연스런 질문들까지 처리할 수 있을지는 아직 명확하지 않다.
 
이 외에도 시리에는 위치에 기반한 위치 기억 기능 등 다수의 개인화 기능들이 있다. 사용자에게 퇴근할 때 우유를 가지고 가라던가 출근할 때 회사에 도넛들을 사가라고 상기시킬 수 있다. 위치 기반 기억 기능은 시리가 없어도 미리 알림 앱을 통해 iOS5를 구동하는 장비에서 모두 사용 가능하다.
 
시리는 개인 인맥 처리 및 저장이 가능하다. 어머니가 누구인지, 형제가 누구인지 등을 시리에게 알릴 수 있다. 이런 사람들이 주소록에 있다면, 시리가 요청을 받아 전화를 걸 수도 있다. 예를 들면 "존 스미스(John Smith)에게 전화를 걸어줘"(또는 어머님의 이름을 넣어서) 대신 "어머니께 전화를 걸어줘"라고 명령할 수 있다.
 
그뿐 아니라 시리는 일정을 짜고, 주식 시세를 확인하며, 울프람 알파(Wolfram Alpha)에서 기본적인 정보 및 인물을 추출하고 알람과 타이머를 맞추는 등 보이스 액션이 현재 지원하지 않는 다수의 기타 기능들을 제공한다.
 
이러한 결점들을 극복하고자 하는 안드로이드 사용자들은 블링고(Vlingo)(무료), 스피크투잇 어시스턴트(Speaktoit Assitant)(무료) 그리고 패너스(Pannous)의 보이스 액션 플러스(Voice Action Plus)($2.99)와 같은 서드 파티 앱을 통해 보이스 액션을 보강할 수 있다. 
 
이 앱들은 앞서 언급한 알람 설정, 일정 추가 및 기본 정보와 기능 검색 등 시리에서 제공하는 것과 비슷한 기능들을 추가로 제공한다. 심지어 블링고는 음성으로 폰에 설치된 앱들을 실행시킬 수도 있고 트위터와 페이스북의 상태를 업데이트하기도 하며 포스퀘어(Foursquare)에 접속하기도 한다. 스피크투잇 어시스턴트는 시리와 유사하게 자연스런 문장을 처리할 수 있다고 주장한다. 
 
외부 앱들을 떼어놓고 봤을 때에는 시리가 보이스 액션에 비해 더 우세한 듯 하며 구글은 아이스크림 샌드위치로도 뾰족한 수가 없어 보인다. 하지만 경쟁은 이제 보다 나은 음성 명령을 중심으로 이루어지고 있는데, 일명 젤리빈(Jelly Bean)이라는 이름의 구글의 다음 주요 안드로이드 업데이트에서 어떤 묘안이 나올지 기대해보자. 
 
안드로이드용 스피크투잇 어시스턴트(Speaktoit Assitant) 시연 영상
 
아이폰 시리(Siri) 시연 영상
editor@itworld.co.kr