2016.10.11

“궁극의 UI” 구글 어시스턴트, 과연 누구를 위한 AI인가?

Mike Elgan | Computerworld

영화 스타트렉은 꿈이 아니었다. 사람들이 컴퓨터와 말로 대화하는 시대가 현실로 다가오기 시작했다.

구글은 최근 개최한 행사에서 새로운 하드웨어로 사람들의 시선을 붙잡았다. 구글은 픽셀 스마트폰 2종, 구글 와이파이 홈 라우터, 가상 개인 비서 장치인 구글 홈, 4K 미디어 스트리밍 기기 크롬캐스트, 데이드림 뷰 VR 헤드셋을 공개했다.

픽셀 스마트폰은 애플, 홈은 아마존 제품을 모방했다며 구글의 경쟁 방식을 비판하는 사람들도 있다. 그러나 중요한 부분을 놓친 비판이다.

구글은 인공 지능과 가상 비서, 대화형 사용자 인터페이스가 검색 엔진과 모바일 앱보다 더 큰 역할을 할 수 있는 시장이 충분하다고 판단한다. 구글 CEO 순다 피차이에 따르면, 우리 인류는 인공지능이 우선시되는 세상으로 이동하고 있다.

즉, 컴퓨터와 대화하는 시대가 열리고 있다는 의미다. 컴퓨터가 사용자가 하는 모든 말을 이해하고 사용자와의 대화를 바탕으로 사용자의 일을 대신 해주는 시대다.

구글은 구글 어시스턴트라는 인터페이스에 미래를 투자했다. 필자 개인적으로 충분히 승리를 장담할 수 있는 투자라고 생각한다.

'궁극'의 사용자 인터페이스
인공 지능 대화 에이전트는 사용자 인터페이스의 최종 진화 버전이라 할 수 있다. 사람과 컴퓨터 간 사용자 인터페이스의 역사를 돌아보자. 끊임없이 개선되고 있는 컴퓨팅 성능은 사람과 기계의 간편한 상호작용에 투입돼왔다.

사람은 대화를 중시한다. 따라서 사람에게 가장 편안한 인터페이스는 사람과 대화할 수 있는 인터페이스다.

그러나 문제가 있다면 사람의 대화에는 복잡한 심리와 지식이 개입된다는 점이다. 가장 기본적인 대화라 하더라도 인공지능은 사람의 심리를 시뮬레이션하고 수 많은 정보와 지식을 수집해야 한다.

그런데 잠깐만! 구글 나우는 인공지능이 아닌가?
구글 나우는 인공지능에 기반을 두지 않은 가상 비서로 분류할 수 있다. 시리, 코타나, 알렉사 등 다른 가상 비서도 마찬가지다. 성능이 뛰어나지만 인공지능은 아니다.

구글 어시스턴트는 적응력과 응용력이 더 뛰어나다. 학습을 통해 한층 광범위한 능력, 개인화된 능력을 갖춘다.

구글 어시스턴트는 사용자 정보를 기억해 개인화에 대응한다. 필자의 아내 이름인 'Amira Elgan'을 입력했더니 구글 어시스턴트가 아내 이름을 기억하겠다고 대답했다.

'Remember' 명령으로 구글 어시스턴트에 개인 정보를 입력할 수 있다. 예를 들어, "내 자전거 자물쇠 번호는 397이야"라고 말해 비밀번호를 기억시킬 수 있다. 나중에 구글 어시스턴트에 자전거 자물쇠 번호를 물어보면 바로 대답해 줄 것이다.

구글 어시스턴트가 사용자의 정보를 학습하고, 이를 이용할 수 있다는 점은 매우 중요하다. 어시스턴트는 구글 검색과 지식 기반 정보에 액세스해서 가정의 가전 제품과 전자 제품을 제어하고, 레스토랑에 저녁 식사를 예약하는 등 이 모든 업무를 처리할 수 있다.

인공지능은 사용자 주변에 항상 존재하면서 어디에서나 업무를 처리한다.

구글 나우(또는 시리, 알렉사, 코타나 포함)와 달리, 어시스턴트는 애매모호한 요청도 파악할 수 있는 능력을 갖고 있다. 또 사용자가 응답에 순위를 부여하면서 시간이 지날 수록 능력이 향상된다.

사소한 결정도 내릴 수 있다. 자동차에서 "키아라가 부른 노래 ‘골드(Gold)'를 틀어 줘"라고 명령하면, 자동차 사운드 시스템으로 음악을 재생한다. 그러나 집 안에서는 개인 선호도에 따라 크롬캐스트나 구글 홈 기기에서 음악을 틀 수도 있다.

또 다른 기능은 (프라이버시를 우려하는 사람들에게는 엿듣는 행위가 될 수도 있지만)대화에 귀를 기울이고 있다가, 레스토랑을 추천하는 등 유용한 정보를 제공하는 것이다. 구글 알로를 이용하고 있다면, 대화 쌍방 모두에 추천 정보를 제공한다.

픽셀 스마트폰은 구글 어시스트턴트의 상황 파악 능력을 한층 더 높인다. 예를 들어, 사진을 보면서 홈 버튼을 길게 누르면, 사진 내용에 따라 개인화된 검색 결과를 제시한다(어시스턴트와 새 스마트폰으로 확대된 구글 나우 온 탭 기능).

가상 현실, 혼합 현실, 증강 현실 등 다른 사용자 인터페이스도 계속 영향력이 있겠지만, 사용자 경험에 목적이 있다는 점에서 인공지능이나 구글 어시스턴트와 다르다. 정보 목적의 인터페이스는 대화 방식을 취하는 것이 더 효율적이다. 장치나 앱, 플랫폼 등을 신경 쓸 필요가 없다. 그냥 말만 하면 된다. 그러면 어시스턴트가 이를 실행한다. 물론 이상적인 시나리오다.



2016.10.11

“궁극의 UI” 구글 어시스턴트, 과연 누구를 위한 AI인가?

Mike Elgan | Computerworld

영화 스타트렉은 꿈이 아니었다. 사람들이 컴퓨터와 말로 대화하는 시대가 현실로 다가오기 시작했다.

구글은 최근 개최한 행사에서 새로운 하드웨어로 사람들의 시선을 붙잡았다. 구글은 픽셀 스마트폰 2종, 구글 와이파이 홈 라우터, 가상 개인 비서 장치인 구글 홈, 4K 미디어 스트리밍 기기 크롬캐스트, 데이드림 뷰 VR 헤드셋을 공개했다.

픽셀 스마트폰은 애플, 홈은 아마존 제품을 모방했다며 구글의 경쟁 방식을 비판하는 사람들도 있다. 그러나 중요한 부분을 놓친 비판이다.

구글은 인공 지능과 가상 비서, 대화형 사용자 인터페이스가 검색 엔진과 모바일 앱보다 더 큰 역할을 할 수 있는 시장이 충분하다고 판단한다. 구글 CEO 순다 피차이에 따르면, 우리 인류는 인공지능이 우선시되는 세상으로 이동하고 있다.

즉, 컴퓨터와 대화하는 시대가 열리고 있다는 의미다. 컴퓨터가 사용자가 하는 모든 말을 이해하고 사용자와의 대화를 바탕으로 사용자의 일을 대신 해주는 시대다.

구글은 구글 어시스턴트라는 인터페이스에 미래를 투자했다. 필자 개인적으로 충분히 승리를 장담할 수 있는 투자라고 생각한다.

'궁극'의 사용자 인터페이스
인공 지능 대화 에이전트는 사용자 인터페이스의 최종 진화 버전이라 할 수 있다. 사람과 컴퓨터 간 사용자 인터페이스의 역사를 돌아보자. 끊임없이 개선되고 있는 컴퓨팅 성능은 사람과 기계의 간편한 상호작용에 투입돼왔다.

사람은 대화를 중시한다. 따라서 사람에게 가장 편안한 인터페이스는 사람과 대화할 수 있는 인터페이스다.

그러나 문제가 있다면 사람의 대화에는 복잡한 심리와 지식이 개입된다는 점이다. 가장 기본적인 대화라 하더라도 인공지능은 사람의 심리를 시뮬레이션하고 수 많은 정보와 지식을 수집해야 한다.

그런데 잠깐만! 구글 나우는 인공지능이 아닌가?
구글 나우는 인공지능에 기반을 두지 않은 가상 비서로 분류할 수 있다. 시리, 코타나, 알렉사 등 다른 가상 비서도 마찬가지다. 성능이 뛰어나지만 인공지능은 아니다.

구글 어시스턴트는 적응력과 응용력이 더 뛰어나다. 학습을 통해 한층 광범위한 능력, 개인화된 능력을 갖춘다.

구글 어시스턴트는 사용자 정보를 기억해 개인화에 대응한다. 필자의 아내 이름인 'Amira Elgan'을 입력했더니 구글 어시스턴트가 아내 이름을 기억하겠다고 대답했다.

'Remember' 명령으로 구글 어시스턴트에 개인 정보를 입력할 수 있다. 예를 들어, "내 자전거 자물쇠 번호는 397이야"라고 말해 비밀번호를 기억시킬 수 있다. 나중에 구글 어시스턴트에 자전거 자물쇠 번호를 물어보면 바로 대답해 줄 것이다.

구글 어시스턴트가 사용자의 정보를 학습하고, 이를 이용할 수 있다는 점은 매우 중요하다. 어시스턴트는 구글 검색과 지식 기반 정보에 액세스해서 가정의 가전 제품과 전자 제품을 제어하고, 레스토랑에 저녁 식사를 예약하는 등 이 모든 업무를 처리할 수 있다.

인공지능은 사용자 주변에 항상 존재하면서 어디에서나 업무를 처리한다.

구글 나우(또는 시리, 알렉사, 코타나 포함)와 달리, 어시스턴트는 애매모호한 요청도 파악할 수 있는 능력을 갖고 있다. 또 사용자가 응답에 순위를 부여하면서 시간이 지날 수록 능력이 향상된다.

사소한 결정도 내릴 수 있다. 자동차에서 "키아라가 부른 노래 ‘골드(Gold)'를 틀어 줘"라고 명령하면, 자동차 사운드 시스템으로 음악을 재생한다. 그러나 집 안에서는 개인 선호도에 따라 크롬캐스트나 구글 홈 기기에서 음악을 틀 수도 있다.

또 다른 기능은 (프라이버시를 우려하는 사람들에게는 엿듣는 행위가 될 수도 있지만)대화에 귀를 기울이고 있다가, 레스토랑을 추천하는 등 유용한 정보를 제공하는 것이다. 구글 알로를 이용하고 있다면, 대화 쌍방 모두에 추천 정보를 제공한다.

픽셀 스마트폰은 구글 어시스트턴트의 상황 파악 능력을 한층 더 높인다. 예를 들어, 사진을 보면서 홈 버튼을 길게 누르면, 사진 내용에 따라 개인화된 검색 결과를 제시한다(어시스턴트와 새 스마트폰으로 확대된 구글 나우 온 탭 기능).

가상 현실, 혼합 현실, 증강 현실 등 다른 사용자 인터페이스도 계속 영향력이 있겠지만, 사용자 경험에 목적이 있다는 점에서 인공지능이나 구글 어시스턴트와 다르다. 정보 목적의 인터페이스는 대화 방식을 취하는 것이 더 효율적이다. 장치나 앱, 플랫폼 등을 신경 쓸 필요가 없다. 그냥 말만 하면 된다. 그러면 어시스턴트가 이를 실행한다. 물론 이상적인 시나리오다.



X