2020.01.23

"아마존과 다른 길 간다" 애플의 엑시노어 인수가 시리에 미치는 영향

Michael Simon | Macworld
애플은 연중 내내 많은 기업을 인수하지만 그 중에서 관심을 끄는 뉴스거리가 되는 경우는 한두 건에 불과하다. 작년 인텔 스마트폰 모뎀 사업부 인수, 2018년 샤잠 인수는 관심을 끈 축에 속했지만 사실 대부분의 경우 애플은 알 수 없는 이유로 들은 적도 없는 기업을 사들인다.
 
그런데 가장 최근 인수는 제법 눈길을 끈다. Xnor.ai(엑스노어)라는 이름이 생소한 사람도 있겠지만, 이 회사는 나름 인지도가 있다. 미국 시에틀에 본사를 둔 신생 기업인 엑스노어는 작년 여름부터 와이즈(Wyze) 캠의 대표적인 기능인 사람 감지 기능을 구현한 주인공이다. 간단히 설명하자면, 이 회사의 기술 덕분에 불과 20달러짜리 카메라가 사람 얼굴, 애완동물, 일반 물체를 구분하고 기능을 비약적으로 향상해 훨씬 더 비싼 링(Ring), 네스트(Nest) 캠과 어깨를 나란히 하게 된 것이다.
 
와이즈의 동작 감지 기능은 기기 내에 탑재돼 있어 영상 해킹에 대한 걱정을 없앴다. ⓒWYZE LABS

엑스노어의 엔진이 저가형 캠에서 작동했다는 자체보다 더 눈길을 끄는 점은 그 방식이다. 엑스노어 엔진은 소형 리코더인 와이즈 캠의 기능을 대폭 개선했을 뿐만 아니라, 그 과정에서 개인정보 보호도 구현했다. 엑스노어는 엣지 AI(Edge AI)라는 기술을 사용해서 카메라 자체에서 알고리즘 엔진을 처리했다. 즉, 멀리 떨어진 클라우드로 이미지를 전송할 필요가 없다.
 
이것이 개인정보 보호에 관한 애플의 논점과 맞아떨어지는 부분이다. Macworld는 오래 전부터 시리가 구글 어시스턴트, 아마존 알렉사에 비해 뒤처지는 이유가 구글, 아마존이 수집하는 정보를 애플은 수집하지 않기 때문이라고 생각해왔다. 애플과 아마존은 개인정보 보호 설정을 켜고 끄는 옵션을 제공하지만 핵심 비즈니스 모델은 어쨌든 데이터 수집에 의존한다. 방대한 데이터를 확보하면(특히 수많은 사용자를 대상으로) AI의 역량을 더 쉽게 개선할 수 있다. 그런데, 꼭 그럴 필요가 없을지도 모르겠다. 왜일까?
 

시리는 건재하다

엑스노어의 기술이 작동하는 방식은 다르다. 애플이 막대한 돈을 투자한 이유도 여기에 있을 것이다. 필자는 시리의 발전이 더딘 이유는 개발진의 권태나 애플의 관심 부족이 아니라 AI 엔진의 역량에 있다고 생각한다. 애플은 최대한 많은 정보를 디바이스 자체에서 처리하려고 하지만, 시리가 움직이는 수준의 규모에서 그렇게 하기는 현실적으로 불가능하다.
 
문제는 처리 성능의 부족이 아니다. 애플의 A 시리즈 바이오닉 칩은 익히 알려진 대로 성능이 뛰어나다. 아이폰 11의 A13은 역대 가장 빠른 뉴럴 엔진과 다수의 머신 러닝 가속기를 내장해 과거보다 더 많은 작업을 처리하지만, 여전히 배터리 효율성이나 전력 소모, 그래픽 가속 등 아이폰이라는 디바이스의 현실적인 제약에 묶인다.
 
A13 바이오닉 칩은 이미 강력한 뉴럴 엔진을 갖추고 있는데, 엣지 Ai로 수준을 더욱 끌어올릴 수 있다. ⓒAPPLE

그러나 엑스노어의 엣지 AI 엔진이 모든 문제를 해결하는 열쇠가 될 수 있다. 물론 아이폰 12, 어쩌면 아이폰 13에서도 엑스노어 인수에 따른 결과물을 보기는 어렵겠지만, 애플의 놀라운 첨단 반도체 기술과 엑스노어가 제공하는 디바이스 내 AI 처리가 결합되면 시리의 역량이 비약적으로 향상될 수 있다. 뉴럴 엔진 또는 새로운 코프로세서를 통해 엣지 AI를 애플 자체 칩에 내장하게 되면 시리는 더욱 빠른 속도로, 훨씬 더 많은 기능을 제공하고 사용자의 행동을 통해 학습하고 작업의 우선 순위를 분류할 수 있게 된다. 애플 시스템 온 칩의 강력한 성능을 활용해 클라우드 작업을 디바이스 자체에서 처리하면서 이 모든 작업이 오프라인에서 가능해질 것이다.
 
엑스노어는 엣지 AI가 클라우드 기반 시스템에 비해 10배 더 빠르고 메모리 효율성은 15배 더 높은 것으로 추정한다. 각각의 개별 폰 전용으로 작동하는 빠른 비서가 구현되면 애플은 마침내 완벽에 가까운 정확함을 갖춘 음성 인식 시스템을 구축할 수 있게 된다. 각자 다른 사람의 목소리를 구분하는 것과 같은 기초적인 기능이 시리에 구현되기를 몇 년째 기다리는 사용자가 많은데, 엣지 AI가 통합되면 각 사용자의 억양 특색을 매우 정확히 파악할 수 있다. 엑스노어의 와이즈 AI가 사람과 애완동물을 구분할 수 있다는 사실은 이미 입증됐으므로 목소리를 구분하는 정도는 그렇게 어렵지 않을 것이다. 목소리 구분 하나만 해도 시리가 구글 어시스턴트, 아마존 알렉사와 떨어진 격차를 크게 좁혀줄 수 있다. 애플은 강력한 AI 엔진을 폰 자체에 구축함으로써 개인정보 보호를 타협하지 않으면서 우리가 원하는 기능을 시리에 넣을 수 있다.
 
음성 패턴에도 이 엔진을 적용할 수 있다. 지금의 시리 구술도 나쁘진 않지만 “마침표”, “쉼표”를 계속 말하다 보면 지친다. 엣지 AI는 음성 패턴을 인식하므로 특정한 방식으로 말을 멈추면 알아서 마침표를 추가하거나 음성의 높낮이를 구분해 물음표를 추가할 수 있다.
 
엣지 AI로 20달러짜리 소형 카메라를 훌륭한 제품으로 바꿔놓은 Xnor.ai가 아이폰이나 시리에 적용됐을 경우를 상상해보자.
ⓒWYZE LABS

한 발 더 나아가 생각해 보자. 예를 들어 친구와 문자를 주고받는 과정에서 친구가 어떤 영화를 보자고 제안한다. 그러면 시리가 대화 내에서 다음 영화 상영 시간을 알려줄 수 있다. 또는 사파리에서 링크를 복사하면 공유 버튼을 누르기도 전에 똑똑한 추천 기능이 관련된 일련의 앱을 즉시 제안할 수 있다. 애플이 클라우드를 통해서는 절대 하지 않을 종류의 작업이다(아이폰에서 일어나는 일은 아이폰 안에 머물러야 한다는 고집). 엣지 AI를 사용하면 애플은 아이폰 자체에 이와 같은 기능을 구현해서 시리를 위한 완전히 새로운 가능성을 열 수 있다.
 
또한 디바이스 내에서 학습한다면 사용 중인 앱을 파악해 적절히 반응할 수 있다. 예를 들어 사진 앱에서 사진을 보는 중에 “이걸 아내와 공유해”라고 말하면 ‘이게’ 뭘 의미하는지 따로 설명할 필요 없이 공유된다. 또는 사파리에서 뉴스를 읽다가 “관련된 내용을 더 보여줘”라고 말하기만 하면 적절한 내용을 검색해준다. 앱 사용 습관을 기반으로 한 자동 루틴을 제안하는 기능도 가능하다.
 
핵심은 현재 시리는 못 하는 일이 많은데 엑스노어의 엣지 AI 엔진이 할 수 있게 해준다는 것이다. 또한 이 과정에서 개인정보도 안전하게 보호된다. 와이즈 캠 소유자들에게는 좋지 않은 소식이지만 엑스노어의 엣지 AI 시스템은 와이즈 캠에서 빠지기로 했다. 이들이 잃은 것을 시리가 가져가게 된다. editor@itworld.co.kr 


2020.01.23

"아마존과 다른 길 간다" 애플의 엑시노어 인수가 시리에 미치는 영향

Michael Simon | Macworld
애플은 연중 내내 많은 기업을 인수하지만 그 중에서 관심을 끄는 뉴스거리가 되는 경우는 한두 건에 불과하다. 작년 인텔 스마트폰 모뎀 사업부 인수, 2018년 샤잠 인수는 관심을 끈 축에 속했지만 사실 대부분의 경우 애플은 알 수 없는 이유로 들은 적도 없는 기업을 사들인다.
 
그런데 가장 최근 인수는 제법 눈길을 끈다. Xnor.ai(엑스노어)라는 이름이 생소한 사람도 있겠지만, 이 회사는 나름 인지도가 있다. 미국 시에틀에 본사를 둔 신생 기업인 엑스노어는 작년 여름부터 와이즈(Wyze) 캠의 대표적인 기능인 사람 감지 기능을 구현한 주인공이다. 간단히 설명하자면, 이 회사의 기술 덕분에 불과 20달러짜리 카메라가 사람 얼굴, 애완동물, 일반 물체를 구분하고 기능을 비약적으로 향상해 훨씬 더 비싼 링(Ring), 네스트(Nest) 캠과 어깨를 나란히 하게 된 것이다.
 
와이즈의 동작 감지 기능은 기기 내에 탑재돼 있어 영상 해킹에 대한 걱정을 없앴다. ⓒWYZE LABS

엑스노어의 엔진이 저가형 캠에서 작동했다는 자체보다 더 눈길을 끄는 점은 그 방식이다. 엑스노어 엔진은 소형 리코더인 와이즈 캠의 기능을 대폭 개선했을 뿐만 아니라, 그 과정에서 개인정보 보호도 구현했다. 엑스노어는 엣지 AI(Edge AI)라는 기술을 사용해서 카메라 자체에서 알고리즘 엔진을 처리했다. 즉, 멀리 떨어진 클라우드로 이미지를 전송할 필요가 없다.
 
이것이 개인정보 보호에 관한 애플의 논점과 맞아떨어지는 부분이다. Macworld는 오래 전부터 시리가 구글 어시스턴트, 아마존 알렉사에 비해 뒤처지는 이유가 구글, 아마존이 수집하는 정보를 애플은 수집하지 않기 때문이라고 생각해왔다. 애플과 아마존은 개인정보 보호 설정을 켜고 끄는 옵션을 제공하지만 핵심 비즈니스 모델은 어쨌든 데이터 수집에 의존한다. 방대한 데이터를 확보하면(특히 수많은 사용자를 대상으로) AI의 역량을 더 쉽게 개선할 수 있다. 그런데, 꼭 그럴 필요가 없을지도 모르겠다. 왜일까?
 

시리는 건재하다

엑스노어의 기술이 작동하는 방식은 다르다. 애플이 막대한 돈을 투자한 이유도 여기에 있을 것이다. 필자는 시리의 발전이 더딘 이유는 개발진의 권태나 애플의 관심 부족이 아니라 AI 엔진의 역량에 있다고 생각한다. 애플은 최대한 많은 정보를 디바이스 자체에서 처리하려고 하지만, 시리가 움직이는 수준의 규모에서 그렇게 하기는 현실적으로 불가능하다.
 
문제는 처리 성능의 부족이 아니다. 애플의 A 시리즈 바이오닉 칩은 익히 알려진 대로 성능이 뛰어나다. 아이폰 11의 A13은 역대 가장 빠른 뉴럴 엔진과 다수의 머신 러닝 가속기를 내장해 과거보다 더 많은 작업을 처리하지만, 여전히 배터리 효율성이나 전력 소모, 그래픽 가속 등 아이폰이라는 디바이스의 현실적인 제약에 묶인다.
 
A13 바이오닉 칩은 이미 강력한 뉴럴 엔진을 갖추고 있는데, 엣지 Ai로 수준을 더욱 끌어올릴 수 있다. ⓒAPPLE

그러나 엑스노어의 엣지 AI 엔진이 모든 문제를 해결하는 열쇠가 될 수 있다. 물론 아이폰 12, 어쩌면 아이폰 13에서도 엑스노어 인수에 따른 결과물을 보기는 어렵겠지만, 애플의 놀라운 첨단 반도체 기술과 엑스노어가 제공하는 디바이스 내 AI 처리가 결합되면 시리의 역량이 비약적으로 향상될 수 있다. 뉴럴 엔진 또는 새로운 코프로세서를 통해 엣지 AI를 애플 자체 칩에 내장하게 되면 시리는 더욱 빠른 속도로, 훨씬 더 많은 기능을 제공하고 사용자의 행동을 통해 학습하고 작업의 우선 순위를 분류할 수 있게 된다. 애플 시스템 온 칩의 강력한 성능을 활용해 클라우드 작업을 디바이스 자체에서 처리하면서 이 모든 작업이 오프라인에서 가능해질 것이다.
 
엑스노어는 엣지 AI가 클라우드 기반 시스템에 비해 10배 더 빠르고 메모리 효율성은 15배 더 높은 것으로 추정한다. 각각의 개별 폰 전용으로 작동하는 빠른 비서가 구현되면 애플은 마침내 완벽에 가까운 정확함을 갖춘 음성 인식 시스템을 구축할 수 있게 된다. 각자 다른 사람의 목소리를 구분하는 것과 같은 기초적인 기능이 시리에 구현되기를 몇 년째 기다리는 사용자가 많은데, 엣지 AI가 통합되면 각 사용자의 억양 특색을 매우 정확히 파악할 수 있다. 엑스노어의 와이즈 AI가 사람과 애완동물을 구분할 수 있다는 사실은 이미 입증됐으므로 목소리를 구분하는 정도는 그렇게 어렵지 않을 것이다. 목소리 구분 하나만 해도 시리가 구글 어시스턴트, 아마존 알렉사와 떨어진 격차를 크게 좁혀줄 수 있다. 애플은 강력한 AI 엔진을 폰 자체에 구축함으로써 개인정보 보호를 타협하지 않으면서 우리가 원하는 기능을 시리에 넣을 수 있다.
 
음성 패턴에도 이 엔진을 적용할 수 있다. 지금의 시리 구술도 나쁘진 않지만 “마침표”, “쉼표”를 계속 말하다 보면 지친다. 엣지 AI는 음성 패턴을 인식하므로 특정한 방식으로 말을 멈추면 알아서 마침표를 추가하거나 음성의 높낮이를 구분해 물음표를 추가할 수 있다.
 
엣지 AI로 20달러짜리 소형 카메라를 훌륭한 제품으로 바꿔놓은 Xnor.ai가 아이폰이나 시리에 적용됐을 경우를 상상해보자.
ⓒWYZE LABS

한 발 더 나아가 생각해 보자. 예를 들어 친구와 문자를 주고받는 과정에서 친구가 어떤 영화를 보자고 제안한다. 그러면 시리가 대화 내에서 다음 영화 상영 시간을 알려줄 수 있다. 또는 사파리에서 링크를 복사하면 공유 버튼을 누르기도 전에 똑똑한 추천 기능이 관련된 일련의 앱을 즉시 제안할 수 있다. 애플이 클라우드를 통해서는 절대 하지 않을 종류의 작업이다(아이폰에서 일어나는 일은 아이폰 안에 머물러야 한다는 고집). 엣지 AI를 사용하면 애플은 아이폰 자체에 이와 같은 기능을 구현해서 시리를 위한 완전히 새로운 가능성을 열 수 있다.
 
또한 디바이스 내에서 학습한다면 사용 중인 앱을 파악해 적절히 반응할 수 있다. 예를 들어 사진 앱에서 사진을 보는 중에 “이걸 아내와 공유해”라고 말하면 ‘이게’ 뭘 의미하는지 따로 설명할 필요 없이 공유된다. 또는 사파리에서 뉴스를 읽다가 “관련된 내용을 더 보여줘”라고 말하기만 하면 적절한 내용을 검색해준다. 앱 사용 습관을 기반으로 한 자동 루틴을 제안하는 기능도 가능하다.
 
핵심은 현재 시리는 못 하는 일이 많은데 엑스노어의 엣지 AI 엔진이 할 수 있게 해준다는 것이다. 또한 이 과정에서 개인정보도 안전하게 보호된다. 와이즈 캠 소유자들에게는 좋지 않은 소식이지만 엑스노어의 엣지 AI 시스템은 와이즈 캠에서 빠지기로 했다. 이들이 잃은 것을 시리가 가져가게 된다. editor@itworld.co.kr 


X