AIㆍML / 글로벌 트렌드 / 디지털 디바이스

글로벌 칼럼 | AR 글래스의 대중화를 이끌 단 하나의 열쇠

Mike Elgan | Computerworld 2023.10.11
최근 오픈AI는 AI 챗봇에 텍스트 프롬프트 대신 사진을 사용할 수 있는 기능을 포함한 새로운 ChatGPT 기능을 발표했다.

오픈AI는 “여행지 랜드마크 사진을 찍고 흥미로운 이야기를 들을 수 있다. 집에서는 냉장고와 팬트리 사진을 찍어 저녁 식사 메뉴를 추천받고 단계별 레시피에 대한 후속 질문을 한다. 저녁 식사 후에는 자녀의 수학 문제를 사진으로 찍어 풀이를 도와줄 수 있다”라고 설명했다.
 
ⓒ Redd F/Unsplash

이와 함께 오픈AI는 앞으로 챗GPT가 추가 정보를 얻을 수 있도록 마이크로소프트의 빙 검색 엔진에 액세스할 수 있으며, 모바일 앱은 음성 입력 및 출력을 지원한다고 밝혔다.


메타의 스마트 글래스에서 찾은 힌트

사진 프롬프트를 제공하는 업체는 오픈AI만이 아니다. 메타는 최근 에실로룩소티카(EssilorLuxottica)의 레이밴 사업부와 파트너십을 통해 만든 스마트 글래스 ‘레이밴 스토리(Ray-Ban Sorties)’의 두 번째 버전을 공개했다. 오는 10월 17일 299달러(약 40만 원)로 출시되는 새로운 스마트 글래스는 전작보다 성능이 개선된 카메라, 마이크, 스피커를 탑재하고 있으며, 페이스북과 인스타그램 라이브 스트리밍을 지원한다.

전자기기 마니아와 소셜 인플루언서들은 이런 기능에 열광하고 있다. 하지만 레이밴 스토리 2의 진정한 업그레이드는 AI다. 새로운 스마트 글래스에는 퀄컴의 강력한 신형 AR1 1세대 칩이 탑재돼 사용자는 내장 스피커와 마이크를 통해 AI와 대화할 수 있다. 
 
ⓒ Meta

하지만 레이밴 스토리의 AI는 단순한 AI가 아니다. 

지난 9월 메타는 28가지의 성격과 특징을 가지고 있는 AI 챗봇 '메타 AI(Meta AI)'를 공개했다. 메타는 스마트 글래스를 포함한 모든 소셜 플랫폼에 메타 AI를 탑재해 왔다. 또한 메타 AI 역시 마이크로소프트의 빙을 통해 자체 LLM 라마2(Llama2)가 학습하지 못한 최신 정보를 검색할 수 있게 된다. 

메타는 오는 2024년 레이밴 스토리를 ‘멀티모달’로 만드는 소프트웨어 업데이트를 약속했다. 음성을 통해 메타 AI 챗봇과 상호작용하는 것 외에도 챗GPT처럼 사진 프롬프트를 처리하는 기능을 지원하게 된다. jpg 파일을 업로드하는 대신 레이밴 스토리에 내장된 카메라로 이미지를 캡처하는 방식이다. 

예를 들어, 안경을 착용한 상태에서 건물을 바라보며 “이 건물은 무슨 건물이야?”라고 물으면 AI가 답을 알려준다. 또한 메타는 표지판과 메뉴의 실시간 언어 번역, 보고 있는 가전제품의 수리 방법 및 기타 용도에 대한 지침을 제공하는 기능을 약속했다. 필자는 메타의 강력한 얼굴 인식 기술을 통해 대화 상대가 누구인지 알려주는 기능도 시간 문제라고 생각한다. 

즉, 레이밴 스토리는 예정된 소프트웨어 업데이트를 통해 사실상 AR(Argumented Reality) 글래스로 거듭나는 셈이다. 


왜 AI가 AR의 미래인가?

AR은 디지털 이미지, 사운드 및 텍스트를 통해 물리적 현실을 증강하거나 보는 것에 대한 추가 정보를 제공하는 기술이다. 애플, 마이크로소프트, 매직 리프(Magic Leap) 같은 기업은 고가의 무겁고 배터리를 많이 소모하는 AR 헤드셋으로 고해상도 가상 3D 객체, 캐릭터, 아바타를 표시하는 시스템을 개발하는 데 많은 시간과 비용을 투자했다. 

기술 미디어나 업계에서 AR에 대해 이야기할 때면 AR 글래스를 통해 현실 세계에 어떤 홀로그램 이미지를 겹쳐서 볼 수 있는지에 집중하는 경향이 있다. 핸즈프리 포켓몬 고(Pokemon Go)나 획기적으로 개선된 버전의 구글 글래스를 상상한다. 그러나 작년 말 생성형 AI 기반 챗봇 혁명이 일어난 이후 AR 경험을 구성하는 모든 요소 중 홀로그램 디지털 가상 객체가 가장 덜 중요하다는 사실이 점점 더 분명해지고 있다. 

AR에서는 안경이 필수다. 안드로이드 휴대폰과 아이폰은 수년 동안 AR 기능을 제공해 왔지만, 휴대폰을 보는 것은 안경을 통해 핸즈프리로 세상을 보는 것과는 비교가 되지 않기 때문에 아무도 주목하지 않았다. 

AR 안경에는 카메라와 센서, 양방향 오디오가 필요하다. 디바이스가 현실을 인식할 방법이 없다면 현실을 증강하는 것은 불가능하다. 양방향 오디오는 사용자가 핸즈프리로 AR을 제어하는 수단이다. 

그리고 스마트 글래스가 사람의 시야에 있는 임의의 사람, 사물, 활동을 해석하고 이해하기 위해서 필요한 것이 바로 AI다. 가상 디스플레이, 가상 데이터 및 가상 객체는 있으면 좋지만 꼭 필요한 것은 아니다. 

가장 중요하다고 생각했던 기술이 알고 보니 가장 중요하지 않은 것이었다. AR에 대해 이야기할 때는 ‘출력물’의 시각적 품질을 지나치게 강조해 왔다. 컨퍼런스 참석자, 데모 청중 및 초기 고객은 3D 캐릭터가 뛰어다니는 모습과 기타 무의미한 콘텐츠에 매료됐던 것이다.

AR은 눈앞의 현실을 명확하게 이해하는 것에서 시작한다. 그 현실에 대한 정보, 인사이트, 조언을 제공할 수 있을 때 AR의 진정한 힘이 발휘된다. AI가 범용 AR에서 가장 필수적인 요소라는 것이 이제 분명해졌다. 시각적 요소가 전부이고 AI가 필요하지 않은 VR(Virtual Reality)와는 정반대다. 

마크 주커버그는 메타 레이밴 안경 발표에서 “스마트 글래스는 AI 비서가 사용자가 보는 것을 보고 사용자의 말을 들을 수 있는 이상적인 폼팩터”라고 말했다. 

주커버그의 말이 맞다. 

메타가 AR의 미래를 지배할 것이라고 단언할 수는 없다. 분명한 것은 AI가 AR의 미래이고 AR이 AI의 미래라는 점이다. 필자는 오픈AI, 마이크로소프트, 구글을 포함한 모든 선도적인 AI 회사가 메타 레이밴과 같은 안경을 빠르게 출시한다고 해도 놀라지 않을 것 같다. 타이핑하는 것보다 말하는 것이 낫고, 말하는 것보다 보여주는 것이 더 낫기 때문이다. 

애플에 대한 소문과 특허에 따르면 애플은 거대하고 부피가 큰 실내 전용 비전 프로(Vision Pro)를 출시한 이후 가벼운 일상용 AR 안경을 출시할 예정이라고 한다. 하지만 애플은 가정용 가상 비서 기기에서 그랬던 것처럼 또다시 배를 놓칠 것 같다. 애플은 아마존이 에코를 출시하고 2년 뒤에서야 애플 홈팟을 출시했다. 애플의 AR 글래스 출시가 늦어지는 이유는 음성 대화와 AI 카메라 입력에 집중하기보다는 매력적인 시각적 데이터를 제공하는 데 매달렸기 때문이다. 

메타의 최근 발표에서 아무도 핵심을 파악하지 못한 것 같아서 필자가 직접 이야기한다. 메타 레이밴 스마트 글래스 2세대 발표는 AI 기반 AR 글래스라는 새로운 플랫폼을 장악하기 위한 경쟁이 본격적으로 시작했음을 의미한다. 소비자와 기업 모두에 큰 도움이 될 완전히 새로운 컴퓨팅 플랫폼이다. 다시 한번 강조한다. AR의 미래는 AI다. 그리고 AI의 미래는 바로 AR이다.
editor@itworld.co.kr
Sponsored

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.