2020.01.06

2020년, 업무 환경의 음성 기반 AI 기술 보편화 원년 될까?

Matthew Finnegan | Computerworld
아마존 알렉사, 애플 시리, 구글 어시스턴트와 같은 음성 기반 AI 비서가 가정에서 점점 일상화되고 있다. 스마트폰과 웨어러블 기기도 음성으로 제어할 수 있다. 업무에서는 음성 기술 사용을 이제 시작하는 단계지만, 올해부터 많은 변화가 있을 예정이다.

업무 환경에서 음성으로 할 수 있는 일이 무엇일까? 똑똑한 음성 비서를 통해 일상적인 작업을 더 쉽게 완료하고 집과 같은 디지털 경험으로 직원의 효율성을 높일 수 있다. 

2019년 451 리서치(451 Research)의 설문조사에 따르면, 음성 UI 및 음성 비서는 사물인터넷과 AI에 이어 기업을 위한 가장 파괴적인 혁신 기술로 꼽혔으며, 응답 기업의 40%는 2년 이내에 음성 기술을 채택할 계획이다.

451 리서치의 선임 애널리스트인 라울 카스타논 마르티네즈는 “2020년에는 음성 사용자 인터페이스가 업무에 널리 보급되리라 예상한다. 초기에는 간단한 업무를 처리하지만, 점점 복잡한 업무의 토대가 될 것”이라고 말했다.

우선 음성 비서는 전화 수/발신, 알림 설정, 일정 예약 등 집에서 했던 소소한 작업으로 시작할 것이다. 그러나 소프트웨어 업체가 음성 기능을 제품에 통합함으로써 직무별로 특화된 사용례가 빠르게 등장하게 될 것이다.
 
ⓒ Getty Images Bank


업무 생산성을 높이는 음성 AI

최근 마이크로소프트는 소비자가 아닌 기업 대상의 AI 비서로 확고히 자리잡은 코타나(Cortana)를 아웃룩 모바일 앱과 통합한다고 발표했다. 이메일에서 사용자 음성을 텍스트로 변환하거나 읽어줄 수 있게 된 것이다. 구글 어시스턴트도 G 스위트 캘린더와 통합되기 시작했다. 사용자는 음성 명령으로 일정을 확인 및 예약할 수 있고, 특정 연락처로 이메일을 보내거나 컨퍼런스콜을 할 수 있다.

비교적 쉬운 작업이지만, 기업에 널리 사용되는 오피스 365와 G 스위트를 통해 음성으로 더 많은 협업을 끌어낼 수 있다. 

또한, 음성 비서는 업무에 특화된 하드웨어에 내장되어 기업이 더 쉽게 도입할 수도 있다. 아마존의 비즈니스용 알렉사는 폴리(Poly)의 컨퍼런스용 전화 및 헤드셋에 내장되었고, 마이크로소프트의 코타나는 서피스(Surface) 이어폰에 내장됐다.

카스타논 마르티네즈는 “음성 기술을 생산성 애플리케이션과 디바이스에서 더 많이 사용할 수 있게 되면, 기업이 더 많이 채택하게 될 것이다. 이를 통해 업무상 음성 사용자 인터페이스를 사용하는 것이 더 익숙해질 것이다. 일반 사용자가 알렉사, 시리와 같은 AI 비서나 아마존 에코, 구글 홈/네스트와 같은 스마트 스피커에 익숙해지는 과정과 비슷하다”고 말했다.


도입 장벽 낮아지는 음성 AI

IDC의 선임 리서치 애널리스트 헤일리 서덜랜드에 따르면, 현재 챗봇과 같은 대화형 AI 도구가 일반적이지만, 음성 인터페이스의 도입은 더디게 진행됐다. 하지만 기본 자연어 처리 기술의 발전으로 음성 기반 비서는 일상적인 상호작용을 할 수 있을 정도로 정확해졌다.

서덜랜드는 “지난해 자연어 처리(Natural Language Processing, NLP) 기술이 크게 도약했다. 이는 음성 비서가 명령을 오해해 사용자를 성가시게 하는 경우가 줄어든다는 의미이기에 중요하다. 음성 비서로 하는 작업 중 80%만 제대로 작동했을 때 나머지 20%는 사용자의 일상 작업에 추가되는 셈이고, 이는 상당한 양이다”라고 말했다.

자연어 처리의 발전은 대게 마이크로소프트, 아마존, 구글처럼 R&D에 막대한 예산을 쓸 수 있는 거대 기술 기업에서 나왔다. 하지만 음성 API의 활용 가능성으로 더 많은 기업이 자연어 처리 기술에 접근할 수 있다. 그리고 특정 업무 시나리오에 더 적합한 AI 비서를 만들 수 있다. 

일례로 부동산 회사 JLL에서 지난여름 공개한 자체 음성 및 문자 비서, JiLL이 있다. 이 스마트 오피스 비서는 구글 클라우드 기반의 대화형 AI 플랫폼 다이얼로그플로우(Dialogflow)를 사용해 구축됐다. 여분의 책상을 찾아 예약하고 동료와 회의를 잡는 작업 등을 할 수 있다.

JLL의 최고 디지털 제품 책임자 비나이 고엘은 이전 인터뷰에서 “우리는 (음성 비서에 대한) 일반 사용자 경험을 업무에 적용하고 싶었다. 알렉사나 구글 어시스턴트를 통해 경험하는 것처럼, JiLL이 일상의 비서라고 생각하며, 기본적으로 JiLL을 통해 업무 환경의 경험을 재창조하고자 한다”고 말했다.

서덜랜드는 “회사에서 자체 음성 비서 기술을 구축할 수 있는 자원이 없거나 집중 영역이 아니어도, 이제는 서드파티 API를 사용해 자체적으로 구축하기 위해 필요한 75%의 음성 기능을 확보하고 나머지는 맞춤화할 수 있다. 이는 기술의 또 다른 발전이 될 수 있다”고 설명했다.


여전한 개인정보보호 및 보안 문제

음성 AI 비서를 채택하는 데 남아있는 또 다른 장벽은 개인정보보호 및 보안에 대한 두려움이다. 작년 애플, 아마존, 구글, 마이크로소프트는 직원 및 계약 직원이 제품 품질 검사를 위해 일부 고객의 음성 녹음에 접근했다고 밝혀져 여론의 뭇매를 맞았다.

최근 IDC 조사에 따르면, 소비자의 44%는 기기에 스마트 디바이스에 대한 개인정보보호 및 보안에 우려를 표했다. 민감한 기업 데이터가 위험에 노출될 수 있다는 면에서 이런 우려는 더 높아질 수 있다. 특히, 세일즈포스나 오라클 같은 비즈니스 애플리케이션에 음성 인터페이스가 추가될 경우가 더욱더 그렇다.

오라클은 지난 9월 텍스트 상호작용을 목표로 시작한 디지털 비서에 음성 기능을 추가한다고 발표하면서, 고객의 음성 데이터에 대한 엄격한 관리를 강조했다.

오라클 AI 및 디지털 어시스턴트 사업부 부사장인 수하스 울리야르는 “고객은 자신의 데이터가 퍼블릭 클라우드 벤더에 전송되거나 더 구체적으로는 서드파티 벤더가 액세스하거나 듣지 않길 원한다. 우리의 경우 개인정보보호와 보안이 유지되며, 오직 고객만 자신의 데이터에 액세스할 수 있다”고 말했다. 

또한, “우리는 제품 모델을 재교육하기 위해 고객의 음성 정보를 사용하지 않는다. 이는 GDPR에서도 매우 중요하다. 음성 정보를 오라클 2세대 클라우드 인프라에 저장하지만 오라클에 있는 누구도 이를 건드리지 않는다”고 강조했다.

카스타논 마르티네즈는 고객의 우려를 불식시키고 비즈니스 애플리케이션에 지속적인 음성 인터페이스 지원을 우선하는 것이 성장의 핵심이라고 말했다.

그는 “음성 기술이 보편화하는 데 제한이 될 유일한 핵심 장벽은 보안이다. 음성 명령을 사용해 복잡한 워크플로우를 해내려면 특정 유형의 디바이스 사용과 사용자 인증이 필요하다. 이는 데이터와 비즈니스 애플리케이션과 같은 보안에 민감한 기업 자원과 상호작용을 요구하므로 도입에 걸림돌로 남는다”고 말했다.


간단한 작업에서 복잡한 작업까지

바쁜 사무실에서 음성 AI를 사용하는 것에는 여러 실질적인 이유로 저항이 있을 수 있지만, 이동중이거나 책상 업무에 국한되지 않은 직원에게는 특히 유용할 수 있다.

서덜랜드는 “특히 수작업이 많은 업계에서는 음성 기술을 우선적으로 그리고 자연스럽게 도입할 수 있는 곳이다. 현장 근로자는 훨씬 자연스럽게 사용할 것이며, 이를 통해 효율성이 높아지면 도입은 더욱 쉬워진다”고 설명했다.

헬스케어 산업은 음성 기반 비서의 도입 가능성이 큰 업계 중 하나다. 이미 많은 스타트업이 벤처 캐피탈 투자를 유치했다. 이 중 시애틀에 본사를 둔 세이카라(Saykara)는 음성 인식을 사용해 전자 건강 기록 시스템에 정보를 입력한다. 의사는 부담스러운 데이터 입력 업무에서 벗어날 수 있다.

세이카라 CEO 하진더 산두는 이전 인터뷰에서 “의사는 진료 중 하루 평균 약 2시간을 컴퓨터 앞에서 타이핑해야 한다. 진료 이후 저녁에 진료 기록을 남기느라 몇 시간씩 보내고 한다”고 제품 개발 이유를 설명했다.

헬스케어 영역에서는 서비스 개발도 활발히 진행 중이다. 구글은 최근 의료 디지털 비서 스타트업인 수키(Suki)와 협력 관계를 맺었고, 마이크로소프트는 오랜 음성 인식 서비스 업체인 뉘앙스(Nuance)와 협력 예정이라고 발표했다.

회의는 이미 음성 비서가 널리 사용되고 있는 분야다. 시스코 웹엑스 어시스턴트(Webex Assistant)와 비즈니스용 알렉사를 사용하면 음성으로 컨퍼런스 콜을 시작하고 사용 가능한 회의실을 확인할 수 있다.

이런 회의 비서 기능은 회의 중에 음성으로 중요한 정보를 검색해 논의를 돕는 방식으로 더욱 발전할 수 있다.

카스타논 마르티네즈는 “CEO나 CFO가 발표하는 경우, 알렉사나 코타나에게 ‘동부 지역의 3분기 매출은 얼마인가?’와 같은 질문을 할 수 있다. 이에 대한 답을 내려면 매우 복잡한 워크플로우가 필요하다. 누가 질문을 하는지, 요청하는 정보가 무엇인지 파악하고 다양한 경로로 정보를 수집한 다음 자연어를 사용해 일관된 방식으로 제시해야 한다는 뜻”이라고 설명했다.

그리고 “다음 단계에는 이런 음성 검색 기능이 이뤄지고, 더 까다로운 워크플로우를 위한 길을 열게 될 것”이라고 전망했다. editor@itworld.co.kr
 


2020.01.06

2020년, 업무 환경의 음성 기반 AI 기술 보편화 원년 될까?

Matthew Finnegan | Computerworld
아마존 알렉사, 애플 시리, 구글 어시스턴트와 같은 음성 기반 AI 비서가 가정에서 점점 일상화되고 있다. 스마트폰과 웨어러블 기기도 음성으로 제어할 수 있다. 업무에서는 음성 기술 사용을 이제 시작하는 단계지만, 올해부터 많은 변화가 있을 예정이다.

업무 환경에서 음성으로 할 수 있는 일이 무엇일까? 똑똑한 음성 비서를 통해 일상적인 작업을 더 쉽게 완료하고 집과 같은 디지털 경험으로 직원의 효율성을 높일 수 있다. 

2019년 451 리서치(451 Research)의 설문조사에 따르면, 음성 UI 및 음성 비서는 사물인터넷과 AI에 이어 기업을 위한 가장 파괴적인 혁신 기술로 꼽혔으며, 응답 기업의 40%는 2년 이내에 음성 기술을 채택할 계획이다.

451 리서치의 선임 애널리스트인 라울 카스타논 마르티네즈는 “2020년에는 음성 사용자 인터페이스가 업무에 널리 보급되리라 예상한다. 초기에는 간단한 업무를 처리하지만, 점점 복잡한 업무의 토대가 될 것”이라고 말했다.

우선 음성 비서는 전화 수/발신, 알림 설정, 일정 예약 등 집에서 했던 소소한 작업으로 시작할 것이다. 그러나 소프트웨어 업체가 음성 기능을 제품에 통합함으로써 직무별로 특화된 사용례가 빠르게 등장하게 될 것이다.
 
ⓒ Getty Images Bank


업무 생산성을 높이는 음성 AI

최근 마이크로소프트는 소비자가 아닌 기업 대상의 AI 비서로 확고히 자리잡은 코타나(Cortana)를 아웃룩 모바일 앱과 통합한다고 발표했다. 이메일에서 사용자 음성을 텍스트로 변환하거나 읽어줄 수 있게 된 것이다. 구글 어시스턴트도 G 스위트 캘린더와 통합되기 시작했다. 사용자는 음성 명령으로 일정을 확인 및 예약할 수 있고, 특정 연락처로 이메일을 보내거나 컨퍼런스콜을 할 수 있다.

비교적 쉬운 작업이지만, 기업에 널리 사용되는 오피스 365와 G 스위트를 통해 음성으로 더 많은 협업을 끌어낼 수 있다. 

또한, 음성 비서는 업무에 특화된 하드웨어에 내장되어 기업이 더 쉽게 도입할 수도 있다. 아마존의 비즈니스용 알렉사는 폴리(Poly)의 컨퍼런스용 전화 및 헤드셋에 내장되었고, 마이크로소프트의 코타나는 서피스(Surface) 이어폰에 내장됐다.

카스타논 마르티네즈는 “음성 기술을 생산성 애플리케이션과 디바이스에서 더 많이 사용할 수 있게 되면, 기업이 더 많이 채택하게 될 것이다. 이를 통해 업무상 음성 사용자 인터페이스를 사용하는 것이 더 익숙해질 것이다. 일반 사용자가 알렉사, 시리와 같은 AI 비서나 아마존 에코, 구글 홈/네스트와 같은 스마트 스피커에 익숙해지는 과정과 비슷하다”고 말했다.


도입 장벽 낮아지는 음성 AI

IDC의 선임 리서치 애널리스트 헤일리 서덜랜드에 따르면, 현재 챗봇과 같은 대화형 AI 도구가 일반적이지만, 음성 인터페이스의 도입은 더디게 진행됐다. 하지만 기본 자연어 처리 기술의 발전으로 음성 기반 비서는 일상적인 상호작용을 할 수 있을 정도로 정확해졌다.

서덜랜드는 “지난해 자연어 처리(Natural Language Processing, NLP) 기술이 크게 도약했다. 이는 음성 비서가 명령을 오해해 사용자를 성가시게 하는 경우가 줄어든다는 의미이기에 중요하다. 음성 비서로 하는 작업 중 80%만 제대로 작동했을 때 나머지 20%는 사용자의 일상 작업에 추가되는 셈이고, 이는 상당한 양이다”라고 말했다.

자연어 처리의 발전은 대게 마이크로소프트, 아마존, 구글처럼 R&D에 막대한 예산을 쓸 수 있는 거대 기술 기업에서 나왔다. 하지만 음성 API의 활용 가능성으로 더 많은 기업이 자연어 처리 기술에 접근할 수 있다. 그리고 특정 업무 시나리오에 더 적합한 AI 비서를 만들 수 있다. 

일례로 부동산 회사 JLL에서 지난여름 공개한 자체 음성 및 문자 비서, JiLL이 있다. 이 스마트 오피스 비서는 구글 클라우드 기반의 대화형 AI 플랫폼 다이얼로그플로우(Dialogflow)를 사용해 구축됐다. 여분의 책상을 찾아 예약하고 동료와 회의를 잡는 작업 등을 할 수 있다.

JLL의 최고 디지털 제품 책임자 비나이 고엘은 이전 인터뷰에서 “우리는 (음성 비서에 대한) 일반 사용자 경험을 업무에 적용하고 싶었다. 알렉사나 구글 어시스턴트를 통해 경험하는 것처럼, JiLL이 일상의 비서라고 생각하며, 기본적으로 JiLL을 통해 업무 환경의 경험을 재창조하고자 한다”고 말했다.

서덜랜드는 “회사에서 자체 음성 비서 기술을 구축할 수 있는 자원이 없거나 집중 영역이 아니어도, 이제는 서드파티 API를 사용해 자체적으로 구축하기 위해 필요한 75%의 음성 기능을 확보하고 나머지는 맞춤화할 수 있다. 이는 기술의 또 다른 발전이 될 수 있다”고 설명했다.


여전한 개인정보보호 및 보안 문제

음성 AI 비서를 채택하는 데 남아있는 또 다른 장벽은 개인정보보호 및 보안에 대한 두려움이다. 작년 애플, 아마존, 구글, 마이크로소프트는 직원 및 계약 직원이 제품 품질 검사를 위해 일부 고객의 음성 녹음에 접근했다고 밝혀져 여론의 뭇매를 맞았다.

최근 IDC 조사에 따르면, 소비자의 44%는 기기에 스마트 디바이스에 대한 개인정보보호 및 보안에 우려를 표했다. 민감한 기업 데이터가 위험에 노출될 수 있다는 면에서 이런 우려는 더 높아질 수 있다. 특히, 세일즈포스나 오라클 같은 비즈니스 애플리케이션에 음성 인터페이스가 추가될 경우가 더욱더 그렇다.

오라클은 지난 9월 텍스트 상호작용을 목표로 시작한 디지털 비서에 음성 기능을 추가한다고 발표하면서, 고객의 음성 데이터에 대한 엄격한 관리를 강조했다.

오라클 AI 및 디지털 어시스턴트 사업부 부사장인 수하스 울리야르는 “고객은 자신의 데이터가 퍼블릭 클라우드 벤더에 전송되거나 더 구체적으로는 서드파티 벤더가 액세스하거나 듣지 않길 원한다. 우리의 경우 개인정보보호와 보안이 유지되며, 오직 고객만 자신의 데이터에 액세스할 수 있다”고 말했다. 

또한, “우리는 제품 모델을 재교육하기 위해 고객의 음성 정보를 사용하지 않는다. 이는 GDPR에서도 매우 중요하다. 음성 정보를 오라클 2세대 클라우드 인프라에 저장하지만 오라클에 있는 누구도 이를 건드리지 않는다”고 강조했다.

카스타논 마르티네즈는 고객의 우려를 불식시키고 비즈니스 애플리케이션에 지속적인 음성 인터페이스 지원을 우선하는 것이 성장의 핵심이라고 말했다.

그는 “음성 기술이 보편화하는 데 제한이 될 유일한 핵심 장벽은 보안이다. 음성 명령을 사용해 복잡한 워크플로우를 해내려면 특정 유형의 디바이스 사용과 사용자 인증이 필요하다. 이는 데이터와 비즈니스 애플리케이션과 같은 보안에 민감한 기업 자원과 상호작용을 요구하므로 도입에 걸림돌로 남는다”고 말했다.


간단한 작업에서 복잡한 작업까지

바쁜 사무실에서 음성 AI를 사용하는 것에는 여러 실질적인 이유로 저항이 있을 수 있지만, 이동중이거나 책상 업무에 국한되지 않은 직원에게는 특히 유용할 수 있다.

서덜랜드는 “특히 수작업이 많은 업계에서는 음성 기술을 우선적으로 그리고 자연스럽게 도입할 수 있는 곳이다. 현장 근로자는 훨씬 자연스럽게 사용할 것이며, 이를 통해 효율성이 높아지면 도입은 더욱 쉬워진다”고 설명했다.

헬스케어 산업은 음성 기반 비서의 도입 가능성이 큰 업계 중 하나다. 이미 많은 스타트업이 벤처 캐피탈 투자를 유치했다. 이 중 시애틀에 본사를 둔 세이카라(Saykara)는 음성 인식을 사용해 전자 건강 기록 시스템에 정보를 입력한다. 의사는 부담스러운 데이터 입력 업무에서 벗어날 수 있다.

세이카라 CEO 하진더 산두는 이전 인터뷰에서 “의사는 진료 중 하루 평균 약 2시간을 컴퓨터 앞에서 타이핑해야 한다. 진료 이후 저녁에 진료 기록을 남기느라 몇 시간씩 보내고 한다”고 제품 개발 이유를 설명했다.

헬스케어 영역에서는 서비스 개발도 활발히 진행 중이다. 구글은 최근 의료 디지털 비서 스타트업인 수키(Suki)와 협력 관계를 맺었고, 마이크로소프트는 오랜 음성 인식 서비스 업체인 뉘앙스(Nuance)와 협력 예정이라고 발표했다.

회의는 이미 음성 비서가 널리 사용되고 있는 분야다. 시스코 웹엑스 어시스턴트(Webex Assistant)와 비즈니스용 알렉사를 사용하면 음성으로 컨퍼런스 콜을 시작하고 사용 가능한 회의실을 확인할 수 있다.

이런 회의 비서 기능은 회의 중에 음성으로 중요한 정보를 검색해 논의를 돕는 방식으로 더욱 발전할 수 있다.

카스타논 마르티네즈는 “CEO나 CFO가 발표하는 경우, 알렉사나 코타나에게 ‘동부 지역의 3분기 매출은 얼마인가?’와 같은 질문을 할 수 있다. 이에 대한 답을 내려면 매우 복잡한 워크플로우가 필요하다. 누가 질문을 하는지, 요청하는 정보가 무엇인지 파악하고 다양한 경로로 정보를 수집한 다음 자연어를 사용해 일관된 방식으로 제시해야 한다는 뜻”이라고 설명했다.

그리고 “다음 단계에는 이런 음성 검색 기능이 이뤄지고, 더 까다로운 워크플로우를 위한 길을 열게 될 것”이라고 전망했다. editor@itworld.co.kr
 


X