Offcanvas
Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.
Offcanvas
1111Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.

음성인식

“마스크의 디지털 변신” 레이저, RGB 장착 N95 마스크 발표

코로나19 확산을 방지하기 위한 마스크는 보호에서 패션으로 진화하고 있다. 게임 디바이스 전문업체 레이저(Razer)는 여기서 한걸음 더 나아가 음성 증폭 RGB 마스크인 프로젝트 헤이즐(Project Hazel)을 발표했다. 2020년 3월 레이저는 자사 제조 라인의 일부를 수술용 등급 인증 마스크 개발로 전환해 코로나 확산 방지에 일조하겠다고 발표했으며, 이미 수백만 장의 마스크를 생산했다고 밝힌 바 있다. 레이저의 수석 마케팅 책임자인 마이크 샤니코우는 “자연스러운 단계로 이 구상이 진화하면서 뉴 노멀에 맞게 처음부터 다시 설계한 새로운 마스크를 개발할 방안을 시험해 보고자 했다”고 설명했다.   레이저는 이번 CES 발표에서 아직 본격 생산하지 않은 프로젝트 헤이즐의 시제품을 선보였다. 레이저가 “세상에서 가장 똑똑한 마스크”로 내세우는 이 마스크는 위생과 함께 마스크 폐기로 인한 환경 문제까지 고려한 것이 특징이다.  재활용할 수 있는 프로젝트 헤이즐 마스크는 투명한 안면 쉴드와 유연한 실리콘 끈, 그리고 양쪽에 필터링 기능을 하는 N95 ‘스마트 팟(Smart Pod)’이 있다. 배출구는 능동형 환기 시스템으로 설계해 마스크로의 공기 유입 및 배출을 제어할 수 있다.   레이저에 따르면, 투명한 안면 쉴드는 마스크로 인한 사회적 인터랙션 제한 문제를 해결할 수 있다. 사용자의 표정은 물론, 입 모양을 볼 수 있으며, 내부에 약한 LED 조명이 있어 밤에도 유용하다. 마스크의 또 다른 문제는 소리를 막아 커뮤니케이션에 방해가 된다는 것. 프로젝트 헤이즐은 사용자의 음성을 탐지하는 저지연 마이크와 스피커를 탑재해 사용자의 음성을 외부로 정확하게 전달한다. 음성 알고리즘은 함께 제공하는 앱을 통해 훈련할 수 있으며, 마스크 없이 말하는 것과 같은 소리를 전달한다.   필터에 장착된 RGB LED는 미적 기능은 물론, 마스크의 상태를 표시하는 기능도 수행한다. 충전이 필요한 상태임을 나타낼 수 있으며, L...

마스크 필터 음성인식 2021.01.14

"구글과 다른 길 걷는" 애플 개인정보 보호 페이지 업데이트의 의미

최근 애플은 개인정보 보호 웹사이트를 업데이트하고, 애플의 개인정보 접근법과 애플 제품이 사용자 개인정보를 보호하는 방법을 설명하는 여러 개의 백서를 발간했다. 전보다 더 많은 정보 제공 업데이트된 웹사이트는 애플이 하는 일에 대한 전반적인 개요를 비롯해 훨씬 더 많은 정보를 제공한다. 각 기능과 통제 수단, 그리고 애플의 개인정보보호 정책과 투명성 보고서에 대한 세부적인 설명이 나와 있다.   또한 사이트는 사파리, 위치 서비스, 사진, 애플로 로그인 기능에서 개인정보보호 통제 수단이 어떻게 작동하는지를 설명하는 이해하기 쉬운 몇 가지 백서도 제공한다. 백서에는 애플과 서비스에 관한 다량의 정보가 포함돼 있다.   헤이 시리, ‘debacle’의 철자가 뭐지? 애플은 사용자 개인정보를 보호하기 위한 지속적인 노력에 대해 매년 많은 정보를 제공해왔지만, 올해는 시리와 나눈 대화 일부가 음성 인식 개선 채점 시스템에 재활용되면서 논란이 발생한 만큼 그 의미가 예년에 비해 더 크다.   시리와의 대화가 채점 시스템에 전달되었다는 소식이 보도된 이후 애플은 시리의 음성 인식 개선 과정을 더 투명하게 만들고 사용자에게 더 많은 통제 권한을 제공하기 위한 여러 조치를 취했다. 이제 사용자는 채점 프로세스를 완전히 방지할 수 있을 뿐만 아니라 시리 시스템에 보관된 자신의 녹음 파일을 삭제할 수도 있다. 또한 애플은 외부 업체에 맡겼던 채점 프로세스 운영을 회사 내부로 가져왔다.   그저 이타적인 동기로 사용자 개인정보를 보호하는 것은 아니다. 애플은 사용자가 스마트폰을 집어 들고 전화를 걸고 메시지를 확인하거나 어느 장소를 방문할 때마다 스마트폰에 내장된 센서가 사용자의 행동을 추적할 수 있음을 인식하고 있다. 즉, 스마트폰은 사용자에 관한 막대한 양의 정보를 수집한다.   애플은 단순히 기능하는 시스템을 설계하는 데 그치지 않고 이러한 정보가 디바이스 내에 머물고 애플에 공유되지 않도록 시스템을 설계했으며, 여기에 더해 데이...

개인정보 음성인식 시리 2019.11.11

“음성 인식과 인공 지능으로” 업무 생산성을 높여줄 3가지 앱

유용한 팁들을 밝혀내면서 필자는 업무 생산성 중심의 앱들을 사용하면서 시간을 보냈다. 그리고 최근 미래가 유망한 앱 3가지를 찾아냈다. 회의를 더욱 생산적으로 만들어주고, 회의록을 잘 정리할 수 있도록 도와주며, 이메일을 더 잘 제어할 수 있도록 한다. 단, 이런 기능들을 활용하려면 본인 데이터의 일부를 공유해야 한다. 더 좋은 이메일 : 부메랑(Boomerang) 부메랑(무료)은 인공지능을 비롯한 여러 추가 기능들이 조합된 대안 이메일 클라이언트다. 동작 방식은 간단하다. 앱에 본인의 데이터에 접근 권한을 주면, 앱이 받은 이메일들을 모니터링하고, 분류하고, 자동 응답, 나중에 보도록 분류해주는 기능까지 수행한다. 그리고 이메일을 검토하고, 회의 일정을 잡고, 답장이 필요한 이메일까지 찾아주는 음성 비서 기능도 있다. 필자가 가장 좋아하는 기능 중 하나는 브리프 미(Brief Me)로, 봐야 할 이메일을 한 번에 표시해주고, 하루의 일정을 알려주는 음성 기능이 탑재된 스마트 비서다. 리스판더블 AI(Respondable AI)라는 기능도 좋아하는데, 이것은 이메일을 더 효율적으로 작성할 수 있도록 실시간 피드백을 주는 편집 도우미다. 부메랑에는 또 후속 작업을 위해 깃발 표시도 할 수 있도록 한다. 관련된 아이콘을 표시하면 해당 항목에 대해 언제 알려주길 원하는지 묻는 메시지가 나타난다. 이 앱은 매우 효율적이다. 그러나 맥OS 메일 앱을 지원하지 않고 이메일과 연락처 정보에 완전히 접근할 수 있는 권한을 주어야 한다는 큰 문제가 있다. 필자는 애플이 이 기능들을 메일 앱에도 추가하되 프로세스가 디바이스 안에서만 진행되도록 해 더욱 안전한 방식으로 구현하길 기대한다. 회의의 달인이 되자 : 보이세라(Voicera) 보이세라(무료)는 회의 생산성을 위해 음성 인식 기능을 활용한 앱이다. 보이세라는 아이폰의 마이크를 사용해서 사용자의 음성이나 회의 소리를 듣는다. EVA AI가 대화를 모니터링하고, 메모를 하고...

생산성 인공지능 음성인식 2018.08.30

글로벌 칼럼 | 오작동인가, 오해인가? 아마존 에코 사건, 기업 IT도 주의해야

마존이 에코 디바이스가 가족의 대화를 녹음해 연락처 목록에 있는 무작위 지인에게 메시지로 보낸 사실을 확인했다. 그러나 아마존은 Computerworld에 보낸 이메일에서의 성명을 통해 프라이버시에 민감한 사용자들이 제일 두려워하는 사태를 해명했다. 아마존은 “에코는 ‘알렉사’와 비슷한 소리가 알렉사와 상관 없는 배경 대화 중에 섞여서 반응했다. 이어진 대화 내용은 ‘메시지를 전송해’로 인식됐다. 중간에 알렉사가 “누구에게 보낼까요?”라고 물었고, 이어진 대화에서는 연락처에 등록된 이름 중 하나가 언급된 것으로 보인다. 이후 알렉사가 다시 이름을 물으며 “맞나요?”라고 물었고, 사용자들의 대화에서 “그래”를 인식했다. 우연적인 사건이 연달아 일어나는 일은 드물지만, 아마존은 이러한 사건의 빈도를 줄이기 위해 노력하겠다”는 설명이다. 기록에 따르면 이번 사태를 겪은 사용자 가족은 에코의 질문이나 반응을 전혀 듣지 못했다고 한다. 양측의 말이 서로 다르지만, 둘 다 틀리지 않았을 수도 있다. 사용자가 소리 높여 대화를 했거나 에코에 전혀 주의를 기울이지 않았다면 에코의 질문이나 반응을 확인하지 못했을 것이다. 필자 개인적으로는 이번 사건이 충분히 불쾌할 수 있으며, 동시에 매우 개연성이 있다고 생각한다. 시리도 역시 단어를 명령으로 잘못 인식하고 그 단어대로 행동하려고 할 때가 많았다. 시리를 통해 누군가에게 문자 메시지를 보내려고 하는 순간 일반 전화가 울리고 통화를 끝내면, 시리의 음성 인식 기능이 통화 내용을 문자 메시지로 바꿔 놓은 후 다른 사람에게 전송하려고 하는 상태가 된다. 만일 통화 내용에 “보내”와 비슷한 단어가 있었다면 아마 이미 메시지가 전송되었을 것이다. 아마존은 인터뷰 요청에는 응하지 않았다. 인터뷰가 성사되었더라면 사용자 가족의 대화에 언급되어 에코가 명령으로 받아들인 ...

음성인식 에코 아마존 2018.05.29

“음성 인식 기술, 100% 완벽할 필요 없다” 기업의 AI 기술 활용, 지금부터 시작해야

지난 수 년간 클라우드 컴퓨팅과 머신러닝 기술이 발전하면서 음성 인식 기술이 크게 개선되었다. 덕분에 아마존과 구글, 애플이 만든 가상 비서들이 사용자들 사이에 빠른 속도로 인기를 끌고 있다. 이런 점을 감안하면 크게 놀랄 일은 아니지만, 가상 비서 서비스의 기반이 되는 자연어 처리 기술도 기업 시장으로까지 확산되고 있다. 지난주 엔터프라이즈 커넥트(Enterprise Connect) 컨퍼런스에 참석한 제이 아놀드 앤 어소시에이츠의 존 아놀드는 “기업 시장은 도입 초기 단계지만, 기본적인 기능은 이미 구현되어 있다”고 말했다. 기업에서는(최소한 초기에는) 직원 생산성 향상과 워크플로우 자동화를 분야에 음성 인식 기술을 활용할 것으로 전망된다. 인공 지능 기법이 발전하면서 음성 인식 시스템의 정확도도 크게 높아졌다. 구글 등의 음성 인식 정확도는 약 95%인 것으로 알려져 있다. 아놀드는 엔터프라이즈 커넥트 행사의 키노트 프레젠테이션에서 “음성 인식 기술은 오랜 시간 동안 발전했다. 사람의 음성 인식 수준과 동등한 임계점을 통과했다는 것이 중요하다. 머신의 역량이 인간의 인식 수준을 크게 따라 잡은 것”이라고 말했다. 아놀드에 따르면, 기업이 음성 인식 기술을 활용하는 방법은 크게 4가지로 요약된다. - 스피치-투-텍스트(음성을 문자로 변환)는 이메일 받아쓰기에 활용할 수 있다. 사용할수록 더 정확해 진다. - 텍스트-투-스피치(문자를 음성으로 변환)는 모바일 환경에 도움을 준다. 예를 들어, 출퇴근 때 메모나 업무 문서를 검토하는 개인 팟캐스트를 만들 수 있다. - 음성 인식은 가상 비서와 대화하면서, 문서를 찾거나 캘린더 일정을 생성하는 등의 명령을 내리는 용도로 사용할 수 있다. - 마지막은 ‘감성 분석’을 지원하는 음성 분석으로, 면접이나 트레이닝 상황에 유용하게 활용될 수 있다. 음성 기술을 부각시킨 4가지 ‘획기적 사건...

음성인식 자연어처리 AI 2018.03.22

2018 IT 전망 보고서 - IDG Deep Dive

2017년의 IT 분야는 몇 년 동안 논의 및 검증 단계였던 기술들이 본격 보급화될 것임을 알리는 신호탄들을 여러 발 쏘아올렸다. 실용화 단계의 각종 IoT 플랫폼을 비롯해 클라우드에서 쉽게 이용할 수 있는 여러 빅데이터 분석 솔루션, 기업 내 모든 직원들이 저렴하게 이용할 수 있는 수많은 애널리틱스 도구 등이 그것이다. 마케팅 분야와 결합한 여러 챗봇 솔루션 및 다수의 비즈니스 자동화 도구들도 이에 해당한다. 2018년 CIO를 비롯한 기업 내 IT 리더들이 그 어느 해보다도 바빠질 것이라는 전망이 제기되는 이유다. 다가오는 2018년, IT 부문은 어떤 트렌드를 예상하고 준비해야 할까? 주요 시장조사기관의 보고서와 전망, 벤더의 시각, 실무 전문가들의 설문조사를 토대로 정리했다. 2018 Perspectives ·“지능, 디지털, 메시”… 가트너가 제시한 2018년 10대 전략 기술 트렌드 ·기업 IT 부문의 미래를 이끄는 9가지 힘 ·2018년을 지배할 보안 위협 5가지 ·2018년 하이브리드 클라우드 시장에 대한 5가지 예측 ·‘파일럿 넘어 현실로 간다’ 블록체인 기술의 현재와 미래 ·‘상상을 이미 넘었다’ 기업 현실로 들어온 AI ·‘일상이 달라진다’ AI와 음성인식이 가져오는 뉴노멀 시대 ·“미래에 대한 시각이 미래를 결정한다”… 선제적 IT 전략 수립법 Vendor ViewPoint ·2018년 고객경험의 혁신, 컨택센터가 ‘주역’이다 – 한솔인티큐브 ·인공지능(AI) 챗봇의 전망과 활용을 위한 조건 – 유비원 ·2018년에 대비해야 할 클라우드 컴퓨팅 트렌드 5가지 Survey ·&lsqu...

전망 챗봇 블록체인 2017.12.22

'듣고 말하는 미래 인터페이스' 음성 인식 가상 비서의 현황과 전망 - IDG Deep Dive

아마존 알렉사와 애플 시리, 마이크로소프트 코타나, 구글 어시스턴트 등 다양한 음성 인식 가상 비서가 스마트폰부터 앱, 스피커, 냉장고까지 전방위로 확산하고 있다. 영화 <2001 스페이스 오디세이>의 할이나 <아이언맨>의 자비스와 비교하면 아직은 갈 길이 멀지만, 키보드와 마우스 대신 말로 기기를 조작한다는 개념은 여전히 혁신적이다. 미래의 인터페이스 ‘음성 인식 가상 비서’의 현재를 진단하고 미래를 전망한다. 아마존 알렉사를 기반으로 간단한 앱도 직접 만들어 본다.   Trend “시리에서 알렉사까지” ‘가상 비서’ 전성시대   Reference “커피·피자 주문도 음성으로” 스타벅스·도미노의 거침없는 디지털 질주   How To “나만의 알렉사 앱을 만들자” 음성 비서 프로그래밍 실전

음성인식 시리 가상비서 2017.11.15

"스마트 홈에서 호텔 방까지", 애플과 아마존의 음성 인식 격돌

시리(Siri) 대 알렉사(Alexa), 어떤 음성 인식 비서가 더나은 호텔 컨시어지가 될까. 아마존의 알렉사는 소비자의 가정 내에 성공적으로 도전했다. 애플의 홈키트(HomeKit)는 자동화와 보안 표준과 관련해 최첨단이지만 에코(Echo)와 다른 다양한 알렉사 기기는 가정에 급속도로 보급되고 있다. 알렉사와 시리와의 전투는 이미 진행 중이며, 이들 가운데 음성 인식 비서로 누가 더 유용할까. 이 전쟁의 결론을 현재 호텔 체인들이 결정하려고 한다. 고급 호텔 체인인 윈 라스베이거스(Wynn Las Vegas) 리조트는 지난 12월 말, 알렉사를 선택하고 자체 시스템에 아마존 에코 기기를 추가했다. 블룸버그에 따르면, 현재 메리어트 인터내셔널(Marriott International)은 아마존과 애플을 놓고, 결정하는 중이다. 미국 텍사스 주 샌안토니오에 있는 JW 매리어트는 지난 10월부터 룸 서비스와 하우스 키핑에 이르기까지 다양한 종류의 운영자로서 아마존 알렉사 통합 기기를 테스트해왔다. 또한 알렉사는 메리어트 객실 가운데 일부의 조명을 제어할 수 있다. 하지만 알렉사의 주된 역할은 그것이 아니다. 메리어트, W 호텔, 리츠칼튼(Ritz-Carlton), 세인트 레지스(St. Regis), 쉐라톤(Sheraton), 웨스틴(Westin) 등을 소유하고 있는 메리어트 인터내셔널은 조명, 커튼, 실내 온도, TV를 포함한 다양하고 광범위한 기능을 제어하기 위해 알렉사와 시리 사이에서 고민하고 있다. 메리어트 인터내셔널은 미국 보스톤의 알로프트(Aloft) 호텔에서 아마존과 애플 기기를 테스트하고 있다. 메리어트의 실험적인 브랜드인 알로프트는 방 열쇠를 대체하기 위해 로봇 집사와 애플 워치를 사용하고 있다. 블룸버그 통신에 따르면, 메리어트는 올해 여름 무렵에 양사의 기기 가운데 하나를 결정할 것이다. 이렇게 결정된 알렉사 또는 시리가 미국 내 130개가 넘는 알로프트 호텔에만 적용될 지, 아니면 모든 메리어트 브랜...

음성인식 시리 Siri 2017.03.23

글로벌 칼럼 | 아무도 말하지 않는 윈도우의 약점, "음성 인식"

윈도우에는 마이크로소프트가 굳이 나서서 알리지 않는 기능이 하나 있다. 스타일러스를 사용해서 메모를 하고, 윈도우 헬로(Windows Hello)를 사용해서 얼굴을 인식하거나 로그인하고(또는 웹 보안), 코타나(Cortana)에게 어떤 일을 상기시키도록 지시할 수도 있는 윈도우에서 유독 음성 인식(Speech recognition) 엔진을 사용해 명령을 내리거나 받아쓰기를 하는 기능만큼은 별로 내세우지 않는다. 마이크로소프트가 이 기능에 침묵하는 이유를 찾아보면 대략 10년 전으로 거슬러 올라간다. 당시 마이크로소프트 제품 관리자 섀년 보쳐는 윈도우 비스타에 내장된 음성 받아쓰기를 시연했지만 이 시연은 속된 말로 폭망했다. 이후 마이크로소프트는 음성 인식 기능을 굳이 드러내지 않았다. 지금은 윈도우 내에서 받아쓰기로 문서를 작성할 수 있다는 것을 아는 사용자는 극소수에 불과하다. 만일 윈도우가 이 기능에 재도전할 적당한 시점을 꼽는다면 바로 지금이다. 컴퓨터와 인공 지능의 발달로 기술적인 토대가 훨씬 더 견고해졌기 때문이다. 마이크로소프트 음성 인식 연구와 코타나, 빙을 총괄하는 해리 슘 부사장은 마이크로소프트 오피스 내 받아쓰기 기능의 미래에 대한 질문을 받자 "아주 좋은 질문"이라고 운을 뗀 뒤 "이 기능은 지금 알려진 것보다 훨씬 더 큰 역할을 할 수 있다"고 강조했다. 그래서 한번 테스트해 보기로 했다. 다른 최신의 음성 기반 기술에 비해 어느 정도 수준인지 가늠해보기 위해 윈도우의 음성 받아쓰기 기능을 세부적으로 살펴봤다. 음성 인식이 완벽할 수 없는 이유 받아쓰기라고 하면 몇몇 사람은 여전히 만화 둔즈베리(Doonesbury)에서 조롱한 애플 뉴튼(Newton)을 떠올린다. 이 만화에서 뉴튼은 "I am writing a test sentence"라는 말을 "Siam fighting atomic sentry"로 받아쓴다. 사실 그렇게 생각...

음성인식 마이크로소프트 2016.10.11

비밀 음성 명령으로 스마트폰을 해킹한다

연구원들은 인터넷에서 걱정할 만한 새로운 무언가를 발견했다. 악의없는 한 유투브 동영상에서 '소리를 낮춘 음성'이 사용자가 알아차리지 못하게 근처 스마트폰에 명령을 내릴 수 있다는 것을 발견한 것이다. 이 연구원들은 이 위협을 설명한 보고서를 다음달 미국 텍사스 오스틴에서 개최되는 USENIX 보안 심포지엄에서 발표할 것이라며, 그들은 동영상을 보여줬다. 조지타운 대학 교수이자 이 논문 저자 가운데 한 사람인 미가 셀은 "음성인식은 구글 나우(Google Now)와 애플의 시리(Siri)와 같은 서비스 덕분에 급격하게 인기를 얻고 있다"며, "그러나 음성 소프트웨어는 기기를 해킹하기 쉽게 만들 수 있다"고 경고했다. . 이 팀은 인간은 해당 단어를 겨우 인지할 수 있는 수준이나 소프트웨어는 제대로 인지할 수 있는 음성으로 음성 명령을 훼손할 수 있다는 것을 발견했다. 한 마디로 귀신 같은 우웅대는 소리에서 단어를 뽑아낼 수 있다. "오케이 구글, XKCD.com을 열어"라고 음성이 말하면 가까이에 있는 한 스마트폰이 URL을 열었다. 해커들이 이를 악용한다면 스마트폰을 악성코드가 담긴 웹사이트에 직접 접속하게 하거나 사진을 가져오게 폰에 지시할 수 있다. 이것이 언제든 가능한 것은 아니지만, 이는 숫자 놀음에 불과하다. 100만 명이 비밀 메시지가 담긴 이 동영상을 본다면, 이들 폰이 가까이에 있을 확률은 1만명이라 치면, 약 5,000개는 악성코드가 담긴 URL로 로드하는 것이다. 셀은 "5,000개의 스마트폰이 공격자의 명령 하에 놓이게 된다"고 말했다. 해커들이 음성 인식 소프트웨어의 세부사항과 자체 내부동작 방식을 알게 되면 인간이 판독하기 어려운 음성 명령어를 만들 수 있다. 연구원들은 안드로이드 폰으로 테스트하면서 음성 명령의 샘플들을 업로드했다. 자체 테스트를 해 본 결과, 이 명령 샘플들은 때때로 탐지되지...

해킹 음성인식 음성명령 2016.07.08

글로벌 칼럼 | "제국의 집안 침공"...구글 홈에 대한 3가지 우려 사항

필자는 구글 제국이 점령한 집에 산다. 안드로이드 태블릿, 크롬북, 크롬캐스트를 생각해 보라. 운영체제가 오래된 탓에 넷플릭스 앱이 작동을 멈췄을 때도 구글 TV에 끝까지 충성했다. 이런 상황에서 필자의 남편은 구글 홈(Google Home)까지 더할 생각이다. 이 계획을 들은 필자는 그다지 유쾌하지 않았다. 이미 사용자의 소리를 듣는 기기는 충분히 많다. 집안에는 "OK, 구글" 명령을 대기하는 안드로이드 기기들이 있다. 물론 시작은 애플 시리(Siri)였다. 마이크로소프트 코타나(Cortana)가 그 뒤를 따랐고 아마존도 수백만 개의 가상 비서 에코(Echo)를 팔았다. 구글이 홈을 출시하게 되면 에코와 직접 경쟁하게 된다. 그런데 생각해보자. 이런 사용자들의 음성이 어디에 저장되는지, 어떻게 보호되는지, 얼마나 오래 보관되는지, 심지어 누가 이 데이터에 접근할 수 있는지도 알고 있는가? 모른다. 이것도 정부 감청 대상이 될까? 광고주들은 타겟 스팸 광고를 위해 무작위로 대화를 마이닝할까? 필자는 사람들의 대화를 엿듣는 새로운 이 전자기기들과 함께 생활하는 데 적응하기 위해 이미 노력 중이다. 하지만 그 전에 먼저 알고 싶은 것이 몇 가지 있다. 구글의 홈(Home)은 누구의 목소리를 듣는가? 구글 홈에 대해서는 예를 들어 홈이 어떤 방법으로 소리를 듣는지 등 알려지지 않은 부분이 많다. 이전의 가상 비서와 같은 방식을 사용한다면 "OK, 구글" 또는 이와 비슷한 명령을 수신할 때까지 다른 소리는 모두 무시하게 될 것이다. 안드로이드 폰과 같이 특정 음성을 인식하도록 훈련될까? 아니면 누구나 명령할 수 있는 안드로이드 와치(Android Watch)처럼 작동할까? 거실용으로 만들어진 가족 친화적인 기기인 만큼 여러 음성에 반응하는 편이 더 합당할 듯하지만 이 경우 문제의 소지도 있다. 구글 홈은 몇 가지 홈 오토메이션 기기와 연계해 작동한다. 최종 목록은 아직 공개되지 않았지만 온도...

음성인식 에코 시리 2016.06.22

IDG 블로그 | “안녕, 바비! 클라우드와 IoT는 처음이지?”

필자는 항상 인형을 좀 섬뜩한 것으로 생각해 왔다. 필자가 남자라서가 아니라 공포 영화에는 으레 사람을 죽이려는 사악한 인형이 잔뜩 등장하기 때문이다. 이런 인형이 실제로 등장하려면 ‘처키’ 시리즈가 몇 편까지 나와야 할까? 마텔의 신제품 헬로 바비는 아이들의 대화를 녹음해 부모들에게 보내준다. 이미지 : Mattel 그런데 ‘헬로 바비(Hello Barbie)’가 등장했다. 네트워크에 연결되고 클라우드 기반의 인공 지능이 탑재된 인형으로 아이들과 대화를 나눌 수도 있다. 테크리퍼블릭에 따르면, “헬로 바비의 목걸이는 녹음기 겸 마이크이다. 와이파이를 이용해 아이들의 질문과 대화를 받고, 이를 중앙 처리 센터로 전송한다. 토이토크(ToyTalk)를 통해 운영하는 음성 인식 소프트웨어가 입력을 탐지하며, 헬로 바비가 미리 프로그램된 8000여 개의 문장 중 하나를 사용해 대답한다.” 어떻게 이런 일이 가능한 것일까? 와아파이 칩 가격이 거의 공짜에 가까운 수준으로 떨어지고, 클라우드가 부상하면서 사물 인터넷이 섬뜩한 장난감의 인터넷으로 발전하고 있는 것이다. 실제로 언론은 아이들의 프라이버시가 침해될 수 있다는 우려를 제기하고 있다. 음성 응답이 백엔드 클라우드 서버에 저장되기 때문이다. 바비 인형을 차치하면, 기술 자체는 단지 귀여운 장난감을 넘어 실질적인 효용을 만들어 내고 있다. 예를 들어, 이런 식으로 인터랙티브한 학습을 제공할 수도 있으며, 간질이 있는 아이의 건상 상태를 모니터링하는 등의 용도로도 사용할 수 있다. 헬로 바비는 이제 시작에 불과하다. 2017년 말이면, 가정용 와이파이 허브는 주방의 오븐에서부터 수많은 아이들 장난감까지 모든 것을 연결하게 될 것이다. 이들은 모두 네트워크를 통해 실질적인 힘의 원천인 클라우에 연결될 것이다. 과연 좋은 일일까? 몇몇 기기에는 엄청난 잠재력을 가진 애플리케이션이 탑재되겠지만, 대부분의 애플리케이션은 그저 섬뜩한...

인공지능 음성인식 바비인형 2015.12.23

바이두 가상비서 ‘듀어’, 모바일 앱으로 출시

마이크로소프트가 윈도우 10을 출시하면서 가상 비서인 코타나(Cortana)를 전격 공개함에 따라, 중국의 검색 엔진 업체인 바이두(Baidu)도 수백만 명의 중국인이 사용할 수 있는 인공지능 기반의 가상 비서인 듀어(Duer)를 모바일 앱으로 출시했다. 바이두는 작고 귀여운 로봇인 듀어의 소프트웨어 버전인 듀어를 공개하고 온라인 구매를 시연했다. 지난 7일(현지시각) 데모 현장에서 사용자가 원하는 것을 입력하자, 15분 안에 라떼 2잔을 주문에 성공했다. 현재 바이두는 이 로봇을 당장 판매할 계획은 없다고 밝혔으나, 안드로이드 및 iOS용 바이두 앱에서는 소프트웨어를 이용해볼 수 있다. 바이두의 CEO인 리옌홍에 따르면, 바이두의 듀어는 음성기반의 가상 비서이며 추천에 기반한 온라인 구매를 도와준다. 그는 “누구나 가상 비서를 사용했으면 하는 바람이다”고 말했다. 듀어는 식당 예약과 영화 티켓 구매, 항공권 예매 등을 수행할 수 있다. 바이두의 CEO는 듀어가 반려견을 들일 수 있는 식당을 찾아 추천해달라는 질문에 답하는 모습을 시연하기도 했다. 바이두는 다양한 업체의 정보를 인덱싱해 듀어에 탑재했다. 바이두의 부사장인 왕 하이펑은 듀어가 사용자 리뷰를 기반으로 답을 내놓는다고 밝혔다. 바이두가 아직 듀어 로봇을 개발 중이기는 하나, 이 소프트웨어를 다양한 기기로 확장할 것이라고 왕은 덧붙였다. 같은 날 바이두는 상점에서 고객을 맞이하는 대형 로봇 버전을 공개하기도 했다. 듀어는 바이두의 플랫폼에서 더 많은 트래픽과 온라인 구매를 유도할 것으로 기대된다. 음식 배달과 영화 티켓 구매 등 스마트폰을 통한 구매에 의존하는 중국인들이 늘어남에 따라 바이두, 알리바바 그룹, 텐센트와 같은 대형 인터넷 업체들은 O2O 시장에서 치열한 경쟁을 펼치고 있다. 지난 6월 바이두는 자사 O2O 이커머스 비즈니스인 누오미(Nuomi)에 32억 달러를 투자하겠다고 밝힌 바 있다. 누오미는 바이두의 소셜 커머스 서비...

음성인식 바이두 가상비서 2015.09.09

구글 문서에 등장한 3개 기능 “음성 인식 타이핑, 조사 도구, 변경 사항 보기”

구글이 ‘구글 포 워크’ 문서 도구에 새로운 추가 기능을 선보였다. 이번 주에 새로 등장한 6개의 기능 중 3개를 소개한다. 이밖에도 구글은 올해 내내 구글 문서, 구글 스프레드 시트, 구글 슬라이드, 구글 폼 등을 꾸준히 개선해 왔다. 구글 문서 음성 인식 타이핑 기능 구글 문서에 음성으로 타이핑하는 기능이 등장했다. 조사 자문 기관 포레스터 애널리스트 데이비드 존슨에 따르면 음성 인식 타이핑은 기업 사용자에게 가장 중요한 기능일 것으로 전망된다. 음성으로 문서에 타이핑하는 기능은 구글 크롬 도구 메뉴를 통해 활성화되며 40개 이상의 언어를 지원한다. 또한, 크롬 브라우저 상에서만 사용할 수 있으며, 구글은 다른 브라우저에서도 지원하는 기능인지에 대해서는 구체적으로 밝힌 바가 없다. 존슨은 “신뢰도가 높을 경우, 타이핑 속도가 느린 수백만 명의 사용자에게 손가락 대신 말로 입력하는 것은 훌륭한 변화다. 구글의 음성 변환 엔진은 끊임없이 발전하고 있다. 문서 작업에 구글의 학습 기능을 적용한 것은 놀라운 혁신”이라고 분석했다. 단순해진 검색 및 조사 도구 구글 문서에 등장한 ‘조사’ 기능은 애널리스트가 두 번째로 중요하다고 꼽은 기능이다. 이제 구글 문서 앱을 사용하는 동시에 인용구, 사실, 사진 등을 구글에서 검색하고 문서에 포함하거나 인용할 수 있다. 현재로서는 안드로이드 모바일 기기와 데스크톱 사용자만 이용할 수 있다. IDC 기업 소셜 네트워크 및 협동 기술 연구 이사 바네사 톰슨은 “자동화 비서 등의 인식 능력과 전문적인 검색 기능을 통해 여분의 업무를 줄일 수 있고, 사용자 또한 의사 결정에 집중할 수 있다”고 설명했다. 또 하나의 ‘대화’ 역할을 할 ‘변경 사항 보기’ 기능 또 하나 추가된 기능은 ‘변경 사항 보기’인데, 여러 명이 공동으로 작성하는 ...

음성인식 구글문서 구글포워크 2015.09.04

회사명:한국IDG 제호: ITWorld 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 편집인 : 박재곤 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.