Offcanvas
Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.
Offcanvas
1111Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.

음성인식

글로벌 칼럼 | 구글 나우와 코타나를 밀어붙일 iOS 9의 시리

애플 iOS의 개인 비서인 시리(Siri)는 몇 년째 iOS 구석에서 조용히 사용자의 요청만 기다렸다. 그러나 올 가을 출시될 iOS 9에 탑재되는 새 시리는 더욱 외향적으로, 그리고 미리 알아서 도움을 주는 개인 비서가 될 전망이다. 최근 애플 WDC에서 공개된 새 시리는 선행성(Proactivity)에 초점이 맞춰져있으며, 구글 나우 및 마이크로소프트 코타나와 유사한 기능을 갖추고 있다. 시간과 위치를 반영한 미리알림, 앱 안에서 재생할 수 있는 비디오 검색, 전화 번호로 연락처 파악, 특정 곡 재생 등을 예로 들 수 있다. 그러나 경쟁자를 앞설 것으로 점쳐지는 기능들도 몇 개 있다. 앱에서 유용한 데이터를 추출하고, 스마트 홈을 제어하고, 사용자의 습관이나 현재의 필요사항을 반영한 작업 등이다. 디지털 개인 비서 사이의 힘의 균형이 바뀌고 있다. 다음은 시리가 경쟁력을 발휘할 부분들이다. 세심한 건강 상태 및 관리 추적 기능 대다수 건강 관리 앱은 수동적인 특성을 갖고 있다. 예를 들어, 마이크로소프트 윈도우 폰의 빙 헬스 및 피트니스 앱은 운동 상태를 추적한다. 얼마나 많은 거리를 뛰거나 걸었는지, 얼마나 많은 칼로리를 소모했는지 알려주는 것이다. 안드로이드의 건강 관리 전용 앱도 대동소이하다. 그러나 알려진 바로는 소모하고 싶은 칼로리를 기준으로 운동량을 알려주는 앱은 없다. 시리의 경우 "자전거 운동으로 300 칼로리 소모"라고 말할 수 있다. 운동을 좋아하는 사람들은 시리를 사랑하게 될 것이다. 더 정확한 제안을 위해 앱 데이터를 활용 iOS 스포트라이트 검색은 상황 인식을 새로운 수준으로 격상시킬 예정이다. iOS 홈 화면에서 왼쪽으로 스와이프 동작을 하면 관련 검색 정보를 불러올 수 있다. iOS 9에서 관련 검색 정보란 관련된 앱, 연락처, 위치(인근 사업장 주소) 등이다. 안드로이드 런처 앱인 애비에이트(Aviate)처럼 사용자의 상황에 따라 포스크웨어나 엘프 앱을 사용할 것을 제안한다. 시리의 새...

음성인식 개인비서 시리 2015.06.12

애플 시리, 프로액티브 비서로 더 유용한 서비스 제공

애플이 자사의 디지털 가상 비서인 시리(Siri)가 사용자가 행동하기도 전에 무엇을 원하는지 알아챌 수 있을 정도로 똑똑해지고 실제 생활에서 많은 도움을 주게될 것이라고 말했다. 지난 8일(현지 시각) 애플의 WWDC에서는 구글 나우(Google Now)와 마이크로소프트의 코타나(Cortana)와의 경쟁 관계에 놓여 있는 시리의 다양한 새로운 기능이 소개됐다. 약속 장소에 제시간에 도착하려면 몇 시에 출발해야 하는지, 운동할 때 좋아하는 음악을 자동으로 선곡하는 등의 기능이 있다. 애플 소프트웨어 엔지니어링 수석 부사장 크레이그 페더리기는 주당 10억 건의 요청이 애플 시리로 전송된다고 말했다. 또한, 시리가 95%의 정확도로 사용자의 요청을 수행한다고 덧붙였다. 그러나 지금까지 애플 시리의 성과는 부진했다. 미리알림을 설정하고 날씨를 말해주는 것은 잘 수행하지만 요청하지는 않았으나 필요할 것 같은 정보를 표시하는 기능은 미약했다. 예를 들면 비행기 체크인 시간이나 지금 위치에서 호텔까지 떨어진 거리와 같은 정보 말이다. 반면, 안드로이드의 구글 나우와 마이크로소프트의 코타나는 사용자의 질문에 답을 제공하고 필요한 시간에 이를 표시해주는 작업에 주력하고 있다. 단순히 사용자의 요청에 적절한 답을 표시하는 것을 넘어서 필요하다고 판단되는 정보까지 자동으로 표시하는 것으로 가상 디지털 비서의 시장의 흐름이 변화하고 있다. 시리는 다음과 같은 일들을 수행할 것으로 예상된다. 시리는 사용자가 헬스장에 있으면 그에 따라 필요한 것들을 준비해준다. 미리알림 : 시리는 어떤 장소에 도착하면 무엇을 해야 하는지 알림을 주며, 사용자가 무엇을 의도하는지도 이해한다. 예를 들어, 문자 메시지를 수신하면 시리에게 리마인드해달라고 명령한다. 시리는 해당 문자 메시지에 연결된 알림을 새로 생성한다. 또한, 시리는 교통 상황 및 거리를 기준으로 언제쯤 출발해야 정시에 도착할 수 있는지도 알려준다. 앱 : 헬스장에 도착해서 헤드폰 플러그인을 꽂기...

음성인식 시리 가상비서 2015.06.09

스카이프 실시간 번역 서비스, 데스크톱 앱으로 확장한다

프리뷰 버전의 스카이프의 실시간 언어 번역기인 스라이프 트랜스레이터(Skype Translator) 앱이 높은 품질의 번역 서비스를 제공하기 위해서는 많은 사용자가 참여해야 한다. 그래서 올해 여름, 스카이프 트랜스레이터 프리뷰는 윈도우 스토어에서 벗어나 스카이프의 주요 데스크톱 소프트웨어의 기능으로 부상할 전망이다. 스카이프 트랜스레이터는 화상 채팅에서 실시간 번역 서비스를 제공하며, 누군가가 특정 언어로 말한 내용을 컴퓨터 음성으로 번역해서 들려준다. 물론 채팅 화면에 번역된 텍스트도 동시에 표시된다. 아직은 4개의 언어(영어, 스페인어, 이탈리아어, 중국어)의 음성 대화에서만 번역 서비스가 지원되며, 텍스트 번역의 경우 50개의 언어로 지원된다. 현재는 최소한 한 명 이상이 윈도우 8.1 이상의 PC에서만 동작하는 윈도우 스토어 앱을 설치했을 경우에만 프리뷰 버전의 스카이프 트랜스레이터의 기능을 이용해볼 수 있다. 만일 스카이프의 주요 데스크톱 소프트웨어로 탑재할 경우 현재 가장 많이 사용되고 있는 윈도우 7의 사용자도 끌어들일 수 있을 것으로 보인다. 번역 품질을 높여주는 머신러닝을 사용하는 데 있어서 많은 사용자를 확보하는 것은 필수적이다. 마이크로소프트는 지난 10년간 음성틱(Vocal Tic)를 필터링하고 동음이의어를 구분하는 기술에 투자했다고 말했다. 마이크로소프트는 자사의 번역 품질을 개선하기 위해 사용자의 피드백을 수렴하고 사람이 직접 입력한 번역 결과를 활용하고 있다. 마이크로소프트는 자사 블로그를 통해 지난달 처음 프리뷰 버전의 베타 애플리케이션을 공개한 이후 스카이프 트랜스레이터의 성능이 약 300% 정도 향상됐다고 밝혔다. 트랜스레이터 기능을 데스크톱 버전으로 통합한다면 윈도우를 사용자 모두 영어 장벽을 깨부수는 데 일조할 것으로 보인다. editor@itworld.co.kr 

MS 스카이프 음성 2015.06.09

안드로이드의 미래 : 구글 나우 온 탭

안드로이드의 발전상을 살펴보면, 크게 3가지가 바뀌고 있다. 가장 먼저 주목하게 되는 부분은 대대적인 시각적 변화이다. 안드로이드 롤리팝 및 머터리얼 디자인을 예로 들 수 있다. 이보다 덜 가시적이지만 동등하게 중요한 변화는 기능 개선이다. 최근 안드로이드 버전에서 배터리 수명과 성능이 개선된 것이 여기에 해당한다. 세 번째는 뭘까? 처음 등장했을 때는 그 가치를 알아보기 힘든 변화다. 언뜻 보기에는 단순하지만, 운영 시스템의 특성과 이를 활용하는 방법에 큰 변화를 가져올 잠재력을 갖춘 서비스나 기능이다. 여기에 해당되는 사례는 거의 드물지만, 가장 큰 변화의 물결을 일으킬 수 있다. 구글 나우 온 탭(Google Now on Tap)이 바로 여기에 해당한다. 지난주 구글 I/O 개발자 컨퍼런스에서 다른 수많은 기술과 함께 공개된 구글 나우 온 탭은 2012년부터 안드로이드에 도입된 구글 나우 시스템의 확장판이라 할 수 있다. 필자는 안드로이드 4.1 젤리 빈에 나우가 처음 도입됐을 때, 이를 플랫폼의 “새로운 비밀 병기”라고 칭한 바 있다. 허언이 아니다. 나우 온 탭은 플랫폼의 중추다. 오리지널 나우는 우리가 이제 경험하게 될 나우 온 탭을 위한 초석이었던 것으로 판단된다. 다음은 나우 온 탭이라는 기능과 작동 방법, 안드로이드 기기에 가져올 변화, 기타 지금껏 들어보지 못했을 수도 있는 값진 정보에 대한 내용이다. 구글 나우 온 탭이란 뭘까? 간단히 정리하면, 구글 나우 온 탭은 구글 나우의 힘을 안드로이드 운영 시스템의 중심으로 옮긴 기능이다. 구글 나우를 간혹가다 한 번씩 실행하는 독립형 앱에서 탈피시켜(아마 간혹가다 알림 창에서 봤을), 장치의 모든 것을 구글의 지능과 연결하는 결합 조직 역할을 한다. 실행 및 작동 방법은 뭘까? 올가을 출시될 안드로이드 M에 도입될 나우 온 탭은 홈 버튼을 길게 누르면 실행되는 기능이다. 화면 전체를 차지하는 앱이 아니다. 사용하고 있는 다른 앱 ...

나우 음성인식 안드로이드 2015.06.08

한글과컴퓨터, 음성인식 사업 진출

한글과컴퓨터(www.hancom.com)는 미래성장을 견인할 전략적 신사업으로 추진 중인 ‘음성인식’ 사업의 본격적인 진출을 선언하고 구체적인 사업 계획을 공개했다. 먼저 한컴은 자동통번역 업체인 시스트란 인터내셔널(www.systrangoup.com)과 음성인식 기반 신사업 추진을 위한 합작투자기업 설립 협정식을 가졌다. 양사는 2분기 내 합작투자사를 설립, 한컴의 ‘브랜드 파워 및 오피스 기술력’과 시스트란의 ‘다국어 자동통역 및 문서번역 기술력’을 결합한 음성인식 기반의 자동통역, 다국어 문서번역, 외국어 교육 사업을 중점적으로 추진한다는 계획이다. 새로 설립되는 합작투자기업은 시스트란의 통번역 기술력과 수년간의 글로벌 상용화 경험을 기반으로 동시통역사를 대체할 수 있는 수준의 자동통역기를 연내 출시하고, 가상 및 증강현실에서 자동통역기를 활용해 흥미롭게 외국어를 학습할 수 있는 신개념 외국어 교육사업도 펼칠 계획이다. 한컴은 다국어 문서번역기를 한컴오피스에 새롭게 탑재, 영어권은 물론, 아랍권, 중남미 등 세계에서 가장 많은 130여 개 언어의 번역이 가능한 한컴오피스 다국어 버전도 올해 내 선보일 예정이다. 클릭 한번으로도 문서 포맷 그대로 전체 내용이 번역되는 한컴오피스 다국어 버전의 혁신적 번역서비스를 통해 국경없는 문서호환이 가능해질 것으로 기대하고 있다. 한컴은 이번 합작투자사를 통해 향후 사물인터넷까지 영역을 확대하겠다는 전략이다. 이를 위해, 한컴의 관계사이자 국내 임베디드 솔루션 기업인 MDS테크놀로지와 그룹 차원의 시너지를 창출, 사물인터넷, 웨어러블 형태의 다국어 음성인식 기반 자동통역기 제품을 공동 개발할 계획이다. 또한, 지속적인 기술력 향상을 위해 합작투자기업, 시스트란의 글로벌 연구소, 한국전자통신연구원(이하 ETRI)이 함께 음성인식, 자동통번역 기술 공동개발을 추진해 나갈 계획이며, 이와 관련해 한컴과 ETRI는 지난해 5월 기술 협력...

음성인식 한글과컴퓨터 2015.04.27

페이스북, 음성 인식 기술 스타트업 Wit.ai 인수

페이스북이 음성 인식 기술을 보유한 스타트업인 윗에이아이(Wit.ai)를 인수했다. 윗에이아이는 설립된 지 2년도 채 되지 않은 신생 기업으로, 외부 개발자들이 모바일 앱, 자동 온도 조절 장치와 같은 가정용 기기, 심이저 로봇에 음성 인식 기능을 통합할 수 있도록 하는 플랫폼을 보유하고 있다. 윗에이아이에 따르면 현재 6,000명 이상의 개발자들이 이 기술을 활용해서 앱과 기기를 개발하고 있는 것으로 알려졌다. 페이스북에 윗에이아이의 솔루션이 어떻게 어떻게 통합될지에 대해서는 알려진 바 없으나, 애플의 시리(Siri)와 구글의 음성 검색에 대항하는 데 도움이 될 것으로 보인다. 페이스북은 “윗에이아이는 놀라울 정도로 정말 간단한 자연어 프로세싱 API를 구축했는데, 이는 개발자가 음성과 텍스트를 실행 가능한 데이터로 전환하는 데 도움을 준다”며, “같은 배에 탑승하게 된 것을 진심으로 환영한다”고 전했다. 인수 금액은 공개되지 않았다. 윗에이아이의 핵심 기술팀은 미국 캘리포니아 멘로파크에 있는 본사로 합류할 예정이다. 그러나 페이스북이 해당 기술을 독점하지 않을 것으로 전해졌다. 윗에이아이는 블로그를 통해 자사가 보유한 기술은 대중에 공개되어 개발자용으로 무료 배포될 예정이라고 전했다. 한편, 윗에이아이의 기술을 활용하여 페이스북은 흥미로운 서비스와 기술을 선보일 것으로 예상된다. 예를 들면, 페이스북은 사용자가 지난 게시물을 검색할 수 있는 기능을 선보였는데, 음성 인식 기술이 여기에 도입될 수도 있는 가능성도 있다. 페이스북은 게시물 검색에 관한 다양한 기능을 선보이고 있다. 페이스북은 2년 전 그래프 서치(Graph Search)를 발표했는데, 이는 “내 친구가 좋아하는 뉴욕 초밥 음식점”과 같은 자연어 쿼리로 검색할 수 있게 한다. 윗에이아이는 페이스북의 그래프 서치 개발에 속력을 가속화하고, 사용자가 좀 더 자연스러운 방식으로 검색어를 입력하는 데 도...

페이스북 음성인식 2015.01.06

IDG 블로그 | MS ‘코타나’ vs 애플 ‘시리’ 성능 테스트 결과는?

마이크로소프트는 윈도우 폰의 음성인식 서비스 ‘코타나(Cortana)’가 아이폰의 시리(Siri)보다 얼마나 우수한지를 보여주는 광고를 선보이고 있다. 광고의 주장이 사실일까? 마이크로소프트가 새로 선보인 광고는 캘린더 앱이나 실시간 교통 정보를 제공하는 지도 앱과 연동되는 코타나의 기능을 앞세운다. 또한 HTC 원(M8) 윈도우폰에 전면부에 배치된 2개의 스피커도 강조한다. 이는 아이폰 하단부에 위치한 1개의 스피커와 대조되는 장면이다. 이 광고는 지난 7월 HTC 원(M8) 출시 직후에 공개됐으며, 코타나가 다양한 작업을 수행한다는 관점에서 시리를 능가한다는 것을 보여준다. 마이크로소프트의 주장대로, 코타나는 실제로 시리보다 훨씬 더 나은 성능을 제공할까? 필자는 이를 확인해보기 위해 HTC 원(M8) 윈도우폰과 아이폰으로 각각의 음성 인식 서비스를 테스트해봤다. 결론적으로는 마이크로소프트가 주장한 바대로 코타나의 성능이 더 우수하다. 코타나는 그 어떤 질문에 대해서도 구체적이고 유용한 답변을 제공한다. “올해 레드삭스에는 어떤 문제가 있는가?”라고 질문하면, 코타나는 “2014년 보스턴 레드 삭스에는 5가지 문제가 있습니다”라는 제목과 함께 관련 기사 링크를 제공한다. 똑같은 질문에 대해 시리는 레드삭스의 당일 경기 시간 정보를 알려준다. “윌리엄 터너의 작품을 보여줘”라고 말했을 때, 시리는 “윌리엄 터너의 작품에 대해 아무 것도 찾을 수 없습니다”라고 답변한다. 반면, 코타나는 관련 링크를 몇 가지 보여주는데, 위키피디아 페이지를 연결해주는 것만으로도 충분히 ‘똑똑’했다. 또한 코타나는 시리가 제공하지 못하는 기능 인 위치와 수신인, 시간에 기반한 팝업 알림을 제공한다. 이 간단한 테스트를 통해 사용자들이 일상 속에서 질문할 수 있는 것들에 대한 양사 서비스의 반응을 볼 수 있었다. 향후 구...

MS 음성인식 개인비서 2014.09.03

“디지털 혁명이 사회 동요 유발” : 가트너 향후 10년 10대 전망 제시

가트너가 자사의 대규모의 IT 컨퍼런스인 심포지엄 ITxpo에서 향후 10년 간 일어날 10가지 트렌드에 대한 전망을 제시했다. 가트너는 3D 프린팅과 기계 학습, 그리고 음성 인식 분야에서 커다란 변화가 일어날 것으로 보고 있는데, 이들 기술은 모두 강력할 뿐 아니라 인력의 필요성을 줄여주기 때문에 일자리가 줄어들어 사회적인 동요를 불러올 수 있다고 지적했다. 산업 혁명을 포함해 지금까지의 혁신은 일자리를 창출해 왔다. 예를 들어 자동차 조립 라인은 광범위한 인프라 투자로 이어졌는데, 자동차의 대량 생산이 자동차 중개상부터 도로 건설, 그리고 새로운 교외 거주지역으로의 사회 편의 시설 확대로 이어졌다. 하지만 가트너의 애널리스트 대릴 플러머는 디지털 혁명은 동일한 전철을 따르지 않을 것이라며, “우리가 예상하는 것은 일을 하는 데 필요한 사람의 전반적인 숫자가 줄어드는 것”이라고 지적했다. 플러머는 코닥과 같은 기업을 예로 들었는데, 코닥의 직원은 한 때 1만 3000명이었던데 반해 인스타그램은 13명에 불과하다. 이 때문에 가트너는 ‘월스트리트를 점령하라(Occupy Wall Street)와 유사한 사회적 운동이 2014년에 다시 일어날 것으로 전망했다. 가트너가 제시한 향후 10년 간의 10대 전망은 다음과 같다. 1. 2016년이면 ‘바이오프린팅’이라고 불리는 근육과 장기의 3D 프린팅이 전세계적인 논쟁을 불러 일으킬 것이다. 바이오프린팅은 3D 프린팅의 한 부분일 뿐이지만, 이 기술의 잠재력을 가장 잘 보여주는 것이기도 하다. 플러머는 “기업이라면 직원들에게 3D 프린팅이 커다란 영향을 미칠 수 있다는 것은 인식할 수 있도록 준비해야 할 것”이라며, “제품을 출력하기 시작하면, 배포 시스템이 바뀌고 이를 위한 소프트웨어가 바뀌고 일이 처리되는 장소도 바뀐다”라고 강조했다. 2. 2018년 경이면 3D 프린팅으로 인해 전세계 ...

전망 가트너 음성인식 2013.10.08

아이폰의 가상 비서 시리 원리 완전 분석... 과제는?

현재까지 iOS에 추가된 것들 중에 필자는 시리(Siri)가 가장 마음에 든다. 전자 장치들이 더 똑똑해지고 빨리고 얇아지는 시대에 수수한 키보드는 컴퓨터가 손바닥이 아니라 방 한 칸을 차지하던 구시대의 유물처럼 느껴진다. 애플의 가상 비서는 필자가 모바일 장치와 상호 작용하는 방식을 크게 바꾸어 놓았다.   하지만 시리는 매우 제한되어 있다. 애플의 자체 앱뿐만이 아니라 애플이 지원을 결정한 서비스와는 잘 통합되어 있지만 그 외의 써드파티 소프트웨어에서는 무용지물에 가깝다. 장애 때문에 일반적인 키보드를 사용하기 어려운 사람들에게는 큰 도움이 될 수 있음에도 이런 제한적인 현실이 안타까울 뿐이다.   아이폰과 아이패드에서 시리를 적극적으로 활용하고 키보드는 필요에 따라 보조 수단으로 사용하는 것이 가장 이상적이라 생각한다. 애플이 허용하기만 한다면 많은 개발자들이 시리를 적극적으로 활용하려 할 것이라 생각한다. 안타깝게도 시리의 기반 기술 때문에 이것이 쉽지 않다.   주고받는 과정 우리는 "시리"가 단순히 휴대폰과 태블릿에 내장된 앱이 아니라 애플이 다수의 파트너들과 함께 협력하여 운영하여 소프트웨어와 인터넷 기반 서비스의 집합체라는 것을 알고 있다. 대부분의 기능을 서버 쪽에 유지하면서 해당 기업은 모바일 기기라는 한정된 자원 보다는 강력한 컴퓨터에 대부분의 작업을 할당하며, 애플은 수집하는 데이터를 사용해 서비스를 지속적으로 개선하면서 새로운 버전의 iOS 버전을 공개하지 않고도 새로운 기능을 제공할 수 있다.   시리에 명령을 내리면 장치가 사용자의 음성을 수집하고 이것을 오디로 파일로 변환한 후, 애플의 데이터 센터로 전송하여 처리한다. 이것은 생각보다 복잡한 과정이며, 조용한 환경이라고 생각되는 곳에서조차도 마이크를 통해 흘러 들어오는 잡음의 수준을 안다면 매우 놀랄 것이다. 이 때문에 애플은 소리를 최대한 깔끔하게 만드는 기술에 ...

음성인식 시리 아이패드 2013.04.10

음성 인식이 언젠가는 사무실을 점령하게 될 이유

당신은 아침에 출근해서 책상 앞에 앉았다. PC에 음성 명령을 내리고, 이메일을 읽어달라고 하고, 상사에게 보낼 메모를 적으라고 하는 대신, 손으로 직접 타자를 치고 클릭한다. 음성 기술이 우리의 시간을 절약하고 생산성을 증대시켜줄 수 있는 충분한 사무실 환경에서도 우리 대부분은 여전히 키보드와 마우스안에 갇혀있다.   하지만 우리가 사무실 밖에 나오게 되면, 스마트폰에 우리가 음성 전화걸기 명령, 음성 구글 검색 명령, 시리(Siri)에게 오늘 날씨를 묻는 것 등의 음성명령을 내리는 것에 대해 별달리 이상하게 생각하지 않는다.    오푸스 리서치(Opus Research)의 창업자이자 수석 애널리스트인 댄 밀러는 음성 인식 기술을 제공하는 회사들은 자연어 명령어를 이해할 수 있는 애플의 시리나 구글의 안드로이드에서 사용 가능한 보이스 액션(Google Voice Actions)같은 “개인 디지털 비서”의 개념에 많은 자금을 투자하고 있다고 이야기한다. 사실, 최근 클라우드 기반 자연어 검색이 모바일 기기상에서 가능해짐으로써 음성 인식 기술이 돌파구를 찾게 되었다고 그는 말한다.   음성 툴이 이제 이용자들에게 우리의 삶에 있어서 전화기와 태블릿만큼이나 더 가까이 다가왔고, 대부분이 즉각적인 프로세싱과 지속적인 언어 데이터베이스 확장을 계속하는 클라우드상에서 구현된다는 부분이 바로 주요 발전부분이다. 이전의 데스크톱 기반 소프트웨어와 달리, 이런 새로운 툴은 알고리즘상 음성 인식률을 높이기 위한 특별한 말하기 훈련이 필요없다. 우리가 말할 때 그다지 엄밀하게 규칙에 따라야 할 필요가 없는 것이다.    물론, 오늘날의 음성 인식 기술은 완벽과는 거리가 멀다. 모바일 기기상이라 할지라도, 모든이들이 음성 인식 소프트웨어를 문제없이 이용할 수 있는 건 아니다. 그리고 “미팅에 늦을 것 같다고 상사에게 알려줘”같은...

워크스테이션 사무실 업무 2012.12.12

아이폰, 시리, 마인드 콘트롤로 바라본 스마트폰 진화의 미래

애플의 시리(Siri)나 기타 음성인식 지능보조 기능의 중요성을 간과하는 것은 어리석은 일이다. 이런 솔루션은 새로운 유저 인터페이스로의 거대한 움직임이다. 언젠가는 자신이 보내는 염력만으로 아이폰을 조작할 수 있게 될지도 모른다.   마인드 콘트롤만으로 기기 작동 연구 너무 억지스러운가? 그럴지도 모른다, 하지만 마인드 콘트롤로 작동하는 컴퓨터를 완성하기 위한 작업이 진행됐고, 매킨토시 유저 인터페이스 전문가인 고 제프 래스킨 역시 이 주제를 연구했다.   IBM은 "생각을 읽는 것은 공상과학소설 팬들의 수십년간에 걸친 헛된 염원이었지만, 어쩌면 이제 곧 현실화될 지 모른다"고 전했다. 그저 누군가에게 전화를 걸 생각만 하면, 전화가 걸릴 것이라고. IBM은 마인드 콘트롤로 작동하는 PC와 전화기를 2016년까지 만들어낼 수 있으리라 예상했다. IBM은 지난 12월 보도자료에서 "생물정보학 분야의 과학자들은 고급 센서를 장착한 헤드셋으로 뇌파의 활동을 감지해 얼굴 표정, 즐거움, 집중정도, 그리고 사람의 생각을 어떤 물리적 행동 없이도 읽어낼 수 있게 됐다"고 설명한 바 있다.    수십년동안 대량 생산기기는 표준 GUI 인터페이스만으로 작동했다. 이 흐름은 아이폰의 터치 기반 인터페이스를 통해 물꼬를 열자 비로소 바뀌었다(다른 업체들도 그 당시 개발중이었다고 주장한다). 마이크로소프트는 몇년간 이런 시스템을 완성하기 위해 작업해왔지만, 이들이 개발한 솔루션은 힘이 실리지 못했다.   래스킨은 그의 보고서 'GUI를 타도하라!'에서 제기된 비판에 대해 인터페이스의 진화는 피할수 없었다고 주장하며, "그래픽 유저 인터페이스(GUI)는 사람과 호환성이 좋지 않다. 이런 잘 알지 못하는 인터페이스를 고수하는 한, 컴퓨터는 본질적으로 답답하고, 좌절스러우며, 스트레스 덩어리로 남아있을...

인터페이스 음성인식 시리 2012.10.02

시리, 니나를 만나다···뉘앙스, 새로운 솔루션 발표

뉘앙스 커뮤니케이션즈가 iOS와 안드로이드용 앱에 추가할 수 있는 가상 음성 비서인 니나(Nina)를 발표했다.   니나는 뉘앙스의 음성 인식 기술과 텍스트 투 스피치 소프트웨어, 음성 생체 인식 및 기타 소프트웨어를 하나로 통합한 것으로, 클라우드 상의 서버에서 호스팅된다.   미국 군인들을 위한 재무 서비스 제공업체인 USAA는 니나를 USAA 모바일 앱에 사용할 계획이라고 밝혔다. 이달부터 새로운 통합 앱의 파일럿 프로젝트에 착수해 2013년 초에 정식 출시하는 것이 USAA의 계획이다.   뉘앙스는 발표문을 통해 니나를 이용하면 기업이나 단체들이 맞춤형 텍스트 투 스피치 음성으로 자체적인 가상 비서 기능을 구현할 수 있다고 설명했다.   USAA의 이머징 채널 담당 부사장 네프 허드슨은 니나 소프트웨어가 자사 회원들이 USAA의 셀프서비스 앱 상에서 좀 더 신속하게 작업을 마칠 수 있도록 해 줄 것이라고 강조했다.   니나 소프트웨어는 개발자들이 가상 비서 기능을 기존의 모바일 앱에 통합하는 것을 지원하는 SDK가 포함되어 있다. 현재 SDK와 뉘앙스의 클라우드 서비스는 영어만 지원하는 상태이지만, 올해 말부터 다른 언어도 지원할 예정이다.   뉘앙스는 니나에 관한 유튜브 비디오를 공개했지만, SDK나 클라우드 서비스의 가격은 공개하지 않았다. 뉘앙스가 공개한 비디오에서는 사용자가 음성으로 수표책 잔고를 요청하고는, 지불을 승인하는 과정을 보여준다. 기계 음성 응답은 지불 요청이 이행되었다고 응답했다.      이 기술은 애플의 인기 가상 비서 시스템인 시리와 경쟁하게 될 것으로 보인다.  editor@itworld.co.kr

음성인식 시리 뉘앙스 2012.08.07

애플 음성 비서 시리, "일본어도 한다"

일본어를 할 줄 아는 아이폰 4S 사용자라면, 시리와 일본어로 대화를 할 수 있게 됐다. 애플은 수요일 iOS 5.1을 공개하면서, 시리가 일본어를 지원한다고 밝혔다.   iOS 5.1은 수요일(현지시간)부터 업데이트가 가능한 반면, 시리의 일본어는 몇 주 후에 적용될 예정이다.     일본어가 추가되면서, 이제 시리는 영어(미국, 영국, 호주)와 불어, 독어를 포함해 총 4개 언어를 지원한다.    지난 달에 시리가 일본어를 할 수 있다고 답했다는 제보가 있어, 일본어 지원은 예상되어 왔다.    한편, 이날 행사에서는 이 밖에 iOS 5.1에 업데이트 되는 내용은 발표되지 않았다. editor@itworld.co.kr

음성인식 시리 Siri 2012.03.08

흥미를 더해가는 2012년 HDTV

2011년 CES 전시회에서 가장 큰 관심을 끈 HDTV 기술은 3D였다. 그러나 올해 전시회에서 3D는 뒤로 물러섰다. 하지만 앞으로 적용될 HDTV 기술은 더 다양하고 흥미로우며, 훨씬 더 대중적인 매력을 제시한다.   올해 CES에서는 크고 아름다운 HDTV가 가장 큰 관심을 끌었다. 특히 슈퍼슬림 OLED 디스플레이, 음성 및 동작 제어 인터페이스, 초고해상도 제품이 눈길을 모았다.   물론 3D도 아직 건재하다. 올해 전시회에서 공개된 많은 제품들이 패시브, 액티브 및 안경이 필요 없는 3D 시청 환경을 탑재하고 출시된다. 2012년에는 예전보다 더 많은 3DTV가 나오겠지만, 업체들이 대표적으로 홍보하는 기능 목록에서 3D의 위상은 확실히 낮아졌다.   CES에 등장한 가장 흥미로운 TV 기술들 중 일부는 2012년에 본격화되기에는 콘츠나 가격 측면에서 제약이 크다. 그러나 이러한 기능을 통해 가까운 미래의 HDTV의 모습을 그려볼 수 있다. 올해 전시회에서 가장 흥미로왔던 기술들을 모아봤다.   놀라운 OLED 약어만으로 보면 LED와 OLED는 비슷하다. 그러나 TV 기술로 보면 서로 완전히 다른 세계에 속한다.   전통적인 LED(발광 다이오드) TV는 엄밀히 말해 LED 백라이트를 탑재한 액정 디스플레이 텔레비전이다. 스크린 뒤, 또는 가장자리에 위치한 LED가 LCD 스크린을 밝힌다. 그러나 OLED(유기 발광 다이오드) TV는 광원과 그 광원이 만들어내는 이미지가 하나다. 즉, 백라이트가 필요 없다. OLED는 엄청나게 얇고 에너지 효율적인 제품을 만들 수 있게 해주며, 깊이있는 검은색, 픽셀 하나하나 선명한 대비와 생생한 색감, 그리고 전체적으로 훌륭한 화질을 제공한다.   올해 CES에 참여한 기업들은 OLED의 우수성을 확실히 알리는 제품들을 선보였다. LG와 삼성의 화려한 55인치 ...

HDTV 음성인식 3DTV 2012.02.15

“음성과 동작 인식이 지배” CES 2012 총결산

CES에 관한 새로운 뉴스 속보들을 끊임없이 따라잡고 있자면, 마치 왈가닥 루시(I love Lucy)라는 시트콤의 에피소드 한 편을 보는 듯 하다. 그 속에서 루시는 초콜릿 공장에서 일하고 있고 사탕들을 나르는 컨베이어 벨트는 계속해서 점점 더 빠르게 움직인다. 이는 엄청난 스트레스를 주고, 매우 혼란스러우며, 결국에는 아무 것도 되지 않는다.    우후죽순 CES에서 소개된 제품의 양은 줄지어 놓으면 축구장 몇 개와도 맞먹을 정도다.   얇은 TV와 얇은 노트북에 대한 글들을 읽어보았는가? 집에 있는 전등과 에어컨을 조절하는 폰, 안드로이드 기기들과 아이폰 액세서리들, 그리고 수많은 카메라들에 대한 글들은? 대부분의 기사들은 우리가 기기들과 어떻게 상호작용하는가 보다는 기기들이 무엇을 할 수 있는가에 초점을 맞추고 있다.    이에 따라 금년 CES의 커다란 화두이자 관심사인 ‘인간 기계 인터페이스의 미래가 드디어 도래했다’ 라는 주제는 어느 기사에서도 찾아 볼 수 없었다.    지난 수 년간 미래학자들은 미래의 온갖 컴퓨팅 장치는 데스크톱, 노트북, 태블릿, 모바일 폰 기기에 다음의 세 사용자 인터페이스(user interface, UI)가 추가될 것이라고 예측해왔다.  1. 멀티터치 2. 음성 3. 공중 동작(In-the-air gestures)   혹자는 위의 인터페이스들이 이미 몇 년부터 나와 있었다고 말할 수도 있다. 게다가 이 말이 사실이기도 하다. 그러나 수동적으로 이용 가능하며 소수의 파워 유저들만 누려왔던 기술과, 문화 자체를 바꿔놓을 만큼 널리 퍼져있는 기술은 아주 크게 다르다.    물론 애플은 1997년 아이폰을 통해 멀티터치 인터페이스를 주류로 끌어올렸다. 그리고 이번에는 아이폰 4S에 탑재된 시리(Siri) ...

인터페이스 음성인식 동작인식 2012.01.17

레노버, 스마트 TV 시장에 도전장...ICS 기반 프리미엄 제품 발표

레노버는 지난 일요일 자사의 첫번째 스마트TV를 발표했다. 음성 명령을 인식하고 안드로이드 4.0 애플리케이션을 구동할 수 있는 이 제품은 첨단 기능으로 한창 소문이 무성한 애플 TV에 도전장을 던지고 있다.   레노버의 K91 스마트 TV는 전통적인 TV의 기능을 제공할뿐 아니라 음성 인식과 비디오 게임기 수준의 게임 기능을 제공한다. 사용자들이 리모컨을 사용하지 않고도 TV를 조작할 수 있다는 것.    레노버의 이사 닉 레이놀즈는 “이를 통해 사용자는 원하는 조작을 할 수 있는데, 안드로이드 4.0 기반의 수많은 TV 앱에 액세스할 수 있고, 레노버 클라우드 서비스에서 새로운 업데이트를 다운로드하거나 개인 멀티미디어 콘텐츠에 액세스하고 소셜 네트워크 상에서 인터랙션을 하는 등이 가능하다”고 설명했다.   이는 최근 TV 시장을 노리고 있는 것으로 알려진 애플에 대해 레노버가 갖는 장점이 될 수 있다. 전임 CEO 스티브 잡스의 전기를 통해 애플이 새로운 TV 제품을 출시할 것이란 소문이 널리 퍼져있으며, 특히 애플의 TV 제품은 사용하기 쉽고 애플의 아이클라우드 서비스와 쉽게 동기화할 수 있을 것으로 추정되고 있다. 애널리스트들도 대부분 애플의 TV 출시가 임박했다는 데 동의하는 입장.    레노버의 신형 TV는 이번 CES에서 일반에 선 보일 예정이다.   삼성이나 LG 등 기존 TV 시장의 강자들도 게임 등의 애플리케이션을 구동할 수 있고, 넷플릭스같은 영화 스트리밍 서비스에 연결할 수 있는 스마트 TV에 적지 않은 시간을 투여해 왔다. 하지만 레노버는 자사 제품을 기존의 강자들과 차별화하고자 노력했다. 단순히 안드로이드 4.0 앱과 자연어 처리, 음성 인식 기술만으로는 차별화가 어렵다는 것.   레이놀즈는 “경쟁이 치열한 TV 시장에 새로 진입하는 업체...

레노버 음성인식 애플TV 2012.01.09

IDG 블로그 | 탈옥한 구형 아이폰에서 시리 받아쓰기 사용하기

아이폰 4S가 출시된 이후, 해커 커뮤니티는 시리를 다른 디바이스에서도 사용하기 위해 분주한 시간을 보냈다. 하지만 이제 탈옥 친화적인 프로그램인 시리우스(Siri0ous)가 시리의 받아쓰기 기능을 아이폰 4뿐만 아니라 4세대 아이팟 터치와 출시된지 2년이나 된 아이폰 3GS에서도 구현해 준다.   지난 10월 아이폰 4S 출시에 앞서, 시리는 앱스토어에서 개별 애플리케션으로 공급됐다. 당연히 이 구 버전 시리 소프트웨어는 3Gs와 같은 다른 디바이스에서도 동작했다. 그래서 애플이 이 앱을 앱스토어에서 끌어내려 아이폰 4S 하드웨어에서만 이용할 수 있도록 통합해 버렸을 때, 많은 사용자들이 혼란스러워했다.   왜 이 멋진 기능을 제한하는 것인가? 일각에서는 순전히 애플의 마케팅 전략이라고 평가하기도 했다. 물론 진실은 알 수 없지만, 최근의 해킹 노력은 구형 하드웨어에서도 시리를 잘 이용할 수 있다는 것을 보여준다. 더구나 시리우스는 아이폰 4S UDID나 파일, 전용 키 등을 필요로 하지 않는다는 점에서 이전 해킹 프로그램과 차별화된다. 만약 탈옥폰을 가지고 있다면, 사이디아(Cydia)를 통해 이 소프트웨어를 다운로드해 설치하면, 다음 동영상과 같이 이용할 수 있다.     참고로 무료 광고 지원 해킹 프로그램을 이용하기 위해서는 ‘http://apt.if0rce.com’을 소스로 추가한 다음, 시리우스를 검색해야 한다. 하지만 일부 블로거들이 밝힌 것처럼 버그도 있기 때문에 제대로 동작시키려면 몇 번 시도를 해야 할 수도 있다.  editor@itworld.co.kr

해킹 음성인식 아이폰3gs 2011.11.29

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.