2010.09.08

HTML5, 듣고 말하는 웹 사이트 만든다

Joab Jackson | IDG News Service

최근 W3C(World Wide Web Consortium)에 새로 생긴 그룹의 활동이 결실을 맺는다면, 가까운 미래에 웹 페이지는 단지 읽기만 하는 것이 아니라 대화를 하는 대상이 될 수도 있을 것으로 보인다.

 

W3C는 음성 인식과 합성 인터페이스를 웹 페이지 내에 통합할 수 있는 가능성을 검토하고 있는데, 새로 결성된 인큐베이터 그룹이 1년 뒤에 HTML 내에 음성 및 발성 기능을 추가할 수 있는 가능성에 대한 보고서를 제출할 예정이다.

 

AT&T와 구글, 마이크로소프트, 모질라 재단 등이 이번 작업에 엔지니어를 참여시키고 있다.

 

실제로 음성과 웹은 그리 소원한 관계는 아니었다. 구글은 음성 기반의 웹 검색 앱을 자사의 안드로이드 운영체제에 포함시켰으며, 마이크로소프트 역시 자사의 윈도우 폰 7에 음성 중심 기능을 강화할 것이라고 밝혔다.

 

새로 결성된 HTML 스피치 인큐베이터 그룹(HTML Speech Incubator Group)의 의장인 댄 버넷은 음성 인식과 합성을 위한 표준 웹 인터페이스 개발의 실현 가능성을 연구하고 있다고 밝혔다. 버넷은 음성 응답 시스템 업체인 복세오(Voxeo)의 음성 기술 및 표준 책임자이다.

 

이렇게 개발되는 인터페이스는 여러 브라우저에 걸쳐 사용될 수 있다. 내장 도는 플러그인 음성 인식 및 합성 엔진을 사용하면 브라우저가 웹 페이지를 소리 내어 읽거나 사용자가 웹 양식을 음성으로 입력하도록 할 수 있다.

 

한편 이번 연구작업은 W3C의 또 다른 음성 기반 작업인 VoiceXML과 겹치는데, 버넷은 두 가지 표준이 다소 다른 점이 있다고 설명했다. VoiceXML은 처음부터 전화 기반의 음성 응답 시스템과 같은 음성 중심의 애플리케이션을 위해 개발된 것이기 때문에 웹 환경에서는 아주 잘 동작하지는 않는다는 것. 반면에 HTML과 마찬가지로 HTML의 새로운 음성 기능은 사용자의 전용 세션을 필요로 하지 않는다.

 

버넷은 또 현재 작업중인 보고서는 음성 인터페이스의 실현 가능성을 확인하는 것이지만, 인터페이스 자체를 개발하는 작업은 W3C의 다른 HTML 워킹그룹에서 진행될 수 있다고 전했다.

 

현재 W3C는 음성 기술로 매우 분주한 상태이다. 최근에 VoiceXML 3.0 버전이 발표됐는데, 이번 버전에서는 시맨택 디스크르비션 관련 기능이 추가됐고, 기능성도 모듈로 조직화됐다.

 

이와 함께 조만간 SSML(Speech Synthesis Markup Language) 1.1 버전도 발표할 계획이다. VoiceXML과 조합해 많이 사용되는 SSML 1.1 버전은 아시아 언어를 통합하고, 개발자들의 음성 선택에 유연성을 제공할 예정이다.  Joab_Jackson@idg.com



2010.09.08

HTML5, 듣고 말하는 웹 사이트 만든다

Joab Jackson | IDG News Service

최근 W3C(World Wide Web Consortium)에 새로 생긴 그룹의 활동이 결실을 맺는다면, 가까운 미래에 웹 페이지는 단지 읽기만 하는 것이 아니라 대화를 하는 대상이 될 수도 있을 것으로 보인다.

 

W3C는 음성 인식과 합성 인터페이스를 웹 페이지 내에 통합할 수 있는 가능성을 검토하고 있는데, 새로 결성된 인큐베이터 그룹이 1년 뒤에 HTML 내에 음성 및 발성 기능을 추가할 수 있는 가능성에 대한 보고서를 제출할 예정이다.

 

AT&T와 구글, 마이크로소프트, 모질라 재단 등이 이번 작업에 엔지니어를 참여시키고 있다.

 

실제로 음성과 웹은 그리 소원한 관계는 아니었다. 구글은 음성 기반의 웹 검색 앱을 자사의 안드로이드 운영체제에 포함시켰으며, 마이크로소프트 역시 자사의 윈도우 폰 7에 음성 중심 기능을 강화할 것이라고 밝혔다.

 

새로 결성된 HTML 스피치 인큐베이터 그룹(HTML Speech Incubator Group)의 의장인 댄 버넷은 음성 인식과 합성을 위한 표준 웹 인터페이스 개발의 실현 가능성을 연구하고 있다고 밝혔다. 버넷은 음성 응답 시스템 업체인 복세오(Voxeo)의 음성 기술 및 표준 책임자이다.

 

이렇게 개발되는 인터페이스는 여러 브라우저에 걸쳐 사용될 수 있다. 내장 도는 플러그인 음성 인식 및 합성 엔진을 사용하면 브라우저가 웹 페이지를 소리 내어 읽거나 사용자가 웹 양식을 음성으로 입력하도록 할 수 있다.

 

한편 이번 연구작업은 W3C의 또 다른 음성 기반 작업인 VoiceXML과 겹치는데, 버넷은 두 가지 표준이 다소 다른 점이 있다고 설명했다. VoiceXML은 처음부터 전화 기반의 음성 응답 시스템과 같은 음성 중심의 애플리케이션을 위해 개발된 것이기 때문에 웹 환경에서는 아주 잘 동작하지는 않는다는 것. 반면에 HTML과 마찬가지로 HTML의 새로운 음성 기능은 사용자의 전용 세션을 필요로 하지 않는다.

 

버넷은 또 현재 작업중인 보고서는 음성 인터페이스의 실현 가능성을 확인하는 것이지만, 인터페이스 자체를 개발하는 작업은 W3C의 다른 HTML 워킹그룹에서 진행될 수 있다고 전했다.

 

현재 W3C는 음성 기술로 매우 분주한 상태이다. 최근에 VoiceXML 3.0 버전이 발표됐는데, 이번 버전에서는 시맨택 디스크르비션 관련 기능이 추가됐고, 기능성도 모듈로 조직화됐다.

 

이와 함께 조만간 SSML(Speech Synthesis Markup Language) 1.1 버전도 발표할 계획이다. VoiceXML과 조합해 많이 사용되는 SSML 1.1 버전은 아시아 언어를 통합하고, 개발자들의 음성 선택에 유연성을 제공할 예정이다.  Joab_Jackson@idg.com



X