2019.10.16

'녹음 연계 구술' 기능 빛나는 픽셀 4의 레코더 앱이 개선한 점

Mark Hachman | PCWorld
출시를 앞둔 구글 픽셀 4의 레코더 앱은 녹음뿐 아니라 음성을 텍스트로 받아 적는 구술 기능까지 갖췄다. 그러나 픽셀 4가 출시될 때까지 기다리지 않고, 구글의 음성-텍스트 변환 기능을 라이브 트랜스크라이브(Live Transcribe) 앱으로 바로 확인할 수 있다. 라이브 트랜스크라이브 기능은 구글 픽셀 3에서 네이티브 기능에 포함되었고, 동시에 안드로이드 5.0에서 별도의 앱으로도 존재한다. 다음에 소개할 캡처 이미지에서 알 수 있듯, 라이브 트랜스크라이브 앱은 구글 레코더 앱의 간소화된 기본 버전이기도 한데, 한 가지 단점은 존재한다. 두 앱의 차이는 클라우드를 통한 인터넷 연결 필요 여부다. 레코더 녹음은 인터넷에 연결되지 않아도 작동한다는 점이 다르다.

라이브 트랜스크라이브 앱은 생산성을 위해 개발된 보조 기술이고, 레코더 앱은 시작부터 음성을 녹음하는 유틸리티를 목적으로 설계되었다. 본래 목적은 녹음이다. 물론 텍스트 받아쓰기 기능도 중요하지만 어디까지나 보조 기능이다.
 

라이브 트랜스크라이브가 개선해 구글 레코더로

두 앱을 비교하기 위해 구글 행사의 시연 내용을 녹음해보았다. 이 내용은 구글이 레코더 앱으로 녹음하고 받아쓰기한 발표다. 구글 행사 영상을 다시 확인하면 연사의 발언 속도가 좀 느리고 발음이 정확하다는 점을 확인할 수 있다. 속도와 발음은 구술 받아쓰기에는 아주 중요한 요소다. 결과적으로 레코더 앱은 아주 훌륭하게, 라이브 트랜스크라이브 앱도 어느 정도 뛰어난 수준으로 내용을 받아적었다.



라이브 트랜스크라이브는 말을 잠깐 멈추거나 더듬거리는 습관이 있고 대부분의 문장을 완벽하게 받아적지만, 가끔 어구 한 두 개를 빠뜨린다. 자주 일어나는 일은 아니지만, 받아쓴 텍스트의 결과에서는 차이가 명확하다. 캡처 이미지를 보면 PCWorld가 녹음한 1, 2분간의 음성에서도 레코더 앱과의 녹음 받아쓰기 결과가 다른 것을(“We’ve had a Pixel 4 recording the show…”) 확인할 수 있다. 아마도 버그이거나 와이파이 설정 때문에 정확한 구술 인식에 오류가 생겼을 가능성이 있다. 어느 경우든, 레코더 앱에서는 이런 오류가 수정되었다.

문장이 끊어지고 새로운 문장이 다시 시작하는지를 파악하는 단계는 어떤 구술 앱이든 난항을 겪는다. 라이브 트랜스크라이브도 고전하고 있다. 잘못된 단어를 수정할 수 있는 키보드 입력 옵션도 제공한다.

그러나 라이브 트랜스크립션 앱의 UI는 암호에 가까운 수준으로 복잡하다. 한 문장이나 전체 대화를 선택하고 복사하는 것은 가능하지만, 직관적이지 않은 과정을 거쳐야 한다. 대화가 저장된다고는 하는데, 정확히 어디에 저장되는지도 불분명하다. 



레코더 앱에서는 라이브 트랜스크라이브의 단점을 수정했다. 우선, 라이브 트랜스크라이브에서는 대화 내용을 녹음한 후 받아적은 내용을 녹음과 동기화할 수 없었는데, 구글은 이 점을 개선한 것이 가장 큰 발전으로 강조했다. 그러나 이 기능은 이미 모든 윈도우 PC에서 이용할 수 있는 원노트 앱에 포함된 기능이다. 말 그대로 수 년째 제공되고 있다.

필자가 선호하는 Otter.ai 같은 클라우드 기반 텍스트 구술 앱처럼, 레코더 앱도 특정한 단어를 검색해서 음성 파일의 진행을 단어 위치로 건너뛸 수 있다. 원노트에서도 이 기능이 가능하지만 사용자가 직접 입력한 단어 위치만 파악하고, 구술 파일에서 단어를 선택할 수는 없다. 또, 자동으로 텍스트 파일 제목도 붙인다. 녹음 파일을 대량으로 생성하고 관리하는 사람에게는 무척 편리한 기능이다. 레코드 앱은 오터(Otter)와 달리 서드파티 음성 녹음과 텍스트 구술을 지원하지는 않는다.



레코더 앱은 라이브 트랜스크라이브의 버그를 수정하고 조금 더 발전시켜 내놓은 앱이다. 마이크로소프트 워드, 레코더, 다른 서드파티 서비스까지 녹음과 구술 앱도 하나의 치열한 시장으로 성장할 것으로 보인다. editor@itworld.co.kr 


2019.10.16

'녹음 연계 구술' 기능 빛나는 픽셀 4의 레코더 앱이 개선한 점

Mark Hachman | PCWorld
출시를 앞둔 구글 픽셀 4의 레코더 앱은 녹음뿐 아니라 음성을 텍스트로 받아 적는 구술 기능까지 갖췄다. 그러나 픽셀 4가 출시될 때까지 기다리지 않고, 구글의 음성-텍스트 변환 기능을 라이브 트랜스크라이브(Live Transcribe) 앱으로 바로 확인할 수 있다. 라이브 트랜스크라이브 기능은 구글 픽셀 3에서 네이티브 기능에 포함되었고, 동시에 안드로이드 5.0에서 별도의 앱으로도 존재한다. 다음에 소개할 캡처 이미지에서 알 수 있듯, 라이브 트랜스크라이브 앱은 구글 레코더 앱의 간소화된 기본 버전이기도 한데, 한 가지 단점은 존재한다. 두 앱의 차이는 클라우드를 통한 인터넷 연결 필요 여부다. 레코더 녹음은 인터넷에 연결되지 않아도 작동한다는 점이 다르다.

라이브 트랜스크라이브 앱은 생산성을 위해 개발된 보조 기술이고, 레코더 앱은 시작부터 음성을 녹음하는 유틸리티를 목적으로 설계되었다. 본래 목적은 녹음이다. 물론 텍스트 받아쓰기 기능도 중요하지만 어디까지나 보조 기능이다.
 

라이브 트랜스크라이브가 개선해 구글 레코더로

두 앱을 비교하기 위해 구글 행사의 시연 내용을 녹음해보았다. 이 내용은 구글이 레코더 앱으로 녹음하고 받아쓰기한 발표다. 구글 행사 영상을 다시 확인하면 연사의 발언 속도가 좀 느리고 발음이 정확하다는 점을 확인할 수 있다. 속도와 발음은 구술 받아쓰기에는 아주 중요한 요소다. 결과적으로 레코더 앱은 아주 훌륭하게, 라이브 트랜스크라이브 앱도 어느 정도 뛰어난 수준으로 내용을 받아적었다.



라이브 트랜스크라이브는 말을 잠깐 멈추거나 더듬거리는 습관이 있고 대부분의 문장을 완벽하게 받아적지만, 가끔 어구 한 두 개를 빠뜨린다. 자주 일어나는 일은 아니지만, 받아쓴 텍스트의 결과에서는 차이가 명확하다. 캡처 이미지를 보면 PCWorld가 녹음한 1, 2분간의 음성에서도 레코더 앱과의 녹음 받아쓰기 결과가 다른 것을(“We’ve had a Pixel 4 recording the show…”) 확인할 수 있다. 아마도 버그이거나 와이파이 설정 때문에 정확한 구술 인식에 오류가 생겼을 가능성이 있다. 어느 경우든, 레코더 앱에서는 이런 오류가 수정되었다.

문장이 끊어지고 새로운 문장이 다시 시작하는지를 파악하는 단계는 어떤 구술 앱이든 난항을 겪는다. 라이브 트랜스크라이브도 고전하고 있다. 잘못된 단어를 수정할 수 있는 키보드 입력 옵션도 제공한다.

그러나 라이브 트랜스크립션 앱의 UI는 암호에 가까운 수준으로 복잡하다. 한 문장이나 전체 대화를 선택하고 복사하는 것은 가능하지만, 직관적이지 않은 과정을 거쳐야 한다. 대화가 저장된다고는 하는데, 정확히 어디에 저장되는지도 불분명하다. 



레코더 앱에서는 라이브 트랜스크라이브의 단점을 수정했다. 우선, 라이브 트랜스크라이브에서는 대화 내용을 녹음한 후 받아적은 내용을 녹음과 동기화할 수 없었는데, 구글은 이 점을 개선한 것이 가장 큰 발전으로 강조했다. 그러나 이 기능은 이미 모든 윈도우 PC에서 이용할 수 있는 원노트 앱에 포함된 기능이다. 말 그대로 수 년째 제공되고 있다.

필자가 선호하는 Otter.ai 같은 클라우드 기반 텍스트 구술 앱처럼, 레코더 앱도 특정한 단어를 검색해서 음성 파일의 진행을 단어 위치로 건너뛸 수 있다. 원노트에서도 이 기능이 가능하지만 사용자가 직접 입력한 단어 위치만 파악하고, 구술 파일에서 단어를 선택할 수는 없다. 또, 자동으로 텍스트 파일 제목도 붙인다. 녹음 파일을 대량으로 생성하고 관리하는 사람에게는 무척 편리한 기능이다. 레코드 앱은 오터(Otter)와 달리 서드파티 음성 녹음과 텍스트 구술을 지원하지는 않는다.



레코더 앱은 라이브 트랜스크라이브의 버그를 수정하고 조금 더 발전시켜 내놓은 앱이다. 마이크로소프트 워드, 레코더, 다른 서드파티 서비스까지 녹음과 구술 앱도 하나의 치열한 시장으로 성장할 것으로 보인다. editor@itworld.co.kr 


X