2013.04.02

갤럭시 S4 킬러기능 'S 번역기' … 실시간 음성 번역의 성과와 한계

Stephen Lawson | IDG News Service

 
삼성이 지난 수년간 개발자들을 좌절시킨 기능인 '실시간 음성 번역'을 갤럭시 S4(Galaxy S4)에서 제공하겠다고 밝혔다. 갤럭시 S4는 5월 말까지 155개 국에서 출시될 예정이며, 사람들이 국경을 넘어 의사 소통할 수 있는 실시간 음성 번역기가 야심차게 탑재돼 있다.
 
실시간 음성대화 번역은 수 년 동안 다양한 제품과 소프트웨어의 공통된 목표였고 삼성은 이를 달성했다고 밝혔다. 갤럭시 S4에 내장된 S 번역기 앱을 통해 일상 대화 속도로 말한 내용을 다른 언어로 번역할 수 있다는 것이다. 삼성은 출시와 동시에 10개 언어를 지원할 것이라고 밝혔다.
 
그동안 실시간 음성 번역 개발이 쉽지 않았던 것은 그만한 이유가 있다. 이를 위한 핵심 프로세스가 3가지인데 각각이 모두 개발 작업이 까다롭기 때문이다. 지난 2008년 네트워크 업계의 강자 시스코 시스템즈(Cisco Systems)가 자사의 텔레프레즌스(TelePresence) 화상회의 플랫폼용으로 개발한 자체 번역 시스템을 1년 이내에 출시할 것이라고 공언한 바 있다. 그러나 1년 후 이를 번복하면서 예상보다 어려운 작업이었음을 인정했다. 시스코는 지금도 이 기능을 개발중이다.
 
전문가들과 애널리스트들은 S 번역기와 다른 툴들이 개선됐고 점차 나아지겠지만 현재까지는 언어 장벽을 해결하지 못하는 수준이라고 평가한다. 언어는 너무 복잡하고 광범위해서 오해하기 쉽기 때문이다. 오푸스 리서치(Opus Research)의 애널리스트 댄 밀러는 "누구나 가능하긴 하지만 실시간 번역은 여전히 어려운 수준"이라며 "아직까지 이렇다 할 진전은 없는 것 같다"고 말했다.
 
S 번역기 작동 원리
S 번역기는 문자 메시지와 이메일뿐만 아니라 음성 통화에서도 사용할 수 있도록 개발됐지만 가장 놀라운 것은 직접 사용하는 경우다. 라디오 시티 뮤직 홀(Radio City Music Hall)에서 열린 갤럭시 S4 공개 행사에서 연기자들은 미국 배낭여행자가 중국인에게 박물관의 위치를 묻는 상황을 극화하여 S 번역기의 기능을 시연했다. 배낭여행자가 갤럭시 S4에 대고 영어로 질문하면 중국어가 흘러나왔다. 그 남자가 질문을 들은 뒤 전화에 대고 중국어로 대답하자 영어 텍스트로 전환됐다.
 
시스코의 협업 및 기술 그룹 소속 엔지니어인 아난스 상카르는 대화를 번역하려면 말을 문자로 바꾸고 이것은 다른 언어로 번역한 후 번역된 문자를 말로 바꾸는 3가지의 프로세스가 필요하다고 말했다. 그는 자연스러운 대화에서 첫 번째 프로세스가 특히 어려운 부분이라고 덧붙였다.
 
상카르는 사람들이 컴퓨터에게 말하는 것과 다른 사람들에게 말하는 방식이 다르다는 점이 가장 중요하다고 말했다. "음…", "아… " 등 대화 중간의 의미없는 말이나 했던 말을 수정할 때 자연스럽게 말의 흐름을 끊는 요소가 대표적이다. 이 때문에 소프트웨어가 명령이나 지시보다 대화를 이해하기가 더욱 힘들다는 것이다.
 
문자 번역의 또 다른 어려움은 언어별, 영역별 차이다. 이 프로세스를 보완하는 일반적인 방법이 통계적 접근방식으로 두 언어 사이에서 전문 번역가가 작업한 문서를 비교하는 것이다. 그러나 언어마다 교류의 정도에 차이가 있어 정확도에서도 편차가 발생하는 것이다.

비즈니스, 기술, 법률, 여행 등 특정 영역에서는 실시간 번역이 더 유용하다. 상카르는 "특정 주제의 경우 정확도가 90%에 이르는 것도 있다"며 "삼성 S 번역기의 어휘가 여행이라는 주제에 국한되어 있지 않은 것은 놀라운 것"이라고 말했다.
 
번역의 또 다른 문제는 많은 언어를 지원한다고 해서 지원하는 모든 언어 사이의 번역이 가능한 것은 아니라는 점이다. 프로세스는 이미 처리한 번역에 의존하고 있으므로 번역하려는 대응 언어가 중요하다.

S 번역기의 경우 미국 또는 영국식 영어는 불어, 독어, 이탈리아어, 남미 스페인어, 브라질 포르투갈어, 한국어, 중국어, 일본어 등 다른 다른 8개 언어로 번역된다. 또한 한국어, 중국어, 일본어도 상호 번역이 가능하다.
 
기존 번역 기술의 한계를 넘어
삼성은 구글 번역기(Google Translate)나 다른 플랫폼 대신 자체 기술로 번역 기능을 구현했다. 단 이 실시간 번역 시스템의 한계는 온라인 번역 서버에 연결돼 있어야 한다는 것이다. 오푸스 리서치의 밀러에 따르면 이는 비단 삼성 만의 문제가 아니지만 여행 중에는 중요한 단점이 될 수 있다. 밀러는 "기기에서 로컬 상태로 처리하지 않는 한 많은 기업들이 데이터 연결이 필요한 기능은 상당한 비용이 발생할 수 있기 때문에 배제하고 있다"고 말했다. 
 
이 부분에서 신생 기업인 지비고(Jibbigo)는 다른 방식을 택하고 있다. 업체는 iOS와 안드로이드(Android)용 앱을 출시했는데 서버를 호출하는 무료 앱이지만 특정 언어 쌍의 오프라인 번역 모듈을 별도로 구매할 수 있다. 갤럭시 S4의 S 번역기에는 유용한 일부 표현들의 번역 문장이 저장돼 있다.
 
음성 인식과 번역 기술이 꾸준히 발전하고 있다. 통계 모델에 기초하고 있는 소프트웨어는 번역량이 늘어날수록 스스로 학습해 정확도를 높인다. 시스코 역시 화상회의 실시간 번역 기능을 개발하고 있지만 형식적인 논의 정도만 가능한 수준이다. 상카르는 "5~10년 정도 후에는 언어 장벽을 넘어 매우 자연스러운 대화로 웹 컨퍼런스를 할 수 있는 날이 올 것"이라며 "아직 이 기술은 완벽하지 않지만 꾸준히 발전하고 있다"고 말했다. editor@idg.co.kr


2013.04.02

갤럭시 S4 킬러기능 'S 번역기' … 실시간 음성 번역의 성과와 한계

Stephen Lawson | IDG News Service

 
삼성이 지난 수년간 개발자들을 좌절시킨 기능인 '실시간 음성 번역'을 갤럭시 S4(Galaxy S4)에서 제공하겠다고 밝혔다. 갤럭시 S4는 5월 말까지 155개 국에서 출시될 예정이며, 사람들이 국경을 넘어 의사 소통할 수 있는 실시간 음성 번역기가 야심차게 탑재돼 있다.
 
실시간 음성대화 번역은 수 년 동안 다양한 제품과 소프트웨어의 공통된 목표였고 삼성은 이를 달성했다고 밝혔다. 갤럭시 S4에 내장된 S 번역기 앱을 통해 일상 대화 속도로 말한 내용을 다른 언어로 번역할 수 있다는 것이다. 삼성은 출시와 동시에 10개 언어를 지원할 것이라고 밝혔다.
 
그동안 실시간 음성 번역 개발이 쉽지 않았던 것은 그만한 이유가 있다. 이를 위한 핵심 프로세스가 3가지인데 각각이 모두 개발 작업이 까다롭기 때문이다. 지난 2008년 네트워크 업계의 강자 시스코 시스템즈(Cisco Systems)가 자사의 텔레프레즌스(TelePresence) 화상회의 플랫폼용으로 개발한 자체 번역 시스템을 1년 이내에 출시할 것이라고 공언한 바 있다. 그러나 1년 후 이를 번복하면서 예상보다 어려운 작업이었음을 인정했다. 시스코는 지금도 이 기능을 개발중이다.
 
전문가들과 애널리스트들은 S 번역기와 다른 툴들이 개선됐고 점차 나아지겠지만 현재까지는 언어 장벽을 해결하지 못하는 수준이라고 평가한다. 언어는 너무 복잡하고 광범위해서 오해하기 쉽기 때문이다. 오푸스 리서치(Opus Research)의 애널리스트 댄 밀러는 "누구나 가능하긴 하지만 실시간 번역은 여전히 어려운 수준"이라며 "아직까지 이렇다 할 진전은 없는 것 같다"고 말했다.
 
S 번역기 작동 원리
S 번역기는 문자 메시지와 이메일뿐만 아니라 음성 통화에서도 사용할 수 있도록 개발됐지만 가장 놀라운 것은 직접 사용하는 경우다. 라디오 시티 뮤직 홀(Radio City Music Hall)에서 열린 갤럭시 S4 공개 행사에서 연기자들은 미국 배낭여행자가 중국인에게 박물관의 위치를 묻는 상황을 극화하여 S 번역기의 기능을 시연했다. 배낭여행자가 갤럭시 S4에 대고 영어로 질문하면 중국어가 흘러나왔다. 그 남자가 질문을 들은 뒤 전화에 대고 중국어로 대답하자 영어 텍스트로 전환됐다.
 
시스코의 협업 및 기술 그룹 소속 엔지니어인 아난스 상카르는 대화를 번역하려면 말을 문자로 바꾸고 이것은 다른 언어로 번역한 후 번역된 문자를 말로 바꾸는 3가지의 프로세스가 필요하다고 말했다. 그는 자연스러운 대화에서 첫 번째 프로세스가 특히 어려운 부분이라고 덧붙였다.
 
상카르는 사람들이 컴퓨터에게 말하는 것과 다른 사람들에게 말하는 방식이 다르다는 점이 가장 중요하다고 말했다. "음…", "아… " 등 대화 중간의 의미없는 말이나 했던 말을 수정할 때 자연스럽게 말의 흐름을 끊는 요소가 대표적이다. 이 때문에 소프트웨어가 명령이나 지시보다 대화를 이해하기가 더욱 힘들다는 것이다.
 
문자 번역의 또 다른 어려움은 언어별, 영역별 차이다. 이 프로세스를 보완하는 일반적인 방법이 통계적 접근방식으로 두 언어 사이에서 전문 번역가가 작업한 문서를 비교하는 것이다. 그러나 언어마다 교류의 정도에 차이가 있어 정확도에서도 편차가 발생하는 것이다.

비즈니스, 기술, 법률, 여행 등 특정 영역에서는 실시간 번역이 더 유용하다. 상카르는 "특정 주제의 경우 정확도가 90%에 이르는 것도 있다"며 "삼성 S 번역기의 어휘가 여행이라는 주제에 국한되어 있지 않은 것은 놀라운 것"이라고 말했다.
 
번역의 또 다른 문제는 많은 언어를 지원한다고 해서 지원하는 모든 언어 사이의 번역이 가능한 것은 아니라는 점이다. 프로세스는 이미 처리한 번역에 의존하고 있으므로 번역하려는 대응 언어가 중요하다.

S 번역기의 경우 미국 또는 영국식 영어는 불어, 독어, 이탈리아어, 남미 스페인어, 브라질 포르투갈어, 한국어, 중국어, 일본어 등 다른 다른 8개 언어로 번역된다. 또한 한국어, 중국어, 일본어도 상호 번역이 가능하다.
 
기존 번역 기술의 한계를 넘어
삼성은 구글 번역기(Google Translate)나 다른 플랫폼 대신 자체 기술로 번역 기능을 구현했다. 단 이 실시간 번역 시스템의 한계는 온라인 번역 서버에 연결돼 있어야 한다는 것이다. 오푸스 리서치의 밀러에 따르면 이는 비단 삼성 만의 문제가 아니지만 여행 중에는 중요한 단점이 될 수 있다. 밀러는 "기기에서 로컬 상태로 처리하지 않는 한 많은 기업들이 데이터 연결이 필요한 기능은 상당한 비용이 발생할 수 있기 때문에 배제하고 있다"고 말했다. 
 
이 부분에서 신생 기업인 지비고(Jibbigo)는 다른 방식을 택하고 있다. 업체는 iOS와 안드로이드(Android)용 앱을 출시했는데 서버를 호출하는 무료 앱이지만 특정 언어 쌍의 오프라인 번역 모듈을 별도로 구매할 수 있다. 갤럭시 S4의 S 번역기에는 유용한 일부 표현들의 번역 문장이 저장돼 있다.
 
음성 인식과 번역 기술이 꾸준히 발전하고 있다. 통계 모델에 기초하고 있는 소프트웨어는 번역량이 늘어날수록 스스로 학습해 정확도를 높인다. 시스코 역시 화상회의 실시간 번역 기능을 개발하고 있지만 형식적인 논의 정도만 가능한 수준이다. 상카르는 "5~10년 정도 후에는 언어 장벽을 넘어 매우 자연스러운 대화로 웹 컨퍼런스를 할 수 있는 날이 올 것"이라며 "아직 이 기술은 완벽하지 않지만 꾸준히 발전하고 있다"고 말했다. editor@idg.co.kr


X