AIㆍML

리턴제로, 음성AI ‘비토’에 NNLM 언어모델 도입 "오픈API로 공개할 것”

편집부 | ITWorld 2022.06.21
눈으로 보는 통화 앱 ‘비토’를 운영중인 리턴제로가 음성인식(ASR) 모델 ‘소머즈(Sommers) 엔진’의 기술 수준을 더 높였다고 발표했다.
 
ⓒ 리턴제로

비토는 이용자들이 더욱 빠르고 정확한 문자 변환 서비스를 경험할 수 있도록 새로운 인공신경망 언어모델 NNLM(Neural Net Language Model)을 도입했다.

그 동안 리턴제로는 칼디(Kaldi) 기반의 음성인식 모델에 리턴제로의 독자적인 기술을 결합해 비토 서비스를 제공해 왔다. 국내 AI 음성인식 시장에서 보편적으로 활용되고 있는 칼디는 음향모델, 음성모델, 언어모델 등 여러가지 모듈로 이루어져 있다. 다만, 칼디 방식의 경우 데이터가 방대해질 경우 전체 연산 과정에 소요되는 시간과 비용이 커져, 보다 빠르고 효과적인 모델 고안이 필요했다.

리턴제로는 이러한 점에 착안해 NNLM 모델을 새롭게 선보이며 한발 더 앞서나간 서비스를 선보이게 됐다. NNLM이란 AI가 인식한 통화 내용을 인공신경망 언어모델이 한 번 더 평가해 발화자가 말한 내용과 더 일치한 텍스트로 변환할 수 있도록 맥락에 맞게 다듬어 보여주는 것이 특징이다.

이 기술은 일반 이용자는 물론, 기업을 대상으로 한 서비스에도 접목된다. 이에 따라, 리턴제로의 음성인식 기술을 도입 및 활용중인 B2B 시장 전반에도 한층 고도화된 AI 음성인식 서비스가 확산될 전망이다. 리턴제로는 앞으로 업무와 관련된 특정 전문 용어를 수반하는 통화 내용에 있어서도 더욱 고도화된 솔루션을 제공할 수 있을 것으로 기대하고 있다.

리턴제로는 이번 NNLM이 적용된 음성인식 기술을 오픈API로 공개하기 위해 빠른 시일 내에 개발자 웹사이트를 출시하고, 모든 개발자와 기업이 활용할 수 있도록 열린 생태계를 제공할 예정이다.

리턴제로 이참솔 대표는 “비토가 지속적인 서비스 업데이트로 꾸준히 진화하고 있다”며, “리턴제로는 앞으로도 자체 음성인식 기술을 고도화해 나가며 국내 인공지능 스타트업과 개발자 생태계를 지원할 계획”이라고 밝혔다.
editor@itworld.co.kr

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.