AIㆍML

"110여 개국 75종 언어, 450여 명 목소리 구현" 이스트소프트, AI 휴먼 앵커 출시

편집부 | ITWorld 2023.05.19
이스트소프트가 아리랑TV의 대표 앵커로 활동했던 ‘데빈’을 모델로 다국어 발화가 가능한 AI 휴먼을 출시했다고 5월 19일 밝혔다.

이스트소프트에 의해 탄생한 ‘AI 휴먼 앵커 데빈’은 북미, 유럽, 중동, 아시아 권역에 속한 총 110여 개국의 75종 언어를 발화하고 450여 명의 목소리를 생성해 낸다. 이스트소프트의 AI 클론 기술에 마이크로소프트의 기술이 더해진 결과다.
 

구체적으로는 인물의 외모, 발화 능력 및 목소리, 특유의 말투와 동작을 그대로 복제해 생성하는 이스트소프트의 AI 클론(AI Clone) 기술 중 하나인 STF(Speech-To-Face)에 마이크로소프트의 음성합성 기술인 TTS(Text-To-Speech)를 접목해 AI 휴먼의 다국어 발화 기능을 대폭적으로 향상시키고, 사용자 요구를 충족하는 다양한 목소리도 구현해냈다고 업체 측은 설명했다. 특히, 다국어 발화에 있어서는 같은 언어라도 사용 국가 간 다르게 표현되는 뉘앙스까지 표현해 낸다.

또 AI 휴먼 앵커 데빈은 한층 더 완성도 높은 서비스를 제공하기 위해 글로벌 시장에 통용되는 수준의 영어를 발화할 수 있도록 제작했다. AI 서비스 품질 대부분은 데이터 질에 크게 영향을 받는데, 이스트소프트는 아리랑TV 전 대표 앵커 데빈의 음성을 자사 AI 스튜디오에서 고품질의 정제된 데이터로 추출해 발화 기능을 고도화했다고 업체 측은 전했다.

회사에 따르면 이스트소프트는 AI 휴먼 앵커 데빈을 자사의 AI 휴먼 영상제작 솔루션인 ‘AI 스튜디오 페르소(https://studioperso.ai)’에 탑재해 제공한다. 완성도 높은 품질로 다국어 발화가 가능한 AI 휴먼 데빈을 활용해 AI 휴먼 스튜디오 페르소의 글로벌 경쟁력을 강화하겠다는 전략이다. 최근, 이스트소프트는 AI 휴먼의 글로벌 진출에 속도를 높이고 있는데, 이달 초에는 마이크로소프트의 비전 얼라이언스에 합류하며 AI 휴먼 서비스의 글로벌 확장을 위한 기반을 다지기도 했다.

이스트소프트 AI 사업본부 변계풍 이사는 “자사의 AI 휴먼과 MS의 음성합성 기술 접목 성공으로 110여 개국에서 사용하는 75종의 언어를 세밀한 뉘앙스까지 살려 AI 휴먼이 발화할 수 있게 됐다”라며, “완벽한 다국어 발화가 가능한 AI 휴먼 개발로 자사의 AI 휴먼 서비스인 ‘AI 스튜디오 페르소’가 글로벌 경쟁력을 확보한 만큼, 국내를 넘어 해외로 빠르게 사업을 전개해 나갈 계획”이라고 말했다.
editor@itworld.co.kr

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.