2016.11.08

“음성을 포토샵한다” 어도비, 대담한 오디오 편집 실험 프로젝트 공개

Ian Paul | PCWorld
이제 해변에서 수영하는 사람을 공격하는 상어 모습을 만들거나 재미로 사진을 합성하는 일은 잊자. 미래의 어도비는 사람들의 입에 단어를 넣어주려고 한다.

어도비 맥스 컨퍼런스에서 어도비는 ‘스니크(Sneak)’란 이름의 11가지 실험적인 프로젝트를 소개했는데, 이 중 하나인 프로젝트 보코(Project VoCo)란 오디어 편집 기능이 주목을 받았다. 이제 소리를 “포토샵하겠다”는 것이다.



보코는 음성 파일을 가져다 문자를 편집하는 것처럼 여러 가지 방법으로 조작할 수 있다. 문장을 바꾸기 위해 단어를 재배치하거나 심지어 원래 녹음할 때는 없었던 단어를 삽입할 수도 있다.

어도비 맥스의 시연에서 어도비의 엔지니어는 어도비 오디션(Adobe Audition)을 사용해 보코 기능으로 오디오 파일을 열었다. 보코는 짧은 오디오 파일을 문자로 바꿔서 오디오 파장 아래에 텍스트를 보여준다. 이제 사용자는 텍스트를 편집해 오디오 파일을 조작할 수 있다. 어도비의 시연에서는 코메디언 키거 마이클 키가 녹음한 파일이 “그리고 난 강아지와 마누라에게 키스했지”란 말을 “그리고 난 조든에게 세 번 키스했지”란 말로 바뀌었다.



녹음한 오디오 파일을 수정하는 것은 그리 매끄럽게 이루어지지 않았지만, 결과물은 훌륭했다. 수정한 오디오 파일을 재생하면 ‘조단’이란 단어는 삽입된 것처럼 들렸지만, “세 번”이란 말은 마치 원본처럼 들렸다.

어도비는 누군가의 목소리로 새로운 단어를 삽입하려면, 약 20분 분량의 녹음된 음성 파일이 필요하다고 설명했다. 또한 보코가 기존에 녹음한 음성 파일에서 ‘세 번’ 같은 말을 가져다 삽입하는 것인지, 아니면 완전히 새로 만들어 내는 것인지도 확실하지 않다.

어도비는 보코를 팟캐스트나 상업 광고의 나레이티브, 오디오북 녹음 등을 위한 즉석 편집 툴로 만들고자 한다. 하지만 이 툴은 좀 더 사악한 용도로도 사용할 수 있다. 대표적인 예가 선거 기간이다. 보코같은 툴이 일반화된다면, 페이스북 피드는 조작된 음성 파일로 넘쳐날지도 모르는 일이다. 어도비 역시 이런 문제를 인지하고 있으며, 녹음 파일 수정에 디지털 워터마크를 적용하는 방안을 고안하고 있다고 밝혔다. 이 기술을 적용하면, 사람의 귀로는 조작된 음성을 알아내지 못해도 컴퓨터는 식별할 수 있다.

현재 보코는 어도비가 진행 중인 여러 가지 실험 프로젝트의 하나로, 상용화 관련 계획이나 일정은 물론, 이 기능이 시장에 나올 수 있을지도 알 수 없다.  editor@itworld.co.kr


2016.11.08

“음성을 포토샵한다” 어도비, 대담한 오디오 편집 실험 프로젝트 공개

Ian Paul | PCWorld
이제 해변에서 수영하는 사람을 공격하는 상어 모습을 만들거나 재미로 사진을 합성하는 일은 잊자. 미래의 어도비는 사람들의 입에 단어를 넣어주려고 한다.

어도비 맥스 컨퍼런스에서 어도비는 ‘스니크(Sneak)’란 이름의 11가지 실험적인 프로젝트를 소개했는데, 이 중 하나인 프로젝트 보코(Project VoCo)란 오디어 편집 기능이 주목을 받았다. 이제 소리를 “포토샵하겠다”는 것이다.



보코는 음성 파일을 가져다 문자를 편집하는 것처럼 여러 가지 방법으로 조작할 수 있다. 문장을 바꾸기 위해 단어를 재배치하거나 심지어 원래 녹음할 때는 없었던 단어를 삽입할 수도 있다.

어도비 맥스의 시연에서 어도비의 엔지니어는 어도비 오디션(Adobe Audition)을 사용해 보코 기능으로 오디오 파일을 열었다. 보코는 짧은 오디오 파일을 문자로 바꿔서 오디오 파장 아래에 텍스트를 보여준다. 이제 사용자는 텍스트를 편집해 오디오 파일을 조작할 수 있다. 어도비의 시연에서는 코메디언 키거 마이클 키가 녹음한 파일이 “그리고 난 강아지와 마누라에게 키스했지”란 말을 “그리고 난 조든에게 세 번 키스했지”란 말로 바뀌었다.



녹음한 오디오 파일을 수정하는 것은 그리 매끄럽게 이루어지지 않았지만, 결과물은 훌륭했다. 수정한 오디오 파일을 재생하면 ‘조단’이란 단어는 삽입된 것처럼 들렸지만, “세 번”이란 말은 마치 원본처럼 들렸다.

어도비는 누군가의 목소리로 새로운 단어를 삽입하려면, 약 20분 분량의 녹음된 음성 파일이 필요하다고 설명했다. 또한 보코가 기존에 녹음한 음성 파일에서 ‘세 번’ 같은 말을 가져다 삽입하는 것인지, 아니면 완전히 새로 만들어 내는 것인지도 확실하지 않다.

어도비는 보코를 팟캐스트나 상업 광고의 나레이티브, 오디오북 녹음 등을 위한 즉석 편집 툴로 만들고자 한다. 하지만 이 툴은 좀 더 사악한 용도로도 사용할 수 있다. 대표적인 예가 선거 기간이다. 보코같은 툴이 일반화된다면, 페이스북 피드는 조작된 음성 파일로 넘쳐날지도 모르는 일이다. 어도비 역시 이런 문제를 인지하고 있으며, 녹음 파일 수정에 디지털 워터마크를 적용하는 방안을 고안하고 있다고 밝혔다. 이 기술을 적용하면, 사람의 귀로는 조작된 음성을 알아내지 못해도 컴퓨터는 식별할 수 있다.

현재 보코는 어도비가 진행 중인 여러 가지 실험 프로젝트의 하나로, 상용화 관련 계획이나 일정은 물론, 이 기능이 시장에 나올 수 있을지도 알 수 없다.  editor@itworld.co.kr


X