보안 / 스마트폰

목소리 복제하는 AI 음성 비서, 금융권 본인 인증도 뚫는다

Alaina Yee | PCWorld 2023.02.27
최근 삼성이 발표한 갤럭시 S 스마트폰 시리즈에 공상과학 영화가 아니라 현실이다. S23, S23+. S23 울트라 스마트폰에 탑재된 음성 비서 빅스비를 훈련시키면 통화 중 사용자의 목소리를 그대로 모방한다. 전화 통화 중 사용자가 말을 할 수 없는 상황이 되면 텍스트를 입력해서 인공지능 비서가 사용자의 목소리로 텍스트를 읽어주는 방식으로 기능한다.

이 환상적인 기능에는 이면이 있다. 훈련으로 모방하는 AI 음성은 악용될 소지가 너무 많다. 삼성이 제품을 발표한 당일 바로 바이스 기술 지면인 마더보드(Motherboard)는 AI로 기자의 음성을 훈련시키고, 은행 콜 뱅킹 서비스에서 기자 본인인 것처럼 AI 음성 파일을 재생했고 본인 인증에 성공했다.

전문가들은 수 년간 음성 인증의 취약점을 경고했다. AI 기반 도구가 널리 쓰이기 전에는 녹음 파일로 우회하는 방법이 쓰였다. 광고나 영업 전화를 건 후 “네”라고 말할 수밖에 없는 기본적인 질문을 던져 사용자의 음성을 녹음하는 것이다. 그러나 AI의 모방에는 상호작용이 필요하지 않다. 음성 훈련에 필요한 목소리 데이터가 대량으로 필요한 것도 아니다. 훈련 자체는 수 분이면 충분하다.


단기적으로 볼 때 AI 음성의 악용 사례는 아직 많지 않다. 사용자가 모르게 AI 음성을 악용하려면 사용자 음성이 공개되어 있어야 하고 몇 가지 조건이 필요하다. 일레븐랩(ElevenLabs) 도구를 사용했을 때 마더보드는 로이드 은행의 본인 인증 절차를 통과하지 못했다. 사용자 음성을 몰래 AI로 훈련하고 원래 목소리처럼 특정 절차를 통과하려면 여러 번 시도해야 하고 몇 가지 수정도 필요하다. 금융 등의 민감한 서비스가 사용자의 다른 정보나 신호를 모니터링하는 경우 번호 스푸핑 같은 다른 기능을 빅스비 통화와 결합해야 한다.

그렇다고 아직 안심할 수는 없다. 메인보드 실험은 생체 인식 인증이 다른 계정 보호 방법과 똑같이 중시되어야 함을 보여주는 예시다. 생체 인식 데이터는 일종의 물리적 비밀번호이고, 다른 비밀번호와 마찬가지로 정보에 액세스할 수 있거나 보안이 취약하다면 위험해진다.

목소리는 녹음될 수 있다. 얼굴은 촬영될 수 있다. 지문은 사용자가 의식하지 못하는 동안 채취될 수 있다. 생체 데이터는 활용을 그만둘 필요까지는 없지만 간단하고 편리한 만큼 방어 수단이 약하다. 생체 데이터를 짧고 쉬운 비밀번호라고 생각해보자. 어떤 공격은 막아내기도 하겠지만 대부분 매우 쉽게 뚫릴 것이다.
 
ⓒ Getty Images Bank

생체 인식 인증을 현명하게 활용하려면, 민감한 사이트에 ‘항상 로그인하기’를 적용하지 않는 PC나 비밀번호로 보호되는 앱과 스마트폰 등 위험이 적은 상황에서만 사용해야 한다. 목소리나 얼굴 데이터를 다른 강력한 수단과 함께 쓰는 것이 아니라면 가능한 한 비활성화하는 것이 좋다.

은행에서 음성 확인을 본인 인증에 활용할 경우, 2단계 인증을 활성화해야 한다. AI 도구는 점차 더 강력해져서 커다란 위협이 될 것이기 때문이다. 특히 얼굴이 드러난 자신의 동영상을 공유하는 것을 좋아하는 사람은 유료 서비스라도 사용하는 것이 좋다.
editor@itworld.co.kr 

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.