AIㆍML / 글로벌 트렌드 / 미래기술

블로그 | 엔비디아 '스타일GAN'으로 보는 가상 미디어의 미래

Rob Enderle | Computerworld 2022.04.26
엄청난 양의 사진을 가져다 놓고, 강력한 인공지능을 한 스푼 넣어서 다 같이 섞으면 무엇이 나올까? 

엔비디아는 최근 다양한 최첨단 기술 연구를 추진하고 있다. 메타버스 전용 워크스테이션을 만드는 것부터, 인간 디지털 트윈(digital twins)로 진화하고 있는 디지털 어시스턴트, 그리고 누구나 멋진 예술 작품을 만들어 낼 수 있는 도구까지 다양하다. 이 중 제일 흥미로운 기술은 여러 사진을 혼합해 새로운 얼굴을 만드는 ‘스타일GAN’(StyleGAN) 제너레이터(Generator)다.
 

스타일GAN 제너레이터가 학습한 자료에는 7만 개의 고화질 PNG 이미지(각각 해상도 1024×1024픽셀)가 포함되어 있어 사용자가 원본 소스를 자유자재로 활용할 수 있다. 스타일GAN은 2018년에 처음 출시되었고, 2019년 소스 코드가 오픈 소스로 공개되면서 널리 퍼지기 시작했다. 3번째 버전인 스타일GAN 3는 지난 10월 출시됐다. 

이미지 작업을 하는 사람에게 가장 큰 이점은 저작권 걱정 없이 보호되어 있는 방대한 원본 이미지 풀을 활용해 자신만의 작품을 만들 수 있다는 것이다. 다른 이미지를 취합하여 새로운 이미지를 만드는 이미지 블렌딩 엔진(image-blending engine) 기술로 다양한 출처의 전문적인 사진을 혼합해 현실적, 비현실적 기억이나 상상에 기반한 독특하고 아름다운 이미지를 만들 수 있다. 스타일GAN 같은 AI 기반 이미지 블렌딩 도구는 많은 산업과 업무 방식을 획기적으로 바꿀 수 있다(물론 더 위험한 ‘딥페이크’에 악용될 수도 있다). 그 몇 가지 사례를 살펴보자.


자동화된 범죄자 몽타주 제작자

범죄 영화나 드라마를 보면, 사건의 목격자가 몽타주 제작자 앞에 앉아 관찰한 범죄자의 얼굴을 떠올리며 같이 몽타주를 만드는 장면이 있다. 이런 절차가 대화형 AI로 완전히 대체될 수 있다. AI가 다른 특징을 가진 수많은 얼굴을 혼합하여 목격자에게 계속 보여주면, 목격자는 피해자의 기억과 완전히 일치하는 몽타주를 찾을 수 있다. 안면인식 프로그램이 범인을 추적하는 데 사용할 수 있을 정도로 사실적인 몽타주를 만들 수 있는 것이다 (안타깝게도 더 이상 몽타주 제작자가 필요하지 않게 될 것이다). 

이런 기술이 큰 영향을 미칠 수 있는 특정 범죄 분야는 아동 유괴다. AI 기술로 아이가 성장한 모습을 이미징할 수 있기 때문에 시간이 지나도 여전히 당사자를 추적하고 파악할 수 있다. 


마케팅, TV 그리고 영화 산업 

마케팅 캠페인에서는 스톡 이미지를 사용하거나 모델을 섭외한다. 스톡 이미지의 문제는 동일한 이미지가 다른 마케팅 캠페인에서 사용될 수 있다는 점이다. 의도치 않게 서로 다른 캠페인이 연관된다. 예를 들어, 약 광고와 레스토랑에 동일한 이미지가 사용된다면, 고객은 그 둘을 연관 지어 레스토랑을 피할 수 있다. 비슷한 문제는 모델을 섭외했을 때도 발생한다. 배우와 모델이 여러 업체에서 활동하기 때문에 한 회사가 섭외한 모델이 나중에 다른 회사의 모델이 되어 브랜드 메시지를 혼동시킬 수 있다. 또한 모델과 배우는 광고 캠페인이나 브랜드 이미지를 훼손할 수 있는 개인적인 문제를 가질 수도 있다. 

그러나 스타일GAN 같은 이미지 혼합 기술을 사용하면 이런 문제를 벗어날 수 있다. 이미지 혼합으로 만든 얼굴이나 이미지의 저작권은 회사에 있고, 그 어떤 스톡 이미지나 실제 살아 있는 배우 혹은 모델과 겹치지 않는다. 큰 비용을 절감할 뿐만 아니라 리스크가 크게 줄어든다. 더 빨리 원하는 결과를 얻을 수 있고 모델과 배우의 필요성은 점점 줄어든다. 자신의 정체성을 베일에 가린 채 3D 이미지 슈트를 입은 배우만 필요하게 될지 모른다. 더 먼 미래에는 메타버스 도구와 3D 이미징 기술이 발전함에 따라 이런 배우조차 필요 없을 수도 있다. 이런 기술의 발전으로 영화배우들이 기술로 완전히 대체되는 미래에 다가서고 있다. 


인간과 동일한 디지털 트윈

엔비디아가 연구하고 있는 또 다른 영역은 메타버스를 위한 디지털 트윈 기술이다. 디지털 트윈에 기반한 AI 기술이 점점 현실적으로 발전하면서, 원본과 점점 더 구분하기 힘들어지고 있다. 만약 디지털 트윈과 원본이 동일화된다면, 누가 결과물을 가져가야 할까?

직원과 직원의 디지털 트윈이 있다고 가정해보자. 어떤 사람들은 직원이 자신의 디지털 트윈을 소유해야 한다고 주장할 수 있다. 그러나 스타일GAN 같은 기술이 직원의 외관뿐만 아니라 능력까지 결합할 수 있다면, 소유권을 주장하기 점점 어려워진다. 트윈 직원의 소유권을 주장하여 법정 공방까지 이어질 수 있다(필자는 미래의 직원들 및 노조가 이 같은 기술로 실제 직원들이 대체되는 문제에 직면하게 될 수도 있다고 예상한다). 


혼합된 미래

저작권이 보호되거나 보호되지 않은 대규모 원본 소스를 혼합해 창작물을 만들어내는 능력은 정말 매력적이다. 특히 잠재적인 법적 문제를 해결 수만 있다면 그 가능성은 더 무궁무진 해진다. 엔비디아의 이미지 처리 과정은 법적 문제가 없는 검증된 이미지 소스를 사용한다고 한다. 하지만, 계속 스톡 이미지 데이터베이스에만 의존할 이유는 없어 보인다. 소셜 미디어 포스트, 영화 또는 다른 광고 자료에서 찍은 공공 인물의 이미지 등 수많은 곳에 활용될 수 있다. 

필자는 언젠가 이 기술이 발전해 합성 이미지를 다루는 저작권법이 개정될 수 있다고도 본다. 동시에, 비즈니스 및 엔터테인먼트 산업 종사자들은 사실주의적 사진과 영상에 들이는 노력과 비용을 줄일 것이다. 엔터테인먼트 및 광고 업계의 수익 구조에 지각변동이 예상된다. 모델, 배우, 감독, 그리고 삶에서 기억 남는 순간을 시각적 작품으로 바꾸는 아티스트 모두가 이런 변화의 초기에 서있다.  

스타일GAN과 같은 도구는 비즈니스, 정부 및 엔터테인먼트를 포함한 모든 분야에서 활용될 가상 미디어의 미래를 재정의할 것이다. 

*Rob Enderle은 신기술 자문 회사인 Enderle Group의 사장 겸 수석 애널리스트다. 마이크로소프트, 퀄컴, 엔비디아는 그의 고객사다. 
ciokr@idg.co.kr

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.