AIㆍML

“생성형 AI의 현주소” 주요 생성형 AI 서비스 둘러보기

Heinrich Vaske | COMPUTERWOCHE 2023.02.22
생성형 AI가 세상을 바꿀 기세다. 이들 서비스는 몇 가지 간단한 명령어로 프리젠테이션을 만들고 비디오를 편집하고 글을 쓴다. 주요 생성형 AI 서비스가 얼마나 흥미로운지, 또 얼마나 사용자에게 도움이 될지 살펴보자.

ChatGPT의 성공으로 AI, 특히 생성형 AI에 대한 관심이 높다. Computerwoche는 생성형 AI에 관심있는 독자라면 살펴봐야 할 몇 가지 툴과 서비스를 소개한다. 일부 서비스는 사용자의 일상 작업을 개선해주며, 어떤 서비스는 그 자체로 멋지다.
 
에디터가 책상에 앉아 파리를 잡고 있는 모습을 그려달라고 했다. 달리가 이 프롬프트로 그린 그림이다. ⓒ DALL-E2
 

비휴먼(bHuman) : 개인화된 비디오 대량 발송

마케팅이나 영업일을 하고 개인화된 비디오를 대량으로 전송하고 싶다면? 비휴먼은 이미 만들어진 동영상에 개별적인 음성이나 기타 요소를 통합해 발송할 수 있으며, 수신자는 메일이 자신에게만 온 것처럼 느낄 수 있다. 사용자는 기본적으로 고객, 파트너 또는 다른 소비자의 관심을 끌 산업별 기능별 템플릿을 사용할 수 있으며, 비디오 내에서 고객의 이름을 말하면 AI가 수신자를 자동으로 입력하도록 할 수도 있다.

이 서비스로 개인화된 대량 이메일을 보낼 수 있으며, 잠재고객 발굴이나 고객 지원 등의 여러 주제에 맞는 템플릿을 제공한다. 예를 들어, 전자상거래 업체가 “김영희님, 안녕하세요. 김영희님의 장바구니가 차 있는데, 아직 구매를 완료하지 않으신 것 같습니다. …” 같은 내용의 비디오를 한 번만 제작해 수많은 고객에게 개인적으로 보낼 수 있다. 이런 동영상을 이메일 마케팅 솔루션이나 고객의 이름이 있는 파일과 통합할 수 있으며, 사용자가 준비한 동영상에서 고객 이름 부분을 AI가 채워준다. 음성은 일반인은 구별할 수 없을 정도로 사용자의 음성을 재현한다.
 

 

브라우즈 AI(Browse AI) : 웹사이트 모니터링

이 웹 사이트 스크레이퍼 서비스는 사용자가 웹페이지의 변화를 지속적으로 모니터링하고 별도의 코딩이나 API를 만들지 않고도 콘텐츠를 추출할 수 있도록 해준다. 예를 들어 사전 구축된 봇을 사용해 링크드인의 회사 정보나 구인 정보, 구글 워크스페이스 마켓플레이의 앱 목록, 아마존의 특정 상품 검색 결과, 국가별 구글 트렌즈 등을 가져올 수 있다.

브라우즈 AI는 웹 사이트에서 변화하는 콘텐츠와 가격을 지속적으로 파악하는 데 매우 유용하다. 웹사이트가 API를 제공하지 않거나 잘못된 API를 제공해도 상관없다. 사용자는 데이터 추출에 필요한 API를 쉽게 만들 수 있으며, 이를 원하는 콘텐츠를 추적하는 데 사용할 수 있다.
 

 

ChatGPT : 지시대로 만드는 텍스트와 프로그램

긴 설명이 필요없는 서비스이다. ChatGPT는 스스로 다양한 종류의 텍스트를 쓰고 프로그램 코드를 작성할 수 있으며, 소프트웨어 코드를 디버깅할 때도 유용하다. ChatGPT가 간단한 질문에 빠르고 정확하게 대답하기 때문에 마이크로소프트는 자사의 검색엔진과 다양한 오피스 애플리케이션에 통합하고 있다.
 

클립드롭(ClipDrop) : 지능형 디자인 도우미

AI 툴 클립드롭은 스스로 “디자인 도우미”라고 설명한다. 노출이나 색상, 화질 등을 최적화해 이미지의 품질을 개선하며, 필요하면 배경도 없애 준다. 물론 클립드롭이 제공하는 기능은 그 이상으로 다양하다. 몇 번의 클릭만으로 개별 개체, 사람, 텍스트 또는 결함을 이미지에서 삭제할 수 있으며, 바꾸기 기능으로 사람이나 물체를 새 배경 앞에 투사할 수 있다. 클립드롭은 iOS와 안드로이드용 앱으로도 이용할 수 있다.
 

 

컴포즈 AI(Compose AI) : 이메일 응답

컴포즈 AI는 구글 크롬 브라우저용 확장 프로그램으로, 이메일에 더 빨리 응답할 수 있도록 지원하는 것이 핵심 기능이다. 동작 방식은 ChatGPT와 유사하다. 예를 들어, "지금은 바쁘지만 다음 주에 회신할 것이라고 볼프강에게 전해줘”라는 프롬프트에 대응해 컴포즈 AI가 정교한 회신 이메일을 작성한다. 또 시간이 지나면서 사용자의 메일 작성 방식까지 학습해 더 자연스러운 응답 메일을 작성한다.
 

 

달리(DALL-E2) : 설명에 따라 그림 그리기

ChatGPT만큼이나 잘 알려진 생성형 AI로, 사용자의 설명을 듣고 지시에 따라 새로운 그림을 그려준다. 물론 결과물은 프롬프트, 즉 사용자의 설명이 얼마나 정확하고 타당한지에 따라 달라진다. 또한, 사용자의 이미지를 업로드하고 달리에게 수정을 요청할 수도 있다.
 

데스크립트 오버덥 : 음성 복제

데스크립트 오버덥은 음성을 정확하게 복제하는 데 많이 사용되는 오디오 및 비디오 편집 소프트웨어 중 하나이다. 사실적인 음성 복제 기능은 다소 섬찟한데, 당장 할머니에게 전화해 곤경에 처한 손자를 가장해 돈을 요구하는 전화를 조심하라고 경고하고 싶은 수준이다.

사용자는 최소 10분 이상, 이상적으로는 30~180분 분량의 구어가 포함된 음성 녹음으로 AI를 훈련시켜야 한다. 모델이 완성되면 사용자는 화면에서 음성의 텍스트를 편집해 자신의 목소리, 즉 복제한 음성으로 읽을 수 있다. 학습에 사용한 데이터 외에 새로 추가된 단어는 듣는 사람이 차이를 느끼지 못하는 방식으로 음성의 텍스트에 통합된다. 또한 다양한 전문가 음성을 제공해 사용자의 동영상을 보다 전문적으로 만드는 데 활용할 수 있다.
 

 

D-ID.com : 실시간 비디오 제작

D-ID.com의 AI 지원 동영상 플랫폼인 크리에이티브 리얼리티(Creative Reality Studio)는 쉽고 빠르게 동영상을 제작하는 데 안성맞춤이다. 사용자는 실사 이미지나 일러스트로 그린 얼굴을 아바타로 선택하고, 듣기 좋은 목소리를 고른 다음, 아바타가 낭독할 텍스트를 입력하기만 하면 된다. 사용자 자신의 사진을 업로드해 말하는 동영상을 만들 수도 있다. 스테이블 디퓨전(Stable Diffusion)의 텍스트 투 이미지(Text to Image) 기능을 사용해 아바타를 직접 만들 수도 있다. 

동영상은 MP4 형식으로 최대 5분 길이로 제공되는데, D-ID.com의 유료 API 사용자는 최대 10분 길이의 동영상을 만들 수 있다. 텍스트는 언어 파일로 업로드하거나 직접 입력할 수 있으며, GPT3 편집기를 사용해 자동으로 생성할 수도 있다. 현재 119개 언어를 지원한다.
 

 

듀러블(Durable) : 30초만에 웹 사이트 구축

듀러블은 AI를 이용해 텍스트, 이미지 및 연락처 양식이 있는 간단한 웹사이트를 30초만에 구축할 수 있다고 자신한다. 사용자가 비즈니스의 종류와 회사 또는 사람의 이름을 입력하면, AI는 적절한 이미지, 설명 및 요소로 웹 사이트 디자인을 제안한다. 또한 광고 메시지를 자동으로 생성하는 데 사용할 수 있는 구글 광고 작성기(Google Ad Writer) 같은 기능도 제공한다.
 

 

카이버(Kaiber) : 설명만 하면 만들어지는 애니메이션

카이버는 사용자의 입력 내용을 시각적 애니메이션으로 변환한다. 간단히 아이디어를 설명하고, 필요하다면 사진만 업로드하면 된다. 신규 등록 고객에게는 5개 정도의 비디오를 생성할 수 있는 50크레딧을 무료로 제공하는데, 체험용으로 생성한 애니메이션은 워터마크가 표시된다. 상업적으로 사용할 수 있는 애니메이션을 생성하려면, 유료 표준 계정을 설정해야 한다.
 

 

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.