AIㆍML / BI|분석

IBM, 왓슨으로 동영상 속 메타데이터 추출한다

Thor Olavsrud | CIO 2017.04.25
오늘날 동영상 속에는 대량의 데이터가 들어있다. 휴대폰 카메라, 드론 카메라, 교통 정보 수집 카메라, CCTV 등은 엄청난 양의 데이터를 수집하며, 이 속의 데이터를 제대로 추출해서 분석할 수 있다면, 굉장한 통찰력을 얻게 된다. 사람이 직접 분석하는 것이 효과적이지만, 대량의 동영상 데이터 분석에는 한계가 있다. IBM은 왓슨을 통해 이 도전 과제를 해결하려 한다.

지난 월요일 LA에서 열린 방송 기자재 전문 박람회 NAB 쇼(National Association of Broadcasters Show)에서 IBM은 왓슨을 활용한 클라우드 서비스에 대한 계획을 발표했다. 왓슨과 인공 지능을 결합해 동영상에서 인사이트를 추출하는 서비스다. 초기에는 미디어와 엔터테인먼트 기업들이 비정형 데이터를 지금보다 더 활용할 수 있도록 하는 데 초점을 맞춘다.

예를 들어, IBM은 스포츠 네트워크가 이 서비스를 활용해서 언어, 감정, 이미지 등에 기반해 행복하거나 흥미로운 장면을 모은 농구 관련 콘텐츠를 모아 광고주에 제공하며, 광고주들은 플레이오프 전에 홍보 영상으로 활용할 수 있다. 몇 년간 방송된 TV 프로그램에서 특정 장면만을 다시 묶어 광고주에게 판매하는 것도 가능하다.

사람도 이 작업을 할 수 있지만, 영상의 각 장면을 수동으로 보고 콘텐츠를 가려내고 장면을 잘라내는 과정에 상당한 시간과 노력이 들어간다.

이 서비스로 미디어 및 엔터테인먼트 기업들은 콘텐츠 라이브러리를 훨씬 효율적으로 관리할 수 있다. 라이브러리를 분석하고 특정 시청자를 대상으로 한 콘텐츠만을 가려낼 수도 있다.



IBM 글로벌 커뮤니케이션, 미디어, 엔터테인먼트 업계 총괄인 스티브 카네파는 “멀티 스크린 콘텐츠의 급속한 성장을 목격하고 있으며, 미디어와 엔터테인먼트 업체들은 시청자의 행동과 연관된 콘텐츠를 발굴하고 전달하는 방식의 변화를 위해 콘텐츠 생산의 옵션이 필요해졌다”고 말했다.

이어, “오늘 우리는 미디어와 엔터테인먼트 업체들이 깊은 곳에서 인사이트를 발굴하고, 콘텐츠를 다른 방식으로 보고, 정보에 바탕이 된 결정을 할 수 있도록 도울 새로운 인지 솔루션(cognitive solutions)를 만들었다”고 전했다.

IBM은 이 클라우드 서비스가 올해 말에 상용화될 것으로 기대하고 있다. 어조 분석, 성격 분석, 자연어 이해, 시각 인지 등 다양한 왓슨 API가 활용된다. 이런 API들은 새로운 IBM 리서치(IBM Research) 기술로 결합되어 왓슨이 생성한 데이터를 분석하고 콘텐츠의 문맥에 기반해 장면을 논리적으로 분류한다. 이 서비스는 동영상에서 키워드, 개념, 시각 정보, 어조, 감정 등의 메타데이터를 추출할 수 있다.

IBM 리서치는 이미 유사한 기술을 선보인 바 있다. 지난해 20세기 폭스와 파트너십을 맺고, 인지 컴퓨팅을 활용한 호러 영화인 모건의 예고편을 제작한 바 있다. 여러 실험적인 왓슨 API를 활용해서, 100개의 호러 영화 예고펀을 기계학습한 다음, 시각 분석, 오디오 분석, 장면 구성 분석 등을 수행했다. ‘호러 영화 예고편’ 학습을 끝낸 이 시스템은 모건 영화를 본 후, 예고편으로 활용할 10개의 장면을 가려냈다. editor@itworld.co.kr
Sponsored

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.