디지털 디바이스 / 애플리케이션

탄성이 절로 나오는 5개 소프트웨어 연구 프로젝트

Esther Schindler | ITWorld 2013.03.27
기자들은 독자들과 함께 반짝거리는 것을 좋아한다는 점에서는 같지만, 비즈니스 관련 질문들을 쏟아내도록 훈련된 것이 다른 점이다. 대개 무역 박람회에 참가하는 기자는 개발업체들에게 물어보는 질문이 정해져 있다. 
 
"언제 출시되는가? 가격은 얼마인가? 타깃 사용자는 누구인가?"
 
때로는 비즈니스 사례보다는 기술과 가능성에 초점을 맞추기도 한다. 그리고 2013년 3월에 봤던 연구 프로젝트를 기준으로 볼 때, 자칭 마니아라는 사람들의 입이 쩍 벌어질만한 많은 연구 프로젝트가 진행되고 있다.
 
매년 독일의 하노버(Hannover)에서 열리는 CeBIT 컨퍼런스는 이미 '엄청나다'는 말로 표현할 수준을 넘어섰다. 대부분의 무역 박람회는 1~2개 정도 컨퍼런스 홀을 채우는 것으로 만족하지만 CeBIT에는 수십 개의 홀이 존재한다. 
 
이를테면, 건물이 통째로 보안 제품에 할당됐으며 전자상거래와 콘텐츠 관리 등의 인터넷 툴은 다른 건물에서 볼 수 있다. 필자는 그 가운데서도 9번 홀의 연구 및 개발 부문이 마음에 들었다. 그 내부에서는 대학 및 기타 기관들이 진행 중인 프로젝트를 시연하는 것을 볼 수 있었고, 심지어 '우리가 이걸로 뭘 할 수 있을까?' 고민해야 하는 수준의 소프트웨어 제품도 눈에 띄었다.
 
이번 기사에서는 이 가운데 마음에 들었던 연구 프로젝트에 대해 이야기해 보고자한다. 사진이 마음에 들지 않더라도 이해해주기 바란다. 박람회를 보다 보면 이런 일은 흔하게 일어난다. 
 
미래를 향한 프로젝트
두 개의 안면 인식 프로젝트가 눈에 띄었다. 둘 다 "제발 악용되지 않고 선한 목적을 위해 사용됐으면 좋겠다"는 생각이 드는 정도의 수준이었다.
 
독일 남부의 카를스루에공과대학(Karlsruhe Institute of Technology)은 마니아들이 좋아할만한 빅뱅 이론(The Big Bang Theory)의 동영상으로 필자의 시선을 사로잡았다. 공식적으로 이 프로젝트는 이미지와 영상에서 보이는 얼굴과 사람들의 감지 및 분석이 가능하도록 컴퓨터 비전에서 새로운 방식을 탐구하는 것에 초점을 맞추고 있다.
 
또는 비공식적으로 말하자면, 이 프로젝트는 배우의 얼굴을 인식하는 소프트웨어의 능력을 시연하고 해당 데이터를 다른 자원과 결합시킨다. 예를 들어, 화면을 터치하면 imdb.com에 저장되어 있는 해당 배우의 기록이 보인다(배우자와의 '정말로 반딧불이 에피소드에 나왔던 배우랑 같은 배우라니까!'과 같은 논쟁을 한 순간에 불식시킬 수 있다). 또한 더 나은 비디오 검색 결과를 가능하게 한다(쉘돈(Sheldon)과 페니(Penny)가 나오는 모든 장면을 보고 싶다 등).
 
이 모든 프로젝트에서처럼 아직 제대로 '숙성되지' 않았다. 연구원들은 현재 해당 소프트웨어의 정확도가 약 80% 정도이며 각 TV 에피소드를 처리하는데 1~2시간 정도가 소요된다고 설명했다. 그리고 오직 주인공에게만 집중한다. 엑스트라나 잠시 등장하는 배우를 찾으면, 다른 쇼에서 본 배우와 동일 인물인지 확인하기가 어렵다(즉, 배우자와 계속 싸워야 한다는 의미다).
 
하지만, 이 연구는 가능성이 있다. 이 기술은 단순히 TV 만이 적용 대상이 아니다(물론, 지금도 이것보다 더욱 정확한 버전에 투자할 사람들은 있을 것이다). 
 
우리가 비디오 검색 기술을 개선할 수 있는 방법은 신이 주신 멀티미디어 데이터의 의미론적 색인 작성이다. 그리고 연구 자료에서 볼 수 있듯이 사용자를 인식해 소프트웨어가 자동으로 TV 프로그램 추천을 하는 등 개별 설정을 선택하도록 할 수 있다. 
 
또한 그들은 컴퓨터 비전을 통해 사람들의 마음을 들여다 볼 수 있을 것이다. 예를 들어, 시선이 향하는 방향을 추정해 누가 어떤 물체에 관심이 있는지 파악해 그/그녀의 관심을 끌 수 있다.
 
소프트웨어 가라사대 '혁신은 계속된다'
카를스루에공과대학만이 안면 인식기술을 개발하고 있는 것은 아니다. 유럽 최대의 애플리케이션 지향 연구 기관인 프론호퍼(Fraunhofer)는 바이에른 주립도서관(Bavarian State Library)의 라이브러리를 검색하고 키 접속을 위해 스마트폰을 사용하는 등 다수의 연구 프로젝트를 시연했다.

하지만 필자의 관심을 끈 것은 '펠릭스(Felix)라는 로봇'으로부터 얻은 입력 값을 통합하는 안면 인식 시스템이었다.
펠릭스는 슬픔, 기쁨, 놀람, 분노 등 주로 얼굴 표정을 모방해 사람들이 '기쁨'이 어떻게 눈에 보이는지 더욱 쉽게 인식하도록 함으로써 이것을 소프트웨어 솔루션에 통합할 수 있다. 사용자가 미소를 보내면 컴퓨터도 함께 웃는다. 로봇과 아바타가 사용자의 기분을 파악해 적절히 대응한다. 이것은 매장의 점원들과 같은 수준의 기술이다.
 
프론호퍼 소프트웨어는 청중을 학습한 카메라를 사용해 간략하게나마 성별, 추정 연령 기분 등을 포함한 얼굴의 표정을 어떻게 인식하는지 시연했다. 26일 월요일에는 필자가 10대처럼 보인다고 했다가 28일 수요일 오후 박람회 때문에 피곤해질 즈음에는 필자를 어른으로 인식하는 등 완벽하지는 못했다.
 
필자가 대화를 나눈 연구원은 몇 가지 상용 애플리케이션을 제안했다. 광고 애플리케이션이 사람이 매장의 창문에 접근하는 것을 인식하거나 플랫폼을 학습시켜 관련된 광고를 표시하도록 할 수 있다(향수냐 아니면 남성용 속옷이냐). 또한 이것은 시각적 관심과 집착 시간을 측정해 광고 기업이 관심을 끄는데 실패했는지 여부를 파악할 수 있다. 
 
또한 한 기업이 운전자의 스트레스 또는 집중력 저하를 인식하는 자동차용 애플리케이션으로 실험을 진행하고 있다. 운전자의 연령을 확인하고 위험한 경우에는 자동차를 '안전 모드'로 진입시키는 상황을 상상해 보자. 해당 소프트웨어를 보안을 위한 단기적인 익명 저장소로 활용할 수도 있다. 왜냐하면 하나의 얼굴이 여러 번 인식되고 재 수집될 수 있기 때문이다(스토커? 그런 말은 안 했다).
 
두뇌의 능력 측정 기기
오스트리아의 구거 테크놀로지스(Guger Technologies)는 EKG에 연결된 샤워용 모자처럼 보이는 간단한 장치를 시연했다. 하지만 이것은 '우리가 이것으로 무엇을 할 수 있을까'의 수준을 벗어난 전시품이었다. 이것은 매우 정밀한 두뇌 스캔을 통해 뇌졸중을 겪고 난 사람의 회복 과정을 측정하도록 고안됐다.
 
BNCI(Brain-neural Computer Interface)를 사용하는 관련 기술을 통해 ALS 또는 기타 신체적 장애가 있는 사람이 화면을 쳐다보는 것만으로 "그림을 그릴 수 있다." 또한 개인용 EEG 기반 철자작성 시스템이 있어 환자가 글쓰기, 의사소통, 제어를 할 수도 있다. 이것은 환자의 간병인이 집에서 설치하고 운용할 수 있도록 고안됐다. 그리고 확실하지는 않지만 당시에 대여 또는 구매가 가능한 것 같았다. 
 
사용자는 대상을 수 초 동안 응시해 화면 상의 키보드 같은 매트릭스로부터 문자를 순차적으로 선택할 수 있다. 대부분의 환자들은 10분이면 그 사용법을 학습할 수 있다고 한다.
 
이 백 홈(Back Home) 프로젝트의 주된 목적은 뇌 손상 또는 질병으로 인해 거동 장애가 있는 사용자들이 간병인의 도움 없이는 할 수 없는 일들을 할 수 있도록 하는데 도움을 주기 위한 것이다. 해당 인터페이스는 두뇌의 전기 생리학적 신호를 포함해 환자의 자발적인 전기 생리학적 반응을 일상적인 활동을 용이하게 하는 애플리케이션과 연결시킨다. 
 
현재 우리가 할 수 있는 일들 가운데 많은 부분을 웹을 통해 할 수 있기 때문에 키 입력 또는 물리적 상호작용을 없애는 인터페이스는 신의 선물과도 같다고 할 수 있다.
 
구글 지도와 연동된 자전거 업힐
그렇게 대단하지는 않지만 그렇다고 너무 시시하지도 않은 프로젝트로 분산형 인공지능 연구소(Distributed Artificial Intelligence Laboratory)의 'CLOG(Clever LOGging of Activities)' 프로젝트가 있었다. 자전거 한 대가 일반적인 스마트폰을 통해 구글 어스(Google Earth) 지도와 연동되어 있었다. 
 
구글 지도와 연동되는 운동용 자전거는 별로 새로울 것이 없고, 직접 만드는 것도 가능하다. 지도 데이터 상으로 업힐 구간이 등장하면 페달링이 더욱 힘들어지고 소모된 칼로리가 표시된다.
 
이것은 하나의 시연에 불과하다. CLOG는 일상적인 움직임 또는 집중적인 운동 등 인간의 활동을 추적하는 모바일 애플리케이션이다. 해당 소프트웨어는 스마트폰의 내장 센서와 무선 센서로부터 데이터를 수집하고 운동을 추적 및 최적화하며 목표를 정의하고 동적 히트맵, 차트, 또는 실시간 위젯으로 활동 이력을 확인할 수 있다고 연구원들은 설명했다. 
 
CLOG는 다른 서비스의 센서 데이터와의 데이터 동기화를 위한 CHM(Common Health Model) 백엔드에 연결할 수 있다.
 
완벽한 쇼핑을 위한 증강 쇼핑
모든 연구 프로젝트가 대학에서만 진행되는 것은 아니다. 놀랄만한 프로젝트 가운데에는 IBM 리서치(IBM Research)가 진행하고 있는 증강 쇼핑(Augmented Shopping)도 있었다(동영상).


 
자신이 라벨을 반드시 확인하거나 구매 전에 제품을 비교하는 사람이라면 이 작업이 얼마나 많은 시간을 소요하는지 잘 알고 있을 것이다.

글루텐이 포함되어 있지 않고 쌀이 들어있는 시리얼일까? 채식주의자용 상품인가? 탄수화물 함량이 가장 낮은 것은 무엇일까? 단위 무게당 가장 저렴한 것은 무엇일까?

이스라엘 하이파에 위치한 IBM 리서치가 개발한 IBM 증강 쇼핑 앱은 매장 진열대의 사진을 찍고 이미지에 필터를 적용해 가격이나 영양 등 관련된 특성에 따라 제품을 분류한다.
포장 상자의 QR 코드 리더를 갖다 댈 필요가 없으며, 해당 앱은 진열된 모든 제품의 이미지를 분석하고 자동으로 데이터베이스 검색을 실시한다. 당연히 클라우드(Cloud)를 활용한다. 스마트폰을 들고 재료별로 결과를 정렬한 후 '땅콩 없음' 등의 조건에 해당하는 제품을 고르면 된다.
 
이 연구는 곧 상용화될 것으로 보인다. 해당 앱을 개발한 IBM의 아몬 리박은 영국의 한 식료품 체인이 몇몇 매장에서 해당 앱의 맞춤형 버전을 시험하기 위해 준비 중이라고 밝혔다. 가까운 상점이나 온라인에서 더욱 저렴한 제품을 찾는데 도움이 되는 앱이 넘쳐나는 상황에서 이런 방법은 소매매장의 회원제 프로그램을 향상시키는데 도움이 된다.
 
우리는 기술, 혁신의 종말, 기타 문제 등에 대해 투덜댈 때, 똑똑한 사람들이 여전히 삶의 질을 향상시키기 위해 컴퓨터를 사용하고 있음을 기억해야 할 것이다. editor@itworld.co.kr

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.