구글, 랜드마크 이미지 검색 기술 공개

Jeff Bertolucci | PCWorld 2009.06.23

AP6D93.JPG사람들은 패턴 인식을 잘 하지만, 컴퓨터는 이미지를 구별해낼 만큼 똑똑하지 않다. 우리의 뇌는 자유의 여신상이나 만리장성 등을 사진으로 구별할 수 있지만, 컴퓨터는 태그가 없으면 알아내지 못한다.

 

그러나 구글의 컴퓨터 비전(computer vision)관련 검색 프로젝트의 결과가 나오면 이런 사람과 컴퓨터의 차이가 없어질 것으로 보인다. 구글은 22일 마이애미에서 열린 CVPR(Computer Vision and Pattern Recognition) 컨퍼런스에서 랜드마크 인식에 관한 보고서를 발표했다. 구글은 이 새로운 기술은 컴퓨터가 빨리 전 세계 5만개 이상의 랜드마크 이미지를 파악하도록 하며, 정확도는 80%라고 밝혓다.

 

구글은 이런 패턴 인식 기술이 아직 연구프로젝트이지 새로운 서비스는 아니라고 강조했다. 10번 중 8번 검색에 성공한다는 것은 아직 서비스될 단계는 아니이다. 그러나 이런 개념은 매우 멋지고 언젠가 구글이 정확도를 높여, 여행자들이 잘 이용하게 될 수도 있을 것으로 기대된다.

 

예를 들어, 스마트폰이나 인터넷이 가능한 카메라로 정체를 알 수 없는 랜드마크의 사진을 찍어 검색하는 기능은 아마 출시 즉시 큰 인기를 얻을 것으로 관측된다. 물론, 아직 아무도 생각해내지 못한 애플리케이션도 나올 수 있다.

 

구글 컴퓨터 비전 연구 책임자인 제이 야그닉은 블로그를 통해 이 랜드마크 인식 기술에 대해 설명했다. 먼저, 피카사 및 파노라미오(Panoramio) 등에서 가져온 GPS 태그가 들어있는 사진 4,000만 장과 가이드 웹페이지를 이용해 랜드마크 목록을 수집했다. 그 후에는 이런 자료와 구글 이미지 검색을 이용해서 각 랜드마크의 후보 이미지들을 찾고, 효율적인 이미지 매칭과 비감독 클러스터링 기술(unsupervised clustering techniques)를 이용해 불필요한 부분을 제거했다.

 

AP730A.JPG

 

마지막으로 빠른 이미지 인식을 위해 효율적인 인덱싱 시스템을 구축했다. 그러나 이 프로젝트의 현명함에도 불구하고 이미지 검색의 정확성은 여전히 불충분하다. 위 사진에서 볼 수 있는 것 처럼 관계없는 랜드마크가 비슷한 건축 양식을 가지고 있을 수 있고, 배너나 깃발 같은 것도 잘못 매치시킬 수 있다.

 

오늘날 태그에 전적으로 의존하고 있는 이미지 검색이 구글의 검색 프로젝트로 인해 향상됐으면 하는 것이 모든 이의 바램일 것이다. 다음 단계는 랜드마크 이미지가 아닌 셀수없는 이미지들을 구별하는 방법을 찾는 것인데, 이 일은 랜드마크 인식 보다 훨씬 더 힘든 일로 보인다. editor@idg.co.kr

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.