구글도 못 찾는 5가지 콘텐츠

John Brandon | Network World 2009.02.24

AP6028.JPG구글은 세상의 모든 것을 웹으로 검색할 수 있도록 하는 미션을 가지고 있다. 그리고 현재 어느 업체보다도 가장 잘 해내고 있는데, 하지만 그 중에서도 구글이 찾아내지 못하는 것들이 있어 정리해 보았다.

 

1. 이미지

 

만일 사진을 올리고 태그를 단다면, 구글이 해당 이미지를 찾을 수 있다. 하지만 어떤 메타데이터 텍스트도 넣지 않은 채 웹에 올려 놓으면, 구글이 찾아내지 못한다. 여기서 필요한 것은 이미지 인식 기술로, 현재 구글은 이 기술을 개발 중이다. 조지 부시 부자의 얼굴을 구별하는 안면 인식 시스템 등이 포함된다. 하지만 이미지 말고도 동영상이라는 커다란 산맥이 남아있기도 하다.

 

2. 공공 DB

 

구글은 여전히 생활 속의 소소한 내용까지 검색하지는 못한다. 예를 들면, 다음 비행기편은 도시명이나 비행기 번호 등으로 쉽게 찾을 수 있지만, 날씨 때문에 지연되는 일 등 공공 DB가 들어간 정보는 찾지 못한다. 또한 구글은 종종 경매 정보나 건강 기록 같은 정보도 찾지 못한다. 만일 찾더라도 충분히 자세하지 않으며, 일부 정보는 개인 DB에 들어가 잇기도 하다. 콕스믹스(Koxmix)라는 사이트가 이런 문제를 해결하기 위해서 노력 중이다.

 

3. 음성파일

 

이 부분에 대해서도 역시 연구 중인 구글은 아직까지 음성 검색을 하지 못한다. 녹음을 해서 웹에 올려도 태그를 넣지 않으면 찾을 수가 없다. 음성으로 컴퓨터를 제어하는 기술이 나오는 등, 음성 인식이 중요해 지는 만큼 음성 검색이 중요한 화두로 떠오르게 될 것이다.

 

4. 출력물

 

분명히, 출력물은 본래 웹 상에 존재하지 않았다. 하지만 매그클라우드(MagCloud)이나 지니오(Zinio)처럼 잡지를 디지털화해서 제공하는 사이트가 생겨나고 있다. 아직까지는 이런 잡지를 스캔해서 컴퓨터에 저장한다고 하더라도, 태그를 만들지 않는 이상 찾아볼 수가 없다.

 

5. 온라인 책

 

온라인 책 중 일부는 PDF 파일이고, 또 일부는 그렇지 않다. PDF 파일이 아닌 것들은 소니 리더로만 읽을 수 있는 등 독점적인 포맷이기 때문에 검색이 힘들다. 구글은 저작권 문제 때문에 books.google.com을 구축하는데 여러 가지 문제를 겪고 있다. editor@idg.co.kr

 

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.