IT 관리 / 데이터ㆍ분석 / 스토리지

데이터 폭증에 대처하는 방법

Matt Prigge | InfoWorld 2014.08.26


2. 기술적 방법론

데이터가 나오는 근원에서 데이터를 억제하기 위해 할 수 있는 모든 일을 한 다음에는 스토리지 인프라 자체에 집중한다. 데이터를 가능한 가장 효율적인 방법으로 저장하기 위한 많은 새로운 기술들이 등장하고 있으니 필히 확인한다.

(1) 데이터 중복 제거

데이터 중복은 비효율성의 큰 요인이다. 중복 제거는 중복되는 파일을 찾아서 제거한다. 중복의 정도에 따라 다르지만 이를 통해 필요한 디스크 용량을 10:1 ~ 50:1 또는 그 이상까지 줄여준다. 이는 사용자들이 동일한 파일의 복사본을 여러 개 만드는 경향이 있는 부서 파일 공유와 같은 비구조적 데이터에 사용할 때 특히 효과적이다.

백업 시스템에서 파생되어 만들어진 중복 제거 기술은 주 스토리지 시장으로 진출했다. 윈도우 서버 2012를 포함한 많은 최신 OS가 중복 제거를 기본 기능으로 내장하고 있으므로 간편히 사용할 수 있다.

(2) 데이터 구조화

데이터의 증가에 대처하는 방법 중 하나는 바로 새로운 ‘틀’을 구축하는 것이다. 이메일의 예를 를 살펴보자. 이메일 아카이빙 소프트웨어는 이메일 데이터베이스에서 첨부파일을 분리한 다음, ‘싱글 인스턴스 스토리지(single-instance storage)’ 기술을 통해 이를 이메일 인프라 밖으로 분리한다. 싱글 인스턴스 스토리지는 동일한 파일이 여러 개 존재하는 경우, 단 하나의 파일만을 백업하는 것으로 저장공간을 최소화한다.

이메일 이외에도 단순히 정보 관리 솔루션을 적용하는 것만으로도 기업 데이터의 생성 및 저장 작업을 크게 향상시킬 수 있다. 일례로, 쉐어포인트(SharePoint)와 같은 정보 관리 시스템은 파일 공유 방식을 제어하기 어려웠던 기존의 시스템에 비해 데이터가 중복 생성되는 상황을 줄일 수 있다. 또한, 데이터에 대한 저장 및 삭제를 결정하기 위해 필요한 다양한 메타데이터를 수집하는 기능도 한다.

(3) 데이터주기 관리

모든 스토리지 인프라 관리에 있어 가장 어려운 문제 가운데 하나로 꼽히는 것이 바로 ‘데이터가 저장되고 삭제되는’ 스케줄을 구성하는 ‘데이터주기 관리’다.

데이터를 삭제하는 것을 즐기는 이는 없다. 데이터를 삭제하는 것 자체가 꺼림칙하기 때문이다. 그 모든 데이터를 생성하는데 들어간 노력과 비용, 그리고 이를 자칫하면 다시 반복해야 한다는 생각을 하면 데이터를 지우고 싶은 생각이 쉽사리 들지는 않을 것이다.

그렇기 때문에 데이터 삭제를 규정한 매뉴얼을 만들 때는 세심한 고려가 필요하다. 단순히 일정 기간이 지나면 무조건 삭제하도록 규정하는 것이 편할 수는 있겠지만 이는 그다지 현명한 선택이 아니다. 데이터 삭제를 결정하기 위해서는 우선, 데이터의 목표와 용도를 명시한 메타데이터가 필요하다. 그리고 이러한 메타데이터를 구성하기 위해서 필요한 것이 바로 앞서 말한 데이터 구조화 작업이다.

맺는 말

데이터 폭증에 대처하기 위해서는 문제를 끊임없이 주시하며 데이터 양을 일정 수준에서 유지하는 자세가 필요하다. 비기술적, 기술적 접근 방식을 동원해 사용자에게 데이터 관리에 대한 개념을 교육하는 동시에 스토리지 효율성을 제고해야 한다. 데이터는 눈덩이처럼 불어나기 때문에 스토리지 관리 시작은 빠르면 빠를수록 좋다. editor@itworld.co.kr 

Sponsored

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.