스토리지

"테이프가 전부가 아니야" 데이터 아카이빙 방법 3가지

W. Curtis Preston | Network World 2022.06.23
장기 스토리지(아카이빙)는 처리량과 중복 제거가 주요 관심사인 백업 및 복구와는 완전히 다른 방식으로 접근해야 한다. 아카이빙은 데이터를 훼손하지 않고 장기간 저장하는 것이 가장 중요하다. 즉, 10년이나 20년이 지난 후 데이터를 회수했을 때 저장 당시의 상태를 그대로 유지해야 한다.
 
ⓒ Getty Images Bank

데이터가 일정 규모에 도달한 대부분 기업은 리니어 테이프 오픈(Linear Tape Open)(LTO) 자기 테이프를 선택하는 것이 이상적이다. 반면, 이런 지출을 용납할 수 없거나 테이프는 이제 과거의 유물이라고 믿는 기업이라면 다른 대안이 필요하다. 이런 기업이 생각할 수 있는 것이 3가지다. 클라우드 내 오브젝트 스토리지, 온프레미스 디스크 스토리지 그리고 광학 매체다.
 

클라우드 내 아카이빙

오브젝트 스토리지는 특별히 장기 스토리지용으로 설계됐다. 각 객체를 파악하는 용도로 사용하는 체크섬을 해당 객체의 내용이 변하지 않았음을 검증하는 용도로도 사용할 수 있다. 시스템이 체크섬을 재실행한 후 이를 객체의 고유 식별자(UID)로 사용하는 이전 체크섬과 대조하면 된다. 따라서, 저장된 지 수십 년이 지난 데이터도 무결성을 지속해서 검증할 수 있다.

비용도 저렴하다. AWS, 애저(Azure), 구글(Google)은 모두 월 100달러 정도면 100TB 데이터를 클라우드 스토리지에 저장할 수 있다. 스토리지 제공업체를 2곳 이용하면 사본 2개를 월 200달러에 정도에 보관할 수 있다. 데이터를 업로드만 하고 다운로드는 전혀 하지 않는다고 가정하면 매우 비용 효과적이다.

만일 데이터를 다운로드할 필요가 생긴다면 비용이 상당하겠지만 비상상황이므로 그만한 가치가 있을 것이다. 단, 유의할 점은 각 객체당 다운로드 수수료와 기가바이트 당 대역폭 요금을 따로 내야 한다는 사실이다. 아카이브는 데이터를 장기간 저장한다는 가정하에 가격이 책정되므로 조기에 삭제할 때도 별도의 수수료를 내야 할 수 있다. 실제로 데이터를 회수하면 얼마를 내야 하는지 확인해야 한다.
 

온프레미스 디스크 드라이브

아카이브용으로 사용할 온프레미스 디스크의 선택지는 일반 디스크 어레이, 중복 제거된 디스크 타깃, 온프레미스 객체 스토리지 등 3가지다. 일반 디스크 어레이와 네트워크 연결 스토리지 시스템은 1차 데이터용으로 만들어져 가격이 상대적으로 비싸다. 따라서, 대부분 환경에서 장기 스토리지용으로는 비용이 너무 높을 수 있다.

백업본이라면 중복 제거된 디스크 시스템을 사용해 비용을 절감할 수 있지만, 장기 스토리지는 이와 상황이 다르다. 시간이 지나면 중복 제거 시스템에 완전히 새로운 데이터를 저장하게 되고 중복 제거 비율이 급락한다. 따라서, 일반 디스크 시스템보다 타깃 디스크 시스템의 비용이 커진다. 데이터의 속성으로 인해 실제와 다른 중복 제거 비율에 대한 추가     
비용을 내야 하기 때문이다.

일반 디스크 시스템과 중복 제거 디스크 시스템은 둘 다 디스크의 데이터 장기 저장 기능도 그리 신통치 않다. 5년이 지난 데이터는 손상되어 비트 부패가 생긴다. 이런 우려가 크다면 온프레미스 객체 스토리지 시스템이 대안이다. 클라우드 내 객체 스토리지와 마찬가지로 지속해서 각 시스템의 데이터 무결성을 확인한 후 손상된 데이터를 다른 디스크 시스템 내에 저장된 정상 데이터로 대체한다. 그러나 디스크는 그 비용이 클라우드 내 콜드 스토리지를 사용하는 것보다 여전히 비싸다. 정리하면 종류를 막론하고 디스크는 아카이빙용으로 최고의 선택지가 아니다.
 

광학 디스크

광학 디스크의 선택지는 일반 DVD와 블루레이 기록용 디스크, 아카이브급 DVD-R, M-디스크 등 3가지다.

DVD와 블루레이 디스크는 레이저가 닿으면 위상이 변하는 유기 금형을 사용한다. DVD와 블루레이에 기록된 데이터는 수십 년 동안 문제없다. 아카이브급 DVD-R은 이중 반사층과 추가 하드 코팅을 사용해 긁힘을 방지한다. 대신 가격이 DVD-R의 10배다. M-디스크는 특별히 장기 스토리지용으로 설계된 제품으로 100년 지속되도록 설계된 무기층을 사용한다. 가격은 높지만 기가바이트 당 아카이브급 DVD-R 비용의 약 25% 수준이다. 대부분 최신 광학 드라이브는 이 3종류의 매체에 모두 데이터를 기록할 수 있다.

DVD 디스크는 용량이 5GB 이하로 매우 작다. 블루레이 디스크의 용량은 25GB 또는 양면 디스크의 경우 50GB이다. M-디스크는 25GB, 50GB, 100GB짜리가 있다. 이들 기기는 테이프나 디스크에 비해 데이터 저장 속도가 매우 느리다. 물리적 매체에 위상 변화를 수행하는 과정이 느리기 때문이다.

또 한 가지 알아둬야 할 것은 광학 매체는 무보정 비트 오류율(UBER)이 매우 낮다는 점이다. 대부분 10-10이지만 10-8 정도로 낮은 것도 있다. 직렬 ATA(SATA) 디스크의 UBER는 10-14이고 LTO-9 테이프는 10-19이다. 이는 광학 매체가 SATA 디스크나 테이프에 비해 데이터 기록의 안정성이 떨어진다는 의미다.

미디어와 엔터테인먼트 기업 중에는 이런 매체를 활용해 영화를 LTO 사본 외에도 장기 스토리지 사본으로도 제작하는 기업이 종종 있다. 블루레이 디스크가 LTO 테이프보다 50년 후에 읽기 더 쉬울 것으로 보기 때문이다. 또 하나의 장점은 최신 블루레이 기기로 가장 오래된 CD와 DVD까지 읽을 수 있다는 것이다. 대개 한두 세대 이전 것만 읽을 수 있는 일반 테이프 드라이브에 비해 하위 호환성이 훨씬 뛰어나다.

광학 매체를 장기 스토리지로 사용하려는 기업은 광학 라이브러리를 검토할 필요가 있다. 광학 라이브러리는 테이프 라이브러리와 같지만 테이프 드라이브 대신 광학 드라이브를 쓴다. 또한 수작업 없이 장기간 저장할 수 있는 스토리지를 거의 무한정 제공한다.

정리하면, 아카이브는 수십 년 동안 보관할 데이터를 저장한다. 따라서 시간을 들여 꼼꼼하게 검토해야 한다. 방법마다 세부 내용을 파악하고 충분히 정보를 찾아본 후 결정해야 한다.
editor@itworld.co.kr

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.