2018.11.23

백업 전쟁에서 디스크 백업이 테이프 백업을 이긴 이유

W. Curtis Preston | Network World
스토리지 기술로서 테이프와 디스크는 각각의 장단점을 가지고 있다. 하지만 백업 전쟁에서는 디스크가 이겼는데, 이유는 한 마디로 테이프는 빠르고 디스크는 즉각적이기 때문이다.

어떤 백업 전문가라도 벌써 오래 전부터 우선적인 백업용 스토리지를 디스크로 전환했다. 물론 테이프는 여전히 장기 보관용 스토리지로 사용되고 있으며, 거기에는 충분한 이유가 있다. 하지만 테이프는 매일 매일의 운영 백업과 복구용으로는 적지 않은 문제가 있다.

운영 백업과 복구용으로 디스크가 테이프를 완전히 대체한 근본적인 이유는 두 가지로 요약할 수 있는데, 무작위 액세스(Random Access)와 다중 동시 작업이 그것이다.



디스크는 무작위 액세스가 장정
디스크와 테이프를 비교할 때 어떤 경우에도 디스크가 테이프를 앞서는 부분이 바로 무작위 액세스이다. 테이프는 연속 액세스 디바이스이다. 처음에는 테이프의 이런 특징이 장점으로 보인다. 백업은 보통 이런 연속 액세스 디바이스에 너무나도 잘 어울리는 데이터 스트림을 생성하는 프로세스이기 때문이다. 하지만 이런 백업 스트림의 문제는 최신 스트리밍 테이프 드라이브에는 너무 느리다는 것이다. 반면에 무작위 액세스 디바이스는 더 느린 스트림을 쉽게 처리할 수 있다. 데이터를 기록하는 중에 잠깐 멈췄다가 다시 한 덩어리를 데이터를 기록하면 되고, 이 과정에서 성능 손실은 없다. 복구 과정의 이점도 마찬가지다.

다중 동시 작업
테이프 드라이브는 하나의 읽기/쓰기 헤드가 있어서 한 번에 한 블록의 데이터를 기록할 수 있다. 디스크 드라이브는 여러 개의 읽기/쓰기 헤드가 있어서 동시에 여러 데이터 스트림을 기록할 수 있다. 이런 특징이 무작위 액세스 역량과 결합하면, 디스크는 실제로 동시에 수십 건의 쓰기 동작을 서로 다른 속도로 처리할 수 있다. 당연히 이 과정에서 성능 손실도 없다. 마치 접시돌리기 공연자가 혼자서 열 개가 넘는 접시를 동시에 돌리는 것과 같다. 디스크 드라이브는 본질적으로 이렇게 동작한다. 수많은 백업 요청을 동시에 받아서 각각을 충분히 빠른 속도로 기록해 각 백업 관점에서는 디스크가 서비스하는 수많은 백업 작업 중 하나일 뿐이라는 것을 느끼지 못한다.

테이프가 할 수 없는 것
중복제거는 흥미로운 기술로, 디스크에 필요한 기술이자 디스크라서 가능한 기술이다. 중복제거는 디스크 기반 백업에 필수적인데, 디스크는 테이프보다 훨씬 비싸기 때문이다. 동시에 중복제거는 디스크에서 훨씬 더 구현하기 좋은 기술로, 디스크가 중복제거 개념을 가능하게 했다고 해도 과언이 아니다.

중복제거는 디스크 비용 절감 이상의 효과를 가져다준다. 중복제거가 없이 오프사이트 백업을 하려면, 테이프를 가득 담은 상자를 화물차 운전자에게 건내주는 것밖에는 방법이 없다. 하지만 중복제거는 특정 백업 이후에 디스크에 기록해야만 하는 데이터의 양을 줄여주기 때문에 백업을 WAN 접속을 통해 원격지로 전송할 수 있다. 어떤 기업은 중복제거 기반의 백업 대상으로 백업을 한 다음 이를 비슷한 백업 대상 오프사이트로 복제하는 방법을 사용한다. 그렇지 않으면, 소스 기반의 중복제거를 사용해 백업을 인터넷으로 백업을 직접 서비스 업체에 전송하기도 한다. 중요한 것은 중복제거를 통해 백업의 전자적인 전송을 자동화할 수 있다는 것이다.

백업을 중복제거해 물리적으로 떨어진 위치에 전송할 수 있다면, 이들 백업을 사용해 재해 시에 활성화할 수 있는 사본을 자동으로 생성할 수 있다. 디스크와 중복제거, 백업의 전자적인 전송이 없다면, 버튼 하나만 눌러 데이터센터를 넘겨줄 수 있는 클라우드 기반의 DR을 지원하는 것은 불가능하다. 현재는 이런 것이 많은 백업 시스템에서 비교적 쉽게 구현할 수 있다.

디스크와 같은 무작위 액세스 디바이스는 또한 실시간 복구 개념도 지원한다. 필요에 따라 백업에서 직접 가상머신을 구동할 수 있다. 전체적인 시스템의 재해 상태를 선언할 필요가 없을 때, 아니면 그저 VM의 구 버전에 액세스할 필요가 있을 때 이용할 수 있다. 즉각적인 복구라는 아이디어는 이런 것을 가능하게 한다. 물론 오늘날 즉각 복구를 지원하는 제품들이 한 번에 소수의 VM만 지원하는 한계가 있지만, 테이프에서는 아예 가능하지 않은 개념이다.

모든 백업을 중앙 시설에 저장해 놓고 임의로 액세스하는 개념도 이런 백업으로 가능해진 부가적인 가치이다. 예를 들어, 일부 시스템은 백업에 대한 가동 중의 분석을 지원해 랜섬웨어와 같은 특정 트렌드를 찾아낸다. 만약 랜섬웨어가 탐지되면, 다른 백업본에 영향을 미치지 않고 감염된 백업만 삭제할 수 있다.

디스크의 압도적인 승리
테이프는 장기적인 저장과 아카이브 영역을 계속 지배하겠지만, 이제 대부분의 백업 환경에서 테이프 사용을 정당화하기는 점점 어려워지고 있다.

디스크는 좀 더 비쌀지 모르지만, 확실히 더 다재다능하다. 다양한 속도의 다중 동시 백업을 지원하고, 물리적인 운송없이 백업을 다른 지역으로 전송하며, 클라우드 기반의 재해복구, 즉각적인 VM 복구 등 무수히 많은 이점을 제공한다. 테이프가 사라지지는 않겠지만, 운영 백업 및 복구 영역으로 귀환하기는 어려울 것이다.  editor@itworld.co.kr


2018.11.23

백업 전쟁에서 디스크 백업이 테이프 백업을 이긴 이유

W. Curtis Preston | Network World
스토리지 기술로서 테이프와 디스크는 각각의 장단점을 가지고 있다. 하지만 백업 전쟁에서는 디스크가 이겼는데, 이유는 한 마디로 테이프는 빠르고 디스크는 즉각적이기 때문이다.

어떤 백업 전문가라도 벌써 오래 전부터 우선적인 백업용 스토리지를 디스크로 전환했다. 물론 테이프는 여전히 장기 보관용 스토리지로 사용되고 있으며, 거기에는 충분한 이유가 있다. 하지만 테이프는 매일 매일의 운영 백업과 복구용으로는 적지 않은 문제가 있다.

운영 백업과 복구용으로 디스크가 테이프를 완전히 대체한 근본적인 이유는 두 가지로 요약할 수 있는데, 무작위 액세스(Random Access)와 다중 동시 작업이 그것이다.



디스크는 무작위 액세스가 장정
디스크와 테이프를 비교할 때 어떤 경우에도 디스크가 테이프를 앞서는 부분이 바로 무작위 액세스이다. 테이프는 연속 액세스 디바이스이다. 처음에는 테이프의 이런 특징이 장점으로 보인다. 백업은 보통 이런 연속 액세스 디바이스에 너무나도 잘 어울리는 데이터 스트림을 생성하는 프로세스이기 때문이다. 하지만 이런 백업 스트림의 문제는 최신 스트리밍 테이프 드라이브에는 너무 느리다는 것이다. 반면에 무작위 액세스 디바이스는 더 느린 스트림을 쉽게 처리할 수 있다. 데이터를 기록하는 중에 잠깐 멈췄다가 다시 한 덩어리를 데이터를 기록하면 되고, 이 과정에서 성능 손실은 없다. 복구 과정의 이점도 마찬가지다.

다중 동시 작업
테이프 드라이브는 하나의 읽기/쓰기 헤드가 있어서 한 번에 한 블록의 데이터를 기록할 수 있다. 디스크 드라이브는 여러 개의 읽기/쓰기 헤드가 있어서 동시에 여러 데이터 스트림을 기록할 수 있다. 이런 특징이 무작위 액세스 역량과 결합하면, 디스크는 실제로 동시에 수십 건의 쓰기 동작을 서로 다른 속도로 처리할 수 있다. 당연히 이 과정에서 성능 손실도 없다. 마치 접시돌리기 공연자가 혼자서 열 개가 넘는 접시를 동시에 돌리는 것과 같다. 디스크 드라이브는 본질적으로 이렇게 동작한다. 수많은 백업 요청을 동시에 받아서 각각을 충분히 빠른 속도로 기록해 각 백업 관점에서는 디스크가 서비스하는 수많은 백업 작업 중 하나일 뿐이라는 것을 느끼지 못한다.

테이프가 할 수 없는 것
중복제거는 흥미로운 기술로, 디스크에 필요한 기술이자 디스크라서 가능한 기술이다. 중복제거는 디스크 기반 백업에 필수적인데, 디스크는 테이프보다 훨씬 비싸기 때문이다. 동시에 중복제거는 디스크에서 훨씬 더 구현하기 좋은 기술로, 디스크가 중복제거 개념을 가능하게 했다고 해도 과언이 아니다.

중복제거는 디스크 비용 절감 이상의 효과를 가져다준다. 중복제거가 없이 오프사이트 백업을 하려면, 테이프를 가득 담은 상자를 화물차 운전자에게 건내주는 것밖에는 방법이 없다. 하지만 중복제거는 특정 백업 이후에 디스크에 기록해야만 하는 데이터의 양을 줄여주기 때문에 백업을 WAN 접속을 통해 원격지로 전송할 수 있다. 어떤 기업은 중복제거 기반의 백업 대상으로 백업을 한 다음 이를 비슷한 백업 대상 오프사이트로 복제하는 방법을 사용한다. 그렇지 않으면, 소스 기반의 중복제거를 사용해 백업을 인터넷으로 백업을 직접 서비스 업체에 전송하기도 한다. 중요한 것은 중복제거를 통해 백업의 전자적인 전송을 자동화할 수 있다는 것이다.

백업을 중복제거해 물리적으로 떨어진 위치에 전송할 수 있다면, 이들 백업을 사용해 재해 시에 활성화할 수 있는 사본을 자동으로 생성할 수 있다. 디스크와 중복제거, 백업의 전자적인 전송이 없다면, 버튼 하나만 눌러 데이터센터를 넘겨줄 수 있는 클라우드 기반의 DR을 지원하는 것은 불가능하다. 현재는 이런 것이 많은 백업 시스템에서 비교적 쉽게 구현할 수 있다.

디스크와 같은 무작위 액세스 디바이스는 또한 실시간 복구 개념도 지원한다. 필요에 따라 백업에서 직접 가상머신을 구동할 수 있다. 전체적인 시스템의 재해 상태를 선언할 필요가 없을 때, 아니면 그저 VM의 구 버전에 액세스할 필요가 있을 때 이용할 수 있다. 즉각적인 복구라는 아이디어는 이런 것을 가능하게 한다. 물론 오늘날 즉각 복구를 지원하는 제품들이 한 번에 소수의 VM만 지원하는 한계가 있지만, 테이프에서는 아예 가능하지 않은 개념이다.

모든 백업을 중앙 시설에 저장해 놓고 임의로 액세스하는 개념도 이런 백업으로 가능해진 부가적인 가치이다. 예를 들어, 일부 시스템은 백업에 대한 가동 중의 분석을 지원해 랜섬웨어와 같은 특정 트렌드를 찾아낸다. 만약 랜섬웨어가 탐지되면, 다른 백업본에 영향을 미치지 않고 감염된 백업만 삭제할 수 있다.

디스크의 압도적인 승리
테이프는 장기적인 저장과 아카이브 영역을 계속 지배하겠지만, 이제 대부분의 백업 환경에서 테이프 사용을 정당화하기는 점점 어려워지고 있다.

디스크는 좀 더 비쌀지 모르지만, 확실히 더 다재다능하다. 다양한 속도의 다중 동시 백업을 지원하고, 물리적인 운송없이 백업을 다른 지역으로 전송하며, 클라우드 기반의 재해복구, 즉각적인 VM 복구 등 무수히 많은 이점을 제공한다. 테이프가 사라지지는 않겠지만, 운영 백업 및 복구 영역으로 귀환하기는 어려울 것이다.  editor@itworld.co.kr


X