2018.10.23

“테이프 vs. 디스크 스토리지” 테이프 백업이 아직 죽지 않은 이유

W. Curtis Preston | Network World
디스크 스토리지의 인기에도 불구하고 테이프에 기록되는 데이터의 양이 지금도 계속 증가하고 있다고 하면 아마 놀랄 사람이 꽤 될 것이다. 예를 들어 2017년 출하된 LTO 테이프의 용량은 100만 페타바이트에 이른다. 2008년과 비교하면 5배 더 늘어난 양이다. 이 시기는 테이프를 사용하지 않는 백업 및 복구 시스템이 표준으로 부상한 시기다. 필자가 아는 모든 백업 전문가는 백업 및 복구를 위한 주 타겟으로 디스크를 권장한다.

Image Credit : GettyImagesBank

그렇다면 출하되는 테이프의 양이 증가 중이라는 사실을 어떻게 설명해야 할까? 그 의문에 대한 답은 다소 뜻밖이다. 일단 테이프의 장단점부터 짚고 넘어가자.

테이프는 디스크보다 싸다
중복 제거 기술(주로 디스크에 사용됨)의 발전에도 불구하고 기가바이트당 비용을 따지면 여전히 테이프가 디스크보다 저렴하다. 여기에는 몇 가지 이유가 있다. 테이프의 경우 매체와 기록 디바이스를 분리할 수 있으므로 소수의 테이프 드라이브를 구매해서 수천 개의 테이프를 사용할 수 있다. 또한 이 수천 개의 테이프에 데이터를 보관하는 데는 전력이나 냉방도 필요 없다. 디스크가 공짜라 해도 전력과 냉방 비용을 감안하면 여전히 테이프보다 많은 돈이 들어간다는 이야기가 있을 정도다. 테이프가 다른 저장 매체보다 저렴하다는 사실은 테이프가 아직 건재한 가장 큰 이유다.

테이프는 데이터 쓰기 작업에 더 우수
스토리지에 비트를 쓸 때 복구 불가능한 비트 오류가 발생하는 경우가 있다. 복구 불가 비트 오류는 디바이스가 0 대신 1, 또는 그 반대로 비트를 저장하고 이것이 오류 교정을 통해 수정되지 않는 경우를 의미한다. 많은 사람들이 테이프에 대해 잘 모르는 점은 다른 어떤 기록 매체보다 비트 오류율이 우수하다는 사실이다.

LTO-7/8과 오라클 T10000 테이프 드라이브의 복구 불가 비트 오류율은 모두 1:1019인데, 환산하면 대략 1.25EB당 1개의 오류에 해당된다. 엔터프라이즈급 디스크 드라이브의 오류율은 1:1015로, 125TB당 1개의 오류에 해당된다. 즉, 0과 1을 쓰는 데 있어 테이프가 최고급 디스크 드라이브에 비해 1000배 더 우수하다는 의미하다. 참고로 SSD의 오류율은 1:1016 ~ 1:1018이므로 테이프의 데이터 쓰기는 SSD보다도 10배 더 우수하다. 더 높은 수준에서의 데이터 검사를 통해 디스크와 테이프 사이의 간격을 줄일 수 있지만, 데이터 쓰기에 관한한 테이프가 디스크보다 더 우수하다는 사실에는 변함이 없다.

테이프는 데이터 유지에 더 우수
테이프에 관한 가장 흔한 오해는 데이터 유지 능력이다. 데이터 유지는 기초적인 기록 물리학의 문제다. 모든 마그네틱 비트는 시간이 지나면 약화된다. 따라서 관건은 그 약화가 일어나는 시점이다. 스토리지 기술을 잘 아는 사람들은 시간 경과에 따른 마그네틱 비트의 위치 변화를 방지하는 “차단 에너지(blocking energy)”라는 것을 종종 언급한다. 공식으로는 KuV/kt로 표현된다. 여기서 주목해야 할 두 가지 값은 마그네틱 입자의 용적(V)과 이 입자가 저장되는 온도(k)다. 마그네틱 입자가 크고 저장되는 온도가 낮을수록 좋다.

테이프 드라이브의 마그네틱 입자는 디스크에 비해 훨씬 더 크며, 테이프는 상온에서 보관된다. 디스크 드라이브의 마그네틱 입자는 훨씬 더 작고, 일반적으로 테이프가 보관되는 온도에 비해 훨씬 더 높은 온도에서 지속적으로 작동된다. 결과적으로 테이프의 차단 에너지가 디스크 드라이브보다 훨씬 더 크고 훨씬 더 오랜 기간 동안 데이터를 보존할 수 있다. 디스크 드라이브에 5년 이상 데이터를 저장하지 말라는 말이 있는데, 테이프에는 같은 파일을 최대 30년까지 보관할 수 있다.

단점 하나. 랜덤 액세스 시간
요즘 사람들은 타임 머신, 지속적 데이터 보호 등의 기술을 통해 매우 빠르게 데이터를 복원하는 데 익숙하다. 모두 테이프에 비해 현저히 더 낮은 디스크의 랜덤 액세스 시간 덕분이다. 데이터의 첫 블록을 찾는 시간은 디스크가 테이프에 비해 1000배 더 빠르다. 테이프를 사용하는 방법에 따라 다르지만 복원 시간은 디스크에 비해 1분 더 길 수도 있고 몇 시간 더 길 수도 있다. 백업 소프트웨어가 복원 중 탐색을 많이 하는 경우 테이프의 긴 액세스 시간이 몹시 답답하게 느껴질 것이다.

단점 둘. 속도 일치
테이프의 가장 큰 문제는 대부분의 경우 백업 속도와 보조를 맞추지 못한다는 점이다. 사실 테이프는 너무 빠르다. 표준 LTO-8 테이프 스토리지 기술의 압축 전송률은 초당 750MB다. 테이프는 이 속도를 유지하는 데는 뛰어나지만 이보다 낮은 속도로 작동하는 데는 젬병이다. 문제는 대부분의 백업이 증분 백업이고 증분 백업 속도는 초당 몇 MB이며 이 속도는 테이프와 맞지 않는다는 점이다.

디스크는 초당 몇 MB의 속도(필요한 경우 초당 몇 KB도 가능)로 작동할 수 있을 뿐만 아니라, 이 속도로 수백 개의 백업을 동시에 실행하면서 각 백업을 별도의 위치에 저장할 수 있다. 테이프에서는 불가능하다. 이 점이 디스크가 테이프보다 백업에서 훨씬 더 적합한 이유다.

그 많은 테이프는 누가 다 쓸까?
백업 시스템에 테이프를 사용하지 않는다면 그렇게 많이 출하되는 테이프를 도대체 누가 다 사용할까? 답은 바로 보조 스토리지다. 장기간 동안 안정적으로, 최대한 저렴하게 보관해야 하는 대량의 참조 데이터를 저장하기 위한 테이프 사용이 증가하고 있다. 랜덤 액세스 시간이 별로 중요하지 않은 대용량 파일을 다루는 엔터테인먼트, 바이오테크 분야의 기업들은 수천 개의 테이프로 방대한 테이프 라이브러리를 꽉꽉 채운다.

대부분의 사람들이 잘 모르는 사실은 클라우드 업체들 역시 같은 목적으로 테이프를 사용한다는 점이다. 저렴한 일부 스토리지 서비스의 액세스 시간이 무척 긴 이유가 무엇이라고 생각하는가? 자주 사용되지 않는 데이터를 장기간 안정적으로 저장하기 위해 백엔드에 테이프를 사용하기 때문이다. 많은 사람들이 미래로 여기는 기술이, 많은 사람들이 과거로 치부하는 기술을 기반으로 한다. 그러니 테이프가 죽었다는 말을 하기 전에 이 점을 잘 생각하기 바란다.  editor@itworld.co.kr


2018.10.23

“테이프 vs. 디스크 스토리지” 테이프 백업이 아직 죽지 않은 이유

W. Curtis Preston | Network World
디스크 스토리지의 인기에도 불구하고 테이프에 기록되는 데이터의 양이 지금도 계속 증가하고 있다고 하면 아마 놀랄 사람이 꽤 될 것이다. 예를 들어 2017년 출하된 LTO 테이프의 용량은 100만 페타바이트에 이른다. 2008년과 비교하면 5배 더 늘어난 양이다. 이 시기는 테이프를 사용하지 않는 백업 및 복구 시스템이 표준으로 부상한 시기다. 필자가 아는 모든 백업 전문가는 백업 및 복구를 위한 주 타겟으로 디스크를 권장한다.

Image Credit : GettyImagesBank

그렇다면 출하되는 테이프의 양이 증가 중이라는 사실을 어떻게 설명해야 할까? 그 의문에 대한 답은 다소 뜻밖이다. 일단 테이프의 장단점부터 짚고 넘어가자.

테이프는 디스크보다 싸다
중복 제거 기술(주로 디스크에 사용됨)의 발전에도 불구하고 기가바이트당 비용을 따지면 여전히 테이프가 디스크보다 저렴하다. 여기에는 몇 가지 이유가 있다. 테이프의 경우 매체와 기록 디바이스를 분리할 수 있으므로 소수의 테이프 드라이브를 구매해서 수천 개의 테이프를 사용할 수 있다. 또한 이 수천 개의 테이프에 데이터를 보관하는 데는 전력이나 냉방도 필요 없다. 디스크가 공짜라 해도 전력과 냉방 비용을 감안하면 여전히 테이프보다 많은 돈이 들어간다는 이야기가 있을 정도다. 테이프가 다른 저장 매체보다 저렴하다는 사실은 테이프가 아직 건재한 가장 큰 이유다.

테이프는 데이터 쓰기 작업에 더 우수
스토리지에 비트를 쓸 때 복구 불가능한 비트 오류가 발생하는 경우가 있다. 복구 불가 비트 오류는 디바이스가 0 대신 1, 또는 그 반대로 비트를 저장하고 이것이 오류 교정을 통해 수정되지 않는 경우를 의미한다. 많은 사람들이 테이프에 대해 잘 모르는 점은 다른 어떤 기록 매체보다 비트 오류율이 우수하다는 사실이다.

LTO-7/8과 오라클 T10000 테이프 드라이브의 복구 불가 비트 오류율은 모두 1:1019인데, 환산하면 대략 1.25EB당 1개의 오류에 해당된다. 엔터프라이즈급 디스크 드라이브의 오류율은 1:1015로, 125TB당 1개의 오류에 해당된다. 즉, 0과 1을 쓰는 데 있어 테이프가 최고급 디스크 드라이브에 비해 1000배 더 우수하다는 의미하다. 참고로 SSD의 오류율은 1:1016 ~ 1:1018이므로 테이프의 데이터 쓰기는 SSD보다도 10배 더 우수하다. 더 높은 수준에서의 데이터 검사를 통해 디스크와 테이프 사이의 간격을 줄일 수 있지만, 데이터 쓰기에 관한한 테이프가 디스크보다 더 우수하다는 사실에는 변함이 없다.

테이프는 데이터 유지에 더 우수
테이프에 관한 가장 흔한 오해는 데이터 유지 능력이다. 데이터 유지는 기초적인 기록 물리학의 문제다. 모든 마그네틱 비트는 시간이 지나면 약화된다. 따라서 관건은 그 약화가 일어나는 시점이다. 스토리지 기술을 잘 아는 사람들은 시간 경과에 따른 마그네틱 비트의 위치 변화를 방지하는 “차단 에너지(blocking energy)”라는 것을 종종 언급한다. 공식으로는 KuV/kt로 표현된다. 여기서 주목해야 할 두 가지 값은 마그네틱 입자의 용적(V)과 이 입자가 저장되는 온도(k)다. 마그네틱 입자가 크고 저장되는 온도가 낮을수록 좋다.

테이프 드라이브의 마그네틱 입자는 디스크에 비해 훨씬 더 크며, 테이프는 상온에서 보관된다. 디스크 드라이브의 마그네틱 입자는 훨씬 더 작고, 일반적으로 테이프가 보관되는 온도에 비해 훨씬 더 높은 온도에서 지속적으로 작동된다. 결과적으로 테이프의 차단 에너지가 디스크 드라이브보다 훨씬 더 크고 훨씬 더 오랜 기간 동안 데이터를 보존할 수 있다. 디스크 드라이브에 5년 이상 데이터를 저장하지 말라는 말이 있는데, 테이프에는 같은 파일을 최대 30년까지 보관할 수 있다.

단점 하나. 랜덤 액세스 시간
요즘 사람들은 타임 머신, 지속적 데이터 보호 등의 기술을 통해 매우 빠르게 데이터를 복원하는 데 익숙하다. 모두 테이프에 비해 현저히 더 낮은 디스크의 랜덤 액세스 시간 덕분이다. 데이터의 첫 블록을 찾는 시간은 디스크가 테이프에 비해 1000배 더 빠르다. 테이프를 사용하는 방법에 따라 다르지만 복원 시간은 디스크에 비해 1분 더 길 수도 있고 몇 시간 더 길 수도 있다. 백업 소프트웨어가 복원 중 탐색을 많이 하는 경우 테이프의 긴 액세스 시간이 몹시 답답하게 느껴질 것이다.

단점 둘. 속도 일치
테이프의 가장 큰 문제는 대부분의 경우 백업 속도와 보조를 맞추지 못한다는 점이다. 사실 테이프는 너무 빠르다. 표준 LTO-8 테이프 스토리지 기술의 압축 전송률은 초당 750MB다. 테이프는 이 속도를 유지하는 데는 뛰어나지만 이보다 낮은 속도로 작동하는 데는 젬병이다. 문제는 대부분의 백업이 증분 백업이고 증분 백업 속도는 초당 몇 MB이며 이 속도는 테이프와 맞지 않는다는 점이다.

디스크는 초당 몇 MB의 속도(필요한 경우 초당 몇 KB도 가능)로 작동할 수 있을 뿐만 아니라, 이 속도로 수백 개의 백업을 동시에 실행하면서 각 백업을 별도의 위치에 저장할 수 있다. 테이프에서는 불가능하다. 이 점이 디스크가 테이프보다 백업에서 훨씬 더 적합한 이유다.

그 많은 테이프는 누가 다 쓸까?
백업 시스템에 테이프를 사용하지 않는다면 그렇게 많이 출하되는 테이프를 도대체 누가 다 사용할까? 답은 바로 보조 스토리지다. 장기간 동안 안정적으로, 최대한 저렴하게 보관해야 하는 대량의 참조 데이터를 저장하기 위한 테이프 사용이 증가하고 있다. 랜덤 액세스 시간이 별로 중요하지 않은 대용량 파일을 다루는 엔터테인먼트, 바이오테크 분야의 기업들은 수천 개의 테이프로 방대한 테이프 라이브러리를 꽉꽉 채운다.

대부분의 사람들이 잘 모르는 사실은 클라우드 업체들 역시 같은 목적으로 테이프를 사용한다는 점이다. 저렴한 일부 스토리지 서비스의 액세스 시간이 무척 긴 이유가 무엇이라고 생각하는가? 자주 사용되지 않는 데이터를 장기간 안정적으로 저장하기 위해 백엔드에 테이프를 사용하기 때문이다. 많은 사람들이 미래로 여기는 기술이, 많은 사람들이 과거로 치부하는 기술을 기반으로 한다. 그러니 테이프가 죽었다는 말을 하기 전에 이 점을 잘 생각하기 바란다.  editor@itworld.co.kr


X