451 그룹의 업타임 인스티튜트는 최근 자연재해가 데이터센터에 미치는 영향을 연구한 보고서를 통해 데이터센터 운영업체가 기상 이변이 데이터센터 운영에 미치는 영향을 다시 한 번 생각해야 한다고 주장했다. 보고서는 “기상 이변은 운영 가동시간과 회복성에 대해 다시 생각하게 한다. 지금은 그 어느 때보다 극단적인 기상 사고에 대비할 수 있도록 잠재적인 위협 요소를 파악하는 것이 중요하다”고 강조했다.
업타임은 기상 변화 관련 자연재해를 폭풍 및 홍수, 가뭄, 낙뢰, 산불의 4개 범주로 나누었다. 홍수는 2015년 말 영국 북부 리드 지역에서 보다폰의 데이터센터를 전복시켰고, 낙뢰는 미국 샌 안토니오에서 마이크로소프트 애저 데이터센터를 가동 중단 상태로 만든 바 있다. 3년에 두 번의 사고가 난 것은 상당히 높은 타율이라고 할 수 있다.
가뭄이 발생하면 시스템 냉각에 필요한 적절한 냉각수를 확보하기 어려워지며, 산불은 데이터센터 자체를 파괴하기보다는 전력 공급을 유발할 위험성이 크다.
물 부족에 대해서도 경고했다. 구글이나 마이크로소프트 등 주요 데이터센터 운영업체 다수가 강 근처에 있는 외딴 지역에 데이터센터를 설치해 수력 발전과 냉각수를 확보했다. 물론 기업 데이터센터에 그대로 적용할 수 있는 방안은 아니다.
업타임의 보고서에서 전혀 과장되지 않은 한 가지는 데이터센터 운영업체의 관심 부족이다. 대부분 데이터센터 운영업체가 기상 이변으로 인한 피해를 예상하지 않거나 무시하는 것처럼 보인다. 대표적인 예로, 조사에 응한 조직의 90%가 홍수 위험에 대한 경감책을 세워야 한다고 생각하지 않는다고 답했다.
또한 71%의 응답자는 심각한 기상 이변에 전혀 대비하지 않았으며, 45%는 기상 이변의 위험을 무시하고 있다. 33%만이 안정성 개선을 위해 냉각 시스템과 같은 현재 데이터센터 인프라 기술을 재평가하고 있다고 답했다.
업타임의 보고서는 또 데이터센터 운영업체가 극한의 기상 사고에 대비하기 위해 중점을 두어야 할 세 가지 영역도 제시했는데, 인력과 냉각, 연료이다. 태풍의 경우, 직원은 자신의 가족을 우선시한다. 이는 자연스러운 일이기 때문에 직원들이 저장 음식이나 주변 숙박시설 등을 염두에 둘 수 있도록 계속 준비해야 한다.
많은 데이터센터 운영체제가 데이터센터를 설계할 때 열과 습도의 상승에 대비하지 않았으며, 재해 상황에서 공급이 중단될 수 있는 대량의 냉각수가 필요한 시스템을 사용한다.
마지막으로 데이터센터 연료 공급 문제를 대비한 업체가 없다는 것을 지적했다. 많은 데이터센터가 연료 엔진과 펌프를 지하에 설치했는데, 홍수가 발생하면 제일 먼저 잠기는 곳이다.
그렇다면 데이터센터가 할 수 있는 일은 무엇일까? 물론 허리케인이나 토네이도, 홍수 발생 지역에 데이터센터를 세우지 않으면 좋겠지만, 현실적으로는 어려울 것이다. 업타임의 보고서는 네 가지를 제시했다. 위험요소를 파악하고, 최악의 경우를 계획해, 공급 중단 상황을 시뮬레이션해 정기적으로 테스트하고, 마지막으로 필요한 계획을 업데이트해야 한다. editor@itworld.co.kr