2020.03.23

데이터센터 운영자를 위한 코로나19 모범 사례

Ann Bednarz | Network World
데이터센터 운영자는 화재, 홍수, 정전 및 기타 재해로 인한 격변을 예측하고 대응하도록 훈련받는다. 그러나 코로나바이러스감염증(COVID-19, 이하 코로나19)으로 인해 미션 크리티컬 설비를 담당하는 사람들은 미지의 영역으로 들어서고 있다.

업타임 연구소의 경영 서비스 담당 수석 부사장인 프레드 디커맨은 “데이터센터와 IT 팀은 일반적으로 계획을 수립하는데 매우 뛰어나다. 통상적인 작전을 계획하고, 미래를 대비해 계획을 세우고, 비정상적인 사건에 대해서도 계획을 세운다. 하지만 현재 직면하고 있는 팬데믹과 같은 유형에 대비에 계획을 세운 사람은 거의 없다”라고 말했다.

데이터센터 자문기구는 핵심 인프라 설비를 운영하는 사람이 코로나19의 영향에 대응하고 전략과 절차를 다듬어 미래의 전염병에 대비할 수 있도록 하는 것을 목적으로 한 보고서를 방금 발표했다. 무료 보고서인 <코로나19: 핵심 시설 위험의 최소화(COVID-19: Minimizing critical facility risk)>는 권고사항과 가능한 다음 단계를 상세히 다루고 있다.

업타임 연구소의 앤디 로렌스 전무이사는 “이것은 매우 어렵지만 필요한 주제”라고 이 연구소가 코로나19에 대한 지금까지 업계의 대응과 앞으로 일어날 일에 대해 논의하기 위해 올린 웹캐스트에서 말했다. 로렌스는 “이 팬데믹은 수개월, 어쩌면 더 오래 지속될 것이 분명하다. 이 보고서에서 이야기하는 많은 것이 더 많은 시간과 노력을 투자해야 할 복원 계획의 토대가 될 것이다. 이것이 그 첫 단계였으면 좋겠다”라고 말했다.

팬데믹으로 인해 기술 의존도가 증가하고 있다. 원격 근로자의 수가 급증하고 있고, 온라인 소매가 치솟고 있고, 기업간 커뮤니케이션이 디지털로 이뤄지고 있으며, 사회적 상호 작용이 온라인에서 이뤄지고 있다. 디커맨은 “이 모든 것은 우리가 유지보수를 책임지고 있는 필수적인 인프라의 더 많은 사용과 네트워크의 더 많은 사용을 촉진할 것”이라고 말했다.

디커맨은 “그 와중에, 데이터센터 산업에 종사하는 우리들은 일반 사람들이 직면하고 있는 것과 같은 보건 문제에 직면해 있다”라고 말했다. 데이터센터 직원의 건강과 안전을 유지하는 것이 최우선 사항이며 기업이 데이터센터의 복원력을 보장하기를 원한다면 이는 필수다. 데이터센터에서 시작할 만한 권고사항은 다음과 같다.


코로나19에 기존의 대응계획을 맞춰라

많은 기업들의 재해 복구 계획에는 팬데믹 대비가 포함되어 있지 않을 것이지만, 그렇다고 해서 처음부터 시작해야 하는 것은 아니다. 대신 허리케인과 같이 직원들이 데이터센터 사이트에 접근하는 것을 어렵게 만드는 시나리오에 대비하기 위해 마련되었던 기존의 비상 계획을 수정하도록 노력해보라고 디커맨은 말했다. 그는 “참고 목록에 팬데믹 특화 계획이 없으면 현재 상황에 맞게 조정할 수 있는 방안을 찾아봐도 된다”라고 말했다.
 

단계별 코로나19 대응계획을 마련하라

디커맨은 “사람들이 통상적인 활동에서 100% 고립으로 한 번에 움직이기를 원하지 않는다. 그것은 필요하지도 않고 비용 대비 효과가 좋지도 않을 것이다”라고 밝혔다.

업타임 연구소에 따르면, 모범 사례들은 적절한 예방 조치를 취하는 것에서부터 소등 운영과 같은 최악의 경우 시나리오에 이르기까지의 단계적 상향과 같은 3~5단계의 비상 계획을 필요로 한다. 계획은 각 단계에서 취해야 할 조치와 다음 단계의 실행을 촉발할 상황을 명확하게 파악해야 한다.

예를 들어, 직원 가용성과 관련해, 기업은 결근률이 25% 미만 또는 25~50%인 것과 같은 다양한 직원 결근 시나리오에 대한 인력 위협 매트릭스를 개발해야 한다. 각 단계는 비즈니스에 미치는 영향, 데이터센터 운영에 영향을 미치는 방법 및 서비스 수준에 미치는 영향을 요약해서 담아야 한다.


데이터센터를 보다 자주 그리고 철저히 청소하라

코로나19 대응계획을 이행하는 데 있어서 기업이 가장 먼저 고려해야 할 것은 사이트의 청소다.

디커맨은 “데이터센터는 상당히 깨끗한 경향이 있지만, 우리는 직원에 대한 위험을 제한하고 사이트를 이용 가능하도록 유지하기 위한 요건을 준수하기 위해 우리의 노력을 강화해야 할 것이다. 데이터센터 청소부는 데이터센터 운영에서 더 중요한 부분이 될 것이다. 규칙적인 청소와 심층적인 청소의 빈도를 재평가하고 싶을 것이다. 그 청소부가 사용하는 자료와 절차를 재검토하고 싶을 것이다”라고 말했다.


작업장 보건 프로토콜을 수립하라

신종 코로나19 대응 절차는 특정 조치를 포함해야 한다. 예를 들어, 데이터센터에 들어갈 때 사람들에게 휴지를 배포하는 것, 접근 절차의 일부로 비접촉 온도계를 사용하는 것, 멀리 떨어져서 직원들이 교대할 수 있는 작업교대 프로세스를 갖추는 것, 들어오는 직원을 위한 청소 체크리스트를 만드는 것 등이 그것이다.

디커맨은 “물론 목표는 올바른 행동을 취하는 것뿐만이 아니라 직원들이 낮에 하는 일에 대해 생각하고 있는 방식을 바꾸는 것이다. 이것은 그들에게 습관이 되도록 하고, 오염이나 감염 가능성을 피하게 하고 대비하도록 하는 마음가짐에 관한 것이다”라고 말했다.


공급사슬을 보호하고 VPN에 스트레스 테스트를 하라

업타운 연구소에서 권장하는 보호조치 중에는 케이블 및 서버 랙과 같은 품목에 대한 공급망 와해를 대비하고, 연료 탱크를 잠그고, 가능하면 비필수적인 유지보수를 연기하는 것이 있다.

디커맨은 “또한 VPN을 스트레스 테스트해 보라. VPN을 스트레스 테스트하는 것은 단순히 원격 작업과 관리 직원을 원격으로 작업하도록 하기 위한 것이 아니다. 데이터센터에 인력을 배치할 수 없는 최악의 시나리오가 발생하면 건물 관리 시스템 및 기타 운영 체제에 원격으로 안전하게 액세스할 수 있게 되고, 이는 대부분의 경우 VPN이 양호하다는 것을 의미한다”라고 덧붙였다.


출장을 자제하고 데이터센터 예비팀을 만들어라

한 사이트에서 다른 사이트로 감염될 위험을 줄이기 위해 직원들이 데이터센터 간에 출장을 하지 않도록 하는 것이 중요하다고 디커맨은 말했다.

대응수준을 더 높은 수준으로 올려야 하는 경우 다른 팀이 작업하는 동안 한 팀은 2주 동안 집에서 자가 격리될 수 있도록 2개의 교대팀을 구성하는 것을 고려하도록 한다.

자가 격리를 하고 절대적으로 필요한 경우에만 데이터센터에 올 수 있는 핵심 예비군을 지정한다. 디커맨은 “주요 인원을 평가하여 누가 운영에 중요한지 확인하고, 그 사람에 대한 교대인력을 지정하도록 한다. 현 상황에서 핵심 인사들과 그들의 교대인력들이 서로 접촉하지 않는다는 규칙을 세워라”라고 말했다.


데이터센터가 중요하다고 주장하라

포괄적인 코로나19 대응 계획을 수립하는 것의 또 다른 이점은 데이터센터 운영이 중요하다는 것을 확립하는 데 도움이 될 수 있다는 것이다. 정부와 보건 당국은 코로나바이러스 확산을 억제하기 위한 노력으로 이동을 제한할 수 있는데, 확실한 계획을 가지고 있으면 회사가 예외를 주장하는데 도움이 될 수 있다.

디커맨은 “사이트의 중요성과 해당 지역, 또는 서비스를 제공하는 사람에게 미치는 운영 중단의 결과를 문서화하고 직원 안전을 유지하기 위해 취하는 조치를 보여주는 좋은 계획을 세우도록 한다. 데이터센터가 사실 매우 중요하며 그러한 종류의 예외가 인정되어야 한다는 것을 관계당국에 납득시키는 데 크게 도움이 될 것”이라고 말했다.


수행되는 계획을 보장할 경영진을 참여시켜라

기업들은 대내외 커뮤니케이션 모두에 대한 계획을 세워야 한다. 이 계획에는 우선 통신 모드와 주파수가 포함되어야 한다. 디커맨은 “큰 틀에서 모든 계획의 실행에 경영진이 적극적으로 관여하고 상황이 변함에 따라 전술을 바꿀 수 있는 것이 매우 중요하다”라고 말했다.

디커맨은 “절차와 관행으로 확립한 이 모든 것들이 실제로 일관성 있게, 그리고 시간이 흐르면서 실행되도록 보장하는 것은 경영진만이 할 수 있다. 사람들은 10일이나 20일 동안 위기 상황에 처해 있다가도 긴장을 푸는 경향이 있고, 가능하다면 이런 상황을 피하면서 필요한 만큼 절차가 계속 적용되도록 하고 싶을 것이다”라고 말했다.

전체 보고서인 ‘코로나19: 핵심 시설 위험의 최소화’에는 더 구체적인 조치 항목이 많이 들어있다. 앞으로 업타임 연구소는 코로나19에 대한 업데이트가 담긴 정식 게시판을 선보일 계획이다. editor@itworld.co.kr
 


2020.03.23

데이터센터 운영자를 위한 코로나19 모범 사례

Ann Bednarz | Network World
데이터센터 운영자는 화재, 홍수, 정전 및 기타 재해로 인한 격변을 예측하고 대응하도록 훈련받는다. 그러나 코로나바이러스감염증(COVID-19, 이하 코로나19)으로 인해 미션 크리티컬 설비를 담당하는 사람들은 미지의 영역으로 들어서고 있다.

업타임 연구소의 경영 서비스 담당 수석 부사장인 프레드 디커맨은 “데이터센터와 IT 팀은 일반적으로 계획을 수립하는데 매우 뛰어나다. 통상적인 작전을 계획하고, 미래를 대비해 계획을 세우고, 비정상적인 사건에 대해서도 계획을 세운다. 하지만 현재 직면하고 있는 팬데믹과 같은 유형에 대비에 계획을 세운 사람은 거의 없다”라고 말했다.

데이터센터 자문기구는 핵심 인프라 설비를 운영하는 사람이 코로나19의 영향에 대응하고 전략과 절차를 다듬어 미래의 전염병에 대비할 수 있도록 하는 것을 목적으로 한 보고서를 방금 발표했다. 무료 보고서인 <코로나19: 핵심 시설 위험의 최소화(COVID-19: Minimizing critical facility risk)>는 권고사항과 가능한 다음 단계를 상세히 다루고 있다.

업타임 연구소의 앤디 로렌스 전무이사는 “이것은 매우 어렵지만 필요한 주제”라고 이 연구소가 코로나19에 대한 지금까지 업계의 대응과 앞으로 일어날 일에 대해 논의하기 위해 올린 웹캐스트에서 말했다. 로렌스는 “이 팬데믹은 수개월, 어쩌면 더 오래 지속될 것이 분명하다. 이 보고서에서 이야기하는 많은 것이 더 많은 시간과 노력을 투자해야 할 복원 계획의 토대가 될 것이다. 이것이 그 첫 단계였으면 좋겠다”라고 말했다.

팬데믹으로 인해 기술 의존도가 증가하고 있다. 원격 근로자의 수가 급증하고 있고, 온라인 소매가 치솟고 있고, 기업간 커뮤니케이션이 디지털로 이뤄지고 있으며, 사회적 상호 작용이 온라인에서 이뤄지고 있다. 디커맨은 “이 모든 것은 우리가 유지보수를 책임지고 있는 필수적인 인프라의 더 많은 사용과 네트워크의 더 많은 사용을 촉진할 것”이라고 말했다.

디커맨은 “그 와중에, 데이터센터 산업에 종사하는 우리들은 일반 사람들이 직면하고 있는 것과 같은 보건 문제에 직면해 있다”라고 말했다. 데이터센터 직원의 건강과 안전을 유지하는 것이 최우선 사항이며 기업이 데이터센터의 복원력을 보장하기를 원한다면 이는 필수다. 데이터센터에서 시작할 만한 권고사항은 다음과 같다.


코로나19에 기존의 대응계획을 맞춰라

많은 기업들의 재해 복구 계획에는 팬데믹 대비가 포함되어 있지 않을 것이지만, 그렇다고 해서 처음부터 시작해야 하는 것은 아니다. 대신 허리케인과 같이 직원들이 데이터센터 사이트에 접근하는 것을 어렵게 만드는 시나리오에 대비하기 위해 마련되었던 기존의 비상 계획을 수정하도록 노력해보라고 디커맨은 말했다. 그는 “참고 목록에 팬데믹 특화 계획이 없으면 현재 상황에 맞게 조정할 수 있는 방안을 찾아봐도 된다”라고 말했다.
 

단계별 코로나19 대응계획을 마련하라

디커맨은 “사람들이 통상적인 활동에서 100% 고립으로 한 번에 움직이기를 원하지 않는다. 그것은 필요하지도 않고 비용 대비 효과가 좋지도 않을 것이다”라고 밝혔다.

업타임 연구소에 따르면, 모범 사례들은 적절한 예방 조치를 취하는 것에서부터 소등 운영과 같은 최악의 경우 시나리오에 이르기까지의 단계적 상향과 같은 3~5단계의 비상 계획을 필요로 한다. 계획은 각 단계에서 취해야 할 조치와 다음 단계의 실행을 촉발할 상황을 명확하게 파악해야 한다.

예를 들어, 직원 가용성과 관련해, 기업은 결근률이 25% 미만 또는 25~50%인 것과 같은 다양한 직원 결근 시나리오에 대한 인력 위협 매트릭스를 개발해야 한다. 각 단계는 비즈니스에 미치는 영향, 데이터센터 운영에 영향을 미치는 방법 및 서비스 수준에 미치는 영향을 요약해서 담아야 한다.


데이터센터를 보다 자주 그리고 철저히 청소하라

코로나19 대응계획을 이행하는 데 있어서 기업이 가장 먼저 고려해야 할 것은 사이트의 청소다.

디커맨은 “데이터센터는 상당히 깨끗한 경향이 있지만, 우리는 직원에 대한 위험을 제한하고 사이트를 이용 가능하도록 유지하기 위한 요건을 준수하기 위해 우리의 노력을 강화해야 할 것이다. 데이터센터 청소부는 데이터센터 운영에서 더 중요한 부분이 될 것이다. 규칙적인 청소와 심층적인 청소의 빈도를 재평가하고 싶을 것이다. 그 청소부가 사용하는 자료와 절차를 재검토하고 싶을 것이다”라고 말했다.


작업장 보건 프로토콜을 수립하라

신종 코로나19 대응 절차는 특정 조치를 포함해야 한다. 예를 들어, 데이터센터에 들어갈 때 사람들에게 휴지를 배포하는 것, 접근 절차의 일부로 비접촉 온도계를 사용하는 것, 멀리 떨어져서 직원들이 교대할 수 있는 작업교대 프로세스를 갖추는 것, 들어오는 직원을 위한 청소 체크리스트를 만드는 것 등이 그것이다.

디커맨은 “물론 목표는 올바른 행동을 취하는 것뿐만이 아니라 직원들이 낮에 하는 일에 대해 생각하고 있는 방식을 바꾸는 것이다. 이것은 그들에게 습관이 되도록 하고, 오염이나 감염 가능성을 피하게 하고 대비하도록 하는 마음가짐에 관한 것이다”라고 말했다.


공급사슬을 보호하고 VPN에 스트레스 테스트를 하라

업타운 연구소에서 권장하는 보호조치 중에는 케이블 및 서버 랙과 같은 품목에 대한 공급망 와해를 대비하고, 연료 탱크를 잠그고, 가능하면 비필수적인 유지보수를 연기하는 것이 있다.

디커맨은 “또한 VPN을 스트레스 테스트해 보라. VPN을 스트레스 테스트하는 것은 단순히 원격 작업과 관리 직원을 원격으로 작업하도록 하기 위한 것이 아니다. 데이터센터에 인력을 배치할 수 없는 최악의 시나리오가 발생하면 건물 관리 시스템 및 기타 운영 체제에 원격으로 안전하게 액세스할 수 있게 되고, 이는 대부분의 경우 VPN이 양호하다는 것을 의미한다”라고 덧붙였다.


출장을 자제하고 데이터센터 예비팀을 만들어라

한 사이트에서 다른 사이트로 감염될 위험을 줄이기 위해 직원들이 데이터센터 간에 출장을 하지 않도록 하는 것이 중요하다고 디커맨은 말했다.

대응수준을 더 높은 수준으로 올려야 하는 경우 다른 팀이 작업하는 동안 한 팀은 2주 동안 집에서 자가 격리될 수 있도록 2개의 교대팀을 구성하는 것을 고려하도록 한다.

자가 격리를 하고 절대적으로 필요한 경우에만 데이터센터에 올 수 있는 핵심 예비군을 지정한다. 디커맨은 “주요 인원을 평가하여 누가 운영에 중요한지 확인하고, 그 사람에 대한 교대인력을 지정하도록 한다. 현 상황에서 핵심 인사들과 그들의 교대인력들이 서로 접촉하지 않는다는 규칙을 세워라”라고 말했다.


데이터센터가 중요하다고 주장하라

포괄적인 코로나19 대응 계획을 수립하는 것의 또 다른 이점은 데이터센터 운영이 중요하다는 것을 확립하는 데 도움이 될 수 있다는 것이다. 정부와 보건 당국은 코로나바이러스 확산을 억제하기 위한 노력으로 이동을 제한할 수 있는데, 확실한 계획을 가지고 있으면 회사가 예외를 주장하는데 도움이 될 수 있다.

디커맨은 “사이트의 중요성과 해당 지역, 또는 서비스를 제공하는 사람에게 미치는 운영 중단의 결과를 문서화하고 직원 안전을 유지하기 위해 취하는 조치를 보여주는 좋은 계획을 세우도록 한다. 데이터센터가 사실 매우 중요하며 그러한 종류의 예외가 인정되어야 한다는 것을 관계당국에 납득시키는 데 크게 도움이 될 것”이라고 말했다.


수행되는 계획을 보장할 경영진을 참여시켜라

기업들은 대내외 커뮤니케이션 모두에 대한 계획을 세워야 한다. 이 계획에는 우선 통신 모드와 주파수가 포함되어야 한다. 디커맨은 “큰 틀에서 모든 계획의 실행에 경영진이 적극적으로 관여하고 상황이 변함에 따라 전술을 바꿀 수 있는 것이 매우 중요하다”라고 말했다.

디커맨은 “절차와 관행으로 확립한 이 모든 것들이 실제로 일관성 있게, 그리고 시간이 흐르면서 실행되도록 보장하는 것은 경영진만이 할 수 있다. 사람들은 10일이나 20일 동안 위기 상황에 처해 있다가도 긴장을 푸는 경향이 있고, 가능하다면 이런 상황을 피하면서 필요한 만큼 절차가 계속 적용되도록 하고 싶을 것이다”라고 말했다.

전체 보고서인 ‘코로나19: 핵심 시설 위험의 최소화’에는 더 구체적인 조치 항목이 많이 들어있다. 앞으로 업타임 연구소는 코로나19에 대한 업데이트가 담긴 정식 게시판을 선보일 계획이다. editor@itworld.co.kr
 


X