2021.05.06

기업의 재해 복구 및 비즈니스 연속성 계획을 뒤흔든 코로나19

코로나19 팬데믹은 원격 액세스, 네트워킹, SaaS 애플리케이션 및 랜섬웨어와 같은 영역에서 기업 재해 복구(Disaster Recovery, 이하 DR) 및 비즈니스 연속성(Business Continuity, 이하 BC)계획에 존재하는 구멍을 드러냈다. 지난 1년 동안 IT 경영진들은 수시로 이 구멍을 메우고 DR 계획을 업데이트하느라 분주한 시간을 보냈다. 

또한 팬데믹은 많은 조직에서 근본적인 IT 변화를 촉발시켰다. 변화에는 클라우드로의 성급한 애플리케이션 마이그레이션, 디지털 트랜스포메이션 작업의 가속화, 전통적인 구매 절차를 생략한 긴급한 신규 시스템 및 서비스 프로비저닝, 그리고 많은 업계에서 개인 디바이스를 사용해 핵심 데이터를 다루는 정규 재택 근무 직원이라는 새로운 작업 형태의 부상 등이 포함된다.
 
ⓒ Getty Images Bank

액센추어(Accenture)가 새로 발표한 연구 자료에서 그룹 최고 책임자인 매니시 샤르마는 “기업 경영진의 4분의 3 이상이 직원의 업무 방식을 다시 설계하고 디지털 트랜스포메이션 계획을 가속화하고 고객과의 접촉 방식을 근본적으로 바꿀 계획을 갖고 있다”고 말했다.

조직은 2021년과 그 이후를 위한 DR/DC 계획을 다시 세울 때 이러한 모든 요소를 고려해야 한다. 팬데믹은 최악의 시나리오(또는 상상할 수 있는 수준보다 더 심각한 시나리오)가 실제로 발생할 수 있음을 보여줬다. 팬데믹은 재해 복구 및 비즈니스 연속성 계획에 영구적인 변화를 일으켰다.
 

시험대 오른 DR, BC 계획

대부분의 기업은 팬데믹 이전부터 재해 복구 계획을 두고 있었고, 많은 기업은 주요 인력이 모여 재해 시나리오에 대응하는 모의 훈련도 성실히 수행했다. 유행성 전염병 대응은 일반적으로 DR 계획에 포함된 시나리오다.

실제로 IT 서비스 관리 기업 엔소노(Ensono)의 글로벌 비즈니스 연속성 및 재해 복구 부문 책임자인 댄 존슨은 2019년 말에 클라이언트 현장에서 재해 복구 가산 훈련을 실시하면서 테스트 시나리오로 전염병 유행을 선택했다.

그러나 지금과 같은 규모로, 전 세계에서 장기적으로 지속되는 전염병 유행은 누구도 예상하지 못했다. 서비스 중단이나 데이터 손실 없이 가동을 지속한다는(재해 복구의 ‘복구’ 부분), 협소한 IT의 초점 영역에서 보면 팬데믹으로 발생하는 문제 중에서 IT가 사전에 준비하지 못한 문제는 없었다. 바이러스가 전력선을 끊거나 서버를 망가뜨리거나 악성코드로 네트워크를 감염시킨 것은 아니기 때문이다.

팬데믹은 비즈니스 연속성(비즈니스 프로세스 유지, 대응의 인력 측면 조율, 내외부 소통을 포괄하는 더 넓은 분야) 측면에서 여러 문제점을 드러냈다. 존슨은 “재해 복구 계획, 즉 기술 복구 부분은 대체로 여전히 유효하다. 가장 큰 영향을 받은 부분은 프로세스와 인력을 복구해 모든 비즈니스 시스템의 정상 작동을 확인하는 비즈니스 연속성 계획”이라고 말했다.

ESG 리서치(ESG Research)의 선임 애널리스트인 크리스토프 버트랜드는 데이터 손실은 문제가 아니었다고 말했다. 문제는 적절한 인력을 배치하고 VPN, 네트워킹과 같은 요소 측면에서 필요한 모든 조치를 이해하는 것이었다. 가장 명확한 당면 과제는 직원들이 갑자기 종일 집에서 일을 해야 하는 상황이었다. 버트랜드는 “기업에 따라 준비 수준에 차이가 있었다. 일부 기업은 협업 툴과 원격 인력 지원 역량 측면에서 전혀 준비가 안 된 상태였다”고 말했다.

조직은 직원들이 적절한 장비와 인터넷 연결을 갖추었는지 확인하는 한편 견고하고 안전한 협업 툴도 제공해야 했으며, 재택 근무자를 표적으로 한 랜섬웨어의 급증으로부터 홈 와이파이 네트워크라는 새롭고 광범위한 공격 표면을 보호해야 했다.

기업 백업 및 복구 서비스를 제공하는 베리타스 테크놀로지(Veritas Technologies)의 제품 관리 담당 부사장인 덕 매튜스는 “많은 혼란이 있었다. 공황 상태의 문의 전화가 폭주했다”고 말했다. 조직은 엔드포인트가 보호되는지, 보호되지 않는 엔드포인트에서 시작될 수 있는 공격을 방어하도록 기업 방화벽이 설정되었는지를 신속하게 확인해야 했다.

매튜스는 팬데믹으로 인해 이전까지 클라우드 기술에 부정적이었던 조직에서도 “황급한 클라우드 도입”이 촉발됐다고 덧붙였다. 그 결과로 매튜스가 말하는 “회복성 공백”이 발생했다. 기업이 정신을 차리고 이제 SaaS 벤더와의 계약서를 다시 읽어보니, 데이터가 보호되지 않을 수 있다는 사실을 알게 되는 경우다.

버트랜드는 “문제가 되는 분야 중 하나는 SaaS”라며 “SLA를 오해하는 경우가 많다. 오피스 365나 세일즈포스에 데이터가 있다고 해서 데이터가 백업되는 것이 아니다”라고 말했다. SaaS 제공업체는 가용성에 대한 SLA를 제공하지만 가용성은 복구 가능성과는 다르다.

버트랜드는 “데이터에 대한 책임은 항상 기업 자체에 있다”고 말했다. 버트랜드는 조직은 어느 데이터가 운영 핵심 데이터이고 따라서 백업해야 하는지를 결정해야 한다먼서 “세일즈포스와 오피스 365는 핵심적이다. 그러나 깃허브(GitHub)나 젠데스크(Zendesk)는? 눈에 보이는 것보다 훨씬 더 많은 부분을 고려해야 한다”고 말했다.

팬데믹은 DR/BC 계획의 네트워킹 측면에서 준비성의 부족을 드러내는 계기도 됐다. 원격 사이트로의 갑작스러운 직원 이동은 전통적인 네트워크 트래픽 패턴에 혼선을 야기했고 잠재적인 대역폭 문제를 일으켰다.

웰즐리 대학의 부학장이자 CIO인 라비 라비쉔커는 다행히도 얼마 전에 모든 대학 ERP 애플리케이션과 웹 서버, 학습 관리 시스템을 클라우드로 옮겨 두었다고 말했다. 이와 같은 모든 애플리케이션이 온프레미스에 있었다면 (팬데믹 후) 대역폭 부족으로 인해 원격지에서 연결하는 학생과 교직원의 트래픽을 수용할 수 없었을 것이다.
 

웰즐리 대학의 원격 학습 전환

팬데믹은 다양한 형태로 여러 업계에 영향을 미쳤다. 고등 교육 기관은 대면 수업에서 완전한 원격 학습으로의 갑작스러운 전환이라는 어려운 과제에 직면했다.

라비쉔커는 “일반적인 전염병 유행에 대한 대비는 되어 있었지만 코로나에 대한 대비는 누구도 되어 있지 않았다”고 말했다. 다행히 핵심 애플리케이션을 클라우드로 옮긴 웰즐리 대학은 최종 사용자와 학생이 어디에 있든 계속 시스템을 제공할 수 있었다. 

통신선 절단이나 정전과 같은 재해와 코로나 팬데믹의 차이점은 3월 중순이 되자 사람들이 앞으로 닥칠 사태를 예상하고 신속한 계획에 나섰다는 점이다. 라비쉔커는 “의사 결정을 내려야 했던 기본적인 사항 중 하나는 원격 학습을 위한 기술 플랫폼이었다. 만장일치로 줌(Zoom)을 선택했다”고 말했다.

웰즐리 대학은 빠르게 교육 기관 라이선스를 획득했고 지난 3월 학생들이 캠퍼스를 떠나기 전에 학생들을 위한 줌 안내 세션을 마련했다. 라비쉔커는 “전례 없던 속도로 의사 결정이 내려졌다”고 말했다. 오래된 컴퓨터를 사용하거나 집에서 인터넷에 연결하기 위한 경제력이 없는 소수의 학생들은 학교 측이 지원했다.

학생들이 집으로 간 다음 주는 봄방학이었으므로 원격 수업이 시작되기 전에 교사들을 교육할 시간이 어느정도 있었다. 기본적인 사항부터 시작한 다음 휴게실 만들기, 채팅 관리와 같은 고급 기능을 교육했다.

학기가 끝난 후 팀은 교직원들과 결과보고 세션을 갖고 학생의 약 절반은 캠퍼스에서, 절반은 원격지에서 수업을 듣게 될 가을 학기 준비에 착수했다.

두 시스템을 동시에 지원해야 한다는 기술적인 과제에도 대처해야 했고 사회적 거리 두기 요건에 맞춰 강의실 준비하기, 모두가 대학의 코로나 수칙을 준수하도록 하기(예를 들어 마스크 착용)와 같은 조치도 필요했다. 학생들이 마스크를 착용한 상태에서는 말을 알아듣기가 어려웠으므로 각 강의실마다 마이크도 준비했다.

재해에는 항상 긍정적인 부분도 있다. 몇몇 교직원은 줌의 채팅 옵션 덕분에 강의실에서 손을 들고 공개적으로 발언하기를 주저하는 학생들의 참여도가 높아졌다고 보고했다. 라비쉔커는 코로나 위기가 줌과 같은 디지털 기술 도입을 가속화하는 역할을 했으며 이러한 기술은 팬데믹이 종식된 이후에도 계속 사용될 가능성이 높다고 말했다.

IT 서비스 관리 기업 엔소노의 경우 모든 직원들이 이전부터 노트북을 사용했고 상당수는 이미 재택 근무를 하고 있었으므로 그런 부분에서는 문제가 없었다. 엔소노는 직원들이 VPN을 통해 연결하도록 했고 원격 작업자의 트래픽 증가를 수용하기 위해 대역폭을 늘렸다. 비즈니스 연속성 측면에서는 CEO가 직원들과 정기적인 전체 회의를 했고 관리자들이 직원들의 준비 상태를 자주 확인했다. 대비 과정에는 고객도 포함됐다.

엔소노 직원들은 지금도 여전히 재택 근무 중이다. 존슨은 팬데믹 이전의 작업 형태로 완전히 회귀하는 일은 없을 것으로 예상한다. 일부 직원들은 영구적으로 재택 근무를 하고 나머지는 주 2-3일을 사무실로 출근하는 하이브리드 모델이 정착될 가능성이 높다.

이와 같은 종류의 의사 결정이 전 세계 조직을 흔들게 되면 DR 계획을 변경해야 한다. 예를 들어 많은 기업은 본사에 재해가 발생해도 직원들이 계속 작업을 수행할 수 있도록 컴퓨터와 전화기 등이 갖춰진 물리적 백업 사이트를 두고 있다. 그러나 이러한 시설은 사회적 거리 두기에 맞춰 준비되지 않아 팬데믹 상황에서는 쓸모가 없음이 입증되었다. 또한 직원들이 집에서 일을 할 수 있다면, 이와 같은 백업 사이트는 이제 버려야 할 시점일지도 모른다.

마찬가지로 백업 데이터를 클라우드에 저장하는 추세와 함께 많은 기업이 서비스형 재해 복구(DRaaS)로 전환하고 있는 만큼 물리적 데이터 백업 사이트를 소유하고 운영해야 할 필요성에 대한 재점검이 필요한 시점이다. editor@itworld.co.kr
 


2021.05.06

기업의 재해 복구 및 비즈니스 연속성 계획을 뒤흔든 코로나19

코로나19 팬데믹은 원격 액세스, 네트워킹, SaaS 애플리케이션 및 랜섬웨어와 같은 영역에서 기업 재해 복구(Disaster Recovery, 이하 DR) 및 비즈니스 연속성(Business Continuity, 이하 BC)계획에 존재하는 구멍을 드러냈다. 지난 1년 동안 IT 경영진들은 수시로 이 구멍을 메우고 DR 계획을 업데이트하느라 분주한 시간을 보냈다. 

또한 팬데믹은 많은 조직에서 근본적인 IT 변화를 촉발시켰다. 변화에는 클라우드로의 성급한 애플리케이션 마이그레이션, 디지털 트랜스포메이션 작업의 가속화, 전통적인 구매 절차를 생략한 긴급한 신규 시스템 및 서비스 프로비저닝, 그리고 많은 업계에서 개인 디바이스를 사용해 핵심 데이터를 다루는 정규 재택 근무 직원이라는 새로운 작업 형태의 부상 등이 포함된다.
 
ⓒ Getty Images Bank

액센추어(Accenture)가 새로 발표한 연구 자료에서 그룹 최고 책임자인 매니시 샤르마는 “기업 경영진의 4분의 3 이상이 직원의 업무 방식을 다시 설계하고 디지털 트랜스포메이션 계획을 가속화하고 고객과의 접촉 방식을 근본적으로 바꿀 계획을 갖고 있다”고 말했다.

조직은 2021년과 그 이후를 위한 DR/DC 계획을 다시 세울 때 이러한 모든 요소를 고려해야 한다. 팬데믹은 최악의 시나리오(또는 상상할 수 있는 수준보다 더 심각한 시나리오)가 실제로 발생할 수 있음을 보여줬다. 팬데믹은 재해 복구 및 비즈니스 연속성 계획에 영구적인 변화를 일으켰다.
 

시험대 오른 DR, BC 계획

대부분의 기업은 팬데믹 이전부터 재해 복구 계획을 두고 있었고, 많은 기업은 주요 인력이 모여 재해 시나리오에 대응하는 모의 훈련도 성실히 수행했다. 유행성 전염병 대응은 일반적으로 DR 계획에 포함된 시나리오다.

실제로 IT 서비스 관리 기업 엔소노(Ensono)의 글로벌 비즈니스 연속성 및 재해 복구 부문 책임자인 댄 존슨은 2019년 말에 클라이언트 현장에서 재해 복구 가산 훈련을 실시하면서 테스트 시나리오로 전염병 유행을 선택했다.

그러나 지금과 같은 규모로, 전 세계에서 장기적으로 지속되는 전염병 유행은 누구도 예상하지 못했다. 서비스 중단이나 데이터 손실 없이 가동을 지속한다는(재해 복구의 ‘복구’ 부분), 협소한 IT의 초점 영역에서 보면 팬데믹으로 발생하는 문제 중에서 IT가 사전에 준비하지 못한 문제는 없었다. 바이러스가 전력선을 끊거나 서버를 망가뜨리거나 악성코드로 네트워크를 감염시킨 것은 아니기 때문이다.

팬데믹은 비즈니스 연속성(비즈니스 프로세스 유지, 대응의 인력 측면 조율, 내외부 소통을 포괄하는 더 넓은 분야) 측면에서 여러 문제점을 드러냈다. 존슨은 “재해 복구 계획, 즉 기술 복구 부분은 대체로 여전히 유효하다. 가장 큰 영향을 받은 부분은 프로세스와 인력을 복구해 모든 비즈니스 시스템의 정상 작동을 확인하는 비즈니스 연속성 계획”이라고 말했다.

ESG 리서치(ESG Research)의 선임 애널리스트인 크리스토프 버트랜드는 데이터 손실은 문제가 아니었다고 말했다. 문제는 적절한 인력을 배치하고 VPN, 네트워킹과 같은 요소 측면에서 필요한 모든 조치를 이해하는 것이었다. 가장 명확한 당면 과제는 직원들이 갑자기 종일 집에서 일을 해야 하는 상황이었다. 버트랜드는 “기업에 따라 준비 수준에 차이가 있었다. 일부 기업은 협업 툴과 원격 인력 지원 역량 측면에서 전혀 준비가 안 된 상태였다”고 말했다.

조직은 직원들이 적절한 장비와 인터넷 연결을 갖추었는지 확인하는 한편 견고하고 안전한 협업 툴도 제공해야 했으며, 재택 근무자를 표적으로 한 랜섬웨어의 급증으로부터 홈 와이파이 네트워크라는 새롭고 광범위한 공격 표면을 보호해야 했다.

기업 백업 및 복구 서비스를 제공하는 베리타스 테크놀로지(Veritas Technologies)의 제품 관리 담당 부사장인 덕 매튜스는 “많은 혼란이 있었다. 공황 상태의 문의 전화가 폭주했다”고 말했다. 조직은 엔드포인트가 보호되는지, 보호되지 않는 엔드포인트에서 시작될 수 있는 공격을 방어하도록 기업 방화벽이 설정되었는지를 신속하게 확인해야 했다.

매튜스는 팬데믹으로 인해 이전까지 클라우드 기술에 부정적이었던 조직에서도 “황급한 클라우드 도입”이 촉발됐다고 덧붙였다. 그 결과로 매튜스가 말하는 “회복성 공백”이 발생했다. 기업이 정신을 차리고 이제 SaaS 벤더와의 계약서를 다시 읽어보니, 데이터가 보호되지 않을 수 있다는 사실을 알게 되는 경우다.

버트랜드는 “문제가 되는 분야 중 하나는 SaaS”라며 “SLA를 오해하는 경우가 많다. 오피스 365나 세일즈포스에 데이터가 있다고 해서 데이터가 백업되는 것이 아니다”라고 말했다. SaaS 제공업체는 가용성에 대한 SLA를 제공하지만 가용성은 복구 가능성과는 다르다.

버트랜드는 “데이터에 대한 책임은 항상 기업 자체에 있다”고 말했다. 버트랜드는 조직은 어느 데이터가 운영 핵심 데이터이고 따라서 백업해야 하는지를 결정해야 한다먼서 “세일즈포스와 오피스 365는 핵심적이다. 그러나 깃허브(GitHub)나 젠데스크(Zendesk)는? 눈에 보이는 것보다 훨씬 더 많은 부분을 고려해야 한다”고 말했다.

팬데믹은 DR/BC 계획의 네트워킹 측면에서 준비성의 부족을 드러내는 계기도 됐다. 원격 사이트로의 갑작스러운 직원 이동은 전통적인 네트워크 트래픽 패턴에 혼선을 야기했고 잠재적인 대역폭 문제를 일으켰다.

웰즐리 대학의 부학장이자 CIO인 라비 라비쉔커는 다행히도 얼마 전에 모든 대학 ERP 애플리케이션과 웹 서버, 학습 관리 시스템을 클라우드로 옮겨 두었다고 말했다. 이와 같은 모든 애플리케이션이 온프레미스에 있었다면 (팬데믹 후) 대역폭 부족으로 인해 원격지에서 연결하는 학생과 교직원의 트래픽을 수용할 수 없었을 것이다.
 

웰즐리 대학의 원격 학습 전환

팬데믹은 다양한 형태로 여러 업계에 영향을 미쳤다. 고등 교육 기관은 대면 수업에서 완전한 원격 학습으로의 갑작스러운 전환이라는 어려운 과제에 직면했다.

라비쉔커는 “일반적인 전염병 유행에 대한 대비는 되어 있었지만 코로나에 대한 대비는 누구도 되어 있지 않았다”고 말했다. 다행히 핵심 애플리케이션을 클라우드로 옮긴 웰즐리 대학은 최종 사용자와 학생이 어디에 있든 계속 시스템을 제공할 수 있었다. 

통신선 절단이나 정전과 같은 재해와 코로나 팬데믹의 차이점은 3월 중순이 되자 사람들이 앞으로 닥칠 사태를 예상하고 신속한 계획에 나섰다는 점이다. 라비쉔커는 “의사 결정을 내려야 했던 기본적인 사항 중 하나는 원격 학습을 위한 기술 플랫폼이었다. 만장일치로 줌(Zoom)을 선택했다”고 말했다.

웰즐리 대학은 빠르게 교육 기관 라이선스를 획득했고 지난 3월 학생들이 캠퍼스를 떠나기 전에 학생들을 위한 줌 안내 세션을 마련했다. 라비쉔커는 “전례 없던 속도로 의사 결정이 내려졌다”고 말했다. 오래된 컴퓨터를 사용하거나 집에서 인터넷에 연결하기 위한 경제력이 없는 소수의 학생들은 학교 측이 지원했다.

학생들이 집으로 간 다음 주는 봄방학이었으므로 원격 수업이 시작되기 전에 교사들을 교육할 시간이 어느정도 있었다. 기본적인 사항부터 시작한 다음 휴게실 만들기, 채팅 관리와 같은 고급 기능을 교육했다.

학기가 끝난 후 팀은 교직원들과 결과보고 세션을 갖고 학생의 약 절반은 캠퍼스에서, 절반은 원격지에서 수업을 듣게 될 가을 학기 준비에 착수했다.

두 시스템을 동시에 지원해야 한다는 기술적인 과제에도 대처해야 했고 사회적 거리 두기 요건에 맞춰 강의실 준비하기, 모두가 대학의 코로나 수칙을 준수하도록 하기(예를 들어 마스크 착용)와 같은 조치도 필요했다. 학생들이 마스크를 착용한 상태에서는 말을 알아듣기가 어려웠으므로 각 강의실마다 마이크도 준비했다.

재해에는 항상 긍정적인 부분도 있다. 몇몇 교직원은 줌의 채팅 옵션 덕분에 강의실에서 손을 들고 공개적으로 발언하기를 주저하는 학생들의 참여도가 높아졌다고 보고했다. 라비쉔커는 코로나 위기가 줌과 같은 디지털 기술 도입을 가속화하는 역할을 했으며 이러한 기술은 팬데믹이 종식된 이후에도 계속 사용될 가능성이 높다고 말했다.

IT 서비스 관리 기업 엔소노의 경우 모든 직원들이 이전부터 노트북을 사용했고 상당수는 이미 재택 근무를 하고 있었으므로 그런 부분에서는 문제가 없었다. 엔소노는 직원들이 VPN을 통해 연결하도록 했고 원격 작업자의 트래픽 증가를 수용하기 위해 대역폭을 늘렸다. 비즈니스 연속성 측면에서는 CEO가 직원들과 정기적인 전체 회의를 했고 관리자들이 직원들의 준비 상태를 자주 확인했다. 대비 과정에는 고객도 포함됐다.

엔소노 직원들은 지금도 여전히 재택 근무 중이다. 존슨은 팬데믹 이전의 작업 형태로 완전히 회귀하는 일은 없을 것으로 예상한다. 일부 직원들은 영구적으로 재택 근무를 하고 나머지는 주 2-3일을 사무실로 출근하는 하이브리드 모델이 정착될 가능성이 높다.

이와 같은 종류의 의사 결정이 전 세계 조직을 흔들게 되면 DR 계획을 변경해야 한다. 예를 들어 많은 기업은 본사에 재해가 발생해도 직원들이 계속 작업을 수행할 수 있도록 컴퓨터와 전화기 등이 갖춰진 물리적 백업 사이트를 두고 있다. 그러나 이러한 시설은 사회적 거리 두기에 맞춰 준비되지 않아 팬데믹 상황에서는 쓸모가 없음이 입증되었다. 또한 직원들이 집에서 일을 할 수 있다면, 이와 같은 백업 사이트는 이제 버려야 할 시점일지도 모른다.

마찬가지로 백업 데이터를 클라우드에 저장하는 추세와 함께 많은 기업이 서비스형 재해 복구(DRaaS)로 전환하고 있는 만큼 물리적 데이터 백업 사이트를 소유하고 운영해야 할 필요성에 대한 재점검이 필요한 시점이다. editor@itworld.co.kr
 


X