IT 탄력성은 이러한 위기 상황에서 비즈니스 연속성을 보장하지만, 성실한 준비가 있을 때만 가능한 일이다. 엑시언트(Axcient) VP 토드 스칼란이 제안하는 IT 탄력성 확보를 위한 다음의 6가지 팁을 살펴보자.
비즈니스의 한계를 이해한다
각 비즈니스는 독특한 위험감수 수준이 있으며, 여기에 맞는 보호와 복구가 필요하다. 이 요소들은 기업이 뜻밖의 다운타임 처리를 어떻게 준비할지를 결정하는 요소다. 비즈니스의 한계를 이해하기 위해서는 먼저 중요한 시스템을 파악해야 한다. 그다음, ‘중요한 시스템과 그렇지 않은 시스템이 견딜 수 있는 데이터 손실 및 다운타임이 얼마나 되는가?’ ‘충분한 보호 일정은 무엇인가?’ ‘1시간, 하루, 일주일의 다운 타임은 어떤 영향을 끼치는가?’ ‘잠재적인 다운타임을 매출 손실, 고객 손실, 직원 생산성 하락 등으로 수치화할 수 있는가?’ 등을 자문해야 한다.
이런 질문에 답을 한다면 연속성 시스템을 구축할 준비가 된 것이다.
다운타임의 원인이 될 수 있는 시나리오를 열거한다
다운타임을 유발할 수 있는 시나리오를 만듬으로써 각 사례에 대해 적절한 계획을 세울 수 있다. 이런 경우 보통 자연재해를 원인으로 가정한다. 여기에 랜섬웨어 공격, 서버 장애, 정전, 사용자 에러(실수로 인한 데이터 삭제 등) 등 다른 시나리오도 포함키면 더 강력하고 포괄적인 연속성 전략을 세울 수 있다.
확실한 복구를 위해 필요한 기술 요건을 구체화한다
핵심 기술 요건에는 다음과 같은 것들이 포함될 수 있다.
• 포인트인타임(point-in-time) 스냅샷은 특정 시점으로 돌아가서 데이터와 시스템을 복구하도록 한다.
• 풀 이미지(full image) 보호는 처음부터 새로운 시스템을 구축하는 것이 아니라 고장난 시스템 전체를 복구할 수 있도록 한다. 즉, 운영체제 설치, 패치 적용, 애플리케이션 설지, 데이터 복구 등의 작업이 필요 없다.
• 페일오버(failover)는 IT 부서가 전력 복구나 하드웨어 교체 등 핵심 인프라 복원 작업을 하는 사이 시스템을 빠르게 돌릴 수 있도록 한다.
보호 솔루션 도입
보호 솔루션을 도입할 때 의사 결정 과정에서 비용과 범위를 잘 따져야 한다. 보험 가입을 할 떄와 마찬가지로 혜택과 위험요소를 분석해서 적용 범위를 위험 감수도를 비교해 조사해야 한다. 그 다음, 전체 솔루션에 얼만큼의 지속성이 보장되어야 하는지를 IT 관리 및 복구 가능성 측면에서 고려해야 한다. 이런 검토 과정을 통해서 업체 하나의 솔루션을 선호할지, 아니면 여러 업체의 솔루션을 결합할지를 결정할 수 있다.
다른 중요한 결정은 데이터와 시스템 복제와 관련된 것이다. 초기 설비 구축 및 유지보수 비용이 발생하는 보조 하드웨어를 이용할 것인지, 아니면 온디맨드 컴퓨팅을 이용해서 클라우드 운영 비용을 낼지를 결정해야 한다.
보호 및 복구 절차의 문서화 및 최신 상태로 유지
위기의 중간은 복구 프로토콜을 찾아내서 마련하기에 최악의 시기다. 재난 대비의 관점에서 성숙한 IT 조직은 상세한 보소 및 복구 계획을 문서화하고, 항상 최신 상태로 유지한다. 실행 가능한 복구 계획을 마련하면 위기가 발생했을 때 즉시 태세를 전환하고 행동에 돌입함으로써, 비즈니스 중단 기간을 줄일 수 있다.
솔루션을 정기적으로 테스트하라
비즈니스 연속성을 위한 IT 탄력성 확보에는 지속적인 관심이 필수다. 복구 프로토콜은 충분한 ‘폭과 깊이’를 확인하기 위해 정기적으로 실행해보고, 실제로 위기가 발생하기 전에 빈 곳이나 기술적인 이슈가 없는지 확인해야 한다. 따라서 이렇게 만반의 준비를 하기 위한 유일한 방법은 잦은 테스트다. IT 탄력성은 역동적이며, 성공적인 복구를 위해 지속적으로 솔루션에 대한 관심이 필요하다. editor@itworld.co.kr