이 사고로 인해 쿼라(Quora), 비즈니스 인사이더(Business Insider), 넷플릭스(Netflix), 레딧(Reddit), 슬랙(Slack) 등 거대 사이트들의 운영이 전면 혹은 일부 중단되는 피해를 입었다. 시밀러테크(SimilerTech)의 조사에 따르면, 이번 장애로 영향을 받은 사이트는 총 12만 4,000곳에 이르는 것으로 확인됐다. 대학에 다니는 필자의 한 지인으로부터도 “학교의 IT 기능이 마비돼 학생들이 과제에 접근하지 못하는 등 불편을 입었다”는 피해 사례가 전해졌다. 한 클라우드 컨설턴트는 아마존 웹 서비스(AWS, Amazon Web Services)를 이용하던 고객들이 애저(Azure)로의 전환을 요구해오는 통에 전화기에 불이 날 지경이었다고 하소연하기도 했다.
이번 사태는 우리에게 중요한 교훈을 전해줬다. 그간 우리는, 클라우드를 잘못 이용해왔다.
이 수백만 달러의 피해를 불러온 사고의 원인은, 놀랍게도 하나의 타이핑 오류에서 비롯된 것이었다. AWS 측의 보고 자료를 인용해본다.
“아마존 S3(Simple Storage Service) 팀은 S3 청구 시스템 처리 지연을 야기하는 문제에 대한 디버깅 작업을 진행 중이었다. 9:37 AM(태평양 표준시) 기준, 공인 S3 팀원 한 명이 기존 플레이북을 이용해 S3 청구 프로세스에 이용되는 S3 서브시스템 가운데 하나와 연결된 소수의 서버들을 제거하는 명령을 실행했다. 이 과정에서 명령 1 건이 잘못 입력됐고, 그로 인해 계획한 것보다 많은 수의 서버가 제거됐다. 오류로 인해 제거된 서버는 본래 작업 대상이 아닌 다른 두 S3 서브시스템을 지원하는 서버들로, 이로 인해 지역 내 모든 S3 객체의 메타데이터와 위치 정보를 총괄하는 인덱스 서브시스템에 손상이 가해졌다.”
모든 문제가, 하나의 입력 오류에서 비롯된 것이었다.
개인적으로 “잘못은 인간이 하지만, 문제를 키우는 것은 컴퓨터다”라는 업계의 농담을 좋아한다. 그리고 이번 사건을 보며 여기에 한 마디를 덧붙이고 싶어졌다. “그리고 클라우드는 문제를 재앙의 차원으로 확장시킨다.”
언젠가부터 시장에는 퍼블릭 클라우드에 대한 의구심이 슬며시 퍼져왔다. 그리고 이번 사건은 그런 불안이 근거 없는 의심이 아니었음을 확인시켜줬다.
기억해야 할 점은 사고의 책임이 AWS에만 있는 것이 아니라는 점이다. 이는 미 동부 제1 데이터센터라는 특정 지점의 문제로 발생한 사고였으며, 다른 AWS 데이터센터들은 여느 때와 다름없이 정상적으로 운영했다. 그리고 자신들의 모든 IT 자산을 한 곳의 AWS 가용성 존에 몰아넣는 선택을 한 것은 분명 고객들이다. 소규모 기업이라면 수긍할 수 있는 선택이다. 복수 지역에서 이런 규모의 비즈니스를 구동하는 것은 비용적으로 부담이 큰 작업이기 때문이다. 그러나 앞서 이름이 언급된 수준의 대형 기업이라면, 자신들의 선택에 변명의 여지는 없을 것이다.
소규모 기업이라도 아코니스(Acornis) 등의 업체들이 제공하는 클라우드 재난 복구 플랜을 이용할 여력은 있을 것이다. 하지만 이번 AWS 중단 사태에서 드러났듯, 시장의 기업들은 그 규모와 무관하게 하나같이 사고로부터 자신들의 시스템을 보호할 대비책을 마련하지 않고 있었다.
이번 사고를 통해서는 다운디텍터(DownDetector), 아이싯다운라잇나우 (isitdownrightnow.com) 등의 사이트 상태 모니터링 서비스들마저 다운되는 아이러니한 상황이 발생하기도 했다. 아마존의 AWS 서비스 헬스 대시보드(AWS Service Health Dashboard) 역시 피해를 비껴가진 못했다.
애저나 구글 클라우드, 1&1 등으로 피난을 간다 해도 상황은 별반 다르지 않을 것이다. 모든 클라우드는 잠재적 장애의 위험성을 지니고 있다.
잠깐, 업체들이 설명하는 클라우드 SLA는 우리를 보호해주는 조항이 아닌가? 다시 생각해보길 바란다. 이 보장에 포함되는 내용은 기껏해야 다운타임과 관련한 보상이 전부다. 그리고 그 다운타임으로 인해 비즈니스가 입는 타격은, 온전히 고객의 부담으로 남겨진다.
이 혼잡한 상황의 이면에는 보다 깊은 문제가 자리하고 있다. 인터넷 전문가이자 기업가인 트리스탄 루이스는 최근 한 기고를 통해 “탈중앙화를 통해 서비스를 보호한다는 것이 인터넷의 기본 설계 원리다. 그런데 퍼블릭 클라우드는 소수의 주요 기업에 모든 자원이 쏠리는 중앙집중화 모델을 강화해나가고 있다. 인터넷 공간의 수많은 사이트들을 아마존과 마이크로소프트, 구글이 거의 독점적으로 지원하고 있는 것이다. 이들 기업의 고객들 대다수는 자신들의 인프라를 단일 데이터센터에서 호스팅하고 있다. 이런 구조는 인터넷 공간의 많은 영역을 다시 중앙집중화하며, 결과적으로 웹의 취약성을 증대시키게 된다”라고 설명했다.
중앙집중화 경향으로 인터넷 시스템이 하나의 취약 지점만으로 붕괴할 수 있는 구조로 변화하며, 결국 인터넷 전반의 불안정성이 증가한다는 것이 루이스가 지적한 바다.
루이스의 예언은 얼마 지나지 않아 이렇게 현실이 됐다.
자사의 IT 인프라를 대형 퍼블릭 클라우드로 옮기는 투자를 이어나갈 계획이라면, 우선 그 자원을 여러 영역에 분산 배치하기 바란다. 이어, 그것들의 안전을 보장하고 싶다면, 장기적으로는 퍼블릭 클라우드에 대한 과도한 의존을 재고하고 프라이빗 클라우나 하이브리드 클라우드 모델로의 전환을 제안해본다.
물론 어떤 환경에서도 실패의 가능성은 존재한다. 하지만 모든 IT 자원이 한 번의 사고로 망가지는 상황은 피할 수 있을 것이다. editor@itworld.co.kr
함께 보면 좋은 콘텐츠
Sponsored
Surfshark
“유료 VPN, 분명한 가치 있다” VPN 선택 가이드
ⓒ Surfshark VPN(가상 사설 네트워크, Virtual Private Network)은 인터넷 사용자에게 개인 정보 보호와 보안을 제공하는 중요한 도구로 널리 인정받고 있다. VPN은 공공 와이파이 환경에서도 데이터를 안전하게 전송할 수 있고, 개인 정보를 보호하는 데 도움을 준다. VPN 서비스의 수요가 증가하는 것도 같은 이유에서다. 동시에 유료와 무료 중 어떤 VPN을 선택해야 할지 많은 관심을 가지고 살펴보는 사용자가 많다. 가장 먼저 사용자의 관심을 끄는 것은 별도의 예산 부담이 없는 무료 VPN이지만, 그만큼의 한계도 있다. 무료 VPN, 정말 괜찮을까? 무료 VPN 서비스는 편리하고 경제적 부담도 없지만 고려할 점이 아예 없는 것은 아니다. 보안 우려 대부분의 무료 VPN 서비스는 유료 서비스에 비해 보안 수준이 낮을 수 있다. 일부 무료 VPN은 사용자 데이터를 수집해 광고주나 서드파티 업체에 판매하는 경우도 있다. 이러한 상황에서 개인 정보가 유출될 우려가 있다. 속도와 대역폭 제한 무료 VPN 서비스는 종종 속도와 대역폭에 제한을 생긴다. 따라서 사용자는 느린 인터넷 속도를 경험할 수 있으며, 높은 대역폭이 필요한 작업을 수행하는 데 제약을 받을 수 있다. 서비스 제한 무료 VPN 서비스는 종종 서버 위치가 적거나 특정 서비스 또는 웹사이트에 액세스하지 못하는 경우가 생긴다. 또한 사용자 수가 늘어나 서버 부하가 증가하면 서비스의 안정성이 저하될 수 있다. 광고 및 추적 위험 일부 무료 VPN은 광고를 삽입하거나 사용자의 온라인 활동을 추적하여 광고주에게 판매할 수 있다. 이 경우 사용자가 광고를 보아야 하거나 개인 정보를 노출해야 할 수도 있다. 제한된 기능 무료 VPN은 유료 버전에 비해 기능이 제한될 수 있다. 예를 들어, 특정 프로토콜이나 고급 보안 기능을 지원하지 않는 경우가 그렇다. 유료 VPN의 필요성 최근 유행하는 로맨스 스캠은 인터넷 사기의 일종으로, 온라인 데이트나 소셜 미디어를 통해 가짜 프로필을 만들어 상대를 속이는 행위다. 이러한 상황에서 VPN은 사용자가 안전한 연결을 유지하고 사기 행위를 방지하는 데 도움이 된다. VPN을 통해 사용자는 상대방의 신원을 확인하고 의심스러운 활동을 감지할 수 있다. 서프샤크 VPN은 구독 요금제 가입 후 7일간의 무료 체험을 제공하고 있다. ⓒ Surfshark 그 외에도 유료 VPN만의 강점을 적극 이용해야 하는 이유는 다음 3가지로 요약할 수 있다. 보안 강화 해외 여행객이 증가함에 따라 공공 와이파이를 사용하는 경우가 늘어나고 있다. 그러나 공공 와이파이는 보안이 취약해 개인 정보를 노출할 위험이 있다. 따라서 VPN을 사용하여 데이터를 암호화하고 개인 정보를 보호하는 것이 중요하다. 서프샤크 VPN은 사용자의 개인 정보를 안전하게 유지하고 해킹을 방지하는 데 유용하다. 개인정보 보호 인터넷 사용자의 검색 기록과 콘텐츠 소비 패턴은 플랫폼에 의해 추적될 수 있다. VPN을 사용하면 사용자의 IP 주소와 로그를 숨길 수 있으며, 개인 정보를 보호할 수 있다. 또한 VPN은 사용자의 위치를 숨기고 인터넷 활동을 익명으로 유지하는 데 도움이 된다. 지역 제한 해제 해외 여행 중에도 한국에서 송금이 필요한 경우가 생길 수 있다. 그러나 IP가 해외 주소이므로 은행 앱에 접근하는 것이 제한될 수 있다. VPN을 사용하면 지역 제한을 해제해 해외에서도 한국 인터넷 서비스를 이용할 수 있다. 따라서 해외에서도 안전하고 편리하게 인터넷을 이용할 수 있다. 빠르고 안전한 유료 VPN, 서프샤크 VPN ⓒ Surfshark 뛰어난 보안 서프샤크 VPN은 강력한 암호화 기술을 사용하여 사용자의 인터넷 연결을 안전하게 보호한다. 이는 사용자의 개인 정보와 데이터를 보호하고 외부 공격으로부터 사용자를 보호하는 데 도움이 된다. 다양한 서버 위치 서프샤크 VPN은 전 세계 곳곳에 여러 서버가 위치하고 있어, 사용자가 지역 제한된 콘텐츠에 액세스할 수 있다. 해외에서도 로컬 콘텐츠에 손쉽게 접근할 수 있음은 물론이다. 속도와 대역폭 서프샤크 VPN은 빠른 속도와 무제한 대역폭을 제공하여 사용자가 원활한 인터넷 경험을 누릴 수 있도록 지원한다. 온라인 게임, 스트리밍, 다운로드 등 대역폭이 필요한 활동에 이상적이다. 다양한 플랫폼 지원 서프샤크 VPN은 다양한 플랫폼 및 디바이스에서 사용할 수 있다. 윈도우, 맥OS, iOS, 안드로이드 등 다양한 운영체제 및 디바이스에서 호환되어 사용자가 어디서나 안전한 인터넷을 즐길 수 있다. 디바이스 무제한 연결 서프샤크 VPN은 무제한 연결을 제공하여 사용자가 필요할 때 언제든지 디바이스의 갯수에 상관없이 VPN을 사용할 수 있다.