2009.10.13

“지메일에서 사이드킥까지” 클라우드 컴퓨팅 사고 일지

Network World Staff | Network World
마이크로소프트-T모바일의 사이드킥 데이터 손실은  고성능 클라우드 컴퓨팅이 일으킨 사고 목록에 제일 윗줄을 차지하게 됐다. 당연한 일이지만, 이런 클라우드 컴퓨팅의 사고에는 운영자의 실수라든지 네트워크 장비의 문제, 해커 등 사고의 원인에 대한 설명, 그리고 클라우드에 대한 신뢰를 나락으로 빠트리는 분석이 뒤따른다.
 
이제 얼마되지 않은 클라우드 컴퓨팅 역사에 일어난 SNAFU를 살펴보자.
 
마이크로소프트 데인저 서비스 중단
T모바일 사이드킥 사용자의 연락처, 일정, 사진, 기타 개인정보가 사이드킥이 서비스 제공업체인 데인저의 서비스 장애 후 손실된 것으로 보인다. 데인저는 마이크로소프트의 자회사이다. 피해를 본 데이터나 사용자의 수는 아직 공개되지 않았지만, 사이드킥 지원 포럼은 데이터를 살릴 방법을 찾는 사용자들의 탄원으로 붐비고 있다.
 
구글 지메일의 반복되는 장애
구글 지메일이 지난 9월 24일 2시간 정도 장애를 일으켰다. 하지만 9월 들어 두 번째 서비스 중단사태였으며, 지난 18개월 동안 구글의 클라우드 기반 서비스인 검색부터 구글 뉴스, 구글 앱스 등이 일으킨 수많은 사고 중 하나에 불과했다. 그동안 구글은 라우팅 에러부터 서버 유지보수 문제 등 다양한 이유를 제시했다. 일각에서는 구글을 두둔한답시고는 “구글이 장애를 일으키기는 하지만 그래도 무료 서비스가 아니냐?”고 말을 하기도 했지만, 서비스 중단으로 어떤 대가를 치렀는지 확인해 보고 할 말이다.
 
트위터의 다운도 뉴스
트위터가 실패한 고래를 그리 자주 띄우는 것은 아니지만, 8월초 아침부터 오후까지 서비스가 중단되면서 소셜 네트워킹 분야 전체가 시끄러웠다. 원인은 DoS 공격인 것으로 알려졌다.
 
이베이의 페이팔 장애
8월에는 페이팔 온라인 지불결제 시스템이 2시간 정도 장애를 일으키면서 수백만 명의 고객이 거래를 마무리하지 못하고 말았다. 서비스 중단의 원인으로는 네트워크 하드웨어 문제가 지목됐다. 서비스 중단 시간은 어떻게 보느냐에 따라 1시간에 4시간까지 달라졌으며, 페이팔은 수백만 달러의 손실을 입었다. 페이팔이 거래업체에 얼마나 물어줬는지는 밝혀지지 않았다.
 
랙스페이스 달라스 데이터센터 정전
랙스페이스는 지난 6월 자사의 달라스 데이터센터가 정전 사태를 맞이하면서 고객들에게 250~350만 달러를 물어줘야 했다. 기업들을 대상으로 다양한 호스팅 및 클라우드 서비스를 제공하는 랙스페이스는 6월 29일 발전기가 고장 나면서 고객들의 서버가 몇 시간 다운되고 말았다.
 
윈도우 애저 테스트 버전 다운
마이크로소프트 클라우드 컴퓨팅 네트워크인 윈도우 애저의 초기 도입자들은 지난 3월 중순 한 주말에 애저가 밤새도록 중단되는 바람에 애플리케이션을 호스팅하는 네트워크를 사용하지 못했다. 이 사고는 어디까지나 윈도우 애저의 테스트 과정에서 발생한 것으로, 업계 관계자들은 상용 서비스의 중단처럼 크게 문제 삼지는 않았다. 이와는 별개로 3월에 마이크로소프트는 핫메일 메시징 시스템이 중단되면서 고생을 했다.
 
세일즈포스닷컴, 올해의 클라우드 장애
지난 1월 CIO.com의 토마스 웨일검이 보도한 것처럼, 세일즈포스닷컴은 1월 6일 한 시간 동안의 서비스 중단 사고를 겪었다. 원인은 코어 네트워크 장비가 메모리 배치 에러로 고장이 난 것.
 
아마존 S3 스토리지 서비스 중단
아마존의 S3 클라우드 네트워크가 마지막으로 대형 사고를 낸 것은 지난 2008년 여름. 당시 장애는 7~8시간이 지속됐는데, 2008년 초에는 인증 요청이 몰리면서 서비스가 중단되기도 했다. editor@itworld.co.kr


2009.10.13

“지메일에서 사이드킥까지” 클라우드 컴퓨팅 사고 일지

Network World Staff | Network World
마이크로소프트-T모바일의 사이드킥 데이터 손실은  고성능 클라우드 컴퓨팅이 일으킨 사고 목록에 제일 윗줄을 차지하게 됐다. 당연한 일이지만, 이런 클라우드 컴퓨팅의 사고에는 운영자의 실수라든지 네트워크 장비의 문제, 해커 등 사고의 원인에 대한 설명, 그리고 클라우드에 대한 신뢰를 나락으로 빠트리는 분석이 뒤따른다.
 
이제 얼마되지 않은 클라우드 컴퓨팅 역사에 일어난 SNAFU를 살펴보자.
 
마이크로소프트 데인저 서비스 중단
T모바일 사이드킥 사용자의 연락처, 일정, 사진, 기타 개인정보가 사이드킥이 서비스 제공업체인 데인저의 서비스 장애 후 손실된 것으로 보인다. 데인저는 마이크로소프트의 자회사이다. 피해를 본 데이터나 사용자의 수는 아직 공개되지 않았지만, 사이드킥 지원 포럼은 데이터를 살릴 방법을 찾는 사용자들의 탄원으로 붐비고 있다.
 
구글 지메일의 반복되는 장애
구글 지메일이 지난 9월 24일 2시간 정도 장애를 일으켰다. 하지만 9월 들어 두 번째 서비스 중단사태였으며, 지난 18개월 동안 구글의 클라우드 기반 서비스인 검색부터 구글 뉴스, 구글 앱스 등이 일으킨 수많은 사고 중 하나에 불과했다. 그동안 구글은 라우팅 에러부터 서버 유지보수 문제 등 다양한 이유를 제시했다. 일각에서는 구글을 두둔한답시고는 “구글이 장애를 일으키기는 하지만 그래도 무료 서비스가 아니냐?”고 말을 하기도 했지만, 서비스 중단으로 어떤 대가를 치렀는지 확인해 보고 할 말이다.
 
트위터의 다운도 뉴스
트위터가 실패한 고래를 그리 자주 띄우는 것은 아니지만, 8월초 아침부터 오후까지 서비스가 중단되면서 소셜 네트워킹 분야 전체가 시끄러웠다. 원인은 DoS 공격인 것으로 알려졌다.
 
이베이의 페이팔 장애
8월에는 페이팔 온라인 지불결제 시스템이 2시간 정도 장애를 일으키면서 수백만 명의 고객이 거래를 마무리하지 못하고 말았다. 서비스 중단의 원인으로는 네트워크 하드웨어 문제가 지목됐다. 서비스 중단 시간은 어떻게 보느냐에 따라 1시간에 4시간까지 달라졌으며, 페이팔은 수백만 달러의 손실을 입었다. 페이팔이 거래업체에 얼마나 물어줬는지는 밝혀지지 않았다.
 
랙스페이스 달라스 데이터센터 정전
랙스페이스는 지난 6월 자사의 달라스 데이터센터가 정전 사태를 맞이하면서 고객들에게 250~350만 달러를 물어줘야 했다. 기업들을 대상으로 다양한 호스팅 및 클라우드 서비스를 제공하는 랙스페이스는 6월 29일 발전기가 고장 나면서 고객들의 서버가 몇 시간 다운되고 말았다.
 
윈도우 애저 테스트 버전 다운
마이크로소프트 클라우드 컴퓨팅 네트워크인 윈도우 애저의 초기 도입자들은 지난 3월 중순 한 주말에 애저가 밤새도록 중단되는 바람에 애플리케이션을 호스팅하는 네트워크를 사용하지 못했다. 이 사고는 어디까지나 윈도우 애저의 테스트 과정에서 발생한 것으로, 업계 관계자들은 상용 서비스의 중단처럼 크게 문제 삼지는 않았다. 이와는 별개로 3월에 마이크로소프트는 핫메일 메시징 시스템이 중단되면서 고생을 했다.
 
세일즈포스닷컴, 올해의 클라우드 장애
지난 1월 CIO.com의 토마스 웨일검이 보도한 것처럼, 세일즈포스닷컴은 1월 6일 한 시간 동안의 서비스 중단 사고를 겪었다. 원인은 코어 네트워크 장비가 메모리 배치 에러로 고장이 난 것.
 
아마존 S3 스토리지 서비스 중단
아마존의 S3 클라우드 네트워크가 마지막으로 대형 사고를 낸 것은 지난 2008년 여름. 당시 장애는 7~8시간이 지속됐는데, 2008년 초에는 인증 요청이 몰리면서 서비스가 중단되기도 했다. editor@itworld.co.kr


X