2013.03.15

MS, “아웃룩과 핫메일 서비스 장애는 과열된 서버가 원인”

Daniel Ionescu | PCWorld
아웃룩닷컴과 핫메일 사용자들을 무려 16시간이나 이메일에 접속하지 못하도록 했던 서비스 중단 사태는 데이터센터의 과열된 서버들 때문이었다고 마이크로소프트가 밝혔다.
 
태평양 표준시를 기준으로 지난 3월 12일 오후 1시 30분에 시작된 서비스 중단 사태는 Hotmail.com과 outlook.com 그리고 일부 스카이드라이브 사용자에게 영향을 미쳤다. 문제를 바로 잡는 데는 무려 16시간이 걸려 3월 14일 오전 5시 40분에 서비스가 정상화됐다. 하지만 이 시점에서는 마이크로소프트가 이에 대한 설명을 내놓지 않았다.
 
마이크로소프트의 부사장 아서 디 한은 수요일 늦게 서비스 장애가 발생했고, 시스템의 핵심 요소에 대한 펌웨어 업데이트를 했다고 블로그 포스트를 통해 밝혔다 아서 한의 설명에 따르면 이번 업데이트는 이전에 이미 성공적으로 적용된 것이었는데, 이번에 특정 인스턴스에서 예기치 못한 장애를 일으켰고, 이 장애가 데이터센터의 기본적인 온도를 급상승하게 만들었다는 것. 온도가 너무 급하게 올라 보호 조처를 취하기도 전에 데이터센터의 서버들에 영향을 미친 것이다.
 
과열로 인해 영향을 받은 서버에 저장된 메일함에 사용자들이 액세스하지 못하게 됐으며, 대기서버로 시스템을 전환하는 것도 불가능해 져서 결국 소프트웨어는 물론 사람의 직접적인 개입이 필요했다는 것이 아서 한의 설명이다.
 
아서 한은 “이처럼 사람의 직접적인 개입이 필요한 경우는 우리 서비스에서는 일반적인 것이 아니기 때문에 복구에 상당한 시간이 걸렸다”라고 덧붙였다.
 
마이크로소프트는 서비스 중단 사태에 대해 사과하고, 재발 방지를 약속했지만, 얼마나 많은 사용자가 영향을 받았는지는 밝히지 않았다.
 
한편 마이크로소프트는 향후 다시 서비스 중단 사태가 발생하면 https://status.live.com에서 특정 서비스에 대한 정확한 정보를 실시간으로 얻을 수 있다고 밝혔다.
 
이번 서비스 중단 사태는 마이크로소프트에게는 그리 좋지 않은 시기에 발생했다. 새단장을 하고 서비스를 개시한 아웃룩닷컴은 핫메일을 잇는 주력 서비스로 지메일에 도전장을 내민 상태이기 때문이다.
 
지난 해 7월 프리뷰 서비스를 시작으로 오랜 기간 테스트를 거친 아웃룩닷컴은 핫메일 사용자들의 이전을 기대하고 있다. 현재 6000만 명의 사용자가 새로운 서비스로 이전한 상태. 하지만 16시간의 서비스 중단은 이미 지난 1월과 2월에도 서비스 중단 사태를 겪은 바 있는 아웃룩닷컴 사용자들에게 신뢰를 줄 수 있는 신호는 아닌 것이 분명하다.  editor@itworld.co.kr


2013.03.15

MS, “아웃룩과 핫메일 서비스 장애는 과열된 서버가 원인”

Daniel Ionescu | PCWorld
아웃룩닷컴과 핫메일 사용자들을 무려 16시간이나 이메일에 접속하지 못하도록 했던 서비스 중단 사태는 데이터센터의 과열된 서버들 때문이었다고 마이크로소프트가 밝혔다.
 
태평양 표준시를 기준으로 지난 3월 12일 오후 1시 30분에 시작된 서비스 중단 사태는 Hotmail.com과 outlook.com 그리고 일부 스카이드라이브 사용자에게 영향을 미쳤다. 문제를 바로 잡는 데는 무려 16시간이 걸려 3월 14일 오전 5시 40분에 서비스가 정상화됐다. 하지만 이 시점에서는 마이크로소프트가 이에 대한 설명을 내놓지 않았다.
 
마이크로소프트의 부사장 아서 디 한은 수요일 늦게 서비스 장애가 발생했고, 시스템의 핵심 요소에 대한 펌웨어 업데이트를 했다고 블로그 포스트를 통해 밝혔다 아서 한의 설명에 따르면 이번 업데이트는 이전에 이미 성공적으로 적용된 것이었는데, 이번에 특정 인스턴스에서 예기치 못한 장애를 일으켰고, 이 장애가 데이터센터의 기본적인 온도를 급상승하게 만들었다는 것. 온도가 너무 급하게 올라 보호 조처를 취하기도 전에 데이터센터의 서버들에 영향을 미친 것이다.
 
과열로 인해 영향을 받은 서버에 저장된 메일함에 사용자들이 액세스하지 못하게 됐으며, 대기서버로 시스템을 전환하는 것도 불가능해 져서 결국 소프트웨어는 물론 사람의 직접적인 개입이 필요했다는 것이 아서 한의 설명이다.
 
아서 한은 “이처럼 사람의 직접적인 개입이 필요한 경우는 우리 서비스에서는 일반적인 것이 아니기 때문에 복구에 상당한 시간이 걸렸다”라고 덧붙였다.
 
마이크로소프트는 서비스 중단 사태에 대해 사과하고, 재발 방지를 약속했지만, 얼마나 많은 사용자가 영향을 받았는지는 밝히지 않았다.
 
한편 마이크로소프트는 향후 다시 서비스 중단 사태가 발생하면 https://status.live.com에서 특정 서비스에 대한 정확한 정보를 실시간으로 얻을 수 있다고 밝혔다.
 
이번 서비스 중단 사태는 마이크로소프트에게는 그리 좋지 않은 시기에 발생했다. 새단장을 하고 서비스를 개시한 아웃룩닷컴은 핫메일을 잇는 주력 서비스로 지메일에 도전장을 내민 상태이기 때문이다.
 
지난 해 7월 프리뷰 서비스를 시작으로 오랜 기간 테스트를 거친 아웃룩닷컴은 핫메일 사용자들의 이전을 기대하고 있다. 현재 6000만 명의 사용자가 새로운 서비스로 이전한 상태. 하지만 16시간의 서비스 중단은 이미 지난 1월과 2월에도 서비스 중단 사태를 겪은 바 있는 아웃룩닷컴 사용자들에게 신뢰를 줄 수 있는 신호는 아닌 것이 분명하다.  editor@itworld.co.kr


X