2018.11.28

마이크로소프트 다중 인증 서비스 또 오류… “9일 동안 2번째”

Gregg Keizer | Computerworld
27일 다중 인증(Multi-Factor Authentication, MFA)으로 마이크로소프트 오피스 365에 로그인하지 못하는 장애가 발생했다. 지난 19일에도 같은 문제가 일어났고, 마이크로소프트가 이 장애에 대한 후속 조치를 발표한 지 하루 만에 다시 발생한 일이다.

애저 상태 대시보드에 따르면, “UTC(협정세계시)로 2018년 11월 27일 오후 2시 25분부터 MFA 사용 고객들이 정책적으로 MFA가 요구되는 경우 간헐적으로 애저 액티브 디렉토리(Azure Active Directory)와 같은 애저 리소스에 로그인하지 못하는 현상이 발생했다.” 2시간 30분 후 DNS(Domain Name Service) 관련 문제가 해결되었고, 엔지니어들이 서비스를 재부팅했다. 대시보드에는 ‘재부팅 후 실패 비율이 감소하는 것을 확인했다”고 결론 내렸다.

이번 장애는 미주, 유럽, 아시아 태평양 지역의 사용자들에게 영향을 끼쳤다.

19일에 발생했던 장애는 14시간 동안 지속되었으며, 마이크로소프트는 해당 장애에 대해 3가지 근본적인 원인과 자세한 장애 현상, 그리고 엔지니어들이 서비스 복구를 위해 진행한 사항과 향후 계획을 담은 1,150단어가 넘는 긴 보고서로 설명했다. 

이 보고서 말미에 마이크로소프트는 “장애를 겪은 고객들에게 매우 죄송하다”라고 언급했다.

디렉션 온 마이크로소프트(Directions on Microsoft)의 애널리스트인 웨스 밀러는 두 번의 장애에 대해 “골칫거리”라고 표현하면서 애저 액티브 디렉토리 같은 서비스와 MFA 등은 “아주 견고하게 설계되어야만 한다”라고 지적했다.

그는 보고서에서 서비스 업데이트 배포를 재평가하고 서비스를 보다 신속하게 복원할 수 있는 방법을 찾고 있다는 점에서 “애저 팀이 올바른 관점을 갖고 있길 바라며, 그래 보인다”고 평가했다. 밀러는 엔지니어들이 문제의 판단과 수정을 서두르지 않을 것이며, 그렇게 할 경우 문제가 쉽게 악화될 수 있기 때문이라고 전했다. 이어 윈도우 10그룹과 달리 애저 팀은 문제의 원인과 대응을 투명하게 밝혔다고 덧붙였다.

마이크로소프트는 72시간 이내에 27일 발생한 장애에 대한 자세한 후속 조치 보고서를 공개하겠다고 약속했다. editor@itworld.co.kr
 


2018.11.28

마이크로소프트 다중 인증 서비스 또 오류… “9일 동안 2번째”

Gregg Keizer | Computerworld
27일 다중 인증(Multi-Factor Authentication, MFA)으로 마이크로소프트 오피스 365에 로그인하지 못하는 장애가 발생했다. 지난 19일에도 같은 문제가 일어났고, 마이크로소프트가 이 장애에 대한 후속 조치를 발표한 지 하루 만에 다시 발생한 일이다.

애저 상태 대시보드에 따르면, “UTC(협정세계시)로 2018년 11월 27일 오후 2시 25분부터 MFA 사용 고객들이 정책적으로 MFA가 요구되는 경우 간헐적으로 애저 액티브 디렉토리(Azure Active Directory)와 같은 애저 리소스에 로그인하지 못하는 현상이 발생했다.” 2시간 30분 후 DNS(Domain Name Service) 관련 문제가 해결되었고, 엔지니어들이 서비스를 재부팅했다. 대시보드에는 ‘재부팅 후 실패 비율이 감소하는 것을 확인했다”고 결론 내렸다.

이번 장애는 미주, 유럽, 아시아 태평양 지역의 사용자들에게 영향을 끼쳤다.

19일에 발생했던 장애는 14시간 동안 지속되었으며, 마이크로소프트는 해당 장애에 대해 3가지 근본적인 원인과 자세한 장애 현상, 그리고 엔지니어들이 서비스 복구를 위해 진행한 사항과 향후 계획을 담은 1,150단어가 넘는 긴 보고서로 설명했다. 

이 보고서 말미에 마이크로소프트는 “장애를 겪은 고객들에게 매우 죄송하다”라고 언급했다.

디렉션 온 마이크로소프트(Directions on Microsoft)의 애널리스트인 웨스 밀러는 두 번의 장애에 대해 “골칫거리”라고 표현하면서 애저 액티브 디렉토리 같은 서비스와 MFA 등은 “아주 견고하게 설계되어야만 한다”라고 지적했다.

그는 보고서에서 서비스 업데이트 배포를 재평가하고 서비스를 보다 신속하게 복원할 수 있는 방법을 찾고 있다는 점에서 “애저 팀이 올바른 관점을 갖고 있길 바라며, 그래 보인다”고 평가했다. 밀러는 엔지니어들이 문제의 판단과 수정을 서두르지 않을 것이며, 그렇게 할 경우 문제가 쉽게 악화될 수 있기 때문이라고 전했다. 이어 윈도우 10그룹과 달리 애저 팀은 문제의 원인과 대응을 투명하게 밝혔다고 덧붙였다.

마이크로소프트는 72시간 이내에 27일 발생한 장애에 대한 자세한 후속 조치 보고서를 공개하겠다고 약속했다. editor@itworld.co.kr
 


X