2015.07.10

유나이티드 항공 사고가 보여주는 네트워킹의 어려움

Stephen Lawson | IDG News Service
지난 7월 8일 유나이티드항공은 자사의 비행기들을 한 시간 동안 활주로에 대기 상태로 두었는데, 이유는 라우터 장애 때문인 것으로 알려졌다. 장비의 부품 하나가 고장 나는 흔한 사고이지만, 모든 조각이 다른 조각과 항상 연결되어 있어야 하는 네트워크에서는 위험한 사고가 될 수 있다.

동부시간으로 오전 8시 30분에 시작된 착륙으로 유나이티드 항공의 여러 항로가 지연됐고, 승객들은 오도가도 못하는 신세가 됐다. 같은 날 컴퓨터 관련 정전으로 뉴욕증권거래소의 거래가 중단됐다.

유나이티드는 네트워크 연결성 문제를 이유로 설명하며 고장 난 라우터를 원인으로 지목했다. 여분의 라우터도 갖추고 전국적인 영향을 미칠 문제를 방지하기 위해 케이블도 연결되어 있었겠지만, 네트워킹 문제가 라우터 장애처럼 단순한 경우는 드물다.

가트너의 애널리스트 조 스코루파는 “큰 고장은 그런대로 쉽다”라고 말한다. 기업은 장애를 대비해 두 대의 라우터를 갖추고 있는 경우가 많고, 유나이트드처럼 규모가 큰 기업은 인터넷 회선도 두 곳의 다른 통신업체로부터 구매해 연결한다. 하지만 이런 단순한 장애 복구 메커니즘은 즉각적으로 탐지할 수 있는 총체적인 고장 상황에서나 적용된다는 것이 스코루파의 지적이다.

그외의 다른 다양한 네트워크 문제에는 리던던시가 아무런 도움이 되지 않는다. 라우터는 원래 패킷을 원하는 곳으로 전달하기 위해 함께 동작하도록 되어 있기 때문에 서로 영향을 미치기 때문이다.

따라서 라우터 고장은 완전히 정지보다는 여러 가지 다른 문제를 일으킨다. 때에 따라 소프트웨어 결함이나 서투른 엔지니어의 환경 설정 실수가 다른 라우터로 퍼져 나가거나 전체 성능에 악영향을 미치기도 한다. 라우터는 종종 오작동을 할 수 있지만, 네트워크의 다른 구성요소들은 이를 알지 못하는 것이다. 유나이티드 항공은 최근 발생한 문제의 상세한 정보를 아직 공개하지 않고 있다.

라우터 소프트웨어 업그레이드는 이런 전면적인 네트워크 중단을 일으켜 언론을 장식하는 주요 원인이다. 실제로 네트워크 소프트웨어 업데이트는 엄청난 시련이 될 수 있기 때문에 일부 기업은 같은 소프트웨어를 몇 년 동안 고집하기도 한다. 업그레이드의 위험성을 감수하는 것보다는 보안 허점의 위험을 일일이 관리하는 방법을 선택하는 것이다.

SDN(Software Defined Networking)은 이런 위험을 완화하고 대규모 고장 사태를 줄이는 데 도움이 될 것이다. SDN 환경에서 관리자는 한 번에 장비 한 대를 관리하고 수동으로 환경 설정을 입력하는 것이 아니라 보다 중앙집중화되고 프로그래밍이 가능한 소프트웨어를 이용하기 때문이다.

하지만 오픈 네트워킹 사용자 그룹의 공동 설립자인 닉 리피스는 SDN이 이런 대형 사고를 방지하기 위해 필요한 좀 더 큰 변화의 일부분일 뿐이라고 강조했다.  editor@itworld.co.kr

2015.07.10

유나이티드 항공 사고가 보여주는 네트워킹의 어려움

Stephen Lawson | IDG News Service
지난 7월 8일 유나이티드항공은 자사의 비행기들을 한 시간 동안 활주로에 대기 상태로 두었는데, 이유는 라우터 장애 때문인 것으로 알려졌다. 장비의 부품 하나가 고장 나는 흔한 사고이지만, 모든 조각이 다른 조각과 항상 연결되어 있어야 하는 네트워크에서는 위험한 사고가 될 수 있다.

동부시간으로 오전 8시 30분에 시작된 착륙으로 유나이티드 항공의 여러 항로가 지연됐고, 승객들은 오도가도 못하는 신세가 됐다. 같은 날 컴퓨터 관련 정전으로 뉴욕증권거래소의 거래가 중단됐다.

유나이티드는 네트워크 연결성 문제를 이유로 설명하며 고장 난 라우터를 원인으로 지목했다. 여분의 라우터도 갖추고 전국적인 영향을 미칠 문제를 방지하기 위해 케이블도 연결되어 있었겠지만, 네트워킹 문제가 라우터 장애처럼 단순한 경우는 드물다.

가트너의 애널리스트 조 스코루파는 “큰 고장은 그런대로 쉽다”라고 말한다. 기업은 장애를 대비해 두 대의 라우터를 갖추고 있는 경우가 많고, 유나이트드처럼 규모가 큰 기업은 인터넷 회선도 두 곳의 다른 통신업체로부터 구매해 연결한다. 하지만 이런 단순한 장애 복구 메커니즘은 즉각적으로 탐지할 수 있는 총체적인 고장 상황에서나 적용된다는 것이 스코루파의 지적이다.

그외의 다른 다양한 네트워크 문제에는 리던던시가 아무런 도움이 되지 않는다. 라우터는 원래 패킷을 원하는 곳으로 전달하기 위해 함께 동작하도록 되어 있기 때문에 서로 영향을 미치기 때문이다.

따라서 라우터 고장은 완전히 정지보다는 여러 가지 다른 문제를 일으킨다. 때에 따라 소프트웨어 결함이나 서투른 엔지니어의 환경 설정 실수가 다른 라우터로 퍼져 나가거나 전체 성능에 악영향을 미치기도 한다. 라우터는 종종 오작동을 할 수 있지만, 네트워크의 다른 구성요소들은 이를 알지 못하는 것이다. 유나이티드 항공은 최근 발생한 문제의 상세한 정보를 아직 공개하지 않고 있다.

라우터 소프트웨어 업그레이드는 이런 전면적인 네트워크 중단을 일으켜 언론을 장식하는 주요 원인이다. 실제로 네트워크 소프트웨어 업데이트는 엄청난 시련이 될 수 있기 때문에 일부 기업은 같은 소프트웨어를 몇 년 동안 고집하기도 한다. 업그레이드의 위험성을 감수하는 것보다는 보안 허점의 위험을 일일이 관리하는 방법을 선택하는 것이다.

SDN(Software Defined Networking)은 이런 위험을 완화하고 대규모 고장 사태를 줄이는 데 도움이 될 것이다. SDN 환경에서 관리자는 한 번에 장비 한 대를 관리하고 수동으로 환경 설정을 입력하는 것이 아니라 보다 중앙집중화되고 프로그래밍이 가능한 소프트웨어를 이용하기 때문이다.

하지만 오픈 네트워킹 사용자 그룹의 공동 설립자인 닉 리피스는 SDN이 이런 대형 사고를 방지하기 위해 필요한 좀 더 큰 변화의 일부분일 뿐이라고 강조했다.  editor@itworld.co.kr

X