IT 관리 / 네트워크

'통제 불능' 네트워크에 '관측가능성'을 부여하는 방법

Tom Nolle | Network World 2022.04.27
라우터 네트워크와 유치원 사이에 공통점이 있을까? 자세히 살펴보면 생각보다 꽤 많은 공통점을 찾을 수 있다.

일반 기업에 ‘네트워크’란 ‘라우터 네트워크’를 의미한다. 네트워크에 라우터 이외의 다른 것이 없다는 뜻이 아니라 기업 네트워킹 전체의 목적이 ‘IP 연결성 구축’에 있다는 뜻이다. IP 네트워크의 요소를 설명하기 위해 수많은 용어가 만들어졌고 지금도 매일 새로운 용어가 추가되고 있다. 하지만 늘 그랬듯이 많은 기업이 자신의 네트워크 운영에 대해 충분히 알지 못한다. 이는 ‘관측가능성(observability)’이 없기 때문이다.
 
ⓒ Getty Images Bank

관측가능성이라는 말은 정의가 너무 많아서 의미가 없다. 그중에서 추적의 개념에만 집중하자. 추적을 통해 경로와 관계를 알 수 있으며, 이것이 네트워크의 핵심이다.


‘관측가능성’의 통제적 측면

네트워크는 상자로 구성되어 있다. 네트워크 관리와 모니터링은 네트워크 상태의 지표인 이 상자들의 행동에 집중했다. 모든 상자에 문제가 없으면 네트워크에도 문제가 없다. 애플리케이션 관리도 마찬가지다. 각 부분의 상태를 종합하면 전체의 상태를 알 수 있다. 그런데 IT 운영자들은 자명해 보이는 이런 방식이 메시지 플로우의 중요 지점을 놓친다는 사실을 발견했다. 애플리케이션의 작동 방식을 이해하려면 작업이 일련의 구성요소를 통해 이동하는 방식을 추적해야 한다. 네트워크도 마찬가지다. 네트워크는 한 개의 상자가 아니고 상자 여러 개가 모인 것도 아니며, 일종의 협동조합이기 때문이다.

서두의 질문으로 돌아가 보자. 네트워크는 유치원생으로 가득한 방과 비슷하다. 통제 불능의 무질서 상태다. 유치원생들에게 할 일을 알려주고 집단 활동을 조직할 수는 있다. 그러나 유치원생 한 명 한 명은 제멋대로인 악동이다. 통제에서 벗어나 예기치 못한 일을 저지를 수 있다. 거의 모든 IP 네트워크도 제멋대로인 악동의 모임이다.

각 라우터는 적응 행동으로 트래픽을 움직일 경로를 찾아낸다. 일반적으로 모든 라우터는 각자 도달할 수 있는 네트워크 목적지를 알리고, 타 라우터에서 그런 알림을 받아 인접한 모든 라우터에 전달한다. 라우터들은 전달받은 알림 가운데서 ‘최선의’ 경로를 선택한다. 고장이나 혼잡이 발생하면 라우터는 ‘컨버전스(convergence)’를 통해 새로운 토폴로지를 알아낸다. 하지만 그렇게 알아낸 새 토폴로지가 과연 최적일까? 유치원생들이 스스로 짠 학습 계획이 어떨지 생각해 보면 답이 나온다.

경로는 파트너 장치와 주고받은 도달 가능성 데이터(reachability data)에서 만들어진다. 따라서 파트너와 파트너의 파트너 등을 통해 변경 사항이 퍼지고 다들 최선의 것을 선택하는 데 시간이 걸린다. 그러는 동안 패킷은 잘못된 경로를 취하거나 심지어 막다른 골목에 봉착할 가능성이 있다. 이 과정의 끝에 산출된 것이 진정으로 최적의 경로인지는 알 수 없다.

패킷이 취하는 경로는 경로 추적(traceroute)이라는 IP 명령으로 알 수 있다. 일부 라우터 업체의 관리 시스템에는 네트워크 내 경로를 시각화하는 패킷 추적 툴이 내장돼 있다. 네트워크 모니터링 업체의 서드파티 툴에도 똑같은 작업을 하는 것이 있다. 이런 툴은 특정 업체의 툴이 작동하지 않을 수 있는 멀티 벤더 네트워크에서 특히 유용하다. 패킷 추적으로 찾아야 할 것은 아무런 논리가 없어 보이는 경로나 눈에 띄는 장치 또는 네트워크 고장이 없음에도 불구하고 계속 바뀌는 경로이다. 이런 상태는 네트워크 혼잡 때문에 발생한다. 혼잡은 패킷 손실이나 지연을 야기할 수 있다. 상황 파악을 하려면 먼저 엔드 투 엔드 패킷 추적을 따라가면서 과부화 되었거나 오류율이 높은 장치 또는 연결을 찾아내야 한다.

하지만 패킷 추적만으로는 확실한 대답을 기대할 수 없다. 경로가 잘못된 지점을 확인할 수는 있지만, 모든 라우터는 이웃으로부터 도달 가능성 데이터를 얻으므로 고장 지점이 다른 곳일 가능성을 명심해야 한다. 추적 데이터를 여러 네트워크 엔드포인트에서 동시에 얻을 수 있다면 패킷 추적 시각화 전문 툴로 출력한 전체 경로 맵이 도움이 된다.


MPLS, SDN, SD-WAN으로 통제력 부여하기

‘아는 것이 힘’이라는 격언은 이런 경우에 적용되지 않는다. 네트워크를 단순히 관찰하는 것과 운영하는 것은 다른 차원이다. 축구 경기를 관람하는 것과 감독하는 것이 다른 것과 마찬가지다. 네트워크 운영에서는 단순히 아는 것이 아니라 ‘통제하는 것’이 중요하다. 트래픽 관리의 시작은 경로를 정확히 선택하고 있는지 라우터 정책을 검토해 확인하는 것이다. 그러나 라우팅 정책을 통제해도 원하는 경로로 플로우를 이동시킬 수 없는 경우가 있다. 이럴 때에는 트래픽 관리 문제를 해결해야 한다. 트래픽 관리 기능을 추가해주는 최고의 도구가 바로 MPLS(Multi-Protocol Label Switching)와 SDN(Software-Defined Networking)이다.

MPLS는 라우터로 명시적인 ‘길(path)’을 연결해 ‘경로(route)’를 구축한다. SDN은 적응 라우팅 및 컨버전스라는 개념을 아예 버리고 중앙 컨트롤러가 글로벌 라우트 맵을 관리하도록 한다. 각 SDN 스위치에 맵을 전달하고 고장이나 혼잡에 대응해 업데이트한다. VPN 서비스나 복잡한 LAN으로 구성된 네트워크에서는 SDN을 사용하는 것이 낫다. 반면 복잡한 라우터 네트워크를 보유하고 있다면 MPLS를 선택하는 것이 적합하다. MPLS든 SDN든 사용자가 플로우를 직접 넣었기 때문에 플로우의 위치를 알고 있다.

MPLS나 SDN이 모두 적합하지 않으면 가상 네트워킹을 선택하는 방법도 있다. 거의 모든 주요 네트워크 업체가 제2의 라우팅 계층을 사용하는 가상 네트워크를 제공한다. 가상 네트워크 라우터를 중요 장소에 배치하면 트래픽에 명시적 경로를 생성할 수 있다. 일부 SD-WAN 제품도 이런 기능을 지원한다. 정책 관리를 활용해 경로와 경로 변경 사항의 산정 방식을 통제할 수도 있다. 가상 네트워크는 원격 사이트 사이나 클라우드와 데이터 센터 사이에 경로가 여럿일 때 특히 빛을 발한다. 가상 네트워크를 사용해 최상의 경로를 선택하거나 VPN과 인터넷 같은 여러 옵션에 걸쳐 트래픽을 분할할 수 있다.

관측가능성에 통제적 측면이 있다는 사실을 잊어서는 안 된다. 흙장난을 하는 동생을 지켜보는 10대는 “동생을 지켜보라고 했을 텐데!”라는 부모님의 호통을 들으면 놀라기 마련이다. 부모님 말씀 곧이곧대로만 하고 있었기 때문이다. 이것이 바로 관측가능성의 약점이다. 새로 찾은 플로우와 경로 지식을 반드시 활용해야 한다. 그렇지 않으면 네트워크는 여전히 유치원생으로 가득 찬 방처럼 행동할 지 모른다.
editor@itworld.co.kr

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.