하이브리드 클라우드/멀티클라우드 시대의 네트워크 모니터링

Network World
지금 기업의 네트워크 모니터링은 과거에 비해 훨씬 쉽다. 애널리스트 및 컨설팅 업체 엔터프라이즈 매니지먼트 어소시에이츠(Enterprise Management Associates)에 따르면, 소프트웨어와 인프라의 클라우드 이전이 시작되기 전부터 일반적인 기업은 네트워크 모니터링과 문제 해결을 위해 4~10개의 툴을 사용했다.

퍼블릭 클라우드는 네트워크 가시성 측면에서 복잡성을 한 단계 추가했다. 전통적인 모니터링 툴은 개별 네트워크 요소의 상태와 성능을 중심으로 구성된다. 지금 디지털 비즈니스 시대에는 네트워크에 대한 더 전체적인 시야와 함께 빅데이터 분석과 머신러닝을 사용해 다양한 클라우드 환경에서 데이터를 얻고 상호 연계하는 역량도 필요하다.
 
ⓒ GettyImagesBank

켄틱(Kentik)의 설문 조사에 따르면, 현재 기업의 40%는 스스로를 멀티클라우드 사용자로 분류하며, 두 개 이상의 클라우드 서비스 업체를 이용한다. 기업의 1/3은 자체 시설이거나 코로케이션 또는 다른 업체의 데이터센터 형태인 전통적인 인프라와 하나 이상의 클라우드 서비스 업체를 함께 사용하는 하이브리드 클라우드 환경을 운용한다.

EMA의 연구 책임자인 샤무스 맥길리카디는 “네트워크에서 수집하고 분석하는 데이터의 유형은 각종 디바이스 지표부터 넷플로우(NetFlow), 패킷, 로그, 활성 합성 모니터링에 이르기까지 매우 다양하며, 한 업체에서 이 모든 분야를 다 잘 해낼 수는 없다. 대부분은 애초에 모두 다 하려고 시도하지도 않는다”고 말했다.

결과적으로 멀티클라우드 사용자의 35%는 3~5개의 모니터링 툴을 사용한다. 여기에는 로그 관리 툴(48%), 애플리케이션 성능 관리 툴(40%), 오픈소스 툴(34%), 네트워크 성능 관리 툴(25%)이 포함된다.

맥길리카디는 “네트워크 담당자들은 엔드 투 엔드 툴을 찾을 수 없다고 말한다. 데이터센터, AWS, 애저 각각에 대한 시야는 충분히 갖추고 있지만 이것을 하나로 합치지는 못한다”고 지적했다. 엔터프라이즈 스티래티지 그룹(Enterprise Strategy Group)의 밥 랠리버트는 “환경이 훨씬 더 복잡해지고 있다”며, “따라서 복잡한 환경을 간편하게 관리할 수 있게 해주는 매우 정교한 툴을 찾는 것이 앞으로 중요해질 것”이라고 덧붙였다.

하지만 말은 쉬워도 실천은 어렵다. 많은 네트워크 전문가의 공통적인 불만은 기존의 디바이스 중심 네트워크 모니터링은 확장이 되지 않거나 클라우드 및 디지털 비즈니스 시대의 애플리케이션에 필요한 가시성을 제공하지 않기 때문이다. 아마존 클라우드워치(CloudWatch), 애저 모니터 또는 GCP 스택드라이버와 같은 클라우드 네이티브 모니터링 툴은 덜 단편적이고 모든 인프라와 애플리케이션 계층을 관찰할 수 있지만, 일부 사용자는 여전히 클라우드 툴이 온프레미스 툴과 잘 통합되지 않는 것은 물론 기능과 가시성도 부족하다고 지적한다.

아직 어느 업체도 “빅 픽처’ 모니터링 솔루션을 만들지 않았다. 기업이 소유하거나 다른 업체로부터 임대하는 =다양한 네트워크 간의 무수한 차이점을 감안하면 그러한 솔루션이 가까운 미래에 나올 것이라고 기대할 수도 없다. 다만 이 간격을 약간이라도 좁히고 네트워크 전반에 걸쳐 더 나은 시야를 확보할 수 있는 방법은 존재한다.
 

섬처럼 흩어진 네트워크 시야 연결하기

맥길리카디는 “하이브리드 클라우드 환경에서는 항상 가시성이 섬과 같이 흩어지게 된다. 중요한 점은 이러한 섬을 통합할 기회를 찾는 것”이라고 말했다.

네트워크 모니터링 툴에서 가장 유용한 데이터 소스 중 하나는 AWS, 또는 서비스나우(ServiceNow)와 같이 티켓 데이터를 전송하는 IT 서비스 관리 플랫폼, 또는 보안 모니터링 툴 등의 다른 플랫폼에서 데이터를 끌어오는 데 사용되는 관리 시스템 API다.

맥길리카디는 “이와 같은 데이터를 한데 모으려면 맞춤형 데이터 수집, 툴 맞춤 구성, 원하는 방식으로 클라우드를 볼 수 있게 해주는 새 대시보드 생성 기능 등을 제공하는 매우 현대적인 툴 API를 갖춘 네트워크 모니터링 업체가 필요하다”고 말했다. 또 향후 신규 업체는 대부분 적절한 API를 제공할 것이라고도 말했다. 기존 업체의 경우 분석을 통해 생산한 데이터를 전용 데이터로 보는 경향이 있어 고객에게 API를 공개하기를 꺼릴 수 있다.

랠리버트는 “인프라 팀은 클라우드 네이티브 환경으로 확장되고 있는 일부 레거시 툴의 이점을 활용할 수도 있다”고 말했다. 랠리버트는 SNMP 폴링, 플로우, 패킷 캡처를 통합해 하이브리드 클라우드 환경에서 기업의 네트워크 성능을 파악하는 리버베드(Riverbed), 온프레미스부터 하이브리드, 클라우드를 위한 솔라윈드(SolarWinds) 고급 네트워크 모니터링과 같은 툴셋은 “레거시와 클라우드를 묶을 기회를 제공한다”고 덧붙였다.

그러나 전통적인 네트워크 모니터링 툴의 상당수는 클라우드를 위한 로드맵을 선뜻 도입하지 못하고 있다. EMA 설문에 참여한 네트워크 관리자의 74%는 기존 네트워크 관리 툴로 퍼블릭 클라우드 요구사항을 충족하지 못했다고 응답했으며, 이 중에서 28%는 실패의 원인이 업체의 무대책 또는 클라우드 지원 로드맵의 부재라고 답했다.

맥길리카디는 “앞으로 모든 업체가 각자의 툴로 클라우드에 대한 시야를 어느정도 확보하게 되겠지만 완벽한 수준에 이를 수는 없을 것”이라고 말했다.
 

클라우드 서비스 업체의 발전

가트너의 클라우드 및 IT 운영 부문 연구 책임자인 그레그 시그프리드는 클라우드 네이티브 및 멀티클라우드 환경에 대해 “각 클라우드 경계를 통과하는 네트워크를 모니터링하기 위한 클라우드 서비스 업체의 툴이 차차 자리를 잡아가고 있다”고 말했다.

예를 들어 마이크로소프트 애저는 네트워크 패킷 수집기 또는 분석 툴로 가상머신 네트워크 트래픽을 지속적으로 스트리밍하는 가상 네트워크 TAP(현재 모든 애저 리전에서 프리뷰 버전으로 제공)를 추가했다. 수집기 또는 분석 툴은 네트워크 가상 어플라이언스 협력업체가 제공한다.


시그프리드는 “네트워크 엔지니어들이 온사이트 시스템에서 다루는 것과 매우 비슷하다. 이와 같은 요소를 통합하는 기능은 하이브리드 환경에 확실히 도움이 될 것”이라고 평가했다.

한편 켄틱에 따르면 많은 클라우드 사용자는 이미 나와 있는 모니터링 기능에 대해 모르거나, 알더라도 활용하지 않고 있다. 예를 들어 설문에 참여한 AWS 사용자의 절반 이상은 AWS가 제공하는 플로우 로그와 같은 클라우드별 모니터링 툴을 사용한다고 답했다.

시그프리드는 “나는 보통 고객에게 클라우드 서비스 업체의 툴과 클라우드 네이티브 툴을 먼저 테스트하고, 그 다음 서드파티 툴에 시간과 비용을 투자할 것을 권한다”면서 “그러나 클라우드 서비스 업체로부터 얻는 가시성과 이러한 부가적인 제품에서 얻는 가시성 사이에는 확실히 간극이 있다”고 말했다.

경계를 넘어: 멀티클라우드 모니터링

하지만 멀티클라우드 환경 전반의 모니터링을 결합하는 새로운 툴이 부상하고 있다. 이러한 툴에서 중요한 기능은 적응력, 제품 개발 및 기타 인프라 팀과의 협업 지원, 여러 소스의 데이터 통합이다. 또한 시그프리드는 하이브리드 네트워크에서 중요한 비용 및 용량 관리와 같은 요소도 반영할 수 있어야 한다고 말했다.

시그프리드는 이러한 툴로 사우전드아이즈(ThousandEyes), 켄틱(Kentik), 그리고 뉴 렐릭(New Relic) 및 다이나트레이스(Dynatrace)와 같은 APM 툴을 거론했다. 

켄틱은 4월 마이크로소프트 애저를 위한 통합 지원을 발표했다. 켄틱은 작년 후반부터 AWS와 구글 클라우드 플랫폼의 플로우 데이터를 사용하기 시작했다. 이 플랫폼은 호스트 수준 계측기, 가상 네트워크 어플라이언스, 컨테이너 오케스트레이션 또는 서비스 메시와 같은 다른 클라우드 인프라 데이터 소스와도 통합된다.

켄틱은 주로 두 지점 사이의 넷플로우 또는 실시간 트래픽 데이터를 수집한다. 네트워크의 현황을 알려주고, 다른 데이터 소스를 사용해 데이터를 더 강화한다.

인터넷 모니터링 업체 사우전드아이즈는 작년 네트워크 인텔리전스(Network Intelligence) 제품을 멀티클라우드 환경으로 확장했다. 15개의 AWS 리전, 25개의 애저 리전, 15개의 GCP 리전이 포함된 IaaS 관찰 지점을 확보하고 있어 다양한 지리적 위치에서 특정 클라우드 제공업체의 성능에 대한 가시성을 제공할 수 있다. 또한 클라우드 간 에이전트 대 에이전트 테스트를 통해 IT 부서에 지역 간, 하이브리드, 클라우드 간, 클라우드 내 성능을 측정할 수 있는 기능을 제공한다.

켄틱이 라이브 트래픽을 모니터링하는 반면 사우전드아이즈는 사용자를 에뮬레이션하는 합성 트래픽을 생성한 다음 가상의 네트워크 트랜잭션에서 어떤 일이 발생할 수 있는지를 알려준다.

맥길리카디는 지난 3년 동안 활성 합성 모니터링 솔루션에 대한 관심이 커졌다면서 “사물을 보는 두 가지 다른 방식이다. 일부 트랜잭션은 양쪽 모두에서 볼 수 없으므로 합성이 유용하다”고 말했다.
 

AI옵스와 고급 분석 플랫폼

네트워크 모니터링에서 문제해결 못지않게 데이터 수집과 흡수의 중요성이 커지면서 애널리스트들은 빅데이터 분석과 머신러닝을 통해 여러 툴의 시야를 연계하는, IT 운영을 위한 인공 지능(AI옵스)과 고급 분석 플랫폼이 부상하는 것으로 보고 있다.

맥길리카디는 “CA와 같은 업체는 툴 포트폴리오의 다양한 부분에 연결되어 각 툴의 통찰력을 연계하는 자비스(Jarvis)라는 자체 빅데이터 스택을 활용한다”면서 “또한 서드파티 업체의 데이터를 가져와 통찰력을 연계하는 과정을 쉽게 하기 위한 여러 가지 방법을 시도했다. 몇몇 전문 업체는 모든 모니터링 툴에 연결되어 모든 데이터를 사용자가 보기 쉽게 연계해준다. 지금까지 연구에서 나타난 지표를 보면 긍정적인 접근 방법”이라고 덧붙였다.
 

미래는 분산 네트워크 모니터링

가트너는 여러 클라우드 서비스에 걸쳐 네트워크 시야를 강화하려면 전통적인 인프라 툴에 의존하기보다는 데이터 지향 네트워크 모니터링 프레임워크를 사용할 것을 권장한다.

가트너 애널리스트 사이먼 리차드는 “내부용 툴을 클라우드로 가져오려고 애쓰지 말고 클라우드 네이티브 툴을 사용하면서 시장이 발전 방향을 지켜보는 것이 좋다. 클라우드 서비스 업체가 멀티클라우드 모니터링을 위한 더 좋은 툴을 내놓을 가능성이 높다”고 말했다.

시그프리드는 “하이브리드, 클라우드, 소프트웨어 정의 네트워킹, 뭐라고 부르든 네트워킹의 미래는 소프트웨어로 정의되며, 중앙 인텔리전스나 통제가 아닌 분산된 형태를 이루게 된다. 인프라 관리의 다른 영역에 붕괴를 일으킨 자동화 개념, 인프라 및 코드 기법이 네트워킹에도 그대로 적용되고 있다. 앞으로 생존할 수 있는 또는 진화하는 아키텍처를 지원하는 네트워크 모니터링 플랫폼을 구축하려면 데이터 중심의 네트워크 모니터 프레임워크를 고려해야 한다”고 강조했다. editor@itworld.co.kr