다른 말로 하자면 네트워크 부서는 AI 기술을 도입하기 전에 네트워크 데이터 접근 방법을 현대화할 필요가 있다는 의미다.
엔터프라이즈 매니지먼트 어소시에이트(Enterprise Management Associates)는 최근 250명의 IT 전문가를 대상으로 AI/ML 중심의 네트워크 관리 솔루션에 대한 경험을 조사해 "AI 중심의 네트워크: 네트워크 관리 수준을 높여라(AI-Driven Networks: Leveling up Network Management)"라는 보고서로 펴냈다. 보고서에서는 AI/ML을 네트워크 관리에 적용할 때 부딪히는 곤란한 두 번째 기술적 과제로 데이터 문제를 짚었다. 가장 큰 기술적 과제로는 네트워크 복잡성이 지목됐다.
또한 90%의 응답 기업이 AI/ML 솔루션을 시험 적용할 때 네트워크 데이터와 관련된 심각한 문제를 최소 1가지 이상 경험한 것으로 나타났다.
90억 달러 규모의 금융 서비스 기업의 한 IT 부사장은 최근 "AI옵스는 워크플로우를 가속화할 때 데이터가 필요하다. 그런 데이터가 없다면 AI옵스도 사용할 수 없다. AI 프로젝트와 관련해 가장 먼저 해야 할 일은 데이터를 준비하는 것이다. 데이터를 보고, 이해하고, 그 차이를 확인해야 한다"라고 조언했다.
설문조사에서 IT 전문가가 꼽은 데이터 관련 문제의 핵심을 알아보자.
데이터 품질
응답자 46%가 꼽은 가장 큰 문제는 데이터 품질이다. IT 기업은 쓰레기 같은 인사이트를 도출하는 쓰레기 데이터를 빠르게 발견한다. 또 오류와 포맷 문제, 비표준 데이터로 고심한다. IT 기업이 다수의 사일로 도구에서 서드파티 AI옵스 솔루션으로 데이터를 입력하면 이런 문제가 생기기 쉽다. 보통 IT 기업은 네트워크 관리와 모니터링에 최소한 4가지에서 15가지 도구를 사용한다. 각 도구는 품질 수준이 다른 각각의 데이터베이스를 유지하고 있다. AI옵스 솔루션이 이런 데이터 집합에서 인사이트를 상호 연결하려고 하면 문제가 불거진다.보안적 위험
응답자의 39%는 네트워크 데이터를 AI/ML 시스템과 공유할 때의 보안 위험으로 고심한다. 많은 업체가 AI 중심 네트워크 솔루션을 클라우드 기반으로 만들어 판매한다. IT 부서가 네트워크 데이터를 분석하려면 클라우드로 전송해야 한다. 금융 서비스 같은 일부 산업은 네트워크 데이터를 클라우드로 전송하는 것을 기피하고 사내의 온 프레미스 서버에 저장한다. 안타깝게도 AI 데이터 레이크를 온 프레미스 버전으로 판매하는 네트워크 업체는 많지 않다. 분석을 위해 클라우드 확장성이 필요하기 때문이다.일부 업체는 네트워크의 전 세계적 분석을 위해 모든 고객의 익명화된 데이터를 결합한다. 지역 경계나 산업 등의 변수를 가리지 않고 모든 종합 트렌드를 볼 수 있다. 그러나 일부 고객사는 AI/ML 솔루션의 이런 장점을 불편해한다. 익명화된 데이터가 이런 방법으로 결합되는 것을 원치 않기 때문이다.
네트워크 오버헤드
세 번째로 지목된 데이터 관련 과제는 네트워크 오버헤드다. 응답 기업의 36%는 오프프레미스의 방대한 데이터 세트를 클라우드 기반 데이터 레이크로 옮기는 비용을 우려했다. 이러한 데이터 이전은 종종 지나친 대역폭을 소비한다. 일부 업체는 데이터를 로컬 지역의 네트워크 엣지에서 처리하고 메타데이터를 분석용 AI 클라우드로 보내 이 문제를 완화한다. AI 중심 네트워크 솔루션을 평가하는 기업은 이 문제를 AI/ML 업체들이 어떻게 처리하는지를 문의해야 한다.데이터 세분화
마지막으로는 응답자 32%가 꼽은 데이터의 세분화 역량 부족이 문제였다. AI 솔루션에 인사이트를 제공하기에 충분한 간격으로 데이터를 수집하지 못하기 때문이다. 이 문제는 다양한 방법으로 나타난다. 일부 SD-WAN 업체는 네트워크 텔레메트리를 수집하는 비율을 제한하기도 한다. 텔레메트리 트래픽이 네트워크 성능에 영향을 미치기 때문이다.
일부 모니터링 도구는 SNMP로 네트워크를 수집하는 간격을 제한하기도 한다. 응답률이 높을수록 모니터링 플랫폼이 불안정해지기 때문이다. 일부 네트워크 스위치와 라우터도 업무 수행에 영향을 미치므로 플로우 기록 생성 빈도가 제한된다. 최근에는 일부 네트워크 업체는 더 세분화된 데이터를 생성하는 데 최적화된 스위치 실리콘을 사용해 이 문제를 완화하기 시작했으나 이런 하드웨어는 엄청나게 고가다.
이미 수집한 네트워크 데이터를 평가하라
당장은 AI/ML 솔루션을 네트워크 관리에 활용할 계획이 전혀 없다고 하더라도 현재 기업의 네트워크 데이터 상태를 평가하는 것이 좋다. 네트워크 운영 부서는 AI 고려 여부와 상관없이 통상적으로 가장 큰 문제가 데이터 품질이라고 답하기도 했다.에를 들어 기업은 AI를 사용하면 명확하게 보일 네트워크 안의 맹점이 있는지를 확인해야 한다. 현재 사용하는 도구가 수집하고 보유하는 데이터의 품질을 평가해야 한다. 이 수집된 데이터에서 에러가 생기기 쉬운가? 데이터는 또한 표준을 준수해야 한다. 데이터를 메타데이터와 태그하는 도구라면 서드파티로 분석할 수도 있는가? 데이터 표준화는 다른 시스템에서도 데이터를 읽을 수 있음을 보장한다. 데이터 수집 간격도 생각해 보아야 한다. NMP 폴링 간격 5분과 10분 사이에 많은 일이 벌어질 수 있다.
editor@itworld.co.kr