2017.12.01

IDG 블로그 | 인공지능이 데이터센터를 관리하는 방법

Patrick Nelson | Network World
스스로 관리하는 데이터센터가 한발 더 현실로 다가왔다. 지난 주 HPE는 데이터센터의 장애를 찾아내는 인공지능 예측 엔진을 발표했다.

HPE는 내년에 스토리지와 범용 인프라의 장애를 예측하고 문제가 생기기 전에 중단하는 인공지능 추천 엔진 애드온을 출시할 예정이다. 앞으로 여러 솔루션 업체들이 내놓을 것으로 예상되는 무인 데이터센터의 여러 구성 요소 중 하나이다. 이외에 데이터센터를 노리는 인공지능과 머신러닝 시스템 업체로는 릿비트나 오라클 등이 있다.

Image Credit : GettyImagesBank

HPE는 백서를 통해 “인프라 솔루션은 데이터 과학과 머신러닝을 활용해야 한다”며, AI와 머신러닝이 인간보다 데이터센터 다운타임을 더 잘 막을 수 있는 이유를 설명했다.

현재 IT 관리자는 데이터가 애플리케이션에 전달되는 과정에 영향을 미치는 미로를 풀기 위해 복잡한 포렌식 작업을 끊임없이 수행해야 하는데, 여기서 병목현상이 발생한다는 것. 하지만 머신러닝 형태를 통하면 상태가 나쁜 요소를 자동으로 인식할 수 있으며, 이 과정에 어떤 수작업도 필요없다. 조기에 수행되기 때문에 사용자는 문제를 눈치채지도 못한다. 기본적으로 이 작업은 IT 인프라 전반에서 수집한 대규모 데이터를 계산하고 분석한다.

HPE가 제시하는 개념은 “탐지를 통해 근본 원인을 신속하게 파악”하고, 이후 “데이터 수집을 통해 문제를 해소”한다는 것이다. 그 이후 영향을 미칠 수 있는 사용자나 요소, 고객를 파악하기 위해 서명을 만든다. 그리고 해법을 위해 규칙을 개발하는데, 해법은 자동화할 수 있다.

더 나아가 사용자가 큰 실수를 하면, 새로운 서명과 규칙을 갖춘 인공지능 머신러닝 솔루션이 전체 시스템에 개입해 다른 시스템에서 동일한 문제가 이어지는 것을 막는다. 미래의 소프트웨어 업데이트는 이런 인공지능을 통해 학습한 것을 기반으로 최적화된다.

HPE의 인공지능 솔루션에는 올해 초 인수한 플래시 스토리지 및 예측 분석 전문업체 님블 스토리지의 기술도 한몫한다. HPE는 지난 10년 동안 데이터 과학과 원격 측정을 통해 데이터를 수집해 왔다고 밝혔는데, 님블 스토리지는 실제로 1만 2,000건 이상의 애플리케이션 성능 격차 문제를 분석했다.

한편, HPE는 다운타임을 줄이기 위해서는 전체 IT 스택에 대한 완전한 분석이 필요하다고 강조했다. 이를 통해 다운타임을 예측할 수 있다는 것. 사람이 모니터링하고 잠재적인 문제로 표시하는 것이 아니라 인공지능으로 인프라가 느려지는 원인을 파악하고 조처하는 방식이다.

또한 엔진이 장애를 막지 못할 경우를 위한 ‘규범적인 해법’도 채용해야 한다. 즉 엔진은 문ㄴ제가 발생하면 이를 바로 잡을 수 있어야 한다. 전통적인 수작업 트러블슈팅이나 웹 기반의 포럼 참고 같은 도구를 사용하지 않고 예측적이고 분석적으로 근본 원인을 찾아내 문제를 해결해야 한다는 의미이다.

마지막으로 HPE는 무인화에 매우 진지하게 임하고 있다. 기술을 사용하면 필요 인력을 눈에 띄게 줄일 수 있다는 것. 특히 단지 정보를 취합하고 문제를 기록하는 역할만 하는 경우가 많은 현장 기술 지원 인력을 없애면 무인화된 데이터센터가 한층 더 현실로 다가올 것이라고 강조했다. 즉 인공지능이 문제를 파악하기 때문에 현장 대응팀이 필요없다는 것이다. HPE는 “엔지니어와 이야기해야 하는 소수의 문제에 대해서는 바로 3레벨 엔지니어와 연락할 수 있다”고 덧붙였다.  editor@itworld.co.kr


2017.12.01

IDG 블로그 | 인공지능이 데이터센터를 관리하는 방법

Patrick Nelson | Network World
스스로 관리하는 데이터센터가 한발 더 현실로 다가왔다. 지난 주 HPE는 데이터센터의 장애를 찾아내는 인공지능 예측 엔진을 발표했다.

HPE는 내년에 스토리지와 범용 인프라의 장애를 예측하고 문제가 생기기 전에 중단하는 인공지능 추천 엔진 애드온을 출시할 예정이다. 앞으로 여러 솔루션 업체들이 내놓을 것으로 예상되는 무인 데이터센터의 여러 구성 요소 중 하나이다. 이외에 데이터센터를 노리는 인공지능과 머신러닝 시스템 업체로는 릿비트나 오라클 등이 있다.

Image Credit : GettyImagesBank

HPE는 백서를 통해 “인프라 솔루션은 데이터 과학과 머신러닝을 활용해야 한다”며, AI와 머신러닝이 인간보다 데이터센터 다운타임을 더 잘 막을 수 있는 이유를 설명했다.

현재 IT 관리자는 데이터가 애플리케이션에 전달되는 과정에 영향을 미치는 미로를 풀기 위해 복잡한 포렌식 작업을 끊임없이 수행해야 하는데, 여기서 병목현상이 발생한다는 것. 하지만 머신러닝 형태를 통하면 상태가 나쁜 요소를 자동으로 인식할 수 있으며, 이 과정에 어떤 수작업도 필요없다. 조기에 수행되기 때문에 사용자는 문제를 눈치채지도 못한다. 기본적으로 이 작업은 IT 인프라 전반에서 수집한 대규모 데이터를 계산하고 분석한다.

HPE가 제시하는 개념은 “탐지를 통해 근본 원인을 신속하게 파악”하고, 이후 “데이터 수집을 통해 문제를 해소”한다는 것이다. 그 이후 영향을 미칠 수 있는 사용자나 요소, 고객를 파악하기 위해 서명을 만든다. 그리고 해법을 위해 규칙을 개발하는데, 해법은 자동화할 수 있다.

더 나아가 사용자가 큰 실수를 하면, 새로운 서명과 규칙을 갖춘 인공지능 머신러닝 솔루션이 전체 시스템에 개입해 다른 시스템에서 동일한 문제가 이어지는 것을 막는다. 미래의 소프트웨어 업데이트는 이런 인공지능을 통해 학습한 것을 기반으로 최적화된다.

HPE의 인공지능 솔루션에는 올해 초 인수한 플래시 스토리지 및 예측 분석 전문업체 님블 스토리지의 기술도 한몫한다. HPE는 지난 10년 동안 데이터 과학과 원격 측정을 통해 데이터를 수집해 왔다고 밝혔는데, 님블 스토리지는 실제로 1만 2,000건 이상의 애플리케이션 성능 격차 문제를 분석했다.

한편, HPE는 다운타임을 줄이기 위해서는 전체 IT 스택에 대한 완전한 분석이 필요하다고 강조했다. 이를 통해 다운타임을 예측할 수 있다는 것. 사람이 모니터링하고 잠재적인 문제로 표시하는 것이 아니라 인공지능으로 인프라가 느려지는 원인을 파악하고 조처하는 방식이다.

또한 엔진이 장애를 막지 못할 경우를 위한 ‘규범적인 해법’도 채용해야 한다. 즉 엔진은 문ㄴ제가 발생하면 이를 바로 잡을 수 있어야 한다. 전통적인 수작업 트러블슈팅이나 웹 기반의 포럼 참고 같은 도구를 사용하지 않고 예측적이고 분석적으로 근본 원인을 찾아내 문제를 해결해야 한다는 의미이다.

마지막으로 HPE는 무인화에 매우 진지하게 임하고 있다. 기술을 사용하면 필요 인력을 눈에 띄게 줄일 수 있다는 것. 특히 단지 정보를 취합하고 문제를 기록하는 역할만 하는 경우가 많은 현장 기술 지원 인력을 없애면 무인화된 데이터센터가 한층 더 현실로 다가올 것이라고 강조했다. 즉 인공지능이 문제를 파악하기 때문에 현장 대응팀이 필요없다는 것이다. HPE는 “엔지니어와 이야기해야 하는 소수의 문제에 대해서는 바로 3레벨 엔지니어와 연락할 수 있다”고 덧붙였다.  editor@itworld.co.kr


X