2019.09.09

IDG 블로그 | 클라우드 관리, 이제는 자동화된 조치가 답이다

David Linthicum | InfoWorld
생각해 보자. 새벽 4시, 클라우드옵스 센터에서 온 전화 때문에 잠을 깬다. 퍼블릭 클라우드의 재고 애플리케이션이 다운된 것 같다.

일부 애플리케이션의 모니터링 콘솔에서 몇 가지가 초록불에서 빨간불로 바뀌었기 때문이다. 퍼블릭 클라우드 기반 애플리케이션을 모니터링하는 이들 콘솔은 특정 애플리케이션이 다운되면 애플리케이션 어드민을 호출해야 한다는 것만 안다. 그 어드민이 바로 새벽 4시에 전화를 받은 것이다.
 
ⓒ GettyImagesBank

어드민은 잠이 덜 깬 눈으로 클라우드 시스템의 인스턴스 중 하나에서 미들웨어 프로세스가 죽었다는 것을 발견한다. 얼른 인스턴스를 재기동하고 다시 잠자리에 든다. 하지만 이미 시간은 기상 알람까지 30분 정도밖에 남지 않았다.

필자는 종종 이들 클라우드 관리 및 모니터링 솔루션 판매업체에 모니터링 소프트웨어가 발견하는 문제를 바로 잡을 수 있는 자동화된 기능을 넣을 수 없냐고 묻곤 한다. 그런 업체가 거의 없다. 아니면 관리 소프트웨어가 어드민이 작성해야 하는 외부 처리를 실행할 수는 있지만, 이들 외부 처리 내의 가시성이나 제어 권한이 없는 것이다.

복잡한 문제를 자동으로 바로잡을 수 있다는 말이 아니다. 대부분 애플리케이션 문제는 보통 그리 복잡하지 않으며, 단순한 재기동으로 퍼블릭 클라우드에서도 쉽게 바로 잡을 수 있다. 
이런 솔루션에 대한 요구는 분명 증가하고 있다. 이제 애플리케이션이나 데이터베이스, 기타 클라우드 기반 프로덕션 처리의 문제를 발견할 뿐만 아니라 어드민을 성가시게 하지 않고 단순한 수리 작업 대부분을 자동으로 처리할 수 있는 솔루션이 필요하다.

이런 솔루션이 반드시 필요한 이유는 다음과 같다.

첫째, 프로세스에 인간을 배치하는 것은 대응이 일정하지 않을 것이란 의미이다. 서로 다른 사람에게 서로 다른 시간에 문제 해결 임무가 부여되고, 이들은 서로 다른 방식으로 처리할 것이다. 제때 문제를 해결하지 않을 수도 있다. 너무 깊이 잠들어 전화벨 소리를 듣지 못할 수도 있고, 문제를 무시할 다른 방법을 찾을 수도 있다.

둘째, 이제는 눈에 띄는 일을 처리할 수 있는 자동화 역량이 있다. 머신러닝으로 일부 장애 처리 작업을 자동화할 수 있을 뿐만 아니라 경험에서 배운 것도 문제 해결에 이용할 수 있다. 예를 들어 퍼블릭 클라우드 서비스 업체의 미들웨어를 재기동하기 전에 데이터베이스를 재기동해야 한다는 것을 알게 됐다면, 나중을 위해 이 지식을 저장해 둘 수 있다.

필자는 자동 조치나 자체 치유 역량을 갖춘 관리 환경을 주창해 왔다. 이유는 분명하다. 사람은 잠을 자야 하고, 장애는 언제 일어났는지도 모를 정도로 신속하게 바로잡아야 하기 때문이다. editor@itworld.co.kr


2019.09.09

IDG 블로그 | 클라우드 관리, 이제는 자동화된 조치가 답이다

David Linthicum | InfoWorld
생각해 보자. 새벽 4시, 클라우드옵스 센터에서 온 전화 때문에 잠을 깬다. 퍼블릭 클라우드의 재고 애플리케이션이 다운된 것 같다.

일부 애플리케이션의 모니터링 콘솔에서 몇 가지가 초록불에서 빨간불로 바뀌었기 때문이다. 퍼블릭 클라우드 기반 애플리케이션을 모니터링하는 이들 콘솔은 특정 애플리케이션이 다운되면 애플리케이션 어드민을 호출해야 한다는 것만 안다. 그 어드민이 바로 새벽 4시에 전화를 받은 것이다.
 
ⓒ GettyImagesBank

어드민은 잠이 덜 깬 눈으로 클라우드 시스템의 인스턴스 중 하나에서 미들웨어 프로세스가 죽었다는 것을 발견한다. 얼른 인스턴스를 재기동하고 다시 잠자리에 든다. 하지만 이미 시간은 기상 알람까지 30분 정도밖에 남지 않았다.

필자는 종종 이들 클라우드 관리 및 모니터링 솔루션 판매업체에 모니터링 소프트웨어가 발견하는 문제를 바로 잡을 수 있는 자동화된 기능을 넣을 수 없냐고 묻곤 한다. 그런 업체가 거의 없다. 아니면 관리 소프트웨어가 어드민이 작성해야 하는 외부 처리를 실행할 수는 있지만, 이들 외부 처리 내의 가시성이나 제어 권한이 없는 것이다.

복잡한 문제를 자동으로 바로잡을 수 있다는 말이 아니다. 대부분 애플리케이션 문제는 보통 그리 복잡하지 않으며, 단순한 재기동으로 퍼블릭 클라우드에서도 쉽게 바로 잡을 수 있다. 
이런 솔루션에 대한 요구는 분명 증가하고 있다. 이제 애플리케이션이나 데이터베이스, 기타 클라우드 기반 프로덕션 처리의 문제를 발견할 뿐만 아니라 어드민을 성가시게 하지 않고 단순한 수리 작업 대부분을 자동으로 처리할 수 있는 솔루션이 필요하다.

이런 솔루션이 반드시 필요한 이유는 다음과 같다.

첫째, 프로세스에 인간을 배치하는 것은 대응이 일정하지 않을 것이란 의미이다. 서로 다른 사람에게 서로 다른 시간에 문제 해결 임무가 부여되고, 이들은 서로 다른 방식으로 처리할 것이다. 제때 문제를 해결하지 않을 수도 있다. 너무 깊이 잠들어 전화벨 소리를 듣지 못할 수도 있고, 문제를 무시할 다른 방법을 찾을 수도 있다.

둘째, 이제는 눈에 띄는 일을 처리할 수 있는 자동화 역량이 있다. 머신러닝으로 일부 장애 처리 작업을 자동화할 수 있을 뿐만 아니라 경험에서 배운 것도 문제 해결에 이용할 수 있다. 예를 들어 퍼블릭 클라우드 서비스 업체의 미들웨어를 재기동하기 전에 데이터베이스를 재기동해야 한다는 것을 알게 됐다면, 나중을 위해 이 지식을 저장해 둘 수 있다.

필자는 자동 조치나 자체 치유 역량을 갖춘 관리 환경을 주창해 왔다. 이유는 분명하다. 사람은 잠을 자야 하고, 장애는 언제 일어났는지도 모를 정도로 신속하게 바로잡아야 하기 때문이다. editor@itworld.co.kr


X