2021.06.30

IDG 블로그 | 클라우드옵스 기술이 해야만 하는 6가지

David Linthicum | InfoWorld
클라우드옵스(CloudOps)가 무엇인지는 아직도 정의 중이며, 핵심 문제를 해결하는 데 필요한 기술이 무엇인지도 마찬가지이다.

이럴 때는 다른 모든 클라우드 컴퓨팅 환경과 마찬가지로, 현재 동작 중인 클라우드옵스 솔루션을 핵심 구성요소로 분해해 보는 것이 도움이 된다. 또한 어떤 기술이 어떤 가치를 가져오는지를 정의해 보는 것도 좋다. 이를 위해 클라우드옵스 툴이라면 반드시 갖춰야 할 역량 6가지를 뽑았다. 
 
ⓒ Getty Images Bank

데이터를 관찰하고 모은다. 추가 분석과 실행을 위한 패턴을 찾는 데 필요하다면, 규모와 관계없이 많은 시스템으로부터 데이터를 모으고 관찰해야 한다. 여기에는 몇 가지 구성요소가 포함되는데, 커넥터나 에이전트를 이용해 관리 하의 시스템과 커뮤니케이션하는 기능, 안정적인 방법으로 일부 중앙화된 클라우드옵스 시스템으로 데이터를 되가져오는 기능 등이 필요하다.

유의미한 방식으로 대량의 시스템 데이터를 연계한다. 여기에는 데이터의 소스와 같은 패턴을 판단하는 기능이나 심도 있는 분석을 하기 전에 데이터를 그룹으로 묶는 기능 등이 필요하다.

문제와 근본 원인을 판단하기 위한 패턴을 분석한다. AI옵스나 범용 클라우드옵스 툴이 실제로 비용을 절감하는 중요한 요소이다. 취합하고 연계한 데이터에서 패턴을 찾아내고, 고장 난 네트워킹 장비와 같은 현재의 문제를 알려주는 패턴을 판단할 수 있어야 한다. 더 나아가 발생할 가능성이 큰 문제를 예측한다. 선제적인 클라우드옵스는 큰 문제가 발생하는 것을 막을 수 있다. 예를 들어, I/O 오류가 나고 있는 클라우드 스토리지 시스템을 파악할 수 있는데, 이런 오류는 장애가 임박했다는 것을 나타낸다.

데이터 관찰을 통해 발견한 것을 운영팀과 공유한다. 프로세스도 자동화해 자동으로 대응하고 문제를 바로잡아야 한다. 하나는 뭔가 잘못되고 있다는 것을 알려주는 것이고, 나머지는 이 과정에서 오류를 바로 잡을 사람에게 확실히 알려지도록 하는 것이다. 빠르게 발전하고 있는 자동화된 티켓팅 시스템이나 자체 치유 프로세스 등이 이 영역에 해당한다.

문제에 대응하고 자동화된 수정 작업이나 수정을 위한 협업을 실시한다. 문제를 고칠 수 있는 메커니즘이 제대로 자리 잡고 있다는 의미이다. 여기서 자동화가 중요한데, 클라우드옵스 툴의 일부이기도 하면서 일반적인 문제를 인력의 개입없이 수정하는 방법을 정의하는 또 하나의 오케스트레이션 계층이기 때문이다.

보고서와 대시보드를 제공해 클라우드옵스 사용자가 전략 전술 데이터 모두를 보고 시스템의 효율성을 지속적으로 개선할 수 있도록 한다. 대시보드는 현재의 시스템 상태를 보여주는 한편, 모든 시스템의 변화를 보여주기 때문에 앞으로의 상태를 예측할 수 있다. 클라우드옵스팀은 이들 시스템을 팀 전체적으로 이용하는 것을 주저하지만, 필자는 클라우드옵스나 개발 관련된 사람이라면 누구나 이런 측정치를 실시간으로 보고 개선을 위한 옳은 결정을 내릴 것을 권장한다.

다시 한 번 말하지만, 클라우드옵스 문제를 해결하는 마법은 없다. 필자가 추천하는 방안의 상당수가 일부 기업에서는 실행하기 어려울 수도 있다. 시스템의 종류나 운영하는 클라우드, 그리고 애플리케이션과 데이터의 종류와 규모에 따라 달라질 것이다. 하지만 이 6가지 개념을 구현한다면, 원하는 목적을 달성할 수 있는 좋은 출발이 될 것이다. editor@itworld.co.kr


2021.06.30

IDG 블로그 | 클라우드옵스 기술이 해야만 하는 6가지

David Linthicum | InfoWorld
클라우드옵스(CloudOps)가 무엇인지는 아직도 정의 중이며, 핵심 문제를 해결하는 데 필요한 기술이 무엇인지도 마찬가지이다.

이럴 때는 다른 모든 클라우드 컴퓨팅 환경과 마찬가지로, 현재 동작 중인 클라우드옵스 솔루션을 핵심 구성요소로 분해해 보는 것이 도움이 된다. 또한 어떤 기술이 어떤 가치를 가져오는지를 정의해 보는 것도 좋다. 이를 위해 클라우드옵스 툴이라면 반드시 갖춰야 할 역량 6가지를 뽑았다. 
 
ⓒ Getty Images Bank

데이터를 관찰하고 모은다. 추가 분석과 실행을 위한 패턴을 찾는 데 필요하다면, 규모와 관계없이 많은 시스템으로부터 데이터를 모으고 관찰해야 한다. 여기에는 몇 가지 구성요소가 포함되는데, 커넥터나 에이전트를 이용해 관리 하의 시스템과 커뮤니케이션하는 기능, 안정적인 방법으로 일부 중앙화된 클라우드옵스 시스템으로 데이터를 되가져오는 기능 등이 필요하다.

유의미한 방식으로 대량의 시스템 데이터를 연계한다. 여기에는 데이터의 소스와 같은 패턴을 판단하는 기능이나 심도 있는 분석을 하기 전에 데이터를 그룹으로 묶는 기능 등이 필요하다.

문제와 근본 원인을 판단하기 위한 패턴을 분석한다. AI옵스나 범용 클라우드옵스 툴이 실제로 비용을 절감하는 중요한 요소이다. 취합하고 연계한 데이터에서 패턴을 찾아내고, 고장 난 네트워킹 장비와 같은 현재의 문제를 알려주는 패턴을 판단할 수 있어야 한다. 더 나아가 발생할 가능성이 큰 문제를 예측한다. 선제적인 클라우드옵스는 큰 문제가 발생하는 것을 막을 수 있다. 예를 들어, I/O 오류가 나고 있는 클라우드 스토리지 시스템을 파악할 수 있는데, 이런 오류는 장애가 임박했다는 것을 나타낸다.

데이터 관찰을 통해 발견한 것을 운영팀과 공유한다. 프로세스도 자동화해 자동으로 대응하고 문제를 바로잡아야 한다. 하나는 뭔가 잘못되고 있다는 것을 알려주는 것이고, 나머지는 이 과정에서 오류를 바로 잡을 사람에게 확실히 알려지도록 하는 것이다. 빠르게 발전하고 있는 자동화된 티켓팅 시스템이나 자체 치유 프로세스 등이 이 영역에 해당한다.

문제에 대응하고 자동화된 수정 작업이나 수정을 위한 협업을 실시한다. 문제를 고칠 수 있는 메커니즘이 제대로 자리 잡고 있다는 의미이다. 여기서 자동화가 중요한데, 클라우드옵스 툴의 일부이기도 하면서 일반적인 문제를 인력의 개입없이 수정하는 방법을 정의하는 또 하나의 오케스트레이션 계층이기 때문이다.

보고서와 대시보드를 제공해 클라우드옵스 사용자가 전략 전술 데이터 모두를 보고 시스템의 효율성을 지속적으로 개선할 수 있도록 한다. 대시보드는 현재의 시스템 상태를 보여주는 한편, 모든 시스템의 변화를 보여주기 때문에 앞으로의 상태를 예측할 수 있다. 클라우드옵스팀은 이들 시스템을 팀 전체적으로 이용하는 것을 주저하지만, 필자는 클라우드옵스나 개발 관련된 사람이라면 누구나 이런 측정치를 실시간으로 보고 개선을 위한 옳은 결정을 내릴 것을 권장한다.

다시 한 번 말하지만, 클라우드옵스 문제를 해결하는 마법은 없다. 필자가 추천하는 방안의 상당수가 일부 기업에서는 실행하기 어려울 수도 있다. 시스템의 종류나 운영하는 클라우드, 그리고 애플리케이션과 데이터의 종류와 규모에 따라 달라질 것이다. 하지만 이 6가지 개념을 구현한다면, 원하는 목적을 달성할 수 있는 좋은 출발이 될 것이다. editor@itworld.co.kr


X